انجمنهای فارسی اوبونتو
جامعه کاربران => پروژهها => نویسنده: امیرمهری در 24 خرداد 1388، 05:21 بظ
-
قبلا من یک فایلی درست کرده بودم و درخواست کردم بودم که با مشارکت دوستان و کاربران این گلاسری فرهنگ لغت آریان پور تهیه بشود
ولی تعداد محدودی موافق بودند ولی چند نفر خودشان بدون اعلام آمادگی و هماهنگی این کار را انجام دادند
من هم فایل ناقص را پاک کردم
و این پست را اصلاح کردم
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد (http://barnamenevis.org/forum/showthread.php?p=1090744&posted=1#post1090744) رو از exe به xml و بعدش به StarDict تبدیل کردم.
http://sourceforge.net/projects/pyglossary/files/dic/English-Persion
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثالهای انگلیسی و فارسی همه با رنگهای مختلف و فرمتبندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارتهای ورودی رو lowercase کنیم این مشکل حل میشه ولی مخففها شکل زشتی پیدا میکنن)
اینم Tabfile یا همون txt:
البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهمنویسیها، همزههای زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «مینویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضیهاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متنهای فارسی (چه توی وب و چه توی گلاسریهای مختلف) از از غلطها زیاد دارن و باعث میشه پردازشهای کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسریهای فارسی رو هم دستی ویرایش کرد (تازه برای ورژنهای جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازیکاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژهای رو شروع میکنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارتهای regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمعها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شبها میتونم روی پروژههای شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی میطلبه.
-
من مدتی هست که روی دیتابیس دیکشنری بایبلون کار می کردم البته اقای illius هم خیلی به من لطف کردند
این ها رو هم تست کردم شما هم تست کنید اگر مشکلی داشت حتما رفع می کنم ( با اینکه مشغله زیادی دارم)
برای تبدیل هم از برنامه pyglossary استفاده کرده ام
برای دیکشنری StarDict
ftp://download.ospdev.net/glossary-pywork/05-L7mdic/L7englishtofarsi/h7.m2.tar.bz2
برای دیکشنری xFarDic
ftp://download.ospdev.net/glossary-pywork/05-L7xFarDic/L7englishtofarsi/h7.xdb.tar.bz2
برای دیکشنری mdic
ftp://download.ospdev.net/glossary-pywork/05-L7mdic/L7englishtofarsi/h7.m2.tar.bz2
این هم فایل متنی که منبع کار من بود .Tabfile
ftp://download.ospdev.net/glossary-pywork/05-L7Tabfile/L7-englishtofarsi/h7.txt.tar.bz2
من لغت نامه hFarsi - advanced version رو از سایت بابیلون گرفتم و با برنامه مذکور به tabfile تبدیل کردم و
یک سری اصلاحات انجام دادم و حدود 200 اصطلاح و نمونه جمله اضافه کرده ام
ای کاش دوستان همت می کردند و هر کسی فقط یک صفحه از فرهنگ لغت آریان پور جیبی را در مدت یک هفته قبول می کرد و اگر تعداد به بیشتر از 30 نفر برسد حتما در کمتر از 3 ماه یک لغت نامه کامل بدست می آمد.
موفق باشید :)
-
ارادت من اقای illius
-
ای کاش دوستان همت می کردند و هر کسی فقط یک صفحه از فرهنگ لغت آریان پور جیبی را در مدت یک هفته قبول می کرد و اگر تعداد به بیشتر از 30 نفر برسد حتما در کمتر از 3 ماه یک لغت نامه کامل بدست می آمد.
سلام
يك زحمت براي دوستان
من اين گلاسري هاي بابيلون را دارم (ايتاليايي به فارسي و برعكس) كه در بابيلون ويندوز كاملا جواب ميده ولي هنگام تبديل ارور ميدهد كسي مي دونه چطور ميشه اين فايل را تبديل كرد با ناشر هم تماس گرفتم جواب نداد گويا در دسترس نيست
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
-
ممنون ازاینکه لینک گلاسری رو تو این تاپیک گذاشتید
-
سلام امیر جان
حالا که تاپیک ۱ سال پیش زنده شده اون لینک های پست اولی روهم اگه زحمتی نیست اصلاح کن.
بدرد میخورن . ممنون ;)
-
متاسفانه خود من هم فایل ها رو ندارم و طی یک عملیاتی بیشتر اطلاعات پرید
ولی منتظر خبر خوب باشید
-
سلام
لطفا يك فكري هم به حال گلاسري هاي من بكنيد خيلي برام لازم هست من دانشجو هستم و به اين ديكشنري ها نياز دارم
-
لينك گلاسري ديكشنري شش جلدي انگليسي به فارسي آريانپور براي بابيلون با 75000 كلمه همراه با مثال و رنگي
http://www.4shared.com/file/SQYsjcrD/Open_Dictionary_for_Babylon.html
فایل bdc رو نمیشه تبدیل کرد!!! لطفاً فایل bgl رو بذارید!
-
سلام
من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
-
من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
http://up.iranblog.com/Files7/0c8f475395a14f22882f.zip
-
من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
http://up.iranblog.com/Files7/0c8f475395a14f22882f.zip
\\:D/
اميدوارم در زندگي هميشه موفق بشيد لطف و كمك بزرگي به من كرديد عالي بود امكانش هست ماهيگيري (روش تبديل فايل )را به من هم ياد بديد البته تحت ويندوز :)
اين را هم ببينيد
http://www.i-phone.ir/forums/thread18527-3.html
-
\\:D/
اميدوارم در زندگي هميشه موفق بشيد لطف و كمك بزرگي به من كرديد عالي بود امكانش هست ماهيگيري (روش تبديل فايل )را به من هم ياد بديد البته تحت ويندوز :)
اين را هم ببينيد
http://www.i-phone.ir/forums/thread18527-3.html
خواهش میکنم.
نه متاسفانه فعلا میسر نیست! این گلاسریها مشکل encoding داشتن، و فقط با ورژن آتی (منتشر نشدهٔ) برنامهٔ خودم (PyGlossary) تبدیل میشه! در ضمن PyGlossary رو هم برای لینوکس نوشتم و اجراش توی ویندوز کمدردسر نیست (البته اخیراً تست نکردم سعی میکنم اگه وقت کردم تست کنم...)
البته به ندرت از گلاسریهای bgl هست که اینطوری باشه یعنی مشکل encoding داشته باشه (با این دو تا فکر کنم حدود چهار پنج تا دیدم تا بحال. که اونم توی همین چند ماه اخیر داشتم روشون کار میکردم). بقیهش رو قبلا هم میشد با PyGlossary و ابزارهای دیگه مثل dictconv و stardict-editor اجرا کرد، البته همشون برای لینوکس هستن! (ولی ممکنه بتونید توی ویندوز هم اجرا کنید)
-
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم
https://sourceforge.net/projects/glossary-fa/
نظر تون چیه؟
این فقط نسخه stardict رو گذاشتم
-
امیرجان این گلوساری هست؟ من از استاردیکت استفاده می کنم و البت گلوساری های نمی دونم چی چی رو هم براش تبدیل کردم خیلی وقت پیش! که البت بدک هم نیست.
فرق این با گلوساری های بابیلون چیه؟
-
امیرجان این گلوساری هست؟ من از استاردیکت استفاده می کنم و البت گلوساری های نمی دونم چی چی رو هم براش تبدیل کردم خیلی وقت پیش! که البت بدک هم نیست.
فرق این با گلوساری های بابیلون چیه؟
اگه فایل رو دانلود کنید (یا فقط به اسم فایل نگاه کنید) میبینید که h8.txt.bz2 هست، bz2 که مشخصه فشرده شده، txt هم یعنی فایل متنی یا دقیقتر بگیم Tabfile که اگه این فایل رو بدید به PyGlossary (حتی بدون extract کردن یعنی همون txt.bz2) میتونه مستقیم به هر فرمتی که بخواید (از جمله StarDict) تبدیل کنه.
راستی اون دیکشنری Open_Dictionary (که انگلیسی به فارسی و فارسی به انگلیسی هست و خیلی هم کامله) توی ویندوز :!: نصب کردم و به xml تبدیل کردم. حالا اگه فرصت بشه میتونم اون xml رو به یه فرمت درست و حسابی (مثل Tabfile یا StarDict) تبدیل کنم و بدم دوستان استفاده کنن. اما تا حالا فرصت نشده اسکریپت تبدیلش رو کامل کنم. در ضمن غلطهای نگارشی هم خیلی زیاد داره که سعی میکنم درست کنم.
-
گلاسری های دیکشنری استاردیک برای فارسی به
http://forum.ubuntu.ir/index.php/topic,15461.0.html
-
سلام
یک خبر عالی بعد n ساعت انتظار بالاخره فایل xml را تبدیل کردم به اکسل
این هم لینکش
http://www.4shared.com/file/DFjdi6DC/persian_english.html
-
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم
https://sourceforge.net/projects/glossary-fa/
نظر تون چیه؟
این فقط نسخه stardict رو گذاشتم
سلام
امكانش هست تبديل شدشو هم بگذاريد چون من ويندوز دارم و سي دي لايو هم گيرم نيامد !
-
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم
https://sourceforge.net/projects/glossary-fa/
نظر تون چیه؟
این فقط نسخه stardict رو گذاشتم
سلام
امكانش هست تبديل شدشو هم بگذاريد چون من ويندوز دارم و سي دي لايو هم گيرم نيامد !
به چه فرمت تبدیل می خواهی؟
-
سلام
لطفا استارديكت براي آيفن ميخواهم مانند هموني كه آقاي رسولي واسه ايتاليايي لطف كردند
-
دانلود پیش فرض رو تغییر دادم و از همون جا می تونی دانلود کنی
-
سلام دوستان
من ديكشنري فارسي به انگليسي mdm را به فايل اكسل تبديل كرد و بعد از كلي تميز كاري به يك مشكل كمي بزرگ ;D برخورد كردم
اون هم اين هست كه اين ديكشنري هاي فارسي بر اساس ترجمه انگليسي تبديل شده اند و متاسفانه هنگام سرچ خوب جواب نمي دهند و دامنه لغت 120000 تايش بيش از 5000 تا به نظر نمي رسد مثلا
كلمه pacificism = آيئن احتراز از جنگ
fud = آدم امل
magnifico = آدم با وقار
اگر فايل را چك كنيد حدود 100 تا كلمه با آدم شروع ميشه !!!! در صورتي كه بهتر بود
با وقار (آدم) باشه يا سرچ دو واژه اي يعني" آدم" در يك ستون ديگه باشه تا سرچ كلمه " با وقار" درست در بياد چ.مد تا مثال ديگر:
آدم دزد :D آدم لجوج ..... در جاي ديگر 450 كلمه با كلمه "با " شروع شده
با برق كشتن . با بشاشت . با بغض شديد گريستن....... ](*,)
در مورد فرهنگ آريانپور فارسي يه انگليسي اون هم وضعيت بهتري نداره ??? معاني انگليسيش درجه دو و سه هستند اين فرهنگ بهتره! خلاصه.....
من شروع كردم به اديت كردن حدود 12000 كلمه را اديت كردم ::)
تعداد لغات كلا 120000 تا هست اگر دوستان لطف كنند هر نفر 10 -20 هزار تا را قبول كنند زود تمام بشه و همگي استفادشو ببريم- زياد وقت نمي گيره ولي من وقتم كمه :( من براي اين 12000 تا 3-4 ساعت وقت گذاشتم
فقط اگر كسي خواست كمك كنه روي همين صفحه. بگه از چه شماره تا چه شماره اي را انجام ميدهد تا دوبار كاري نشه
من نمونه اش را در 12000 اول كار كردم و فرمتش هم لطفا به هم نريزيد :oops: به نظر من بهتر مانند انگليسي جاي صفت و اسم را در جاهايي كه مفهوم به هم نريزد عوض كنيم در ضمن كلماتي را كه از ابتدا لغات حذف ميكنيد در ستون جلو قرار دهيد تا بر اساس اونها هم بشود سرچ كرد
فقط حروفي كه منفي كننده هستند را به صورت (....) به خود لغت اضافه ميكنيم تا معني تغيير نكند مثلا كلملت زير
بدون توضيج ---> توضيح (بدون) و در ستون جلو ------> بدون(منفي)
بدون جنگ-----> جنگ (بدون) علت اين كار هم اين هست كه به نظر من تاكيد روي جنگ هست تا كلمه بدون كه 1000 با تكرار شده...
در ضمن يك خبر خوب به اسكريپت نويسي در اكسل مسلط شده ام و بر اساس اون ميخواهم ديكشنري فارسي بع انگليسي آريانپور را هم به مجموعه اضافه كنم تا ايشالا مجموعه كاملي داشته باشيم \\:D/
فايل http://www.4shared.com/file/8zpjKGBd/farsi_to_english_dic_-_Copy.html
-
رضا جان کارت عالیه برادر
-
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد (http://barnamenevis.org/forum/showthread.php?p=1090744&posted=1#post1090744) رو از exe به xml و بعدش به StarDict تبدیل کردم.
StarDict - Rich Text (http://dl.dropbox.com/u/3154538/dic/Open%20Dictionary%20aka%20QueerDick-2010-09-28-rich.tar.gz)
StarDict - Plain Text (http://dl.dropbox.com/u/3154538/dic/Open%20Dictionary%20aka%20QueerDick-2010-09-28.tar.gz)
Tabfile - Rich Text (http://dl.dropbox.com/u/3154538/dic/Arianpur-OpenDictionary-2010-09-28-rich.txt.gz)
Tabfile - Plain Text (http://dl.dropbox.com/u/3154538/dic/Arianpur-OpenDictionary-2010-09-28.txt.gz)
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثالهای انگلیسی و فارسی همه با رنگهای مختلف و فرمتبندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارتهای ورودی رو lowercase کنیم این مشکل حل میشه ولی مخففها شکل زشتی پیدا میکنن)
اینم Tabfile یا همون txt:
البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهمنویسیها، همزههای زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «مینویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضیهاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متنهای فارسی (چه توی وب و چه توی گلاسریهای مختلف) از از غلطها زیاد دارن و باعث میشه پردازشهای کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسریهای فارسی رو هم دستی ویرایش کرد (تازه برای ورژنهای جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازیکاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژهای رو شروع میکنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارتهای regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمعها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شبها میتونم روی پروژههای شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی میطلبه.
-
سعید جان واقعا کارت حرف نداره
این دیکشنری خودش یه منبعیه برای یاد گیری زبان با اون همه مثال های جورواجورش
دستت درد نکنه
-
بدانلودیدم تا بتستم
هر آنچ باشد تلاش شما دست مریزاد داره ;)
-
اوه ببخشید. اون فایلهایی که گذاشتم Plain Text بود (رنگ و italic و اینا نداشت، نگها اشتباهی حذف شده بود)
دوباره آپلود میکنم پست رو ویرایش میکنم.
-
شما ها اصلا به stardic چی کار دارید؟ :D
تا وقتی MDIC و golden dict هستن دیگه نیازی به stardic نیست.به نظر من هر دوشون از استاردیک بهترن.golden dict که همه گلاسوری ها رو بدون نیاز به تبدیل (حتی مال بایلون رو) می گیره.mdic هم که باید با یک تبدیل ساده مثل همین که به استار دیک تبدیل می کنید به Mdic تبدیل کنید.
(البته نظر شخصی من بود.)
-
به نظر من هر دوشون از استاردیک بهترن
(البته نظر شخصی من بود.)
نظر شما از نظر من صائب نیست ولی محترمه! سلیقه ها و نظرات همیشه فرق می کنه ;)
-
شما ها اصلا به stardic چی کار دارید؟ :D
تا وقتی MDIC و golden dict هستن دیگه نیازی به stardic نیست.به نظر من هر دوشون از استاردیک بهترن.golden dict که همه گلاسوری ها رو بدون نیاز به تبدیل (حتی مال بایلون رو) می گیره.mdic هم که باید با یک تبدیل ساده مثل همین که به استار دیک تبدیل می کنید به Mdic تبدیل کنید.
(البته نظر شخصی من بود.)
جدا از مقایسهٔ خود اپلیکیشنهای دیکشنری (که سلیقهای هست)، فرمت استاردیکت بهترین فرمت برای دیتابیسهای دیکشنری هست واقعاً به نظر من طراحی فوقالعادهای داره که هم نسبتاً ساده هست (نه مثل bgl که complicated هست. فرمت استاردیکت از ترکیب فایل متنی UTF-8 برای دیتا و info، و فایل باینری برای index استفاده میکنه. خودم فرمت استاردیکت رو با مهندسی معکوس در عرض چند ساعت کشف کردم و کد لود کردنش رو با پایتون نوشتم.) و هم سرعت و کارایی خیلی خوبی داره (بخاطر index شدن، و اینکه لازم نیست کل فایل دیتا توی رم لود بشه) (فایل ifo که اطلاعات کلیش هست، فایل dict دیتا هست و فایل idx همون index هست). به همین خاطر فرمت استاردیکت خاطر خودش تبدیل به یه استاندارد شده و خیلی از اپلیکیشنهای دیکشنری (مخصوصاً اونایی که آزاد یا اوپنسورس هستن) از فرمت استاردیکت استفاده میکنن.
بعدش هم stardic نه. stardict
stardic (بدون t) یه دیکشنری مزخرف هست! (از توی مخازن اوبونتو ببینید)
-
سلام.یکم بیستر در مورد stardic و stardict توضیح بدید لطفا.شاید من اشتباهی اون یکی رو نصب کردم ;D
-
سلام.یکم بیستر در مورد stardic و stardict توضیح بدید لطفا.شاید من اشتباهی اون یکی رو نصب کردم ;D
خب هر دوش رو از مخازن اوبونتو نصب کنید! ببینید کدوم کدومه!
-
سلام
کسی میدونه چه فرمانی فثطف قش یشق stardict رنگی میکنه من اینو استفاده کردم ولی جواب نمی دهد
متن مورد نظر <span foreground=\"violet\"> ::)
من حتی این دساور را هم امتحان کردم
<FONT COLOR="#909090">
ولی متنها رنگس نمی شه البته در استاردیکت من حتی آریانپور هم سیاه و سفید هست
-
سلام
ديكشنري فارسي به انگليسي پيشرفته امروز بعد از 1 ماه كار مداوم تمام شد
اين ديتا بيس بر پايه استارديكت هست و از نركيب 4 تا ديتا بيس به وجو د امده بي اشكال نيست 200 هزار كلمه دارد كه معاني انگليسي داراي معني فارسي نيز هستند و اين مورد با عث ميشود در انتخاب كلمه انگليسي دقت يسشتري بشه خرج داد
http://www.4shared.com/file/lTOcWuvg/Farsi_to_English_Advanced.html
اميدوارم دوستان خوششون بياد
اگر كسي توانست يك كمكي كنه متنشو رنگي كنم
-
دست شما درد نکنه! زحمت بسیاری برده اینکار!
-
آقا دم همگی شما ها گرم
عجب حالی دادید به من ;D
رضا جان و سعید جان کارتون حرف نداشت
بهترین ویژگیش که من حاضر نیستم با ۱۰۰ تا بابیلون عوض کن تلفظشه که تلفظ انسان واقعیه هست نه ماشین
-
رضاجان دستت درد نکنه،ولی چرا از فرمت غیرآزاد rar استفاده کردی؟
-
رضاجان دستت درد نکنه،ولی چرا از فرمت غیرآزاد rar استفاده کردی؟
من ويندوز كار هستم ولي ابونتو اي ها را دوست دارم :D
-
خب تو همون ویندوز نمیشد با با 7z ذخیره کنیش؟
-
بهترین ویژگیش که من حاضر نیستم با ۱۰۰ تا بابیلون عوض کن تلفظشه که تلفظ انسان واقعیه هست نه ماشین
میشه لطف کنید یه توضیحی بدید، منظورتون کدوم تلفظه؟ (و با چه دیکشنری؟ استاردیکت، گلدندیکت، ...) تلفظ (اون هم با صدای انسان) مستلزم دانلود تعداد زیادی (به تعداد کلمات) قایلهای صوتیه، درسته؟
-
بهترین ویژگیش که من حاضر نیستم با ۱۰۰ تا بابیلون عوض کن تلفظشه که تلفظ انسان واقعیه هست نه ماشین
میشه لطف کنید یه توضیحی بدید، منظورتون کدوم تلفظه؟ (و با چه دیکشنری؟ استاردیکت، گلدندیکت، ...) تلفظ (اون هم با صدای انسان) مستلزم دانلود تعداد زیادی (به تعداد کلمات) قایلهای صوتیه، درسته؟
دقیقا درسته
من نمیدونم طرف ( البته هم آقاهه هم خانومه ) چه حوصله ای داشتن که اینقدر کلمه رو تلفظ کردن
21059 تا فایل برای تلفظه ;D
برای استاردیکت و من روی بقیه تست نکردم
کافیه اکستراکتش کنید و فولدر مورد نظر که اسمش WyabdcRealPeopleTTS هست رو توی فولدر usr/share/ کپی کنید
اینم لینک فایل فشرده
http://sourceforge.net/projects/stardict/files/WyabdcRealPeopleTTS/2.1.0/WyabdcRealPeopleTTS.tar.bz2/download
-
بسیار عالی، در Goldendict هم کار میکنه. کافیه یه جا اکسترکت بشه و نشانی پوشه رو به برنامه در در sound dir (در تنظیمات دیکشنریها) معرفی کنید.
سپاس!
-
از زحمات دوستان سپاسگزارم،
فقط یه موردی بود، امکانش هست این دیتابیس هاتون رو، با فرمت XML هم منتشر کنید؟
-
بهترین ویژگیش که من حاضر نیستم با ۱۰۰ تا بابیلون عوض کن تلفظشه که تلفظ انسان واقعیه هست نه ماشین
میشه لطف کنید یه توضیحی بدید، منظورتون کدوم تلفظه؟ (و با چه دیکشنری؟ استاردیکت، گلدندیکت، ...) تلفظ (اون هم با صدای انسان) مستلزم دانلود تعداد زیادی (به تعداد کلمات) قایلهای صوتیه، درسته؟
دقیقا درسته
من نمیدونم طرف ( البته هم آقاهه هم خانومه ) چه حوصله ای داشتن که اینقدر کلمه رو تلفظ کردن
21059 تا فایل برای تلفظه ;D
برای استاردیکت و من روی بقیه تست نکردم
کافیه اکستراکتش کنید و فولدر مورد نظر که اسمش WyabdcRealPeopleTTS هست رو توی فولدر usr/share/ کپی کنید
اینم لینک فایل فشرده
http://sourceforge.net/projects/stardict/files/WyabdcRealPeopleTTS/2.1.0/WyabdcRealPeopleTTS.tar.bz2/download
البته دوستان توجه کنید که از فرمان Play واسه اجرای فایل های wav استفاده میکنه، که تو سیستم من نصب نبود.
واسه این که تلفظ کنه این فایل ها رو بهتره این برنامه Sox رو با فرمان زیر نصب کنید.
sudo apt-get install sox
موفق باشید
-
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد (http://barnamenevis.org/forum/showthread.php?p=1090744&posted=1#post1090744) رو از exe به xml و بعدش به StarDict تبدیل کردم.
StarDict - Rich Text (http://dl.dropbox.com/u/3154538/dic/Open%20Dictionary%20aka%20QueerDick-2010-09-28-rich.tar.gz)
StarDict - Plain Text (http://dl.dropbox.com/u/3154538/dic/Open%20Dictionary%20aka%20QueerDick-2010-09-28.tar.gz)
Tabfile - Rich Text (http://dl.dropbox.com/u/3154538/dic/Arianpur-OpenDictionary-2010-09-28-rich.txt.gz)
Tabfile - Plain Text (http://dl.dropbox.com/u/3154538/dic/Arianpur-OpenDictionary-2010-09-28.txt.gz)
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثالهای انگلیسی و فارسی همه با رنگهای مختلف و فرمتبندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارتهای ورودی رو lowercase کنیم این مشکل حل میشه ولی مخففها شکل زشتی پیدا میکنن)
اینم Tabfile یا همون txt:
البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهمنویسیها، همزههای زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «مینویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضیهاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متنهای فارسی (چه توی وب و چه توی گلاسریهای مختلف) از از غلطها زیاد دارن و باعث میشه پردازشهای کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسریهای فارسی رو هم دستی ویرایش کرد (تازه برای ورژنهای جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازیکاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژهای رو شروع میکنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارتهای regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمعها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شبها میتونم روی پروژههای شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی میطلبه.
اول اگر امکان داره فایلها رو تو گوگل داک آپلود کنید
دوم اینکه فایلی که شما تبدیل کردید رو خواستم به فرمت txt تبدیل کنم پایگلاسری کنم ارور داد چرا؟
کاش آخرین نسخه رو تو سایت می گذاشتید
-
اول اگر امکان داره فایلها رو تو گوگل داک آپلود کنید
توی سورسفورج گذاشتم
http://sourceforge.net/projects/pyglossary/files/dic/English-Persion
دوم اینکه فایلی که شما تبدیل کردید رو خواستم به فرمت txt تبدیل کنم پایگلاسری کنم ارور داد چرا؟
با آخرین ورژن PyGlossary تست کنید، و متن ارورش رو هم پیست کنید.
-
سلام دوستان
میشه گلاسری عربی به فارسی و فارسی به عربی که تو لینک زیر موجودرو به تکست تبدیل کنید؟این برنامه رو ubuntu نشد نصب کنم
http://barnamenevis.org/showthread.php?248286-%D8%AF%DB%8C%D8%AA%D8%A7-%D8%A8%DB%8C%D8%B3-%D8%A7%D9%86%D9%88%D8%A7%D8%B9-%D8%AF%DB%8C%DA%A9%D8%B4%D9%86%D8%B1%DB%8C-%D9%87%D8%A7-%D8%A8%D9%87-%D9%81%D8%A7%D8%B1%D8%B3%DB%8C
-
میشه گلاسری عربی به فارسی و فارسی به عربی که تو لینک زیر موجودرو به تکست تبدیل کنید؟این برنامه رو ubuntu نشد نصب کنم
PyGlossary رو نتونستید نصب کنید؟ این برنامه اصلاً نیازی به نصب نداره. فایل tar.gz رو از اینجا دانلود کنید:
https://sourceforge.net/projects/pyglossary/files/pyglossary/2010.10.03/pyglossary-2010.10.03.tar.gz/download
و extract کنید، بعد فایل pyglossary.sh داخلش رو اجرا کنید (توی ترمینال drag and drop کنید، یا فایل رو open with bash کنید، یا یه آیکون براش درست کنید روی پنل...
-
کشیدمش انداختمش تو ترمینال و کوتیشناشو برداشتم اما اجرا نشد میگه مجوز نداری
-
کشیدمش انداختمش تو ترمینال و کوتیشناشو برداشتم اما اجرا نشد میگه مجوز نداری
توی ترمینال قبل از مسیرش یه bash فاصله بذار.
یا اینکه از راست کلیک فایل open with bash کن.
یا اینکه توی Properties فایل تب Permissions مجوز اجراش رو تیک بزن.
-
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!
-
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!
چک میکنم ببینم اشکالش چیه. ولی کلاً بهتره به tabfile تبدیل کنید و بعد خودتون با یه ادیتو (مثل gedit یا vim یا emacs ) ادیت کنید. بعد که ادیت تموم شده دوباره از tabfile به هر فرمتی که خواستید تبدیل کنید.
-
کاش خروجی ترمینال رو میذاشتید. مثلاً ممکنه بخاطر مشکل encoding اینطوری شده باشه. (در اینصورت باید لینک دانلود گلاسری رو بهم بدید تا چک کنم)
-
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
این باگ بود که برطرف کردم.
اگه از اینجا دانلود کنید درست میشه:
https://github.com/ilius/pyglossary
-
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
این باگ بود که برطرف کردم.
اگه از اینجا دانلود کنید درست میشه:
https://github.com/ilius/pyglossary
-
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!
اوه! با text editor چه نوع گلاسری رو باز کردید؟ اون فقط فایل متنی ساده رو باز میکنه (فایلهای txt و مثلاً فایل tabfile که اونم txt هست)
که باز میگم، بهتره از gedit استفاده کنید...
-
این سایته که دادین چقد قاطی پاتیه!!! از کجاش آخرین ورژنو دانلود کنم؟
:'(
-
این سایته که دادین چقد قاطی پاتیه!!! از کجاش آخرین ورژنو دانلود کنم؟
:'(
سمت راست یه دکمهٔ دانلود داره...
این لینک مستقیم: https://github.com/ilius/pyglossary/tarball/master
-
من رفتم تو سایت فقط به عالم نوشته زیر هم اونم سمت چپ اومده بود اصلا عکس نداشت سایت سمت راستم نداشت!! :o ](*,) از لینکتون ممنون
-
:'( :'( :'(اینم میزنم یه چیزی میاد میزنم کانتینیو اما هیچی نمیشه :'( :'(
-
آخرین ورژنو میشه ی جا آپلود کنین؟ اونو نمیشه دانلود کرد :'(
-
سلام به همه ی دوستان
متاسفانه هر قدر سعی کردم تا دیکشنری انگلیسی به انگلیسی بابیلون را که لینک دانلودش را در زیر قرار می دهم به StarDict با MDict تبدیل کنم راهی پیدا نشد.
با ابزار convdict فونوتیک ها درست ثبت نمی شه با pyGlossary هم یه سری کد های غلط ایجاد میشه که توی خونده شدن مشکل ایجاد میکنه.
کسی نظری نداره
و البته در مورد این دیکشنری با ۱۶۲۰۰۴ لغت به نوعی کامل و ترجمه های سلیس و روان و ساده ای داره که با فونوتک ها تقریبا می تونه اکثر نیاز ها از ابتدایی تا بالا تر از متوسطه را حل کنه.
ممنون
لینک دانلود Babylon English (http://dl.softgozar.com/Files/Software/Babylon_Glossary_English_to_English_softgozar.com.exe/)
-
آخرین ورژن PyGlossary رو از اینجا بگیرید و باهاش تبدیل به StarDict کنید
https://github.com/ilius/pyglossary/tarball/master
-
سلام دوستان.
دیتابیس این دیگشنری ها (مثل بابیلون یا بلودیکت یا استاردیکت) رایگانن؟!
منظورم اینه که اگر دیگشنری این برنامه هارو تبدیل کنم به دیتابیس دیگه ای و استفاده کنم غیر قانونیه؟!
حق کپی رایتشون چطوریه؟
-
آخرین ورژن PyGlossary رو از اینجا بگیرید و باهاش تبدیل به StarDict کنید
https://github.com/ilius/pyglossary/tarball/master
بسیار متشکرم آقای سعید رسولی بابت لینک آپدیت Pyglossary. به دردم خورد, سلامت باشی و موفق ;) :)