انجمن‌های فارسی اوبونتو

لطفاً به انجمن‌ها وارد شده و یا جهت ورود ثبت‌نام نمائید

لطفاً جهت ورود نام کاربری و رمز عبورتان را وارد نمائید




نویسنده موضوع: گلاسری انگلیسی به فارسی برای استاردیک  (دفعات بازدید: 58816 بار)

0 کاربر و 3 مهمان درحال مشاهده موضوع.

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
قبلا من یک فایلی درست کرده بودم و درخواست کردم بودم که با مشارکت دوستان و کاربران این گلاسری فرهنگ لغت آریان پور تهیه بشود
ولی تعداد محدودی موافق بودند ولی چند نفر خودشان بدون اعلام آمادگی و هماهنگی این کار را انجام دادند
من هم فایل ناقص را پاک کردم
و این پست را اصلاح کردم
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد رو از exe به xml و بعدش به StarDict تبدیل کردم.

http://sourceforge.net/projects/pyglossary/files/dic/English-Persion
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثال‌های انگلیسی و فارسی همه با رنگ‌های مختلف و فرمت‌بندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارت‌های ورودی رو lowercase کنیم این مشکل حل میشه ولی مخفف‌ها شکل زشتی پیدا می‌کنن)
اینم Tabfile یا همون txt:


البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهم‌نویسی‌ها، همزه‌های زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «می‌نویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضی‌هاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متن‌های فارسی (چه توی وب و چه توی گلاسری‌های مختلف) از از غلطها زیاد دارن و باعث میشه پردازش‌های کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسری‌های فارسی رو هم دستی ویرایش کرد (تازه برای ورژن‌های جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازی‌کاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژه‌ای رو شروع می‌کنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارت‌های regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمع‌ها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شب‌ها می‌تونم روی پروژه‌های شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی می‌طلبه.
« آخرین ویرایش: 20 شهریور 1394، 02:47 ب‌ظ توسط امیرمهری »
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #1 : 25 خرداد 1388، 06:22 ق‌ظ »
من مدتی هست که روی دیتابیس دیکشنری بایبلون کار می کردم البته اقای illius هم خیلی به من لطف کردند
این ها رو هم تست کردم شما هم تست کنید اگر مشکلی داشت حتما رفع می کنم ( با اینکه مشغله زیادی دارم)
برای تبدیل هم از برنامه pyglossary استفاده کرده ام

 برای دیکشنری StarDict
ftp://download.ospdev.net/glossary-pywork/05-L7mdic/L7englishtofarsi/h7.m2.tar.bz2

برای دیکشنری xFarDic
ftp://download.ospdev.net/glossary-pywork/05-L7xFarDic/L7englishtofarsi/h7.xdb.tar.bz2

برای دیکشنری mdic
ftp://download.ospdev.net/glossary-pywork/05-L7mdic/L7englishtofarsi/h7.m2.tar.bz2

این هم فایل متنی که منبع کار من بود .Tabfile
ftp://download.ospdev.net/glossary-pywork/05-L7Tabfile/L7-englishtofarsi/h7.txt.tar.bz2

من لغت نامه hFarsi - advanced version رو از سایت بابیلون گرفتم و با برنامه مذکور به tabfile تبدیل کردم و
یک سری اصلاحات انجام دادم و حدود 200 اصطلاح و نمونه جمله اضافه کرده ام

ای کاش دوستان همت می کردند و هر کسی فقط یک صفحه از فرهنگ لغت آریان پور جیبی را در مدت یک هفته قبول می کرد و اگر تعداد به بیشتر از 30 نفر برسد حتما در کمتر از 3 ماه یک لغت نامه کامل بدست می آمد.
موفق باشید :)

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #2 : 26 خرداد 1388، 09:59 ق‌ظ »
ارادت من اقای illius
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #3 : 10 شهریور 1389، 03:41 ب‌ظ »
ای کاش دوستان همت می کردند و هر کسی فقط یک صفحه از فرهنگ لغت آریان پور جیبی را در مدت یک هفته قبول می کرد و اگر تعداد به بیشتر از 30 نفر برسد حتما در کمتر از 3 ماه یک لغت نامه کامل بدست می آمد.
سلام

يك زحمت براي دوستان
من اين گلاسري هاي بابيلون را دارم (ايتاليايي به فارسي و برعكس) كه در بابيلون ويندوز كاملا جواب ميده ولي هنگام تبديل ارور ميدهد كسي مي دونه چطور ميشه اين فايل را تبديل كرد با ناشر هم تماس گرفتم جواب نداد گويا در دسترس نيست
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
« آخرین ویرایش: 16 شهریور 1389، 06:53 ب‌ظ توسط reza1615 »

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #4 : 11 شهریور 1389، 10:46 ق‌ظ »
ممنون ازاینکه لینک گلاسری رو تو این تاپیک گذاشتید
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین HaajAli

  • Newbie
  • *
  • ارسال: 3
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #5 : 11 شهریور 1389، 06:52 ب‌ظ »
سلام امیر جان
حالا که تاپیک ۱ سال پیش زنده شده اون لینک های پست اولی روهم اگه زحمتی نیست اصلاح کن.
بدرد میخورن ‌. ممنون ;)
Just Impossible Is Impossible

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #6 : 13 شهریور 1389، 11:04 ق‌ظ »
متاسفانه خود من هم فایل ها رو ندارم و طی یک عملیاتی بیشتر اطلاعات پرید
ولی منتظر خبر خوب باشید
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #7 : 13 شهریور 1389، 06:54 ب‌ظ »
سلام
لطفا يك  فكري هم به حال گلاسري هاي من بكنيد خيلي برام لازم هست من دانشجو هستم و به اين ديكشنري ها نياز دارم

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #8 : 15 شهریور 1389، 11:44 ق‌ظ »
لينك گلاسري ديكشنري شش جلدي انگليسي به فارسي آريانپور براي بابيلون با 75000 كلمه همراه با مثال و رنگي
http://www.4shared.com/file/SQYsjcrD/Open_Dictionary_for_Babylon.html
فایل bdc رو نمیشه تبدیل کرد!!! لطفاً فایل bgl رو بذارید!
« آخرین ویرایش: 15 شهریور 1389، 11:46 ق‌ظ توسط سعید رسولی (ilius) »

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #9 : 15 شهریور 1389، 09:24 ب‌ظ »
سلام

من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
« آخرین ویرایش: 16 شهریور 1389، 06:54 ب‌ظ توسط reza1615 »

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #10 : 16 شهریور 1389، 09:10 ق‌ظ »
من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
http://up.iranblog.com/Files7/0c8f475395a14f22882f.zip

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #11 : 16 شهریور 1389، 12:54 ب‌ظ »
من مشكلم اين دوتا ديكشنري ايتاليايي هست كه اصلا كسي تا حالا اينها را تبديل نكرده :(
اگر ميشه واسم تبديل كنيد متاسفانه هنگام تبديل ارور ميده و فونت فارسي به هم ميريزه
http://www.4shared.com/file/R6LiloAF/Babylon_persian_italian.html
http://www.4shared.com/file/03syAjot/Babylon_Italian_Persian.html
http://up.iranblog.com/Files7/0c8f475395a14f22882f.zip
\\:D/
اميدوارم در زندگي هميشه موفق بشيد لطف و كمك بزرگي به من كرديد عالي بود امكانش هست ماهيگيري (روش تبديل فايل )را به من هم ياد بديد البته تحت ويندوز :)
اين را هم ببينيد
http://www.i-phone.ir/forums/thread18527-3.html
« آخرین ویرایش: 16 شهریور 1389، 01:05 ب‌ظ توسط reza1615 »

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #12 : 16 شهریور 1389، 01:34 ب‌ظ »
\\:D/
اميدوارم در زندگي هميشه موفق بشيد لطف و كمك بزرگي به من كرديد عالي بود امكانش هست ماهيگيري (روش تبديل فايل )را به من هم ياد بديد البته تحت ويندوز :)
اين را هم ببينيد
http://www.i-phone.ir/forums/thread18527-3.html

خواهش می‌کنم.
نه متاسفانه فعلا میسر نیست! این گلاسری‌ها مشکل encoding داشتن، و فقط با ورژن آتی (منتشر نشدهٔ) برنامهٔ خودم (PyGlossary) تبدیل میشه! در ضمن PyGlossary رو هم برای لینوکس نوشتم و اجراش توی ویندوز کم‌دردسر نیست (البته اخیراً تست نکردم سعی می‌کنم اگه وقت کردم تست کنم...)
البته به ندرت از گلاسری‌های bgl هست که اینطوری باشه یعنی مشکل encoding داشته باشه (با این دو تا فکر کنم حدود چهار پنج تا دیدم تا بحال. که اونم توی همین چند ماه اخیر داشتم روشون کار می‌کردم). بقیه‌ش رو قبلا هم میشد با PyGlossary و ابزارهای دیگه مثل dictconv و stardict-editor اجرا کرد، البته همشون برای لینوکس هستن! (ولی ممکنه بتونید توی ویندوز هم اجرا کنید)
« آخرین ویرایش: 16 شهریور 1389، 01:41 ب‌ظ توسط سعید رسولی (ilius) »

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #13 : 23 شهریور 1389، 02:58 ب‌ظ »
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم

https://sourceforge.net/projects/glossary-fa/

نظر تون چیه؟

این فقط نسخه stardict رو گذاشتم
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین ریچارد استالمن بزرگ!

  • High Sr. Member
  • *
  • ارسال: 694
  • جنسیت : پسر
  • انا المسموم ما عندی به تریاق ولا راقی !
    • بازاریابی چریکی و کسب درامد اینترنتی
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #14 : 24 شهریور 1389، 12:43 ق‌ظ »
امیرجان این گلوساری هست؟ من از استاردیکت استفاده می کنم و البت گلوساری های نمی دونم چی چی رو هم براش تبدیل کردم خیلی وقت پیش! که البت بدک هم نیست.
فرق این با گلوساری های بابیلون چیه؟
من نباید چیزى باشم که تو می خواهى ، من را خودم از خودم ساخته ام، تو را دیگرى باید برایت بسازد و منى که من از خود ساخته ام،آرزوهای من است ،تویى که تو از من می سازى کمبودهایت هستند.
----
ده نکته در استفاده از لینوکس یا آنتی ویندوز!