انجمن‌های فارسی اوبونتو

لطفاً به انجمن‌ها وارد شده و یا جهت ورود ثبت‌نام نمائید

لطفاً جهت ورود نام کاربری و رمز عبورتان را وارد نمائید




نویسنده موضوع: گلاسری انگلیسی به فارسی برای استاردیک  (دفعات بازدید: 58827 بار)

0 کاربر و 11 مهمان درحال مشاهده موضوع.

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #15 : 24 شهریور 1389، 09:56 ق‌ظ »
امیرجان این گلوساری هست؟ من از استاردیکت استفاده می کنم و البت گلوساری های نمی دونم چی چی رو هم براش تبدیل کردم خیلی وقت پیش! که البت بدک هم نیست.
فرق این با گلوساری های بابیلون چیه؟
اگه فایل رو دانلود کنید (یا فقط به اسم فایل نگاه کنید) می‌بینید که h8.txt.bz2 هست، bz2 که مشخصه فشرده شده، txt هم یعنی فایل متنی یا دقیق‌تر بگیم Tabfile که اگه این فایل رو بدید به PyGlossary (حتی بدون extract کردن یعنی همون txt.bz2) می‌تونه مستقیم به هر فرمتی که بخواید (از جمله StarDict) تبدیل کنه.


راستی اون دیکشنری Open_Dictionary (که انگلیسی به فارسی و فارسی به انگلیسی هست و خیلی هم کامله) توی ویندوز  :!: نصب کردم و به xml تبدیل کردم. حالا اگه فرصت بشه می‌تونم اون xml رو به یه فرمت درست و حسابی (مثل Tabfile یا StarDict) تبدیل کنم و بدم دوستان استفاده کنن. اما تا حالا فرصت نشده اسکریپت تبدیلش رو کامل کنم. در ضمن غلطهای نگارشی هم خیلی زیاد داره که سعی می‌کنم درست کنم.

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: گلاسری انگلیسی به فارسی برای استار&
« پاسخ #16 : 29 شهریور 1389، 03:33 ب‌ظ »
گلاسری های دیکشنری استاردیک برای فارسی به

 http://forum.ubuntu.ir/index.php/topic,15461.0.html
« آخرین ویرایش: 30 شهریور 1389، 11:27 ب‌ظ توسط reza1615 »

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #17 : 30 شهریور 1389، 09:35 ب‌ظ »
سلام
یک خبر عالی بعد n  ساعت انتظار بالاخره فایل xml  را تبدیل کردم به اکسل
این هم لینکش

http://www.4shared.com/file/DFjdi6DC/persian_english.html

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: پاسخ به: دیتا بیس برای دیکشنری های لینوکس
« پاسخ #18 : 30 شهریور 1389، 11:42 ب‌ظ »
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم

https://sourceforge.net/projects/glossary-fa/

نظر تون چیه؟

این فقط نسخه stardict رو گذاشتم
سلام
امكانش هست تبديل شدشو هم بگذاريد چون من ويندوز دارم و سي دي لايو هم گيرم نيامد !

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #19 : 31 شهریور 1389، 07:56 ق‌ظ »
من هم اشکال نسخه قبلی رو رفع کردم و یک صفحه مستقل هم درست کردم

https://sourceforge.net/projects/glossary-fa/

نظر تون چیه؟

این فقط نسخه stardict رو گذاشتم
سلام
امكانش هست تبديل شدشو هم بگذاريد چون من ويندوز دارم و سي دي لايو هم گيرم نيامد !

به چه فرمت تبدیل می خواهی؟
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #20 : 31 شهریور 1389، 10:50 ق‌ظ »
سلام
لطفا استارديكت براي آيفن ميخواهم مانند هموني كه آقاي رسولي واسه ايتاليايي لطف كردند

آفلاین امیرمهری

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • درورد بر اوبونتو
پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک
« پاسخ #21 : 31 شهریور 1389، 12:41 ب‌ظ »
دانلود پیش فرض رو تغییر دادم و از همون جا می تونی دانلود کنی
خداحافظ وبلاگ نويسي

من كاربر حرفه اي لينوكس نيستم
فقط خوب جستجو ميكنم.

آفلاین reza1615

  • Jr. Member
  • *
  • ارسال: 32
پاسخ به: گلاسری انگلیسی به فارسی برای استار&
« پاسخ #22 : 05 مهر 1389، 11:15 ب‌ظ »
سلام دوستان
من ديكشنري فارسي به انگليسي mdm  را به فايل اكسل تبديل كرد و بعد از كلي تميز كاري به يك مشكل كمي بزرگ  ;D برخورد كردم
اون هم اين هست كه اين ديكشنري هاي فارسي بر اساس ترجمه انگليسي تبديل شده اند و متاسفانه هنگام سرچ خوب جواب نمي دهند و دامنه لغت 120000 تايش بيش از 5000 تا به نظر نمي رسد مثلا
كلمه pacificism  = آيئن احتراز از جنگ
fud  =  آدم امل
magnifico = آدم با وقار
اگر فايل را چك كنيد حدود 100 تا كلمه با آدم شروع ميشه !!!! در صورتي كه بهتر بود
با وقار (آدم) باشه يا سرچ دو واژه اي يعني" آدم" در يك ستون ديگه باشه تا سرچ كلمه " با وقار" درست در بياد چ.مد تا مثال ديگر:
آدم دزد  :D   آدم لجوج ..... در جاي ديگر 450 كلمه با كلمه "با " شروع شده 
با برق كشتن .  با بشاشت . با بغض شديد گريستن....... ](*,)
در مورد فرهنگ آريانپور فارسي يه انگليسي اون هم وضعيت بهتري نداره  ???  معاني انگليسيش درجه دو و سه هستند اين فرهنگ بهتره!  خلاصه.....
من شروع كردم به اديت كردن حدود 12000 كلمه را اديت كردم  ::)
تعداد لغات كلا 120000 تا هست اگر دوستان لطف كنند هر نفر 10 -20 هزار  تا را قبول كنند  زود تمام بشه و همگي استفادشو ببريم- زياد وقت نمي گيره ولي من وقتم كمه :(  من براي اين 12000 تا 3-4 ساعت وقت گذاشتم
فقط اگر كسي خواست كمك كنه روي همين صفحه. بگه از چه شماره تا چه شماره اي را انجام ميدهد تا دوبار كاري نشه
من نمونه اش را در 12000 اول كار كردم و فرمتش هم لطفا به هم نريزيد  :oops: به نظر من بهتر مانند انگليسي جاي صفت و اسم را در جاهايي كه مفهوم به هم نريزد عوض كنيم در ضمن كلماتي را كه از ابتدا لغات حذف ميكنيد در ستون جلو قرار دهيد تا بر اساس اونها هم بشود سرچ كرد
فقط حروفي كه منفي كننده هستند را به صورت (....) به خود لغت اضافه ميكنيم تا معني تغيير نكند مثلا كلملت زير
بدون توضيج ---> توضيح (بدون)    و در ستون جلو ------>  بدون(منفي)
بدون جنگ-----> جنگ (بدون)     علت اين كار هم اين هست كه به نظر من تاكيد روي جنگ هست تا كلمه بدون كه 1000 با تكرار شده...
در ضمن يك خبر خوب به اسكريپت نويسي در اكسل مسلط شده ام و بر اساس اون ميخواهم ديكشنري فارسي بع انگليسي آريانپور را هم به مجموعه اضافه كنم تا ايشالا مجموعه كاملي داشته باشيم  \\:D/
فايل  http://www.4shared.com/file/8zpjKGBd/farsi_to_english_dic_-_Copy.html
« آخرین ویرایش: 05 مهر 1389، 11:24 ب‌ظ توسط reza1615 »

آفلاین eMan

  • High Hero Member
  • *
  • ارسال: 1366
  • جنسیت : پسر
رضا جان کارت عالیه برادر
جهت تماس با بنده یا از طریق فروم آرچ و یا از طریق وبلاگ آرچ بوک و یا از طریق ایمیل با بنده تماس بگیرید

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
پاسخ به: گلاسری انگلیسی به فارسی برای استار&
« پاسخ #24 : 06 مهر 1389، 01:18 ب‌ظ »
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد رو از exe به xml و بعدش به StarDict تبدیل کردم.
StarDict - Rich Text
StarDict - Plain Text
Tabfile - Rich Text
Tabfile - Plain Text
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثال‌های انگلیسی و فارسی همه با رنگ‌های مختلف و فرمت‌بندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارت‌های ورودی رو lowercase کنیم این مشکل حل میشه ولی مخفف‌ها شکل زشتی پیدا می‌کنن)
اینم Tabfile یا همون txt:


البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهم‌نویسی‌ها، همزه‌های زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «می‌نویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضی‌هاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متن‌های فارسی (چه توی وب و چه توی گلاسری‌های مختلف) از از غلطها زیاد دارن و باعث میشه پردازش‌های کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسری‌های فارسی رو هم دستی ویرایش کرد (تازه برای ورژن‌های جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازی‌کاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژه‌ای رو شروع می‌کنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارت‌های regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمع‌ها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شب‌ها می‌تونم روی پروژه‌های شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی می‌طلبه.
« آخرین ویرایش: 06 مهر 1389، 04:31 ب‌ظ توسط سعید رسولی (ilius) »

آفلاین eMan

  • High Hero Member
  • *
  • ارسال: 1366
  • جنسیت : پسر
سعید جان واقعا کارت حرف نداره
این دیکشنری خودش یه منبعیه برای یاد گیری زبان با اون همه مثال های جورواجورش
دستت درد نکنه
جهت تماس با بنده یا از طریق فروم آرچ و یا از طریق وبلاگ آرچ بوک و یا از طریق ایمیل با بنده تماس بگیرید

آفلاین ریچارد استالمن بزرگ!

  • High Sr. Member
  • *
  • ارسال: 694
  • جنسیت : پسر
  • انا المسموم ما عندی به تریاق ولا راقی !
    • بازاریابی چریکی و کسب درامد اینترنتی
بدانلودیدم تا بتستم
هر آنچ باشد تلاش شما دست مریزاد داره ;)
من نباید چیزى باشم که تو می خواهى ، من را خودم از خودم ساخته ام، تو را دیگرى باید برایت بسازد و منى که من از خود ساخته ام،آرزوهای من است ،تویى که تو از من می سازى کمبودهایت هستند.
----
ده نکته در استفاده از لینوکس یا آنتی ویندوز!

آفلاین سعید رسولی

  • ilius, saeedgnu
  • عضو کاربران ایرانی اوبونتو
  • *
  • ارسال: 1543
  • جنسیت : پسر
اوه ببخشید. اون فایل‌هایی که گذاشتم Plain Text بود (رنگ و italic و اینا نداشت، نگ‌ها اشتباهی حذف شده بود)
دوباره آپلود می‌کنم پست رو ویرایش می‌کنم.

آفلاین shervinkh

  • Full Member
  • *
  • ارسال: 197
  • جنسیت : پسر
  • An ENFP
    • سایت شخصی
شما ها اصلا به stardic چی کار دارید؟ :D
تا وقتی MDIC و golden dict هستن دیگه نیازی به stardic نیست.به نظر من هر دوشون از استاردیک بهترن.golden dict که همه گلاسوری ها رو بدون نیاز به تبدیل (حتی مال بایلون رو) می گیره.mdic هم که باید با یک تبدیل ساده مثل همین که به استار دیک تبدیل می کنید به Mdic تبدیل کنید.

(البته نظر شخصی من بود.)
Gentoo KDE x86_64
Notebook:Asus N53SN
www.shervin.org

آفلاین ریچارد استالمن بزرگ!

  • High Sr. Member
  • *
  • ارسال: 694
  • جنسیت : پسر
  • انا المسموم ما عندی به تریاق ولا راقی !
    • بازاریابی چریکی و کسب درامد اینترنتی
به نظر من هر دوشون از استاردیک بهترن
(البته نظر شخصی من بود.)
نظر شما از نظر من صائب نیست ولی محترمه! سلیقه ها و نظرات همیشه فرق می کنه ;)
من نباید چیزى باشم که تو می خواهى ، من را خودم از خودم ساخته ام، تو را دیگرى باید برایت بسازد و منى که من از خود ساخته ام،آرزوهای من است ،تویى که تو از من می سازى کمبودهایت هستند.
----
ده نکته در استفاده از لینوکس یا آنتی ویندوز!