نویسنده موضوع: گلاسری انگلیسی به فارسی برای استاردیک (دفعات بازدید: 71651 بار)

امیرمهری

نقل‌قول از: سعید رسولی (ilius) در 06 مهر 1389، 01:18 ب‌ظ

ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد رو از exe به xml و بعدش به StarDict تبدیل کردم.
StarDict - Rich Text
StarDict - Plain Text
Tabfile - Rich Text
Tabfile - Plain Text
Rich Text یعنی رنگ و italic و اینا داره
این گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثال‌های انگلیسی و فارسی همه با رنگ‌های مختلف و فرمت‌بندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارت‌های ورودی رو lowercase کنیم این مشکل حل میشه ولی مخفف‌ها شکل زشتی پیدا می‌کنن)
اینم Tabfile یا همون txt:

البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهم‌نویسی‌ها، همزه‌های زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)
چند مثال:
می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «می‌نویسم» نوشته بشه.
دیکشنری ها ==> دو کلمه: دیکشنری و ها
دیکشنری های ==> دوکلمه: دیکشنری و های
انتهاء ==> انتها
و خیلی غلطهای دیگه که بعضی‌هاش رو فعلاً توی این گلاسری دستی درست کردم.
ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متن‌های فارسی (چه توی وب و چه توی گلاسری‌های مختلف) از از غلطها زیاد دارن و باعث میشه پردازش‌های کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسری‌های فارسی رو هم دستی ویرایش کرد (تازه برای ورژن‌های جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازی‌کاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.
دارم پروژه‌ای رو شروع می‌کنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارت‌های regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمع‌ها و کلمات مرکب رو تشخیص بده...
ولی متاسفانه چون شاغل هستم معمولاً فقط شب‌ها می‌تونم روی پروژه‌های شخصی کار کنم.
اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی می‌طلبه.

اول اگر امکان داره فایلها رو تو گوگل داک آپلود کنید
دوم اینکه فایلی که شما تبدیل کردید رو خواستم به فرمت txt تبدیل کنم پایگلاسری کنم ارور داد چرا؟
کاش آخرین نسخه رو تو سایت می گذاشتید

سعید رسولی

نقل‌قول از: امیرمهری در 11 اردیبهشت 1390، 09:27 ق‌ظ

اول اگر امکان داره فایلها رو تو گوگل داک آپلود کنید

توی سورس‌فورج گذاشتم
http://sourceforge.net/projects/pyglossary/files/dic/English-Persion

نقل‌قول از: امیرمهری در 11 اردیبهشت 1390، 09:27 ق‌ظ

دوم اینکه فایلی که شما تبدیل کردید رو خواستم به فرمت txt تبدیل کنم پایگلاسری کنم ارور داد چرا؟

با آخرین ورژن PyGlossary تست کنید، و متن ارورش رو هم پیست کنید.

benyamin_pc · « **پاسخ #47 :** 08 خرداد 1390، 11:04 ب‌ظ »

سلام دوستان
میشه گلاسری عربی به فارسی و فارسی به عربی که تو لینک زیر موجودرو به تکست تبدیل کنید؟این برنامه رو ubuntu نشد نصب کنم
http://barnamenevis.org/showthread.php?248286-%D8%AF%DB%8C%D8%AA%D8%A7-%D8%A8%DB%8C%D8%B3-%D8%A7%D9%86%D9%88%D8%A7%D8%B9-%D8%AF%DB%8C%DA%A9%D8%B4%D9%86%D8%B1%DB%8C-%D9%87%D8%A7-%D8%A8%D9%87-%D9%81%D8%A7%D8%B1%D8%B3%DB%8C

سعید رسولی · « **پاسخ #48 :** 09 خرداد 1390، 09:53 ق‌ظ »

نقل‌قول از: benyamin_pc در 08 خرداد 1390، 11:04 ب‌ظ

میشه گلاسری عربی به فارسی و فارسی به عربی که تو لینک زیر موجودرو به تکست تبدیل کنید؟این برنامه رو ubuntu نشد نصب کنم

PyGlossary رو نتونستید نصب کنید؟ این برنامه اصلاً نیازی به نصب نداره. فایل tar.gz رو از اینجا دانلود کنید:
https://sourceforge.net/projects/pyglossary/files/pyglossary/2010.10.03/pyglossary-2010.10.03.tar.gz/download
و extract کنید، بعد فایل pyglossary.sh داخلش رو اجرا کنید (توی ترمینال drag and drop کنید، یا فایل رو open with bash کنید، یا یه آیکون براش درست کنید روی پنل...

benyamin_pc · « **پاسخ #49 :** 09 خرداد 1390، 10:54 ق‌ظ »

کشیدمش انداختمش تو ترمینال و کوتیشناشو برداشتم اما اجرا نشد میگه مجوز نداری

سعید رسولی · « **پاسخ #50 :** 10 خرداد 1390، 03:35 ب‌ظ »

نقل‌قول از: benyamin_pc در 09 خرداد 1390، 10:54 ق‌ظ

کشیدمش انداختمش تو ترمینال و کوتیشناشو برداشتم اما اجرا نشد میگه مجوز نداری

توی ترمینال قبل از مسیرش یه bash فاصله بذار.
یا اینکه از راست کلیک فایل open with bash کن.
یا اینکه توی Properties فایل تب Permissions مجوز اجراش رو تیک بزن.

benyamin_pc · « **پاسخ #51 :** 15 خرداد 1390، 01:50 ب‌ظ »

قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!

سعید رسولی · « **پاسخ #52 :** 15 خرداد 1390، 01:59 ب‌ظ »

نقل‌قول از: benyamin_pc در 15 خرداد 1390، 01:50 ب‌ظ

قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!

چک می‌کنم ببینم اشکالش چیه. ولی کلاً بهتره به tabfile تبدیل کنید و بعد خودتون با یه ادیتو (مثل gedit یا vim یا emacs ) ادیت کنید. بعد که ادیت تموم شده دوباره از tabfile به هر فرمتی که خواستید تبدیل کنید.

سعید رسولی · « **پاسخ #53 :** 15 خرداد 1390، 02:01 ب‌ظ »

کاش خروجی ترمینال رو می‌ذاشتید. مثلاً ممکنه بخاطر مشکل encoding اینطوری شده باشه. (در این‌صورت باید لینک دانلود گلاسری رو بهم بدید تا چک کنم)

سعید رسولی · « **پاسخ #54 :** 15 خرداد 1390، 02:10 ب‌ظ »

نقل‌قول از: سعید رسولی (ilius) در 15 خرداد 1390، 01:59 ب‌ظ

نقل‌قول از: benyamin_pc در 15 خرداد 1390، 01:50 ب‌ظ
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
این باگ بود که برطرف کردم.
اگه از اینجا دانلود کنید درست میشه:
https://github.com/ilius/pyglossary

سعید رسولی · « **پاسخ #55 :** 15 خرداد 1390، 02:10 ب‌ظ »

نقل‌قول از: benyamin_pc در 15 خرداد 1390، 01:50 ب‌ظ

قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!

این باگ بود که برطرف کردم.
اگه از اینجا دانلود کنید درست میشه:
https://github.com/ilius/pyglossary

سعید رسولی · « **پاسخ #56 :** 15 خرداد 1390، 02:16 ب‌ظ »

نقل‌قول از: benyamin_pc در 15 خرداد 1390، 01:50 ب‌ظ

با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!

اوه! با text editor چه نوع گلاسری رو باز کردید؟ اون فقط فایل متنی ساده رو باز می‌کنه (فایل‌های txt و مثلاً فایل tabfile که اونم txt هست)
که باز میگم، بهتره از gedit استفاده کنید...

benyamin_pc · « **پاسخ #57 :** 15 خرداد 1390، 07:37 ب‌ظ »

این سایته که دادین چقد قاطی پاتیه!!! از کجاش آخرین ورژنو دانلود کنم؟

سعید رسولی · « **پاسخ #58 :** 15 خرداد 1390، 07:40 ب‌ظ »

نقل‌قول از: benyamin_pc در 15 خرداد 1390، 07:37 ب‌ظ

این سایته که دادین چقد قاطی پاتیه!!! از کجاش آخرین ورژنو دانلود کنم؟

سمت راست یه دکمهٔ دانلود داره...
این لینک مستقیم: https://github.com/ilius/pyglossary/tarball/master

benyamin_pc · « **پاسخ #59 :** 15 خرداد 1390، 07:53 ب‌ظ »

من رفتم تو سایت فقط به عالم نوشته زیر هم اونم سمت چپ اومده بود اصلا عکس نداشت سایت سمت راستم نداشت!!

از لینکتون ممنون

انجمن‌های فارسی اوبونتو

نویسنده موضوع: گلاسری انگلیسی به فارسی برای استاردیک (دفعات بازدید: 71651 بار)

امیرمهری

پاسخ به: پاسخ به: گلاسری انگلیسی به فارسی برای استار&

سعید رسولی

پاسخ به: پاسخ به: گلاسری انگلیسی به فارسی برای استار&

benyamin_pc

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

benyamin_pc

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

benyamin_pc

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

benyamin_pc

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

سعید رسولی

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک

benyamin_pc

پاسخ به: گلاسری انگلیسی به فارسی برای استاردیک