0 کاربر و 3 مهمان درحال مشاهده موضوع.
ورژن سپتامبر اون دیتابیس آریانپور (Open Dictionary aka QueerDick) که ۹ روز پیش منتشر شد رو از exe به xml و بعدش به StarDict تبدیل کردم.StarDict - Rich TextStarDict - Plain TextTabfile - Rich TextTabfile - Plain TextRich Text یعنی رنگ و italic و اینا دارهاین گلاسری خیلی خیلی کامله و من هیچ چیز غیر از صوت رو ازش حذف نکردم (عکس هم که نداشت)، یعنی توضیح کلمه، فونتیک، و مثالهای انگلیسی و فارسی همه با رنگهای مختلف و فرمتبندی توی StarDict نشون داده میشه. فقط بعضی کلمات (مثل A-OK) رو ممکنه Not Found بزنه توی StarDict که فکر کنم باگ StarDict هست چون توی GoldenDict درسته (اگه عبارتهای ورودی رو lowercase کنیم این مشکل حل میشه ولی مخففها شکل زشتی پیدا میکنن)اینم Tabfile یا همون txt:البته غلطهای نگارشی خیلی زیاد داره (مثل جدانویسی و سرهمنویسیها، همزههای زائد یا اشتباه، کاراکترهای عربی بجای فارسی، فاصله گذاشتن قبل از ویرگول و نقطه یا فاصله نذاشتن بعدش و...)چند مثال:می نویسم ==> از دید کامپیوتر دو کلمه است: «می» و «نویسم» که اشتباه هست و باید با فاصلهٔ مجازی بصورت «مینویسم» نوشته بشه.دیکشنری ها ==> دو کلمه: دیکشنری و هادیکشنری های ==> دوکلمه: دیکشنری و هایانتهاء ==> انتهاو خیلی غلطهای دیگه که بعضیهاش رو فعلاً توی این گلاسری دستی درست کردم.ولی باید یه فکر اساسی کرد چون تقریباً همهٔ متنهای فارسی (چه توی وب و چه توی گلاسریهای مختلف) از از غلطها زیاد دارن و باعث میشه پردازشهای کامپیوتری روی متون فارسی خیلی خیلی سخت باشه (شاید یکی از دلایلی که مترجم گوگل برای فارسی اینقدر خنگ هست همین باشه). ضمن اینکه زبان فارسی خودمون هم در خطر هست!! از طرفی همهٔ گلاسریهای فارسی رو هم دستی ویرایش کرد (تازه برای ورژنهای جدید هم مجبوریم همهٔ اون کارها رو انجام بدیم و موازیکاری زیاد میشه)! چه برسه به متون دیگه... حتی درست کردن یه replacement table هم کار خیلی سختی هست.دارم پروژهای رو شروع میکنم به اسم Smart Persian Correction که متن فارسی رو خودش پردازش کنه و غلطهاش رو برطرف کنه. فعلاً بر اساس عبارتهای regexp ولی بعداً باید بتونه نقش کلمات مثل اسم و فعل و حرف و جمعها و کلمات مرکب رو تشخیص بده...ولی متاسفانه چون شاغل هستم معمولاً فقط شبها میتونم روی پروژههای شخصی کار کنم.اون فارسی به انگلیسی هم که آقا رضا گفت کار جدا و وقت زیادی میطلبه.
اول اگر امکان داره فایلها رو تو گوگل داک آپلود کنید
دوم اینکه فایلی که شما تبدیل کردید رو خواستم به فرمت txt تبدیل کنم پایگلاسری کنم ارور داد چرا؟
میشه گلاسری عربی به فارسی و فارسی به عربی که تو لینک زیر موجودرو به تکست تبدیل کنید؟این برنامه رو ubuntu نشد نصب کنم
کشیدمش انداختمش تو ترمینال و کوتیشناشو برداشتم اما اجرا نشد میگه مجوز نداری
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!
نقلقول از: benyamin_pc در 15 خرداد 1390، 01:50 بظقسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!این باگ بود که برطرف کردم.اگه از اینجا دانلود کنید درست میشه:https://github.com/ilius/pyglossary
قسمت db editor برنامه كه دکمه openesh اصلا كار نميكنه!!
با قسمت text editor یه گلاسری عربی به فارسی رو باز کردم فقط عربی هاش اومد یه بارم ی گلاسری فارسی به عربی رو باز کردم فقط فارسی هاش اومد!! یعنی هرچی به هرچی باشه فقط اولیرو میاره مثل آفیس ورد!!!
این سایته که دادین چقد قاطی پاتیه!!! از کجاش آخرین ورژنو دانلود کنم؟