انجمن‌های فارسی اوبونتو

جامعه کاربران => پروژه‌ها => نویسنده: reza1615 در 26 آبان 1389، 04:14 ب‌ظ

عنوان: ocr farsi
ارسال شده توسط: reza1615 در 26 آبان 1389، 04:14 ب‌ظ
سلام
دوستان با توجه به خالی بودن جای برنامه ocr farsi  در مجموعه نرم افزارهای فارسی و نیاز زیاد به این برنامه به خصوص با پیشرفت بایگانی ها و مترجم های ماشینی تصمیم گرفتم برای نوشین این برنامه شروع به کار کنم
در مرحله اول چند فروم اپن سورس که روی نمونه های مشابه انگلیسی کار کرده بودند را پیدا کردم یک مورد هم به زبان عربی پیدا گردم که متاسفانه چند وقت هست این گروه کارشان را متوقف کردند
چند شرکت ایرانی هم شروع به کار کردند که به علت قیمت بالا و عدم حفظ گپی رایت اونها هم متوقف شدند!! نمونه خارجی برنامه هم هست که متاسفانه گران هست و کارایی انچنانی هم ندارد
محیط برنامه را به نظر من بهتر هست که در پایتون باشد.
برای شروع کار باید در ابتدا سورس های خارجی را بگیریم و تبدیل کنیم بخصوص کدهایی که عکس را تمیز و درست میکنند و سپس کدهایی برای شناساندن حروف فارسی به آن اضافه کنیم
به این نکته هم آگاه هستم که کار سختی هست ولی باید این کار از یک جایی شروع بشود
دوستانی که علاقه مند به این موضوع هستند لطفا اینجا اعلام آمادگی بکنند

(ocr  برنامه ای هست که فایل های عکس را به متن txt  تیدیل میکند و کاربرد اصلی آن در کم کردن حجم فایل و مترجم ماشینی و تایپ ماشینی متن میباشد)

عنوان: پاسخ به: ocr farsi
ارسال شده توسط: سید وحید رضا برهانی در 17 آذر 1389، 06:12 ب‌ظ
سلام
چیکار کردی ؟اصلا شروع کردی یا نه ؟
به نظرم بیخیال سورس انگلیسی بشی بهتره چون حروف انگلیسی جدا جدا هستند ولی فارسی (وعربی)هم جدا دارند هم چسبیده به همین خاطر زیاد نمی شه با روش اینا زیاد کارکرد
من چند سال پیش یکمی با متلب پردازش تصویر کار می کردم (ولی متاسفانه با octave نتونستم حتی یک تصویر رو نمایش بدم به همین خاطر کلا بیخیالشون شدم(البته متلب۲۰۱۰ رو گرفتم(طبق عادت)))اگر کاری از دستم بربیاد خیلی خوشحال می شم که انجام بدم در ضمن من پایتون بلد نیستم  من اعتقاد دارم که حتی با خود ابزارها ونرم افزار های خط فرمان هم میشه همچین کاری کرد
عنوان: پاسخ به: ocr farsi
ارسال شده توسط: alireza0361 در 11 بهمن 1390، 10:41 ق‌ظ
پشتیبانی از ocr عربی در برنامهٔ Tesseract اضافه شده، اگه یه نفر زحمت اضافه کردن حروف فارسی رو بکشه خیلی خوب میشه.
عنوان: پاسخ به: ocr farsi
ارسال شده توسط: alieblice در 20 بهمن 1390، 12:19 ق‌ظ
تویه fsforums.ir جناب electron اعلام کردن که رویه همچین جیزی در حال کار کردن هستن حالا من دقیق یادم نیست که این بود یا تشخیص دست خط . به هرحال اخرین خبر (حدود یک ماهو نیم)  این بود که به یک الگوریتم درست حسابی دست پیدا کردن . اگر کسی مایل به همکاری یا ایشون هست از ادرس زیر در دست رس هستن
http://fsforums.ir/