سلام
دوستان با توجه به خالی بودن جای برنامه ocr farsi در مجموعه نرم افزارهای فارسی و نیاز زیاد به این برنامه به خصوص با پیشرفت بایگانی ها و مترجم های ماشینی تصمیم گرفتم برای نوشین این برنامه شروع به کار کنم
در مرحله اول چند فروم اپن سورس که روی نمونه های مشابه انگلیسی کار کرده بودند را پیدا کردم یک مورد هم به زبان عربی پیدا گردم که متاسفانه چند وقت هست این گروه کارشان را متوقف کردند
چند شرکت ایرانی هم شروع به کار کردند که به علت قیمت بالا و عدم حفظ گپی رایت اونها هم متوقف شدند!! نمونه خارجی برنامه هم هست که متاسفانه گران هست و کارایی انچنانی هم ندارد
محیط برنامه را به نظر من بهتر هست که در پایتون باشد.
برای شروع کار باید در ابتدا سورس های خارجی را بگیریم و تبدیل کنیم بخصوص کدهایی که عکس را تمیز و درست میکنند و سپس کدهایی برای شناساندن حروف فارسی به آن اضافه کنیم
به این نکته هم آگاه هستم که کار سختی هست ولی باید این کار از یک جایی شروع بشود
دوستانی که علاقه مند به این موضوع هستند لطفا اینجا اعلام آمادگی بکنند
(ocr برنامه ای هست که فایل های عکس را به متن txt تیدیل میکند و کاربرد اصلی آن در کم کردن حجم فایل و مترجم ماشینی و تایپ ماشینی متن میباشد)