سلام به همگی.
من محمدرضا حقیری هستم، یک برنامهنویس ۲۷ ساله (تازه وارد ۲۷ شدم البته) و خب خیلیهاتون من رو از زمان قدیم و بخصوص پروژه جبیر میشناسید احتمالا. احتمالش وجود داره که من رو از توییتر، رویدادهای حول نرمافزار آزاد و ... بشناسید. و خب احتمالش هم هست که اصلا نشناسید 😁 در هر صورت، از این که در جمع حضور دارم و به نوعی فعال و توسعهدهنده نرمافزار آزاد محسوب میشم خوشحال و خرسندم.
از معرفی خودم که بگذرم، میخوام در مورد این پروژه کمی رودهدرازی کنم و توضیح بدم که این پروژه چیه و چرا ایجادش کردم. خب، یکی از دلایلی که ما اینجاییم (دقت کنید که الزامی هم نیست که دلیل اینجا بودنتون این باشه) اینه که ما عاشقان آزادی هستیم. ما نرمافزار آزاد رو شنیدیم، استفاده کردیم و درکش کردیم. پارسال بود که من پروژه
پلاکخوان رو شروع کردم. این پروژه به نوعی یک OCR خیلی ساده به حساب میومد که میتونست عددهایی که با یک تایپفیس خاص نوشته شدند رو بفهمه و به ما بگه که چی هستند.
راستش، من مدتها بود که هدفی در ذهن داشتم. این که یک محصول بزرگ بینایی ماشین توسعه بدم، در عین حال از آغاز امسال (یعنی ۱۴۰۱ هجری خورشیدی) به سرم زد که یک پروژه آزاد بزرگ هم داشته باشم. از اونجایی که با یک دست نمیشود بیش از یک هندونه بلند کرد، تصمیم گرفتم جفتش یکی باشه. یک پروژه پردازش تصویر آزاد! نتیجه این شد که بعد چند ماه فکر کردن به این نتیجه رسیدم که OCR فارسی آزاد رو توسعه بدم.
پروژه OCR فارسی آزاد
اولین سوالی که در ذهن شما ایجاد میشه احتمالا اینه که OCR چیه؟ خب توضیح سادهست. OCR یا تشخیص نویسه نوری (که البته بهش نویسهخوان نوری هم میگن) فرایندیه که طی اون، نوشتههای درون یک عکس رو میشه خوند. مثلا همون پلاکخوان (البته مثال ملموسترش در نرمافزارهای غیرآزاد Google Lensئه). حالا چرا دارم این نمونه آزاد رو توسعه میدم؟ دلیلش واضحه. چون OCR فارسی خوب نداریم
تصویر بالا، نمونهای از خروجی این نرمافزاره که فعلا در فاز آزمایشگاهیش قرار گرفته. این نرمافزار، تحت پروانه GPL-3 منتشر میشه و خب من تضمین میکنم تا وقتی من مسولیتش رو بر عهده دارم همین پروانه بمونه. اگر چنانچه روزی این پروژه دست شخص/شرکت دیگری بود، باز هم تلاش میکنم تا آزاد بمونه.
بهروزرسانی به تاریخ ۳۱ خرداد ۱۴۰۱:
کار بر روی تشخیص حروف فارسی هم تمام شد و این نتیجهش:
کدها در گیتهاب:
https://github.com/prp-e/persian_ocr_projectمنتظر نظرات و پرسشها و بازخوردهای شما عزیزان هستم.