انجمن‌های فارسی اوبونتو

لطفاً به انجمن‌ها وارد شده و یا جهت ورود ثبت‌نام نمائید

لطفاً جهت ورود نام کاربری و رمز عبورتان را وارد نمائید

نویسنده موضوع: پروژه OCR فارسی آزاد  (دفعات بازدید: 4852 بار)

0 کاربر و 2 مهمان درحال مشاهده موضوع.

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پروژه OCR فارسی آزاد
« : 26 خرداد 1401، 09:22 ب‌ظ »
سلام به همگی.

من محمدرضا حقیری هستم، یک برنامه‌نویس ۲۷ ساله (تازه وارد ۲۷ شدم البته) و خب خیلی‌هاتون من رو از زمان قدیم و بخصوص پروژه جبیر می‌شناسید احتمالا. احتمالش وجود داره که من رو از توییتر، رویدادهای حول نرم‌افزار آزاد و ... بشناسید. و خب احتمالش هم هست که اصلا نشناسید 😁 در هر صورت، از این که در جمع حضور دارم و به نوعی فعال و توسعه‌دهنده نرم‌افزار آزاد محسوب میشم خوشحال و خرسندم.

از معرفی خودم که بگذرم، میخوام در مورد این پروژه کمی روده‌درازی کنم و توضیح بدم که این پروژه چیه و چرا ایجادش کردم. خب، یکی از دلایلی که ما اینجاییم (دقت کنید که الزامی هم نیست که دلیل اینجا بودنتون این باشه) اینه که ما عاشقان آزادی هستیم. ما نرم‌افزار آزاد رو شنیدیم، استفاده کردیم و درکش کردیم. پارسال بود که من پروژه پلاک‌خوان رو شروع کردم. این پروژه به نوعی یک OCR خیلی ساده به حساب میومد که می‌تونست عددهایی که با یک تایپ‌فیس خاص نوشته شدند رو بفهمه و به ما بگه که چی هستند.

راستش، من مدتها بود که هدفی در ذهن داشتم. این که یک محصول بزرگ بینایی ماشین توسعه بدم، در عین حال از آغاز امسال (یعنی ۱۴۰۱ هجری خورشیدی) به سرم زد که یک پروژه آزاد بزرگ هم داشته باشم. از اونجایی که با یک دست نمی‌شود بیش از یک هندونه بلند کرد، تصمیم گرفتم جفتش یکی باشه. یک پروژه پردازش تصویر آزاد! نتیجه این شد که بعد چند ماه فکر کردن به این نتیجه رسیدم که OCR فارسی آزاد رو توسعه بدم.

پروژه OCR فارسی آزاد

اولین سوالی که در ذهن شما ایجاد میشه احتمالا اینه که OCR چیه؟ خب توضیح ساده‌ست. OCR یا تشخیص نویسه نوری (که البته بهش نویسه‌خوان نوری هم میگن) فرایندیه که طی اون، نوشته‌های درون یک عکس رو میشه خوند. مثلا همون پلاک‌خوان (البته مثال ملموس‌ترش در نرم‌افزارهای غیرآزاد Google Lensئه). حالا چرا دارم این نمونه آزاد رو توسعه میدم؟ دلیلش واضحه. چون OCR فارسی خوب نداریم :)


تصویر بالا، نمونه‌ای از خروجی این نرم‌افزاره که فعلا در فاز آزمایشگاهیش قرار گرفته. این نرم‌افزار، تحت پروانه GPL-3 منتشر میشه و خب من تضمین می‌کنم تا وقتی من مسولیتش رو بر عهده دارم همین پروانه بمونه. اگر چنانچه روزی این پروژه دست شخص/شرکت دیگری بود، باز هم تلاش می‌کنم تا آزاد بمونه.

به‌روزرسانی به تاریخ ۳۱ خرداد ۱۴۰۱:
کار بر روی تشخیص حروف فارسی هم تمام شد و این نتیجه‌ش:

کدها در گیتهاب: https://github.com/prp-e/persian_ocr_project

منتظر نظرات و پرسش‌ها و بازخوردهای شما عزیزان هستم.
« آخرین ویرایش: 31 خرداد 1401، 09:52 ب‌ظ توسط Supreme Sailor »

آفلاین جعفر فرقانلوژ

  • High Hero Member
  • *
  • ارسال: 5100
  • جنسیت : پسر
  • اممم . اره دیگه! mehr32
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #1 : 26 خرداد 1401، 09:32 ب‌ظ »
خیلی عالیه جناب حقیری خیلی !
چه کمکی از دستمون بر میاد ؟ احتمالا پایگاه اطلاعات برای تصاویر داره درسته ؟ برای تکمیلش کمکی از دست ما برمیاد ؟ (گرفتن تصاویر یا جدا جدا کردن حروف )
دیگر به انجمن باز نخواهم گشت شاید جایی با این نام پیدام کنید اگه کاری با من دارید : qxc9966@protonmail.com

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #2 : 30 خرداد 1401، 11:22 ق‌ظ »
خیلی عالیه جناب حقیری خیلی !
چه کمکی از دستمون بر میاد ؟ احتمالا پایگاه اطلاعات برای تصاویر داره درسته ؟ برای تکمیلش کمکی از دست ما برمیاد ؟ (گرفتن تصاویر یا جدا جدا کردن حروف )

سلام.
ببینید یک مرحله آزمایشگاهی/آزمایشی باید بره جلو (که الان در اون مراحلیم) و خب اینجا مشخص میشه چقدر مدل ما بهینه‌ست و چطور کار می‌کنه و ... .
بعدش یه مرحله محصولی داریم که در اون مرحله، نیازمند یاری سبز دوستانم 😁

آفلاین جعفر فرقانلوژ

  • High Hero Member
  • *
  • ارسال: 5100
  • جنسیت : پسر
  • اممم . اره دیگه! mehr32
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #3 : 30 خرداد 1401، 11:35 ق‌ظ »
در خدمتم !
دیگر به انجمن باز نخواهم گشت شاید جایی با این نام پیدام کنید اگه کاری با من دارید : qxc9966@protonmail.com

آفلاین ɴɪᴍᴀ

  • High Hero Member
  • *
  • ارسال: 1270
  • جنسیت : پسر
  • یه برنامه نویس 13 ساله :)
    • smartnima Website
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #4 : 30 خرداد 1401، 11:43 ق‌ظ »
عالیه! البته خود Google Lens تا حدی از فارسی پشتیبانی میکنه ولی آزاد نیست :)
پیشنهاد میکنم بعد از کامل شدن پروژه یه محیط گرافیکی براش با کیوی نوشته بشه و برای اندروید هم کامپایل شه : )

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #5 : 30 خرداد 1401، 12:00 ب‌ظ »
عالیه! البته خود Google Lens تا حدی از فارسی پشتیبانی میکنه ولی آزاد نیست :)
پیشنهاد میکنم بعد از کامل شدن پروژه یه محیط گرافیکی براش با کیوی نوشته بشه و برای اندروید هم کامپایل شه : )

بحث گوگل‌لنز رو حالا کاری نداریم (چون خودت هم اشاره کردی که آزاد نیست و این دقیقا همون دلیلیه که من این پروژه رو شروع کردم) اما در مورد اندروید حرف زیاده. چندتا چیز باید سنجیده شه و بعد براش اپ‌های موبایل و دسکتاپ نوشته شه. فعلا ترجیح اصلی خودم وب‌سرویس و نرم‌افزار تحت ترمیناله (شاید هم کتابخونه پایتون)

آفلاین ABOLDOM

  • High Hero Member
  • *
  • ارسال: 1923
  • جنسیت : پسر
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #6 : 30 خرداد 1401، 06:43 ب‌ظ »
وای این عالیههه(: دمتون گرممم، بعدش میشه کارهای خیلی زیادی باهاش کرد :) موفق باشید

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #7 : 31 خرداد 1401، 09:53 ب‌ظ »
پست نخست به‌روز شد و نماگرفت از نتیجه تشخیص حروف، قرار داده شد.

آفلاین جعفر فرقانلوژ

  • High Hero Member
  • *
  • ارسال: 5100
  • جنسیت : پسر
  • اممم . اره دیگه! mehr32
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #8 : 01 تیر 1401، 10:59 ق‌ظ »
تا الان دقتش چقدره ؟ مصلا تصویریک برگه کاغذ که دست نویس باشه هنوز می تونه تشخیص بده ؟
یک فکری با خط من تمرینش بدید بعد میتونه هر خطی رو بخونه  :P خط من رو خودم نمیتونم بخونم !
دیگر به انجمن باز نخواهم گشت شاید جایی با این نام پیدام کنید اگه کاری با من دارید : qxc9966@protonmail.com

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #9 : 01 تیر 1401، 05:08 ب‌ظ »
تا الان دقتش چقدره ؟ مصلا تصویریک برگه کاغذ که دست نویس باشه هنوز می تونه تشخیص بده ؟
یک فکری با خط من تمرینش بدید بعد میتونه هر خطی رو بخونه  :P خط من رو خودم نمیتونم بخونم !

فعلا روی داده دستنویس آموزش نشده.

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #10 : 02 تیر 1401، 08:47 ب‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #11 : 03 تیر 1401، 08:37 ب‌ظ »
دوستان عزیزم در حال حاضر در حال تدوین یک پست بلاگ پیرامون این پروژه هستم. به نظرتون چه چیزایی رو پوشش بدم تو پست بلاگم؟

آفلاین جعفر فرقانلوژ

  • High Hero Member
  • *
  • ارسال: 5100
  • جنسیت : پسر
  • اممم . اره دیگه! mehr32
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #12 : 03 تیر 1401، 09:00 ب‌ظ »
کاربرد هایی که میتونه توی زندگی داشته باشه
کاربرد های تخصصی تر یا حتی صنعتی
مشکلاتی که میتونه حل کنه
فواید ازاد بودن این پروژه
دیگر به انجمن باز نخواهم گشت شاید جایی با این نام پیدام کنید اگه کاری با من دارید : qxc9966@protonmail.com

آفلاین جعفر فرقانلوژ

  • High Hero Member
  • *
  • ارسال: 5100
  • جنسیت : پسر
  • اممم . اره دیگه! mehr32
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #13 : 03 تیر 1401، 09:03 ب‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.
Unable to render code block
گیتهاب دفترچه خطا میده
دیگر به انجمن باز نخواهم گشت شاید جایی با این نام پیدام کنید اگه کاری با من دارید : qxc9966@protonmail.com

آفلاین محمدرضا حقیری

  • High Sr. Member
  • *
  • ارسال: 528
    • ذهن زیبا
پاسخ : پروژه OCR فارسی آزاد
« پاسخ #14 : 04 تیر 1401، 09:31 ق‌ظ »
دوستان عزیز با کمک این دفترچه‌یادداشت ژوپیتر می‌تونید مدل‌ها و ... رو تست کنید.
لطفا اگر ارور و داستانی دریافت می‌کنید، ارور رو دقیق بذارید تا بررسی بشه. چه اینجا چه در ایشوهای گیت‌هاب.
Unable to render code block
گیتهاب دفترچه خطا میده

دفترچه‌های ژوپیتر روی گیتهاب یکم سخت لود میشن. اگر clone بگیری به نظرم بهتره.