چندین ماه پیش، به برنامهنویسی در حوزه بینایی ماشین و پردازش تصویر علاقمند شدم که خب احتمالا اکثر شما دوستانم در جریانش باشید. یکی از دلایلی که سمت چنین چیزی رفتم، حقیقتا سریال Person of Interest بود (که از صدا و سیمای ایران با نام «مظنون» پخش شده) و در اون «ماشین» میتونست آدمها رو تشخیص بده.
در دوران قرنطینه هم، تماشای فیلمهای دنیای سینمایی مارول و علاقمندی شخصی من به شخصیت تونی استارک باعث شد که بیش از پیش به این حوزه علاقمند شم چون که استارک هم با تکنولوژی مشابهی میتونست تهدیدات و ... رو شناسایی کنه (البته از زیباییهای جارویس و فرایدی که بگذریم).
خلاصه اینجا، به خودم آمدم و دیدم که خیلی از مفاهیم و پایههای پردازش تصویر و حتی بینایی ماشین رو یاد گرفتم و با خودم گفتم، چرا یک چیز کاربردی ازش نسازم؟ و این طوری شد که ایدههای فراوانی به ذهنم رسیدند. در ادامه، کم کم با ایدهها آشنا خواهیم شد.
ایدههای اولیه- بارکدخوان: این پروژه چیز پیچیدهای نبود چرا که لایبرریهای زیادی برای بارکد خوندن وجود دارند و حتی نیازی نبود درگیر مراحلی مثل آموزش مدل و ... بشم. به همین خاطر این پروژه رو در حد یک تمرین خیلی ساده زدم و رفت.
- حضور و غیاب مبتنی بر چهره: از اونجایی که در دوران همهگیری کرونا، خیلیها مثل خود من ترجیحشون این بود که کمتر به دکمه و سنسور اثر انگشت و ... دست بزنن و به همین خاطر، دوست داشتم که چنین سیستمی پیاده کنم. اما خب پیچیدگی های سیستمهای حضور و غیاب باعث شد این پروژه رو بذارم برای زمانی که وقت آزاد زیادی دارم
- تشخیص پلاک خودرو: این پروژه رو هم نگه داشتم برای بعد، چرا که این پروژه به خودی خود چیز سادهایه، اما چسبوندن تکههای پازلش به هم، نه.
- مترجم همزمان زبان اشاره/زبان بدن: در نهایت با خودم گفتم که من مدتی در بحثهای کاربردپذیری مطالعه داشتم، چرا چیزی نسازم که دوستان ناشنوا ازش بهره ببرن؟ به همین خاطر هم این ایده رو آوردم صدر مجلس و شروع کردم برای اون پلن چیدن.
جهت خوندن ادامه مطلب لطفا به
اینجا مراجعه کنید. همچنین کدهای این پروژه رو در
این مخزن گیتهاب قرار دادم و امیدوارم به دردتون بخوره