با سلام
اگر منظور شما این است که قصد دارید متن موجود در تصویری که حاوی متن است (مثلا اسکن یک صفحه کتاب) را استخراج کنید در واقع شما به نرم افزار های OCR نیاز دارید.باید بدانید نوشتن یک OCR کار بسیار پیچیده و زمان بری می باشد. به این ترتیب شما دو انتخاب در مقابل خود دارید:
* استفاده از نرم افزار های آماده : که در این صورت ابتدا شما باید یک نرم افزار که نیاز شما را برطرف کند پیدا کنید. اگر متون شما فارسی هستند باید بدانید که نرم افزار های OCR فارسی بسیار کمی در بازار موجود هستند و تقریبا تمامی آنها به صورت کد بسته و با قیمت های بالا عرضه می شوند.(نزدیک به میلیون تومان ). در ضمن فکر نمی کنم تعداد قابل توجهی از آنها نسخه لینوکسی داشته باشند. به هر حال در صورتی که یک نرم افزار لینوکسی پیدا کردید باید مطمئن شوید که رابط خط فرمان هم ارائه می کند. به این ترتیب می توانید یک اسکریپت شل بنویسید که با استفاده از رابط آن نرم افزار OCR ، عملیات مورد نظر شما را انجام دهد.
*نوشتن یک نرم افزار جدید: اگر قصد دارید خودتان یک نرم افزار OCR بنویسید باید توجه داشته باشید که این نرم افزار ها غالبا آن چنان پیچیده هستند که تنها با زبان های برنامه نویسی قدرتمند قابل پیاده سازی موثر هستند. من فکر نمی کنم زبان اسکریپت نویسی مانند بش توانایی ایجاد چنین برنامه هایی را داشته باشد . حتی اگر چنین هم باشد مسلما کار را برای شما بسیار دشوار و هزینه بر خواهد کرد . در ضمن این که کتابخانه های موجود این نرم افزار ها نیز(که من تاکنون نسخه فارسی کارایی از آنها را ندیده ام) اغلب با استفاده از زبان هایی چون ++C/C نوشته شده اند و استفاده از آنها با بش عملا غیر ممکن است.
با توجه به موارد فوق بهتر است توضیح بیشتری در رابطه با هدف خود بدهید تا من یا سایر دوستان بتوانیم در صورت امکان اطلاعات بیشتری را در اختیار شما قرار دهیم.
----------------------------------------
پی نوشت:
لطفا اگر امکانش هست این آواتار خود را عوض کنید. من شخصا اغلب به دلیل وجود این آواتار محتوای پست های شما را نمی خوانم.
----------------------------------------
موفق باشید.