با سلام
من از Evince استفاده میکنم و این دو مشکل(آینه شدن و جدا شدن حروف) رو نداره.
اشتباه شده . من نگفتم که خود pdf رو اینجوری نشون میده که .
من گفتم وقتی یک صفحهی تصویری pdf بهش میدید تا OCR کنه ، خروجی متن به این حالت در میاد .
منم منظورم این بود که توی Evince وقتی یه متن رو کپی میکنیم و مثلاً توی gedit پیست میکنیم، مشکلی نداره، آینه نمیشه و حروفش هم جدا نمیشه.
ولی فکر نکنم Evince و Okular از OCR استفاده کنن!
چون اصلاً OCR فارسی که آزاد باشه من ندیدم و فکر نکنم وجود داشته باشه!
فقط یدونه عربی دیدم توی سایت ArabEyes که اونم تست نکردم....
حتی OCR های آزاد برای انگلیسی هم ضعیف هستن(بهترینشون که من دیدم gocr بود. ocrad که خیلی خنگه!!)
حروف جدا (مثل: س ل ا م ) رو به حروف عادی تبدیل کنه.
تا جایی که من میدونم تمام حروف رو بصورت شکل «جدا»ش مینویسه یعنی : «سلام» رو مینویسه « م ل ا س » .
یعنی بین حروف کاراکتر فاصله قرار میده؟ (موقع کپی کردن)
این مورد رو من برخورد نکردم. اگه میشه یه pdf که اینطوری باشه بدید تا تست کنم ببینم.(شاید یه کاراکتر دیگه باشه. space نباشه)
لی رفع این دو مشکل هم کاری نداره. با یه برنامه کوچیک حل میشه که سعی میکنم در اولین فرصت بنویسم
برنامهی جدا خوبه ولی ایکاش مشکل okular هم حل میشد .
یعنی میگید برای Okular پچ بنویسیم و بفرستیم بهشون؟ اگه بشه خوبه، ولی من فکر نمیکنم بتونم این کارو انجام بدم. امیدوارم از دوستان دیگه کسی پیدا بشه...