انجمنهای فارسی اوبونتو
کمک و پشتیبانی => انجمن عمومی => نویسنده: Geek در 24 اسفند 1393، 12:22 بظ
-
سلام دوستان
من چند تا فایل PDF دارم که تایپ شده هستن (اسکن شده نیستن)، اما وقتی متنش رو کپی میگیرم توی LibreOffice و... به شکل یه سری کاراکتر نامفهوم در میان.
میخواستم بدونم کسی تجربهای در خصوص کار با همچین فایلهایی داشته؟
توی سرچهایی که داشتم ظاهرا گفته میشده که اصلا نمیشه چنین کاری کرد و تنها راه تایپ هست! :o اما من که نمیتونم قبول کنم هیچ راهی نباشه!
ممنون میشم اگه اطلاعاتتون رو در اختیار من هم بذارین.
-
نمیشه، راهی وجود نداره، تنها راهش این بود که سازنده pdf کد گذاری مناسبی رو براش انتخاب کنه!
نرم افزارهایی هستند که با تکنولوژی تبدیل متن به تصویر Optical Character Recognition میتونند این کار رو انجام بدن!
ولی نسخه لینوکس وجود نداره! یا حداقلش من ندیدم!
-
کاری که من انجام میدم، حرفه ای نیست. ولی بالاخره خوب جواب میده واسم. با نرم افزار recoll اون فایل رو preview می کنم. بعد اون قسمت از متن pdf رو که میخوام و الان به صورت text دراومده، copy و بعد تو محیطی که میخوام paste می کنم.
-
الان من recoll رو نصب کردم اما چطور باید از یه فایل preview گرفت؟
-
دوباره تاکید می کنم که روش حرفه ای نیست و صددرصد دقیق همه چیز رو در اختیار قرار نمیده. بعد از اینکه فایل مورد نظر (مثلا pdf) رو با recoll پیدا کردین، روی گزینه previewی اون فایل کلیک کنید. فایل ضمیمه رو نگاه کنید.
ویرایش: بعد از نصب recoll، از منوی file، گزینه update index رو بزنید تا بفهمه چی توی کامپیوتر دارید.
-
فایل pdf رو با فایرفاکس باز کن و کپی کن ببین حل میشه یا نه؟
اگه حل نشد عباراتی مثل pdf to word یا pdf to html و ... رو سرچ کن
-
پی دی اف ها متن فارسی دارند یا انگلیسی؟
-
دوباره تاکید می کنم که روش حرفه ای نیست و صددرصد دقیق همه چیز رو در اختیار قرار نمیده. بعد از اینکه فایل مورد نظر (مثلا pdf) رو با recoll پیدا کردین، روی گزینه previewی اون فایل کلیک کنید. فایل ضمیمه رو نگاه کنید.
ویرایش: بعد از نصب recoll، از منوی file، گزینه update index رو بزنید تا بفهمه چی توی کامپیوتر دارید.
جواب نداد.
فایل pdf رو با فایرفاکس باز کن و کپی کن ببین حل میشه یا نه؟
اگه حل نشد عباراتی مثل pdf to word یا pdf to html و ... رو سرچ کن
قبلا تست کردم، جواب نداد.
پی دی اف ها متن فارسی دارند یا انگلیسی؟
فارسی هستن.
الان یه OCR مخصوص زبانهای ME دانلود کردم، و روی PC نصب کردم، نصفه و نیمه یه کارایی کرد ولی خب نیاز به ویرایش سنگین داره.
این نرمافزارهایی که به فرض یه فایل متنی رو به PDF تبدیل میکنن چه کاری انجام میدن که همچین مشکلی(!) پیش میاد؟
یعنی نمیشه مهندسی معکوسش کرد؟
من به شدت علاقه دارم از این چند تا PDF یه نسخهی چاپی داشته باشم اما متاسفانه چون برای قطع B5 تهیه شدن پرینتشون برام به صرفه نیست و مجبورم که دوباره تایپشون کنم تا بشه با یه هزینهی معقول پرینتشون گرفت.
-
اگر از فایل pdf مطمینی با less بازش کن.
-
اگر از فایل pdf مطمینی با less بازش کن.
سلام دوست من
میشه دقیقتر توضیح بدی؟
از چه لحاظ باید از فایل PDF اطمینان داشته باشم؟
و این less دقیقا چیه؟ منظورتون همین برنامهای هست که تحت ترمیناله و در توضیحش اومده:
pager program similar to more
-
آره.
http://www.pcworld.com/article/2851692/less-means-more-to-malware-authors-targeting-linux-users.html
-
ممنون
اطمینانی که نمیشه داشت!
حالا جواب میده؟
خواستم روی سرور کدینگ این کار رو انجام بدم اما متاسفانه چون از https استفاده میکنه و ISP عزیز هم تن لششو انداخته رو شیلنگ اینترنت نمیتونم سایت رو باز کنم و سایت خوب بار نمیشه.
-
سلام
با گوگل کروم باز کن و کپی کن من تست کردم جواب داد و استاده کردم البته فقط متن این امکان رو داره اگه جدول و ... توش باشه فقط متن جدول کپی میشه و استایلش کپی نمیشه.
-
اگه کاراکتر ها کد گذاری شده باشند حتی با کروم هم نمیشه کپی کرد. ;)