انجمن‌های فارسی اوبونتو

کمک و پشتیبانی => انجمن عمومی => نویسنده: Geek در 24 اسفند 1393، 12:22 ب‌ظ

عنوان: کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Geek در 24 اسفند 1393، 12:22 ب‌ظ
سلام دوستان
من چند تا فایل PDF دارم که تایپ شده هستن (اسکن شده نیستن)، اما وقتی متنش رو کپی می‌گیرم توی LibreOffice و... به شکل یه سری کاراکتر نامفهوم در میان.
می‌خواستم بدونم کسی تجربه‌ای در خصوص کار با همچین فایل‌هایی داشته؟
توی سرچ‌هایی که داشتم ظاهرا گفته میشده که اصلا نمیشه چنین کاری کرد و تنها راه تایپ هست! :o اما من که نمی‌تونم قبول کنم هیچ راهی نباشه!

ممنون میشم اگه اطلاعاتتون رو در اختیار من هم بذارین.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Chamrosh در 24 اسفند 1393، 12:39 ب‌ظ
نمیشه، راهی وجود نداره، تنها راهش این بود که سازنده pdf کد گذاری مناسبی رو براش انتخاب کنه!

نرم افزارهایی هستند که با تکنولوژی تبدیل متن به تصویر Optical Character Recognition میتونند این کار رو انجام بدن!

ولی نسخه لینوکس وجود نداره! یا حداقلش من ندیدم!
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Arcush در 24 اسفند 1393، 01:02 ب‌ظ
کاری که من انجام میدم، حرفه ای نیست. ولی بالاخره خوب جواب میده واسم. با نرم افزار recoll اون فایل رو preview  می کنم. بعد اون قسمت از متن pdf رو که میخوام و الان به صورت text دراومده، copy و بعد تو محیطی که میخوام paste می کنم.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Geek در 24 اسفند 1393، 01:11 ب‌ظ
الان من recoll رو نصب کردم اما چطور باید از یه فایل preview گرفت؟
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Arcush در 24 اسفند 1393، 03:16 ب‌ظ
دوباره تاکید می کنم که روش حرفه ای نیست و صددرصد دقیق همه چیز رو در اختیار قرار نمیده. بعد از اینکه فایل مورد نظر (مثلا pdf) رو با recoll پیدا کردین، روی گزینه previewی اون فایل کلیک کنید. فایل ضمیمه رو نگاه کنید.

ویرایش: بعد از نصب recoll، از منوی file، گزینه update index رو بزنید تا بفهمه چی توی کامپیوتر دارید.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: alireza.crs در 25 اسفند 1393، 12:12 ق‌ظ
فایل pdf رو با فایرفاکس باز کن و کپی کن ببین حل میشه یا نه؟
اگه حل نشد عباراتی مثل pdf to word یا pdf to html و ... رو سرچ کن
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: afrod در 25 اسفند 1393، 12:23 ق‌ظ
پی دی اف ها متن فارسی دارند یا انگلیسی؟
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Geek در 25 اسفند 1393، 09:20 ق‌ظ
دوباره تاکید می کنم که روش حرفه ای نیست و صددرصد دقیق همه چیز رو در اختیار قرار نمیده. بعد از اینکه فایل مورد نظر (مثلا pdf) رو با recoll پیدا کردین، روی گزینه previewی اون فایل کلیک کنید. فایل ضمیمه رو نگاه کنید.

ویرایش: بعد از نصب recoll، از منوی file، گزینه update index رو بزنید تا بفهمه چی توی کامپیوتر دارید.

جواب نداد.

فایل pdf رو با فایرفاکس باز کن و کپی کن ببین حل میشه یا نه؟
اگه حل نشد عباراتی مثل pdf to word یا pdf to html و ... رو سرچ کن

قبلا تست کردم، جواب نداد.

پی دی اف ها متن فارسی دارند یا انگلیسی؟

فارسی هستن.


الان یه OCR مخصوص زبان‌های ME دانلود کردم، و روی PC نصب کردم، نصفه و نیمه یه کارایی کرد ولی خب نیاز به ویرایش سنگین داره.
این نرم‌افزارهایی که به فرض یه فایل متنی رو به PDF تبدیل می‌کنن چه کاری انجام میدن که همچین مشکلی(!) پیش میاد؟
یعنی نمیشه مهندسی معکوسش کرد؟
من به شدت علاقه دارم از این چند تا PDF یه نسخه‌ی چاپی داشته باشم اما متاسفانه چون برای قطع B5 تهیه شدن پرینتشون برام به صرفه نیست و مجبورم که دوباره تایپشون کنم تا بشه با یه هزینه‌ی معقول پرینتشون گرفت.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: alend در 25 اسفند 1393، 09:55 ق‌ظ
اگر از فایل pdf مطمینی با less بازش کن.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Geek در 25 اسفند 1393، 12:26 ب‌ظ
اگر از فایل pdf مطمینی با less بازش کن.

سلام دوست من
میشه دقیق‌تر توضیح بدی؟
از چه لحاظ باید از فایل PDF اطمینان داشته باشم؟
و این less دقیقا چیه؟  منظورتون همین برنامه‌ای هست که تحت ترمیناله و در توضیحش اومده:

pager program similar to more
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: alend در 25 اسفند 1393، 01:26 ب‌ظ
آره.

http://www.pcworld.com/article/2851692/less-means-more-to-malware-authors-targeting-linux-users.html
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Geek در 25 اسفند 1393، 02:09 ب‌ظ
ممنون
اطمینانی که نمیشه داشت!
حالا جواب میده؟
خواستم روی سرور کدینگ این کار رو انجام بدم اما متاسفانه چون از https استفاده میکنه و ISP عزیز هم تن لششو انداخته رو شیلنگ اینترنت نمی‌تونم سایت رو باز کنم و سایت خوب بار نمیشه.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Mavenium در 27 اسفند 1393، 02:27 ب‌ظ
سلام
با گوگل کروم باز کن و کپی کن من تست کردم جواب داد و استاده کردم البته فقط متن این امکان رو داره اگه جدول و ... توش باشه فقط متن جدول کپی میشه و استایلش کپی نمیشه.
عنوان: پاسخ : کپی متن یک فایل PDF تایپ شده
ارسال شده توسط: Ghost Shadow در 28 اسفند 1393، 11:12 ق‌ظ
اگه کاراکتر ها کد گذاری شده باشند حتی با کروم هم نمیشه کپی کرد. ;)