انجمن‌های فارسی اوبونتو

کمک و پشتیبانی => انجمن عمومی => نویسنده: عرفان پورصدیقیان در 02 مهر 1398، 09:36 ق‌ظ

عنوان: متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 02 مهر 1398، 09:36 ق‌ظ
سلام
من وقتی فایل PDF را در اوبونتو اجرا میکنم و متن ها را کپی میکنم و در جایی جایگزاری میکنم بجای متن این کلمات میوفته


Ÿ
»ŽÇw 3z1⁄4aÇμ Am§ ,SwA ¬BÇ ̄C  ̈±Ç{ ¤Ba•A ·«AjA 2An ow oM »£nqM • ̄B« ,k ̄po—
/k ̄oLM ¬B1⁄4« pA An B ́ ̄C 3Ÿ k®®Ÿ»«
oŠ ̄ o1⁄2p »UBv w Ø ±«
nj An ¬Ak ̄po— 3 ̄±£-1⁄2A ¬A±U»« 3Ÿ  ̈±μ±« ÓÀ«BŸ ·1⁄4ƒo— -1⁄2A
¬Ak ̄poÇ— xn°oÇQ 3ÇŸ 2k{ SMBY° -{°n ¥a• nj yTvž{ ,joŸ •a] S§°j
nB1⁄4ÇvM ¤±~dÇ« 2pBÇU° jnAj RÀÇžz« nkšÇa ,Rn±Ç• -1⁄2A 3M njB«° nkQ»M
3ØTL§A) q1⁄4a 3aμ k›B—° S 1⁄4~h{»M
,nBžT1⁄2B®] ,¤k¢®w » ̄Ak ̄po— ;SwA »M±“o«B ̄


این که ملاحضه میفرمایید متن کپی شده از یک فایل PDF هستش. یعنی روی متن ها راست کلید و کپی را زدم و در اینجا جاگزاری کردم
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: Armin.io در 03 مهر 1398، 11:30 ق‌ظ
اول pdf رو به word تبدیل کن بعد متنت رو کپی کن.
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: A. Rahmati در 03 مهر 1398، 03:45 ب‌ظ
گاهی اگر فایل PDF را با مرورگری مثل chromiume یا هر مرورگر دیگری باز کنی و بعد کپی کنی درست کپی می‌شود.
البته نمی‌دانم این جا کار می‌دهد یا نه.
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 03 مهر 1398، 05:56 ب‌ظ
لینک‌های زیر را بررسی کنید.

https://superuser.com/questions/137824/pdf-has-garbled-text-when-copy-pasting

https://www.lightenpdf.com/faq/pdf-converter-encoding.html

https://stackoverflow.com/questions/9143154/how-to-cut-paste-from-pdf-with-non-ascii-encoding

عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 04 مهر 1398، 09:17 ق‌ظ
اول pdf رو به word تبدیل کن بعد متنت رو کپی کن.
چجوری PDF رو به word تبدیل کنم؟
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 04 مهر 1398، 09:29 ق‌ظ
ببینید من وقتی در لینوکس یه فایل word مینویسم ویندوز اون رو نمیاره
این یعمی فرمت لینوکس با ویندوز فرق داره. فکر میکنتم باید فرمت نوشتاری رو به UTF 8 تغییر بدم تا درست بشه. چون PDF ها با ویندوز نوشته شده و وقتی من در لینوکس اون رو کپی میکنم لینوکس اون رو نمیشناسه.  دوستان راه راحت تری میدونن؟ میخوام یه word بنویسم که هم ویندوز و هم لینوکس اونو بیاره و فایل PDF هایی که با ویندوز نوشته شده اند رو هم در لینوکس بتونم کپی کنم بدون اینکه این طوری بشه

Ÿ
»ŽÇw 3z1⁄4aÇμ Am§ ,SwA ¬BÇ ̄C  ̈±Ç{ ¤Ba•A ·«AjA 2An ow oM »£nqM • ̄B« ,k ̄po—
/k ̄oLM ¬B1⁄4« pA An B ́ ̄C 3Ÿ k®®Ÿ»«
oŠ ̄ o1⁄2p »UBv w Ø ±«
nj An ¬Ak ̄po— 3 ̄±£-1⁄2A ¬A±U»« 3Ÿ  ̈±μ±« ÓÀ«BŸ ·1⁄4ƒo— -1⁄2A
¬Ak ̄poÇ— xn°oÇQ 3ÇŸ 2k{ SMBY° -{°n ¥a• nj yTvž{ ,joŸ •a] S§°j
nB1⁄4ÇvM ¤±~dÇ« 2pBÇU° jnAj RÀÇžz« nkšÇa ,Rn±Ç• -1⁄2A 3M njB«° nkQ»M
3ØTL§A) q1⁄4a 3aμ k›B—° S 1⁄4~h{»M
,nBžT1⁄2B®] ,¤k¢®w » ̄Ak ̄po— ;SwA »M±“o«B ̄
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 04 مهر 1398، 02:57 ب‌ظ
نقل‌قول
ببینید من وقتی در لینوکس یه فایل word مینویسم ویندوز اون رو نمیاره
دوست عزیز دقیق مشخص کنید با چه نرم افزاری روی لینوکس و ویندوز کار می‌کنید؟ Libre/Open Office چه نسخه ای؟
موقع ذخیره فایل چه فورمتی برای اون انتخاب می‌کنید؟ odt/doc/docx
کدینگ متن شما چیه؟ UTF8/UNICODE
زبان فایل چیه؟ انگلیسی و فارسی رو امتحان کنید.

از کجا به چه نرم افزاری کپی می‌کنید؟
از گزینه  paste special استفاده کردید؟
فونت مقصد هماهنگی داره با مبدا؟
از این مشکل اسکرین شات بگیرید بفرستید.

می‌تونید فایلی که مشکل داره رو پیوست کنید بشه امتحانش کرد؟

دقیق تر مشکلتونو طرح کنید که بشه راهنمایی کرد.
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 05 مهر 1398، 10:13 ق‌ظ
سلام از لیبرال آفیس 6.0.7.3 استفاده میکنم اما مشکل تنها در این برنامه نیست.
ببینید من الان یه فایل PDF با متن فارسی دارم. متنی را در آن انتخاب میکنم روش راست کلیک میکنم و کپی را میزنم. حالا میام به لیبرال آفیس یا هر کجای دیگه مثل text و یا همینجا راست کلیک و جایگزاری میکنم. اما بجای اون کلمات چنین چیز هایی میاد


nj <nB ́MBÇa> :3¦aÇ] pA ,•¦ThÇ« „BšÇ ̄ 3ÇM k1⁄4ŽLÇU RAo‡Bi SwA  ̈p¿
7 o–Çw ° ,o1⁄2±Ÿ K¦› nj <œnB ̄A> ° Jo“ ¤Ba{ nj <jBMB ́«> ° ,˜o{ J±®]
•¦Th« „Bš ̄ nj 3Ÿ An 3a¬C °  ̈j±a ̄ Bμ2B£k1⁄4ŽLU ­1⁄4M 3Ÿ ooT«±¦1⁄4Ÿ nAqμ
¥¦Ç 3ÇM ,¬C o¿3ÇM¿ pA BÇU ; ̈n°B1⁄4ÇMnj o1⁄2odÇU ·TÇ{n 3ÇM , ̈kÇ1⁄2j Sž¦aÇ«
©1⁄4Ç ̄AkÇM ° k1⁄2oLÇM »ÇQ JÀšÇ ̄A ¥Ç1⁄2A°A »BaTÇ]A oBμnB\–Ç ̄A ° Bμ»Ç«AnCBÇ ̄
Ó
nj »μBU±ÇŸ ·« kšÇ«
©ÇμA±i»Ç« 2pB]A ÀL›
/SwB\Ÿ nj »¦A ·azaow
Ø
2A±Ç£ An
nqÇM


این بخشی از اون کتاب بود

من از اوبونتو 18.04 استفاده میکنم و نمیدونم کدینگش چیه به تنظیماتش دست نزدم پیشفرضه
درمورد هماهنگی فونت نمیدونم اما خب وقتی چنین خط هایی میوفته انتخابشون میکنم و فونتشون رو تغییر میدم اما درست نمیشه
در ضمن همه ی فایل های PDF اینجوری نیست بعضی هاشونو درست می اندازه
الان یکی از اون PDF هارو پیوست میکنم شما هم امتحان کنید
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: میمو ☕ در 05 مهر 1398، 11:06 ق‌ظ
سلام،
خیلی از فایل های pdf با نوشتار فارسی/عربی موقع کپی پیست مشکل دارن.
این ذات اون فایله و کاری نمیشه کرد.
پیشنهاد میشه دنبال اپلیکیشنی باشید که از متن عکس بگیره و به text تبدیل کنه(نمیدونم همچین نرم افزاری بالاخص با پشتیبانی از نوشتار فارسی/عربی وجود داره یا نه).
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 05 مهر 1398، 07:19 ب‌ظ
خیلی ممنون از شما در ویندوز که ادوبی یه چنین بدنامه ای زده بود اما لینوکس رو نمیدونم لطفا چند تا از ابن برنامه ها که عکس رو متن کنه واسه اوبونتو معرفی کنید
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 05 مهر 1398، 09:40 ب‌ظ
فایل شما مشکل فونت داره
اینو داخل خصوصیات نوشته، اما نصب فونت هم مشکلو حل نمی‌کنه
احتمالاً در هنگام ساخت فایل گزینه compress font زده شده.


گفته شده این مشکل برای این به وجود میاد که فایل فقط درست نشون داده می‌شه و کنار هم قرار گیری کاراکترها مشکل داره. (لینک ها رو با دقت ببینید)

اگه بشه encoding فایلو پیدا کرد می‌تونه کمک کنه.
دستور زیر نتیجه بخش نبود.

file -i a.pdf

به لینک های زیر نگاهی بندازید.


https://stackoverflow.com/questions/12184304/extracting-text-from-garbled-pdf

https://tex.stackexchange.com/questions/329349/helvetica-font-not-embedded

https://community.adobe.com/t5/Acrobat/Garbled-text-when-copy-and-paste-after-creating-a-new-pdf-from/td-p/9929331

https://stackoverflow.com/questions/2926159/copypasting-text-from-pdf-results-in-garbage

https://www.tecmint.com/convert-files-to-utf-8-encoding-in-linux/

https://superuser.com/questions/1124583/text-in-pdf-turns-gibberish-on-copying-but-displays-fine

https://stackoverflow.com/questions/42754574/pdf-doesnt-show-characters-even-though-font-is-embedded-and-tounicode-is-prese

https://stackoverflow.com/questions/51444813/how-do-i-extract-the-arabic-text-of-this-pdf-file-correctly

https://apple.stackexchange.com/questions/76471/make-existing-pdf-searchable-ocr-via-command-line-script/147936#147936

https://unix.stackexchange.com/questions/548/ocr-on-linux-systems

عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 06 مهر 1398، 07:54 ق‌ظ
متشکرم
1. من اگر الان یه فایل با فرمت word بنویسم ویندوز اون رو میاره؟ فرق فرمت utf8 با اون یکی چیه کدوم بهتره؟
2. چجوری میشه فایل PDF رو عینا به word تبدیل کرد با همان صفخات و شکل ؟
3. کاراکتر ویل گول تو اوبنتو 18.04 چجوری نوشته میشه؟

عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: میمو ☕ در 06 مهر 1398، 08:04 ق‌ظ
متشکرم
من اگر الان یه فایل با فرمت word بنویسم ویندوز اون رو میاره؟ فرق فرمت utf8 با اون یکی چیه کدوم بهتره؟
یه سوال دیگه اینکه کاراکتر ویل گول تو اوبنتو چجوری نوشته میشه؟
استاندارد utf-8 پشتیبانی خوبی از فونت های فارسی / عربی داره.
برای ویرگول
Shift + 7
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 06 مهر 1398، 01:56 ب‌ظ
متشکرم
1. من اگر الان یه فایل با فرمت word بنویسم ویندوز اون رو میاره؟
فرق فرمت utf8 با اون یکی چیه کدوم بهتره؟
2. چجوری میشه فایل PDF رو عینا به word تبدیل کرد با همان صفخات و شکل ؟
۱) اگه فورمت ذخیره سازی را docx قرار بدید اصولا باید ویندوز نشون بده.
UTF8 نوع کدینک متن شماست نه فورمت.
کدوم یکی؟
۲) تبدیل pdf به doc

sudo apt install abiword
abiword --to=doc file.pdf

البته این دستور روی اون pdf شما که مورد داره کار نمی‌کنه ولی فایل pdf رو به doc تبدیل می‌کنه.

لینک (https://stackoverflow.com/a/42586909/7508077)
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 06 مهر 1398، 08:45 ب‌ظ
ببخشید این کد رو کجا باید بزنم؟ کجا ترمینال رو باز کنم؟
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 06 مهر 1398، 10:31 ب‌ظ
دستور اول برای نصب نرم افزاره هرجایی می تونید بزنید.


اجرای دستور دوم

اصل کار همینه. تبدیل فایل pdf به doc
خب باید ترمینالو جایی باز کنید که فایل pdf همون جاست.

البته در کل مهم نیست می‌تونید آدرس فایلو دقیق بهش بدید.
 
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: عرفان پورصدیقیان در 07 مهر 1398، 11:48 ق‌ظ
سلام
بعد از نصب اون برنامه کد دوم رو در پوشه فایل PDF زدم این اومد
الان کجاست؟
عنوان: پاسخ : متن خرچنگ قورباغه
ارسال شده توسط: esmaeelE در 07 مهر 1398، 01:37 ب‌ظ
در آدرسی که فایل pdf قرار داره و الان هستید ls بگیرید.
شما باید file.pdf رو با اسم pdf خودتون جایگزین کنید.

پی‌نوشت:
برای اینکه متون فارسیو در ترمینال درست ببینید (مثل نام پوشه که فارسیه) نرم افزار زیرو نصب کنید.
ابتدا از مسیر زیر پروژه رو دانلود کنید.
https://github.com/behdad/bicon

از حالت فشرده خارج کنید و داخل پوشه این دستوراتو وارد کنید.
./autogen.sh
./configure
make
sudo make install

بعد از نصب کامل، برنامه رو اجرا کنید.

biconحالا نوشته های راست به چپ درست نمایش داده می‌شه

برای پاک کردن برنامه هم داخل همین پوشه
sudo make uninstall