انجمنهای فارسی اوبونتو
کمک و پشتیبانی => نرمافزارهای اینترنتی => نویسنده: S34b در 01 امرداد 1401، 09:09 بظ
-
سلام
اگر بخواهم تمام تصاویر یک صفحه در اینترنت که در آدرس آن از حروف فارسی استفاده شده رو از طریق ترمینال ذخیره کنم، یک راهحل استفاده از wget است (راه بهتری سراغ دارید؟).
به عنوان مثال، برای ذخیره کردن تصاویر کادر بیمارستان در آدرس زیر:
https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7 (https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7)
دستور زیر، تنها فایلهایی که نام با حروف لاتین دارند را ذخیره میکند و گویا در آدرسیابی فایلهایی که نام با حروف فارسی دارند، دچار مشکلاتی برای دیکود کردن میشود:
wget "https://thc.tums.ac.ir/v-63/استف ها" -p -A .jpg,.jpeg,.png -H -nd
یا بهصورت انکود شده:
wget "https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7" -p -A .jpg,.jpeg,.png -H -nd
همچنین با افزودن موارد زیر، تغییری ایجاد نمیشود:
--remote-encoding=UTF-8
--restrict-file-names=nocontrol
که مشاهده میشود wget مثلا آدرس زیر را جستجو میکند:
https://thc.tums.ac.ir/v-63/%C3%83%CB%9C%C3%82%C2%A7%C3%83%CB%9C%C3%82%C2%B3%C3%83%CB%9C%C3%82%C2%AA%C3%83%E2%84%A2%C3%82%C2%81%20%C3%83%E2%84%A2%C3%A2%E2%82%AC%C2%A1%C3%83%CB%9C%C3%82%C2%A7 (https://thc.tums.ac.ir/v-63/%C3%83%CB%9C%C3%82%C2%A7%C3%83%CB%9C%C3%82%C2%B3%C3%83%CB%9C%C3%82%C2%AA%C3%83%E2%84%A2%C3%82%C2%81%20%C3%83%E2%84%A2%C3%A2%E2%82%AC%C2%A1%C3%83%CB%9C%C3%82%C2%A7)
که درصورت دیکود شدن، به عبارت زیر تبدیل میشود:
استÙÂ%C2%81 ها
که معلوم نیست چی هست!
آیا راهحلی برای این مشکل وجود دارد؟
با سپاس