انجمن‌های فارسی اوبونتو

کمک و پشتیبانی => نرم‌افزارهای اینترنتی => نویسنده: S34b در 01 امرداد 1401، 09:09 ب‌ظ

عنوان: مشکل wget با حروف فارسی در URL
ارسال شده توسط: S34b در 01 امرداد 1401، 09:09 ب‌ظ
سلام
اگر بخواهم تمام تصاویر یک صفحه در اینترنت که در آدرس آن از حروف فارسی استفاده شده رو از طریق ترمینال ذخیره کنم،‌ یک راه‌حل استفاده از wget است (راه بهتری سراغ دارید؟).
به عنوان مثال، برای ذخیره کردن تصاویر کادر بیمارستان در آدرس زیر:
https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7 (https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7)
دستور زیر، تنها فایل‌هایی که نام با حروف لاتین دارند را ذخیره می‌کند و گویا در آدرس‌یابی فایل‌هایی که نام با حروف فارسی دارند، دچار مشکلاتی برای دیکود کردن می‌شود:
wget "https://thc.tums.ac.ir/v-63/استف ها" -p -A .jpg,.jpeg,.png -H -ndیا به‌صورت انکود شده:
wget "https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7" -p -A .jpg,.jpeg,.png -H -ndهمچنین با افزودن موارد زیر، تغییری ایجاد نمی‌شود:
--remote-encoding=UTF-8--restrict-file-names=nocontrolکه مشاهده می‌شود wget مثلا آدرس زیر را جستجو می‌کند:
https://thc.tums.ac.ir/v-63/%C3%83%CB%9C%C3%82%C2%A7%C3%83%CB%9C%C3%82%C2%B3%C3%83%CB%9C%C3%82%C2%AA%C3%83%E2%84%A2%C3%82%C2%81%20%C3%83%E2%84%A2%C3%A2%E2%82%AC%C2%A1%C3%83%CB%9C%C3%82%C2%A7 (https://thc.tums.ac.ir/v-63/%C3%83%CB%9C%C3%82%C2%A7%C3%83%CB%9C%C3%82%C2%B3%C3%83%CB%9C%C3%82%C2%AA%C3%83%E2%84%A2%C3%82%C2%81%20%C3%83%E2%84%A2%C3%A2%E2%82%AC%C2%A1%C3%83%CB%9C%C3%82%C2%A7)
که درصورت دیکود شدن، به عبارت زیر تبدیل می‌شود:
استÙÂ%C2%81 ها
که معلوم نیست چی هست!
آیا راه‌حلی برای این مشکل وجود دارد؟
با سپاس