انجمن‌های فارسی اوبونتو

لطفاً به انجمن‌ها وارد شده و یا جهت ورود ثبت‌نام نمائید

لطفاً جهت ورود نام کاربری و رمز عبورتان را وارد نمائید




نویسنده موضوع: مشکل wget با حروف فارسی در URL  (دفعات بازدید: 475 بار)

0 کاربر و 1 مهمان درحال مشاهده موضوع.

آفلاین S34b

  • Newbie
  • *
  • ارسال: 4
مشکل wget با حروف فارسی در URL
« : 01 امرداد 1401، 09:09 ب‌ظ »
سلام
اگر بخواهم تمام تصاویر یک صفحه در اینترنت که در آدرس آن از حروف فارسی استفاده شده رو از طریق ترمینال ذخیره کنم،‌ یک راه‌حل استفاده از wget است (راه بهتری سراغ دارید؟).
به عنوان مثال، برای ذخیره کردن تصاویر کادر بیمارستان در آدرس زیر:
https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7
دستور زیر، تنها فایل‌هایی که نام با حروف لاتین دارند را ذخیره می‌کند و گویا در آدرس‌یابی فایل‌هایی که نام با حروف فارسی دارند، دچار مشکلاتی برای دیکود کردن می‌شود:
wget "https://thc.tums.ac.ir/v-63/استف ها" -p -A .jpg,.jpeg,.png -H -ndیا به‌صورت انکود شده:
wget "https://thc.tums.ac.ir/v-63/%D8%A7%D8%B3%D8%AA%D9%81%20%D9%87%D8%A7" -p -A .jpg,.jpeg,.png -H -ndهمچنین با افزودن موارد زیر، تغییری ایجاد نمی‌شود:
--remote-encoding=UTF-8--restrict-file-names=nocontrolکه مشاهده می‌شود wget مثلا آدرس زیر را جستجو می‌کند:
https://thc.tums.ac.ir/v-63/%C3%83%CB%9C%C3%82%C2%A7%C3%83%CB%9C%C3%82%C2%B3%C3%83%CB%9C%C3%82%C2%AA%C3%83%E2%84%A2%C3%82%C2%81%20%C3%83%E2%84%A2%C3%A2%E2%82%AC%C2%A1%C3%83%CB%9C%C3%82%C2%A7
که درصورت دیکود شدن، به عبارت زیر تبدیل می‌شود:
استÙÂ%C2%81 ها
که معلوم نیست چی هست!
آیا راه‌حلی برای این مشکل وجود دارد؟
با سپاس