انجمنهای فارسی اوبونتو
کمک و پشتیبانی => نرمافزارهای اینترنتی => نویسنده: abedzadeh در 07 امرداد 1398، 07:37 بظ
-
درود دوستان.
بنده هیچ آشنایی با جاوااسکریپت و افزونههای مرورگر ندارم و نمیدونم این کار تا چه حد عملی هست.
روزانه بارها با صفحهی re-captcha گوگل روبهرو میشم و اینکه اینهمه اطلاعات رو به رایگان و از سر ناچاری تسلیم گوگل میکنم خیلی اذیتم میکنه. اگر افزونهای وجود داشت که این اطلاعات را جمع میکرد و به صورت محلی ذخیره میکرد، دادههای خیلی خوبی جمعآوری میشد. هر کاربر هم میتونست به اختیار خودش، این اطلاعات رو به یک مخزن دونیت کنه تا همه ازش استفاده کنند. چنین منبعی برای یادگیری ماشین و بینایی ماشین یک منبع فوقالعاده خواهد بود.
نظر شما چیست؟ چنین چیزی قابل پیادهسازی هست؟ آیا کسی علاقهمند به کمک هست؟
ممنون.
-
درود دوستان.
بنده هیچ آشنایی با جاوااسکریپت و افزونههای مرورگر ندارم و نمیدونم این کار تا چه حد عملی هست.
روزانه بارها با صفحهی re-captcha گوگل روبهرو میشم و اینکه اینهمه اطلاعات رو به رایگان و از سر ناچاری تسلیم گوگل میکنم خیلی اذیتم میکنه. اگر افزونهای وجود داشت که این اطلاعات را جمع میکرد و به صورت محلی ذخیره میکرد، دادههای خیلی خوبی جمعآوری میشد. هر کاربر هم میتونست به اختیار خودش، این اطلاعات رو به یک مخزن دونیت کنه تا همه ازش استفاده کنند. چنین منبعی برای یادگیری ماشین و بینایی ماشین یک منبع فوقالعاده خواهد بود.
نظر شما چیست؟ چنین چیزی قابل پیادهسازی هست؟ آیا کسی علاقهمند به کمک هست؟
ممنون.
فکر کنم صفحهی re-captcha وقتی ظاهر میشه که از فیلتر-شکن استفاده میکنید، درسته؟
اینهمه اطلاعات
چه اطلاعاتی؟!
-
چه اطلاعاتی؟!
گوگل سالهاست با استفاده از پروژه recaptcha در حال ایجاد Data setهای عظیمی برای مباحث ماشینلرنینگ و بیناییماشین هست.
همونطور که میدونید برای اینکه بتونید یک Model رو Train کنید تا فرضا تصاویر یک شی به خصوص رو شناسایی کنه نیاز به یک مجموعه داده داریم که بهمون تو ساده ترین حالت میگه مثلا این تصویر یک گربه هست یا سگ و نهایتا با مدلی که ساختیم میتونیم تصاویر جدید رو به دسته صحیح تخصیص بدیدم.
ایده در ساده ترین حالت این هست که شما وقتی دارید کلیک میکنید روی تصاویر در حال کمک به گوگل جهت ساخت این مجموعهداده عظیم هستید.
سالها پیش از این هم که کلماتی رو نشون میداد هدف شناسایی و تحلیل متن بود.
- - -
سالها پیش روی اون نسخه متنی یک کارایی کرده بودم (با PHP) حالا بچههای Js کار میتونند بیشتر رو این مورد تصاویر نظر بدند. فکر نکنم کار سختی باشه. حتی پروژههایی داشتیم که از یک Model دیگر استفاده شده برای دور Recaptcha.
-
فکر کنم صفحهی re-captcha وقتی ظاهر میشه که از فیلتر-شکن استفاده میکنید، درسته؟
بله، معمولا به خاطر تور هست.
در مورد اطلاعات هم که میلاد عزیز توضیح دادند.
-
بخوایم یکم ملموس تر بشه، میتونیم چند تا مثال هم بزاریم... مثلا بعضی وقتا میشه با زدن یک تصویر مشابه اشتباه یا نزدن یک تصویر همچنان از re-captcha رد شد.
در تصویر تاکسی ها، یکی اضافه که تاکسی نیست رو زدم و رد شدم.
در تصویر هایلایت شده، تصویر هایلایت قرمز رو نزدم و رد شدم.
-
بابا گوگل از خودمونه، همه سرویسها و خدمات و محصولاتی که ارائه میده مبتنی بر لینوکس است! چرا انقدر دشمنی دارید باهاش؟! حالا فرض کنیم شما درست میگی و کلیک کردنهای شما کمک میکنه به باهوشتر شدن ماشینهای گوگل :o در ازای خدمات رایگانی که میده این کمترین کار است. اگر خیلی حسودید یا مشکل دارید با گوگل لطفاً ازش استفاده نکنید.
-
بابا گوگل از خودمونه، همه سرویسها و خدمات و محصولاتی که ارائه میده مبتنی بر لینوکس است! چرا انقدر دشمنی دارید باهاش؟! حالا فرض کنیم شما درست میگی و کلیک کردنهای شما کمک میکنه به باهوشتر شدن ماشینهای گوگل :o در ازای خدمات رایگانی که میده این کمترین کار است. اگر خیلی حسودید یا مشکل دارید با گوگل لطفاً ازش استفاده نکنید.
بحث حسودی و مشکل نیست. گوگل خیلی بزرگه و بخشهای بزرگی داره. خیلیهاشون هم کمکهای عظیمی به اوپن سورس میکنند. اما در نهایت مثل هر شرکت دیگهای، هدفش سود بردن خودش هست.
این re-captcha ابزاری هست که به رایگان در اختیار سایتها قرار میگیره تا جلوی حملات رو بگیره و برای همین صاحبان سایتها خیلی از گوگل قدردانی میکنند. اما برای کاربرانی مثل من واقعا آزاردهنده هست و در ازاش هیچ چیزی دریافت نمیکنم (برعکس سایر سرویسهای رایگانش).
و اینکه چه اشکالی داره که یه بخشی از این اطلاعات رو برای خودمون نگهداری کنیم؟ (گوگل رفتارهای کاربران رو هنگام پر کردن re-captcha هم بررسی میکنه و به منابع اصلی عکسها دسترسی داره و همینطور فرادادههای زیادی در کنار این re-captcha جمعآوری میکنه)
-
توجه داشته باشید شما حتی اگر از هیچ یک از محصولات گوگل استفاده نکنید هم گاها با re-captcha برخورد خواهید کرد. به این خاطر که اکثر وب سایتها یا مستقیما از re-captcha استفاده میکنند و یا از سرویسهایی مثل Cloudflare استفاده میکنند که اونها re-captcha رو براشون به کار میگیرند.
دلیلی نداره اینهمه کاربر (که تو هیچ پروژه عامالمنفعهای نمیتونید این حجم از همکاری رو پیدا کنید) کمک کنند (مجبور به کمک باشند) برای قدرتمند شدن هوش مصنوعی یک شرکت که مشخص نیست از این علم تولید شده کجا استفاده خواهد کرد. جستجو کنید پیرامون قرارداد با پنتاگون و پهپادها.
با این حال ایده مطرح شده فارغ از اینکه ما با گوگل مشکل داریم یا خیر (که هیچ ربطی به مطلب نداره) صرفا این موضوع رو مطرح میکنه، تا بستری ایجاد بشه که اطلاعات عظیمی که راهی گوگل میکنیم رو به نحوی بتونیم برای پروژههای عامالمنفعه هم جمع آوری کنیم و در اختیار همه قرار بدیم.
هوش مصنوعی گوگل در خدمت گوگل هست.
یک هوش مصنوعی آزاد در خدمت مردمه.
-
:) خب ما استفاده نمیکنیم! دیگران استفاده میکنند (مثلاً توی سایتاشون) و تو دست و پای ما میپیچند.
خدمتی که گوگل به کاربراش میده دربرابر چیزی که از مردم میگیره و باهاش آزارمون میده، هیچه!
من که هیچوقت نتونستم از کپچاهاش با تور بگذرم! ولی بدون تور، میرم روی صداها و هر چیز مسخرهای مینویسم میپذیره! ولی خب بحث درصد شباهت مطرحه که بازم به دادههاش و دقتشون اضافه میشه.