هادوپ / هدوپ یک چیز پیچیده است (: یک سیستم که به تو اجازه می ده با دادههای بزرگ کار کنی. فرض کن گوگل می خواد اینترنت رو ایندکس کنه یا تو قراره یک برنامه بنویسی که کل سهام بازارهای سهام جهان رو لحظه به لحظه ذخیره کنه و بعد تو روشون کوئری بگیری یا با اخباری که از همه روزنامه های بزرگ دنیا ذخیره کردی، ارتباطشون رو بررسی کنی.
برای اینکار باید اطلاعاتت رو بریزی توی یه دیتابیس ولی چه دیتابیسی توان اینکار رو داره؟ (: گوگل هم سوال مشابهی داشت و یک سیستم درست کرد که توش بشه کلی کامپیوتر گذاشت پشت هم و مستقل از اینکه چطوری به هم وصل هستن بهشون گفت که فلان اطلاعات رو یادت نگه دار و بعد ازش خواست که فلان اطلاعات رو بده. این می شه پایه چیزی که بعدا آپاچی ادامه داد و بهش می گیم هدوپ. اگر بخوای کار مشابهی کنی باید کلی کامپیوتر بذاری کنار هم که شبکه باشن، رو همه هدوپ نصب کنی (که آزاده) و بعد اطلاعاتت رو بریزی توش و ازش سوال کنی. اما آدم های معمولی اینکار رو نمی کنن. هدوپ فقط برنامه ساده نیست. فایل سیستم خودش رو داره و در مقابل خراب شدن داده مقاومه و دیگه هر تیکه داده روی یک هارد نیست و این چیزها و کسانی مثل من و تو اگر بخوان اینو راه بندازن برای استفاده می رن سراغ جاهایی که سرورهای زیادی دارن (مثلا آمازون) و به تعداد کافی سرور می گیرن، هدوپ نصب می کنن ، اطلاعاتشون رو می ریزن روش و دستوراتی مثل «ایندکس بساز» می دن بدون نگرانی از حجم اطلاعات. اگر هم سیسیتم کند شد فقط سی پی جدید یا حتی کامپیوترهای جدید سفارش می دادن و می یارنش توی همین مجموعه هادوپشون.
نه من باهاش کار نکردم (: