از زمانی که برای پاسخگویی اختصاص دادید سپاسگزارم.
در روز ۷ مارس حدود ساعت ۱۰ دسترسی به خدمت وب آپاچی روی یک ماشین بسیار کند شده بود.
دسترسی ssh با کندی به این ماشین برقرار شد.
# uptime
10:10:16 up 16 days, 1:13, 8 users, load average: 1375.25, 404.68, 144.44
تا کنون چنین عددی را برای load average ندیده بودم.
htop پرشدن و فعال شدن swap را نشان نمیداد. حافظه هم کمتر از نصف پر بود.
دسترسیهای سایر کاربران را به این ماشین با تغییر رمز ورود متوقف کردم.
لاگهای چند ساعت اخیر را برای بررسی بیشتر ذخیره کردم. تنها چیز مشکوک تعداد نشستها ایجاد شده برای این کاربر(store) بود.
از این کاربر برای کپی کردن یکسری فایل روی سرور استفاده میشود و دسترسی محدودی تنها برای کپی کردن و خواندن از یک آدرس خاص دارد.
شمار نشستهای ایجاد شده برای آن حدود 6200 عدد برای ساعتهای منتهی به ایجاد مشکل است.
در اینجا چند خط نخست را قرار دادم.
# head new_session
Mar 07 08:41:33 server systemd-logind[930]: New session 1027 of user store.
Mar 07 08:41:55 server systemd-logind[930]: New session 1028 of user store.
Mar 07 08:46:10 server systemd-logind[930]: New session 1029 of user store.
Mar 07 08:58:36 server systemd-logind[930]: New session 1030 of user root.
Mar 07 08:59:54 server systemd-logind[930]: New session 1031 of user store.
Mar 07 08:59:55 server systemd-logind[930]: New session 1032 of user store.
Mar 07 08:59:55 server systemd-logind[930]: New session 1033 of user store.
Mar 07 08:59:56 server systemd-logind[930]: New session 1034 of user store.
Mar 07 08:59:56 server systemd-logind[930]: New session 1035 of user store.
Mar 07 08:59:57 server systemd-logind[930]: New session 1036 of user store.
به نظرم رسید که شاید این دو مسئله به هم مرتبط باشند یا اینکه باید به روشی از افزایش شمار نشستهای یک کاربر جلوگیری کرد.
حال دو پرسش
* ارتباطی بین تعداد نشستهای کاربر که با ssh کارمیکند با کندشدن سامانه میتوان متصور بود. و اینکه محدودسازی آن مزیتی دارد یا خیر؟
* به طور کلی در مورد مسئلهٔ کند شدن سرور به این شکل چه نکاتی را باید بررسی کنم تا از تکرار این مورد جلوگیری شود؟