آقای اژدها خیلی خیلی ممنون از توضیحات کامل و خوبتون، واقعا وقت گذاشتید، مرسی.
بله همانطور که گفتید فایلسیستم روت با آپشن errors=remount-ro سوار شده.
findmnt -o options /
OPTIONS
rw,relatime,errors=remount-ro
اینکه عادیه. بهتره وقتی خطایی توی فایلسیستم رخ میده، به صورت فقط خواندنی دربیاد تا احتمال از دست دادن اطلاعات کمتر بشه.
میتونید مقدار آپشن errors رو به continue تغییر بدید (از طریق ویرایش فایل fstab) تا اگه خطتیی ذخ داد، فایلسیستم همچنان به کارش ادامه بده. ولی بهتره اینکار رو انجام ندید.
یه مقدار دیگه هم برای آپشن errors هست. اگه مقدار این آپشن رو برابر panic قرار بدید در صورت رخ دادن یه خطا، کرنل panic میکنه و کلا از کار میافته.
اینجوری مجبور میشید سیستم رو راهاندازی مجدد کنید تا دوباره کار کنه. معمولا این رفتار برای سرورها مناسبه.
به نظرتون راهی نیست بتونم متوجه بشم کدام یک از این موارد هست؟ توی لاگها چیزی نمیتونم پیدا کنم؟
شاید توی گزارشهای کرنل چیزی باشه. مطمئن نیستم.
از اونجایی که بعد از رخ دادن خطا، فایلسیستم روت به شکل فقط خواندنی درمیاد و /var/log/ هم از روت جدا نیست، هیچ گزارشی بعد از خطای فایلسیستم ذخیره نمیشه. در نتیجه گزارشهایی که اون خطا رو توصیف کردند جایی ذخیره نشده.
بهتره وقتی که خطا پیش میاد، وارد محیط console بشید و اگه میتونید، گزارشهای کرنل در حال اجرا رو یه جایی ذخیره کنید. به این شکل:
sudo dmesg > kmsg.txt
به جای kmsg.txt مسیر به فایلی که میهاهید گزارشها داخل اون ذخیره بشن رو قرار بدید. دقت کنید باید دسترسی نوشتن روی اون فایل داشته باشید وگرنه خطا میگیرید. sudo روی redirectها اثر نداره. اگه لازمه با دسترسی روت انجام بشه، از tee استفاده کنید. به این شکل:
sudo dmesg | sudo tee kmsg.txt
میتونید گزارشها رو روی یه فلش ذخیره کنید. بعد میتومید هر وقت تونسنید، اونها رو بررسی کنید.
پس یعنی الان که من حدود سی چهل مگم پره مشکلی نیست؟ نیازی به افزایش حجم نداره؟
نه. نباید مشکل خاصی ایجاد کنه. میتونید هم اندازه اون رو بزرگتر کنید. اگه بخواهید.