1. مستندات
  2. سرور مجازی
  3. لینوکس
  4. بدون کنترل‌پنل
  5. مانیتورینگ و بررسی آپ‌تایم سرور

مانیتورینگ و بررسی آپ‌تایم سرور

Calendar

انتشار:

1404/08/09
Update Calendar

به روز رسانی:

1404/08/09

در این آموزش قصد داریم نحوه بررسی آپ‌تایم (Uptime) و مانیتورینگ وضعیت کلی سرور لینوکسی را توضیح دهیم تا بتوانید مدت زمان روشن بودن سرور، مصرف منابع و پایداری سیستم را ارزیابی کنید.

مرحله اول: بررسی زمان روشن بودن با دستور uptime

بعد از ورود از طریق SSH، ساده‌ترین روش برای مشاهده وضعیت کلی سرور استفاده از دستور uptime است. این دستور زمان فعلی، مدت زمان روشن بودن سیستم از آخرین ریبوت، تعداد کاربران متصل و میانگین بار پردازشی (Load Average) در ۱، ۵ و ۱۵ دقیقه اخیر را نشان می‌دهد. خروجی مشابه زیر نمایش داده می‌شود:

13:20:42 up 15 days, 3:12, 2 users, load average: 0.12, 0.09, 0.08

در این مثال سرور ۱۵ روز است که بدون قطعی فعال مانده است و وضعیت بار پردازشی طبیعی است.

نمای خروجی دستور uptime در ترمینال

مرحله دوم: مشاهده اطلاعات زنده با top و htop

برای بررسی زنده میزان استفاده از CPU، حافظه و پردازش‌ها، می‌توانید از دستور top استفاده کنید. این ابزار اطلاعات را به‌صورت لحظه‌ای نمایش می‌دهد و در بالای خروجی نیز زمان روشن بودن سیستم را نشان می‌دهد. برای خروج از محیط کافیست کلید q را فشار دهید.
اگر ترجیح می‌دهید محیطی رنگی‌تر و گرافیکی‌تر داشته باشید، ابزار htop گزینه بهتری است. با اجرای دستورات زیر می‌توانید آن را نصب کنید:

sudo apt install htop -y     # برای Ubuntu/Debian
sudo yum install htop -y     # برای CentOS/AlmaLinux

سپس با اجرای htop وضعیت دقیق CPU، حافظه و آپ‌تایم سیستم را در محیطی خوانا مشاهده می‌کنید.

نمای htop

مرحله سوم: استفاده از خروجی خلاصه‌تر با uptime -p

اگر فقط می‌خواهید بدانید سرور چه مدت روشن بوده است، از گزینه -p استفاده کنید:

uptime -p

این دستور خروجی ساده‌ای مانند نمونه زیر دارد:

up 15 days, 3 hours, 12 minutes

این روش برای گزارش‌های سریع‌تر یا بررسی‌های روزمره مفیدتر است.

خروجی دستور uptime -p

مرحله چهارم: تحلیل زمان بوت با systemd-analyze

برای بررسی مدت زمان بوت سرور و شناسایی سرویس‌هایی که باعث تأخیر می‌شوند، از دستور زیر استفاده کنید:

systemd-analyze

برای مشاهده جزئیات سرویس‌ها از دستور زیر استفاده کنید:

systemd-analyze blame

این اطلاعات کمک می‌کنند متوجه شوید کدام سرویس‌ها بیشترین زمان بوت را به خود اختصاص داده‌اند تا بتوانید در صورت نیاز بهینه‌سازی انجام دهید.

نمای خروجی systemd-analyze blame

مرحله پنجم: مانیتورینگ بلندمدت با sysstat و sar

برای مشاهده عملکرد سرور در بازه‌های زمانی مختلف از ابزار sar در بسته‌ی sysstat استفاده می‌شود. ابتدا آن را نصب کنید:

sudo apt install sysstat -y

سپس سرویس مربوطه را فعال نمایید:

sudo systemctl enable sysstat --now

با اجرای دستور زیر می‌توانید مصرف CPU در ساعت‌های گذشته را ببینید:

sar -u

این اطلاعات برای شناسایی دوره‌های اوج مصرف و تحلیل پایداری سرور در طول زمان بسیار مفید هستند.

نمای خروجی sar -u

مرحله ششم: بررسی آپ‌تایم از بیرون با سرویس‌های مانیتورینگ

برای اطمینان از در دسترس بودن سرور از بیرون شبکه، می‌توانید از سرویس‌هایی مانند UptimeRobot یا HetrixTools استفاده کنید. در این سرویس‌ها کافیست IP یا دامنه سرور را وارد کنید تا در صورت قطعی، هشدار از طریق ایمیل یا تلگرام دریافت کنید. این کار برای مدیران سرور و صاحبان وب‌سایت‌هایی که نیاز به پایداری بالا دارند بسیار ضروری است.

UptimeRobot

با انجام مراحل بالا می‌توانید آپ‌تایم و وضعیت منابع سرور خود را به‌صورت دقیق بررسی و کنترل کنید. این کار به افزایش پایداری، پیشگیری از مشکلات احتمالی و حفظ عملکرد بهینه سرور کمک می‌کند.

آیا توانستیم چالش شما را حل کنیم؟