/ Статьи / Системное / Установка и настройка средств мониторинга системы. Часть 2 /

Установка и настройка средств мониторинга системы. Часть 2

Дата публикации: May 26, 2009, 7:14 p.m.
Теги: SMART, мониторинг, hdd,
Автор: Brainsburn

Доктор SMART, smartmontools, smartctl, smartd
Мониторинг состояния и диагностика жестих дисков

smartmontools

smartmontools служит для мониторинга состояния и просмотра информации жестких дисков через SMART.
Чипы SMART установлены на всех современных жестких дисках. Эта технология позволяет выявить проблемы магнитных головок, повреждения дисков, логические неисправности, отказ системы привода, проблемы электронной платы и температуры.

Для начала надо установить саму smartmontools через пакетный менеджер Вашего дистрибутива (как это делать Вы должны знать).
После установки Вы сможете использовать две программы - smartctl и smartd. Первая может получать информацию о состоянии диска, включать/отключать SMART или проводить тесты. Вторая - демон, оповещающий администратора об аномалиях и неисправностях. По дефолту smartd осматривает диски каждые 30минут и заносит ошибки в лог (/var/log/messages).

Узнать, поддерживает ли диск SMART можно так:
# smartctl -i /dev/sda

Включить SMART (если отключен):
#smartctl -s on /dev/sda

Получить полную информацию о диске:
#smartctl --all /dev/sda

Вывод команды smartctl --all /dev/sda:

smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is

=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.11
Device Model: ST3500320AS
Serial Number: 9QM5APRJ
Firmware Version: SD15
User Capacity: 500 106 780 160 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4 SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.

Как видно, на этом харде SMART отключен. Включим его.
# smartctl -s on /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is

=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Enabled.

Теперь, после включения SMART, можно посмотреть атрибуты диска:
# smartctl -A /dev/sda

smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen Home page is

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 66600446
3 Spin_Up_Time 0x0003 094 094 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 54
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 071 060 030 Pre-fail Always - 13314909
9 Power_On_Hours 0x0032 097 097 000 Old_age Always - 3189
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 157
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 067 067 045 Old_age Always - 33 (Lifetime Min/Max 32/33)
194 Temperature_Celsius 0x0022 033 040 000 Old_age Always - 33 (0 20 0 0)
195 Hardware_ECC_Recovered 0x001a 036 026 000 Old_age Always - 66600446
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 2
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 2
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0

Разберемся, что-же это все значит.
VALUE - текущее значение атрибута.
WORST - минимальное значение атрибута, которое достигалось с момента включения SMART
TRESH - минимально допустимое значение атрибута. Если значение VALUE стало меньше значения TRESH, значит дело плохо.
TYPE - тип атрибута, Pre-fail - критичный, Old_age - не критичный.

Если VALUE стало меньше или равно TRESH в случае типа Pre-fail, скорее всего жесткий диск находится в предсмертном состоянии.
Если же в случае Old_age, то диск еще поживет, но уже видно, что ему пора на пенсию.
Проще говоря, чем больше значение VALUE, тем лучше.

Raw Read Error Rate - ошибки при чтении данных, за которые ответственна аппаратная часть диска
Spin Up Time - время раскрутки дисков до рабочего сотояния.
Spin Up Retry Count - число повторных попыток раскрутки дисков до рабочей скорости, если первая попытка была неудачной.
Seek Error Rate - частота ошибок при позиционировании блока головок.
Исходные значения (например тот-же Spin Up Retry Count) помещаются в RAW_VALUE, а не в VALUE! В VALUE хранится "нормализованное" значение, и чем оно больше, тем лучше.

smartd

Откройте конфигурационный файл /etc/smartd.conf. По дефолту в нем только одна опция DEVICESCAN, закомментируйте ее и добавьте список жестких дисков.
/dev/sda -S on -o on -a -I 194
/dev/sdb -S on -o on -a -I 194

Опция -S активирует автозапись атрибутов.
Опция -o включает автоматическое тестирование.
Опция -a указывает smartd мониторить все параметры диска.
Опция -I 194 игнорирует атрибут №194 (температура). Это нужно потому-что температура меняется часто и нет смысла ее логировать.

Теперь можно запустить демон smartd
# /etc/init.d/smartd start
*** статья не закончена




Возможно, эти материалы Вас заинтересуют:


Рекомендовать эту страницу:

Комментарии:(1)

# aprogrammer April 1, 2014, 11:56 a.m.
Огромное спасибо за статью. Только мало написано об отправке писем, дебаге запуска демона. Можно чуток от сюда взять - http://sysadmin.te.ua/linux/smartd.html

Комментировать:

Гость, Вы можете оставить свой комментарий.

Стиль кода:
Имя
Сайт * не обязательное поле
Поставьте галку, если вы - бот
Поставьте галку, если вы - человек

Друзья! Убедительная просьба воздержаться от нецензурной лексики!



Справка:
Если вы хотите использовать в тексте комментария специальные символы, например, [ и ], используйте их внутри тега [code] [/code]
Вы можете использовать теги BBcode. Для оформления кода и подсветки синтаксиса используйте тег [code] или [code=название_языка], например, [code=python]
Ссылки вставляйте так: [url]zenux.ru[/url] или так: http://zenux.ru, но не так: zenux.ru
Текст сообщения должен быть в пределах 3000 символов.




Последние комментарии:

Руслан 2: Продолжение8) Сравнение 2D производительности - Ди... >>>
Руслан: Проблема издевательски низкой 2D GDI производитель... >>>
ВикторА: Спасибо за статью.Полезно…Только не учитывае... >>>
vladdou: Спасибо за внятное и содержательное руководство... >>>
Гость: не работает, увы, ищу дальше.... >>>