Перейти к основному контенту

Диагностика диска Dedicated с помощью S.M.A.R.T.

Технология S.M.A.R.T. предназначена для оценки состояния дисков (HDD\SSD\SATA и др.). Она позволяет предсказать выход устройства из строя в результате механических неисправностей и произвести заблаговременную замену аварийного диска во избежание потери данных.

Утилита S.M.A.R.T. не оснащена функциями уведомления и прямого взаимодействия с пользователем. Для ее использования необходимо две составляющие:

  • Встроенное ПО (поддержка технологии накопителем);
  • Внешнее ПО (установленное на сервер).

Для проверки состояния ваших дисков подключитесь к серверу по SSH.

Анализ состояния дисков на Linux

Как установить S.M.A.R.T.?

Доступ к данным, предоставляемым технологией S.M.A.R.T., осуществляется различными утилитами.

  • Для FreeBSD и Linux это – smartctl, входящая в пакет утилит smartmontools.

  • Для Centos/Redhat: yum install -y smartmontools

  • Для Debian/Ubuntu: apt-get install -y smartmontools

  • Для FreeBSD: make -C /usr/ports/sysutils/smartmontools/ install clean

Как проверить состояние дисков?

Проверить состояние диска можно в консоли Linux-командой:

smartctl -a /dev/sdX

Имя диска может отличаться и быть одним из следующих:

  • linux: /dev/sd[a-z] (ide, scsi, sata, sas, рейды); /dev/nvme[0-9]n[0-9] (NVMe SSD)

  • freebsd: /dev/da[0-9] (scsi, sas raid, sata), /dev/ada[0-9] (ahci sata)

Обратите внимание, что указывать необходимо диск, а не раздел (/dev/sda, но не /dev/sda1)

Проверьте вывод команды dmesg на предмет наличия ошибок чтения и записи дисков (обратить внимание на такие параметры, как DMA TIMEOUT, Relocation failed и т.д.).

Вы можете проверить общее состояние устройства с флагом -H:

smartctl -H /dev/XXX

В выводе команды обратите внимание на строку: SMART overall-health self-assessment test result: PASSED

Если статус отличается от «PASSED», необходимо обратиться в службу поддержки, приложив вывод команды smartctl -a для данного диска.

Вы также можете просмотреть список последних результатов тестирования и подробную информацию при помощи команд:

smartctl -l selftest /dev/ и smartctl -a /dev/

Как проверить состояние дисков, подключенных в аппаратный RAID-контроллер?

Если на вашем сервере используется аппаратный RAID-контроллер, вы также можете использовать утилиту smartmontools. Для этого предварительно потребуется установить консольную утилиту от производителя вашей модели контроллера и получить данные подключенных через плату устройств, выполнив одну из команд:

storcli /c0 show all

tw_cli /c0 show

arcconf getconfig 1

Чтобы получить параметры SMART-диска в контроллере, воспользуйтесь командами:

  • Для Megaraid: smartctl -a -d megaraid,N /dev/sdN

где N — это ID диска в контроллере, который можно узнать утилитой storcli (параметр DID):
storcli /c0 show all

  • Для 3ware: smartctl -a -d 3ware,N /dev/twN

где N — это ID диска в контроллере, который можно узнать утилитой twcli:
tw_cli /c0 show

  • Для AAC (ARC): smartctl -a -d aacraid,0,0,2 /dev/sdN

где N — это ID диска в системе, а 0,0,2 — это параметры H,L,ID (Host number, Lun, ID) контроллера, которые можно узнать с помощью утилиты arcconf: arcconf getconfig 1

Анализ состояния дисков на Windows

Smart дисков можно узнать утилитой StorCLI.exe из программного обеспечения для управления RAID MegaRAID Storage Manager:

.\StorCLI /c0 show all

параметр «Drive has flagged a S.M.A.R.T alert» служит для индикации наличия у диска S.M.A.R.T.-предупреждений. «Yes» диск имеет предупреждения, «No», соответственно, не имеет.

Также следует проверить наличие записей в EventLog.

Была ли эта статья полезной?
Пользователи, считающие этот материал полезным: 0 из 0