17 марта 2004
Обновлено 17.05.2023

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T.

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - изображение обложка

Сидит программист за компьютером. Звонок в дверь. Открывает, а там маленькая Смерть с отверткой.Мне рано умирать, я еще молод!Не бойся, парень, я за винтом пришла… Анекдот

Жесткий диск — зверь очень хитрый. Так и норовит куда-то упасть, рассыпать таблицы разделов, забыть пару кластеров, а то и рухнуть всеми 32-мя битами FAT’а на голову несчастному пользователю. В один миг вы можете лишиться всей бесценной, накопленной за долгие годы работы информации. Конечно, можно проклинать судьбу и тщательно затирать свое горе спиртом — но не разумнее ли будет предупредить возможный сбой, нежели надеяться на его величество случай!? Что такое S.M.A.R.T? Впервые над этим задумались в 1995 году. Именно тогда инженеры IBM предложили систему предсказания надежности Predictive Failure Analysis. Вся соль технологии состояла в попытке предсказания того самого дня X и времени Ч, когда наш друг-винчестер решит отойти в мир иной. Немногим позже корпорация Compaq в коалиции с Seagate , Quantum и Conner разработали собственную технологию мониторинга состояния жесткого диска. Проект получил название IntelliSafe. Новоиспеченная технология отслеживала ряд критических характеристик диска, сравнивала полученные значения с допустимыми и рапортовала системе в случае опасности.

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - фото 1

- DTemp - грамотно, просто и со вкусом
Еще некоторое время спустя при участии большинства крупных производителей жестких дисков появилась технология S.M.A.R.T.Self Monitoring Analysing and Reporting Technology (от англ. “технология самодиагностики, анализа и отчета”), в основе которой лежали наработки как IntelliSafe , так и PFA. Вкратце, технология работает следующим образом. Устройство — дисковый накопитель, в котором реализованы функции S.M.A.R.T., — ведет статистику своих рабочих параметров ( количество наработанных часов, время разгона шпинделя, обнаруженные/исправленные ошибки и т.п. ). Показания S.M.A.R.T. накапливаются в служебных зонах или в энергонезависимой памяти носителя. На основе этой информации можно судить о состоянии механики, условиях эксплуатации, а также своевременно заметить предаварийное состояние диска. Между тем, необходимо понимать, что технология S.M.A.R.T. не в силах устранить возникшую проблему. Она лишь способна предупредить о возможном крушении диска и последующей за этим потере информации. В своем развитии технология S.M.A.R.T. прошла три этапа. В первом поколении было реализовано наблюдение лишь за небольшим количеством параметров диска. Никаких самостоятельных действий со стороны накопителя не предусматривалось. Все функции управления ложились на внешние программные утилиты. Строгих спецификаций, четко описывающих стандарт, не было. Как следствие, каждый производитель самостоятельно решал, какие именно показатели надлежит мониторить в каждой конкретной модели дискового накопителя. Только в следующем воплощении S.M.A.R.T. появилась фоновая проверка поверхности в автоматическом режиме и ведение журналов ошибок. Значительно расширился список контролируемых параметров и появилось нечто вроде спецификации, определяющей, какие из этих параметров являются обязательными и критически важными, а какие можно причислить к вспомогательным и необязательным. Разумно сделать небольшое лирическое отступление и вкратце поведать о такой неотъемлемой части технологии, как “журнал ошибок диска”. По спецификации, винчестер сохраняет историю пяти последних ошибок (это число может варьироваться). Кроме того, запоминаются последние пять команд, за которыми, собственно, и последовала каждая из ошибок. Зачем это надо? Дело в том, что журналы ошибок S.M.A.R.T. помогают в деталях воссоздать картину крушения диска. Другой вопрос — кому это надо. Ясное дело — рядовой пользователь слыхом не слыхивал ни об ATA-командах, ни о кодах и расшифровках сбойных ситуаций. Потому расшифровать журнал могут только высококвалифицированные специалисты, которым по гарантии возвращается диск.

Воля случая

Как известно, жесткий диск — устройство очень хрупкое. Порой падение винчестера даже с небольшой высоты может вызвать внутренние повреждения или клиническую смерть. Такова жизнь, и никто в этом мире не застрахован от роковой случайности… Самым распространенным последствием удара является “шлепок головок”. Он происходит, когда энергия удара направлена вертикально или под некоторым углом к горизонтальной плоскости диска. Проще говоря, подобного эффекта можно добиться, если как следует — резко и энергично — потрясти диск вверх-вниз. При особо сильных пертурбациях происходит отрыв магнитной головки от поверхности накопителя, а затем резкий удар о поверхность магнитного диска. Результаты подобных коллизий довольно плачевны. На месте соприкосновения головки с диском появляются поврежденные сектора, и как следствие — теряется бесценная информация.
Это могут быть как лаборанты на мощностях вендора/дилера/продавца, так и инженеры с завода самого производителя. Современный этап развития представлен технологией третьего поколения — S.M.A.R.T III. Конечно, спецификация еще далека от совершенства, однако в сравнении с предыдущими версиями она стала значительным шагом вперед. Наглядный пример тому — неумолимая статистика, которая утверждает, что число правильно и своевременно предсказанных сбоев достигло 80%! Важно отметить, что в третьей модификации S.M.A.R.T. появилась функция обнаружения дефектов поверхностии возможность их последующего " прозрачного " восстановления. Выражаясь простыми словами, жесткий диск неспешно сканирует поверхность и при наличии испорченных секторов замещает их на запасные из резервной области. Причем пользователь даже не заметит каких-либо действий со стороны винчестера. Меньше знаешь — крепче спишь! Атрибуты “умного” диска Нам уже известно, что S.M.A.R.T. производит наблюдение за основными характеристиками или, как их еще называют, атрибутами винчестера. Каждый атрибут имеет вполне определенное значение — value, которое характеризует собой степень надежности. Обычно эта величина изменяется в диапазоне от 1 до 100. Реже встречаются значения от 1 до 253. Чем выше значение value, тем лучше. Исправный жесткий диск должен выдавать максимум по всем параметрам, а изменяющиеся во времени или уверенно убывающие значения не сулят ничего хорошего. Это в теории. На практике же нужно учитывать, что спецификация универсальна и адаптирована для огромного спектра дисковых накопителей, имеющих разное механическое устройство и электронику. То есть конкретное устройство вполне может иметь средние показатели надежности по всем атрибутам, работая при этом исправно много лет. Поэтому для каждого атрибута принято выбирать минимальное значение (это делает сам производитель), при котором гарантируется безотказная работа данной конкретной модели жесткого диска. Эта величина именуется пороговым значением — threshold. В настоящий момент официальная документация и подробные описания технологии S.M.A.R.T. журналистам недоступны. В связи с этим отыскать исчерпывающую информацию по всем параметрам S.M.A.R.T. достаточно трудно. Тем не менее мы собрали и систематизировали те из них, которые тем или иным способом стали известны широкой общественности. Полагаю, начать следует с наиболее важных и повсеместно наблюдаемых атрибутов. *** Raw Read Error Rate** — частота ошибок при чтении данных с диска. Частота ошибок чтения информации с диска, происхождение которых обусловлено аппаратной частью жесткого диска. *** Read Channel Margin** — запас канала чтения. Увы, назначение этого атрибута покрыто завесой тайны. **

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - фото 2

**
- DriveHealth сочетает в себе массу полезных возможностей. Огорчает лишь то, что за полноценное использование программы разработчик требует пеню
Доподлинно известно лишь одно — он используется в накопителях производства Maxtor. *** Reallocated** Sector Count — число переназначенных секторов. Когда жесткий диск встречает ошибку чтения/записи, он пытается переместить поврежденные данные в специальную резервную область и, в случае успеха, помечает сектор как переназначенный. Благодаря этой возможности современные жесткие диски способны скрывать незначительное число плохих секторов. Однако при большом количестве переназначенных секторов (до 10% от общего количества секторов и более) наблюдается резкое падение скорости чтения. *** Reallocation Event Count** — количество операций переназначения сбойных секторов. Показывает общее число попыток переназначения сбойных секторов в резервную область диска. При этом учитываются как успешные, так и неудачные операции. *** Seek Error Rate** — ошибки позиционирования блока головок. Ошибки позиционирования возникают при повреждении сервометок , перегреве носителя или в случае сбоя механической системы позиционирования. Большое количество ошибок позиционирования свидетельствует о низком качестве поверхности или поврежденной механике головок носителя. *** Spin Up Time** — время раскрутки диска из состояния покоя до рабочей скорости. Среднее время раскрутки шпинделя диска до рабочей скорости. Предположительно, в поле “value” содержится время в миллисекундах/секундах. *** Spin Retry Count** — число повторных попыток раскрутки дисков до рабочей скорости. Данный атрибут характеризует число попыток раскрутки шпинделя до рабочей скорости, при условии что первая попытка была неудачной. Напомним, что атрибут имеет не прямое значение, а отражает лишь некий сборный параметр надежности по отдельно взятой характеристике. Соответственно, большое значение — значит “хорошо”, а маленькое говорит о неполадках в механике привода. Разобравшись с критически важными атрибутами, поговорим об информационных значениях S.M.A.R.T. *** Current Pending Sector Count** — текущее число нестабильных секторов. Здесь хранится число претендентов на переназначение в резервную область диска. Судьба отдельно взятого сектора, попавшего в этот список, решается следующим образом. Если сектор будет считываться успешно, то он исключается из списка. Если же чтение сектора будет сопровождаться ошибками, то накопитель попытается восстановить и перенести информацию в резервную область, а сам сектор пометит как переназначенный. Постоянно ненулевое значение этого атрибута говорит о низком качестве поверхности диска. *** Drive Temperature** — температура. Отображает показания встроенного термодатчика.

Анатомия жесткого диска

Все знают, что такое винчестер. Однако немногие знают, что у него внутри.

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - фото 3

- Плата электроники современного жесткого диска - это настоящий микрокомпьютер…

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - фото 4

- Вот так выглядит жесткий диск изнутри гермоблока. Отчетливо различимы конструктивные блоки - дисковый пакет и головка
Позволю себе приоткрыть завесу тайны. Любой винчестер состоит из гермоблока и платы электроники. В гермоблоке размещена вся механика, то есть сами диски, двигатель и магнитные головки по одной на каждый диск. Между тем, дисков, также называемых “блинами”, в устройстве может быть несколько. На один блин вмещается до 80 гигабайт (в последних моделях) информации. К примеру, 120-гигабайтный винчестер может состоять из трех дисков по 40 Гб или двух по 60 Гб. В свою очередь, диски собраны в так называемый дисковый пакет. Оный пакет дисков закрепляется на оси шпинделя , в котором, собственно, и находится движок винчестера. Что касается электронной части винчестера… На самом деле, плата электроники современного жесткого диска — это настоящий микрокомпьютер с собственным процессором, памятью, внешними интерфейсами, устройствами ввода/вывода и прочими неотъемлемыми компонентами. Нетрудно догадаться, что основные задачи электроники — это управление механикой диска, а также преобразование магнитных сигналов в цифровые и наоборот. __
Температура имеет огромное влияние на срок службы диска. По непонятным причинам этот атрибут отсутствует у Western Digital. *** Device (Drive) Power Cycle Count** — число полных циклов включения-выключения винчестера. По этому атрибуту можно оценить, как часто использовался диск. *** Power-On Hours** — количество наработанных часов. Поле “value” этого параметра показывает общее время работы диска. В качестве порогового значения выбирается паспортное время наработки на отказ ( MTBF — Mean Time Between Failures). Принимая во внимание заоблачно высокие паспортные значения MTBF , маловероятно, что атрибут может достигнуть критического порога. *** Start/Stop Count** — число циклов запуск-остановка шпинделя. Моторчик жесткого диска может пережить определенное — гарантированное производителем — число старт-стопов. Это значение и выбирается в качестве критического порога. Важно сказать, что первые модели дисков со скоростью вращения 7200 оборотов в минуту имели не самый надежный двигатель и, как следствие, частенько выходили из строя. *** G-Sense Error Rate** — частота появления ошибок в результате ударных нагрузок. Хранит показания ударочувствительного сенсора. Точнее, выводит общее количество ошибок, возникших в результате удара, падения или неаккуратной установки диска в корпус компьютера. *** Load-in Friction (Hours\Time)** — общее время работы головки под влиянием нагрузок. Предположительно, данный атрибут показывает общее время работы блока головок под воздействием центробежных сил. Не углубляясь в туманные просторы физики, попробую объяснить сей факт на пальцах. На высокой скорости вращения дисков (5000-10000 оборотов в минуту) в накопителе неизбежно возникают центробежные силы. Очевидно, что головка при перемещении по диску также испытывает воздействие этих сил. *** GMR Head Amplitude** — амплитуда дрожания головок в рабочем состоянии. Воздействие центробежной силы приводит к дрожанию головок над поверхностью диска. Высокая амплитуда дрожания может вызвать соприкосновение блока головок с поверхностью. Как следствие — появление поврежденных секторов. Чем меньше амплитуда, тем лучше. Тем не менее, касательно значения, данного атрибутом, все в точности наоборот. Больше — лучше! *** Recalibration Retries** — количество повторов рекалибровки. Характеризует количество попыток установки головок на нулевую дорожку, при условии что первая попытка была неудачной. Значение этого атрибута, меньшее порогового threshold, говорит о неполадках в механике жесткого диска. *** Soft Read Error Rate** — частота появления “программных” ошибок при чтении данных с диска. В переводе на общедоступный язык — параметр информирует нас о программных ошибках чтения данных. К таковым можно отнести ошибки программного обеспечения, драйверов, файловой системы и неверную разметку диска. Словом, почти все, что не относится к аппаратной части винчестера. *** Throughput Performance** — средняя производительность диска. Предположительно, параметр показывает среднюю пропускную способность жесткого диска. Уменьшение значения с некоторой вероятностью указывает на проблемы в накопителе. *** UltraDMA CRC Error Count** — общее количество ошибок CRC в режиме UltraDMA. Выражаясь простым русским языком, атрибут отображает число ошибок контрольной суммы CRC. На практике подобные ошибки появляются при разгоне системы, сильно перекрученном шлейфе, а также по вине драйверов нерадивого Windows. *** Uncorrectable Sector Count** — число нескорректированных ошибок. Этот атрибут информирует нас об ошибках чтения/записи, которые не удалось исправить. Возможной причиной возникновения ошибок подобного рода может быть повреждение поверхности диска. *** Write Error Rate (Multi Zone Error Rate)** — частота появления ошибок при записи данных. Показывает общее число ошибок записи на диск. Чем больше значение, тем хуже состояние поверхности или механики винчестера. Все происходящие ошибки и изменения параметров заносятся в журналы S.M.A.R.T. При значении атрибута ниже величины порога threshold жесткий диск сиюминутно рапортует о неполадке напрямую в BIOS системы. Затем информация по цепочке передается драйверам Windows, которые и сообщают пользователю о возникшей проблеме. Защити данные с умом! Жаль, но встроенными — зачастую скромными — функциями BIOS и операционной системы не отделаешься. Системный драйвер на пару с БИОСом не покажут вам текущую температуру жесткого диска, не сообщат об очередной ошибке чтения и не поведают о количестве переназначенных секторов. Поэтому имеет смысл установить специальные утилиты для чтения показаний атрибутов и содержимого журналов S.M.A.R.T. Одна из самых простых и несложных программок — DTemp (ищите на нашем диске ). Весит она не больше 100 кб , но пользы способна принести на целый гигабайт! Как и любая другая программа подобного рода, DTemp выводит таблицу со значениями каждого атрибута, величинами критического порога, а также, кроме всего прочего, показывает приблизительную дату того самого "дня X " . В общем и целом табличный вывод программы расшифровывается следующим образом. &nbspAttribute; &nbspValue; &nbspThreshold; &nbspRAW; &nbspAttribute; Flags
&nbspSpin; Up Time &nbsp102; &nbsp21; &nbsp000000001612h; &nbspPR; SP CR OC

  • Attribute — имя атрибута; * ID — номер атрибута; * Value — значение атрибута (чем оно больше — тем супер); * Threshold — пороговое значение атрибута (если value меньше, чем threshold, готовьтесь к неприятностям); * Raw — текущее значение атрибута в шестнадцатеричной системе исчисления; * Type (Flags) — тип атрибута. Стоит ли говорить, что DTemp следит за температурой вашего диска и в случае перегрева незамедлительно бьет тревогу. Плюс ко всему, эта чудо-программка бесплатна! То бишь, не мудрствуя лукаво, достаем компакт-диск “Игромании”, лезем в раздел “По журналу” , устанавливаем и наслаждаемся. По сути дела, возможностей DTemp должно хватить за глаза. Тем не менее, существуют и другие утилиты, достойные нашего пристального внимания. Как вариант, на страже здоровья вашего диска встанет DriveHealth , который по своим возможностям даже несколько превосходит расхваленный выше DTemp. В частности, DriveHealth выводит краткую аннотацию к каждому атрибуту, фиксирует любое изменение состояния диска, следит за температурой винчестера. Словом, целая корзина вкусностей и полезностей. Свежую версию программы можно скачать с сайта разработчика — www.drivehealth.com — или взять с нашего компакта. Закончить сегодняшнюю статью хочется словами одного небезызвестного телеведущего: " В наши дни надежность ценится все больше. Покупая автомобиль, мы непременно хотим приобрести надежный. Приятно иметь надежных друзей, а директор счастлив, если его работники отличаются надежностью "… Чего уж говорить про жесткие диски?

Терминология

Унция предусмотрительности. Практическое исследование технологии диагностики жесткого диска — S.M.A.R.T. - фото 5

- Похожий проигрыватель грампластинок был у меня в далеком детстве
Блок головок — или, попросту, головка жесткого диска. Данные с поверхности диска считываются непосредственно магнитной головкой. Принцип действия головок жесткого диска мало чем отличается от принципа действия головки обычного магнитофона. Действительно, при записи головка создает магнитное поле, за счет чего участок диска намагничивается. При считывании же — наоборот, поле диска возбуждает сигнал в головке. Носитель — он же дисковый накопитель, винчестер, и по совместительству жесткий диск. Контрольная сумма (CRC) — служебный блок информации, сформированный с помощью специального алгоритма на основе информации, содержащейся в секторе. Каждому сектору на диске соответствует своя контрольная сумма. С помощью CRC можно определить, не произошло ли несанкционированное изменение/повреждение информации. Разметка жесткого диска — разбиение поверхности винчестера на загрузочную и служебную области, кластеры, сектора, сервометки и т.п. Сервометки — специальная разметка магнитной поверхности дисков HDD. Используется для точного попадания головок на дорожки, получения номеров дорожек и стабилизации частоты вращения двигателя. В случае порчи подлежит восстановлению только на заводе. __

Комментарии
Чтобы оставить комментарий, Войдите или Зарегистрируйтесь