Сегодня 29 марта 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Offсянка

Записки ремонтника: из рабочего журнала

⇣ Содержание

#Seagate: обращаться с осторожностью

История оглушительного провала серии 7200.11 хорошо известна, и она, пожалуй, достойна отдельного материала. Удар по репутации и тяжелые финансовые потери в разгар мирового кризиса — это очень серьезно. Корпорация постаралась загладить грехи, выпустив в 2009 году массовую и недорогую двенадцатую серию. Рынок принял ее на ура.

И вот через полтора года после начала продаж 7200.12 стали так же массово нести в ремонт. Сначала возникает пара тысяч «бэдов» и диск исчезает из ОС в результате серьезной порчи файловой системы. Проблема еще и в том, что «осыпание» происходит стремительно — порой всего за несколько часов. А за день до этого может не наблюдаться вообще никаких симптомов. Микропрограмма до последнего пытается справиться с нарождающимися дефектами, а когда резервов не остается, начинается «панихида с танцами». Пользователи же приближения данного момента часто не замечают. Ну стрекочет диск головками больше обычного, так это на общем фоне не слышно. Ну «тормозит» слегка, так на это можно не обратить внимания. Ну, S.M.A.R.T. просел, так на дисках Seagate он вообще несколько условный. Там есть новые атрибуты, на которые надо смотреть (High Flyes, например), но программы-анализаторы большей частью об этом не знают.

В серии 7200.12 диски емкостью до 500 Гбайт имеют одну пластину и выпускаются в тонком корпусе. Уменьшенная высота банки позволяет сэкономить 70 граммов алюминия, но надежности не прибавляет

Полагаю, проблемы возникают из-за нерасчетной нагрузки. Двенадцатая «бытовая» серия — плод тотальной экономии, собирается из бюджетных компонентов. Прошивка тоже упрощена — в частности, нет адаптивных настроек тракта записи вроде более медленного позиционирования при нагреве. При высокой плотности записи (пластины емкостью по 500 Гбайт) это снижает надежность во время длительной работы. Нагрузка на диск,при которой справедливы паспортные характеристики, — 2400 рабочих часов в год, или 200 в месяц. То есть 9-10 часов в день 5 дней в неделю, расписание типичного офиса. Все что выше — на свой страх и риск.

А используют эти модели сплошь и рядом в режиме 24/7, да еще под торренты в агрессивных настройках, забивающих толстенный канал в обе стороны, или FreeBSD, где одновременно пишется миллион мелких файлов. И охлаждение как получится — нередко с заросшим пылью, малоэффективным корпусным вентилятором. А нагрузка на диск высокая и явно нерасчетная. Тут однозначно нужны накопители корпоративного класса (семейство Enterprise Storage, в полтора-два раза дороже), но кто это завхозу втолкует, который закупает на контору 50 штук разом. Кстати, на потребительские модели Seagate уменьшил гарантию до двух лет…

#Seagate: контролируй нагрев

Не все знают, что у современных дисков Seagate атрибуты S.M.A.R.T. дают много детализированной информации по нагреву. Просто мало какие программы корректно разбирают кодировку, и HDDScan в данном случае — приятное исключение. Вот фрагмент его отчета, из которого можно узнать не только текущие, но и минимальные и максимальные достигнутые температуры.

190 Airflow Temperature 66 64 34 C 45
190 Airflow Temperature Minimum 66 64 23 C 45
190 Airflow Temperature Maximum 66 64 34 C 45
194 HDA Temperature 34 40 34 C 0
194 HDA Temperature Minimum 34 40 23 C 0
194 HDA Temperature Maximum 34 40 60 C 0

Здесь HDA — Head and Disk Assembly, в просторечии банка; Airflow Temperature — нагрев нижней (системной) головки чтения, он примерно равен температуре воздуха внутри банки. Магнитный резистор головки является еще и терморезистором, так что отдельный датчик излишен. Другими словами, контролируется нагрев как всего корпуса жесткого диска (это важно для шпиндельного подшипника и электроники), так и блока магнитных головок, долговечность и отдача которых впрямую зависят от температуры.

В сериях Seagate 7200.9 и 7200.10 нередко «клинил» шпиндель. Причина -— перегрев и неточности изготовления. Лечилось это хирургически: вырезалась опорная пятка подшипника, вал расклинивался бензином и пассатижами. После этого диск мог работать только в таком положении

При этом крышка диска и верхняя головка греются на 5-15 градусов сильнее из-за трения воздуха о крышку (он увлекается пластинами, так что внутри банки царит настоящий ураган под 20-30 м/с). Вот почему проверка диска «на ощупь» нередко вызывает у пользователя тревогу, хотя по термоатрибутам нагрев не столь велик. Также ясна необходимость обдува крышки или, по крайней мере, свободного пространства над ней (3-5 см) для пассивной конвекции.

#Seagate: как узнать дату выпуска

Накопители Seagate в общепонятном виде не датируются — вместо этого на этикетках присутствует Date Code из пяти, реже четырех цифр. Их формат YYWD или YYWWD. Кодировка довольно хитрая, привязанная к корпоративной отчетности.

Первые две цифры — YY — финансовый год, который в Seagate начинается в первую субботу июля предшествующего года. То есть диски, выпущенные с августа по декабрь 2011 года, маркируются уже 12 годом, что часто удивляет покупателей. Следующие цифры — W (1-9) или WW (10-52) — это неделя финансового года. И наконец, последняя цифра — D — число дней, прошедших с начала недели, причем неделя длится с субботы по пятницу включительно.

Так что для расчета точной даты выпуска придется привлекать календарь. Чтобы с этим не заморачиваться, советую использовать онлайн-калькулятор.

#Неприятности с записью

Участились случаи, когда у жесткого диска портится канал записи, а пользователь узнает об этом только тогда, когда диск перестает опознаваться при очередном включении. Неправильно записалась таблица в служебной зоне (чаще всего модуль SMART) — и привет. В технологическом режиме починить «служебку» удается, накопитель нормально стартует, но радости от этого мало: пользовательские данные уже испорчены. Переставляй головки, не переставляй, информацию не вычитаешь — ее на пластинах фактически нет. Ну не так, чтобы вообще нет, но некорректируемых ошибок слишком большой процент. Все файлы (кроме самых мелких) выходят битые.

И самое неприятное, что в момент возникновения этот баг не поймаешь — нет контролирующих механизмов. И при массивной записи больших файлов можно напортачить капитально. Еще 3-4 года назад в дисках, что подороже, встречался режим чтения сразу после записи (головки раздельные, головка чтения идет по ходу движения вслед за головкой записи, а коммутатор способен быстро переключаться), но в целях упрощения микропрограммы и снижения потребляемой энергии от него отказались. Так что первопричина проблемы — экономия.

Цап-царап

Раньше, года три назад, если приносили стучащий диск, я первым делом начинал искать донора. В 80% случаев стук говорил о смерти головки или коммутатора, так что перестановка БМГ позволяла извлечь данные. Теперь порядок действий изменился: первым делом надо снять крышку и внимательно осмотреть пластины на предмет царапин и запилов (запил — это кольцевая царапина). В ряде случаев они находятся — и далеко не всегда легко видимые глазом. Увы, фатальна даже царапина в четверть миллиметра, и после ее обнаружения работа с заказом закончена. Переставлять донорские головки на поврежденные пластины бессмысленно — они испортятся за несколько минут, ничего снять не успеешь. Задевая «холмики», выросшие по краям царапины, головка нагревается и быстро выходит из строя.

Запил крупным планом. Видно, что он неоднороден и не очень глубок, но на вердикт ремонтника это не влияет

Если царапина расположена у самого края пластины, кое-что сделать можно. Иногда удается переставить ограничитель хода БМГ с тем, чтобы головки не попадали на опасный участок. Поскольку там часто находится служебная зона, которая считывается при старте накопителя, применяется технология хот-свопа. Плата с инициализированной в ОЗУ микропрограммой переставляется без выключения питания с донорского диска на пациента (шпиндель перед этим программно останавливается).

Рабочий момент хот-свопа. Плата пациента проинициализирована на банке донора (белая этикетка с тем же номером заказа и буквой «д») и готова к перестановке обратно

Отчего это происходит? Виновата плотность записи современных дисков. Требуется высокое пространственное разрешение записывающих и считывающих элементов. Поэтому высота полета головки предельно снижена и в некоторых моделях доходит до 10 нм. Между прочим, это нанотехнологии в чистом виде (нанообъектом условно считается тот, хотя бы одно измерение которого менее 100 нм, или 0,1 микрона).

При любом сильном толчке, не говоря об ударе, головка чиркает по пластине, и последствия непредсказуемы. Довольно часто все обходится, нынешние пластины покрыты твердой смазкой, типа тефлона, которая снижает трение и смягчает повреждения. Но бывает и хуже, когда зарождается и начинает расти царапина. Процесс ее «созревания» может занимать от пары секунд до нескольких часов, пользователь здесь обычно выступает пассивным наблюдателем. Действовать он начинает, когда появляется стук и ситуация уже необратима, данные свои он потерял. Здесь может помочь только немедленное выключение питания и обращение к специалисту. Но и тогда, как я уже написал чуть выше, шансов немного.

Все эти ужасы, однако, относятся к высокоскоростным (7200 об/мин) и высокоемким (750 Гбайт и выше) накопителям форм-фактора 3,5”. «Зеленые» тихоходные семейства (5400-5900 об/мин), а также диски предыдущего поколения — заметно устойчивее. Ноутбучные же модели для получения царапины надо ударить очень сильно, масса подвижной системы и линейная скорость там намного меньше. К тому же в ноутбуке или в самом диске часто имеется акселерометр, который при любом ускорении выводит головки в парковочную зону, за пределы пластин. При свободном падении включенного диска ему достаточно пролететь 20-30 см, чтобы запарковаться, так что полет ноутбука со стола пластинам и данным угрожает не слишком.

Двойной глубокий запил на ноутбучном диске объемом 500 Гбайт. Случай нечастый и тяжелый, снять данные не удалось

Царапины и тем более запилы на накопителях 2,5″ встречаются не так часто. Там другая беда: при фронтальных ударах, приходящихся на крышку или плату, могут залипнуть головки, а от боковых ударов гнется тонкая ось шпинделя и возникают опасные вибрации. Выправить ось практически невозможно, и данные может спасти только перестановка пакета пластин (вместе с головками) на донорский шпиндель. Операция эта непростая, требуется специальная оснастка и немалый опыт.

#Когда ремонт невозможен

Принесли два диска в ремонт, данные спасать не требовалось. Один, на 500 Гбайт, ударили в бок — похоже, системный блок просто завалился. Теперь подшипник «поет», а сам диск заметно вибрирует (частота 120 Гц, по звуку похоже на массажер). От удара сместилась ось шпинделя. Диск еще работает, но чтение с поверхности нестабильно — есть участки резких замедлений. Я попытался подстроить параметры чтения/записи, расширить дефект-лист — не помогло. Зоны нестабильности уменьшились, но не пропали. Использовать такой накопитель невозможно, ему судьба стать донором деталей. Выкупил его у клиента за символическую сумму.

Удар, кстати, зафиксирован в системном логе, который хранится в служебной зоне на пластинах. Этот лог часто проверяют сервисмены, если пытаешься сдать диск по гарантии. Для этого применяется фирменный софт от производителя (в ряде случаев для доступа к логу нужны недокументированные команды). Так что — скажу по секрету — если поведение диска вам не нравится и вы мечтаете его обменять, то стукать надо выключенный диск, да еще и завернутый в полотенце, чтоб не осталось внешних следов.

Второй диск чиркнули по брюху отверткой — нередкий случай при небрежном монтаже. Обычно при этом сносят детали с платы, а тут удар пришелся на плоский шлейф, ведущий от платы к двигателю. Он длиной всего пару сантиметров, имеет 4 жилы, и две из них перебиты. Что ж, зачистил окрестности и напаял шунты. Работает, но выглядит не очень, да и по гарантии не сдашь.

Клиент попросил припаять новый шлейф — такие у меня есть, но толком припаять их к контактам двигателя не удается. Там хороший теплоотвод, малый паяльник не справится, а греть большим небезопасно — гидродинамический подшипник перегрева не любит: масло в нем изменит вязкость, а то и вообще вытечет за пределы стакана. В общем, «работает — не трожь». А проблемы с гарантией я решить и не обещал.

#Ошибка резидента

Мы привыкли считать, что HDD хранит данные абсолютно неизменными — что записал, ровно то же и считал. Однако это так далеко не всегда. Вот недавний случай: у постоянного клиента один из компьютеров перестал выходить в локальную сеть. Проверил, как обычно, на вирусы, переустановил драйвер сетевой карты — все без толку. Смотрю системный журнал, а там многократно отмечен сбой при вызове главной сетевой службы, причем в одном и том же месте.

Так, уже интересно. Надо бы проверить код dll-ки в папке \system32. Вставляю CD с дистрибутовом, сравниваю файлы в бинарном режиме — опа, различие в одном бите (старшем в байте, в единицу пошел). Нечасто увидишь такое: диск в возрасте (пятый год эксплуатации) пропустил нескорректированную ошибку. Эта вероятность оценивается для HDD прошлых поколений в 10-13, для новых 10-14; серверные модели обеспечивают недостоверность информации 10-15 и даже меньше. Еще реже бывает, что ошибка пришлась на системный код, где даже один неверный разряд имеет далеко идущие последствия. Хорошо, что в данном случае эталонный файл был под рукой, а если бы испортились результаты каких-нибудь важных расчетов? Вот так и падают спутники…

#О неуместной пытливости

Утром приходит клиент с жалобой, что его ноутбук упал со стола и теперь диск стучит и не опознается. Что ж, дело обычное — ноутбуки чаще всего падают на угол, а это для накопителя опасно.

Беру диск в руки — на крышке порваны наклейки крепежных винтов. Значит, внутрь уже лазили. Спрашиваю, как было дело. Мужик со святой простотой отвечает: «После инцидента я вынул диск и открутил верхнюю крышку. Увидел, что головки находятся посреди пластины, то есть залипли, ну и оттащил их пинцетом к краю» (во всех ноутбучных моделях головки паркуются за пределами пластины на специальной рампе). После чего «пионер» прикрутил крышку, поставил диск обратно в ноут и стал ждать нормальной работы.

Чрезмерно старательный лейтенант вскрыл заскрипевший диск и «смазал зеркальную поверхность жидкой смазкой ЦИАТИМ-201 ГОСТ 6267-74 для облегчения скольжения узла вычитывателя» (цитата из донесения по службе). Уже в таком виде HDD попал к одному из ремонтников, получив анекдотическую известность в их среде

М-да, чтобы открутить крышку ноутбучного диска, нужна отвертка-звездочка Т5 — не предполагал, что такие водятся у простых пользователей. Замечу, что это 160-гигабайтник на одной пластине, то есть плотность записи довольно высокая. Такой накопитель вообще нельзя вскрывать вне чистой камеры, потому что осевшая даже за 10 минут комнатная пыль гарантированно убьет его через несколько дней, а то и часов. Данные снять успеешь, но и только, а сам диск пойдет на выброс. Это старые модели на 10-20 Гбайт выдерживали несколько часов в открытом виде и после этого еще пару месяцев работали (но и они в конце концов помирали, причем не всегда от «бэдов» — просто замедление работы все нарастало и в итоге становилось неприемлемым).

Ну а в данном случае все грустно — хозяин сам укокошил свой диск, грубо протащив прилипшие головки (молекулярная адгезия, однако). Специалисты по восстановлению данных тоже сдвигают БМГ, но предельно осторожно, медленно вращая пластину и постукивая в определенных местах. А тут головки и сами повредились (потому диск и стучит — не может, говоря на жаргоне, «найти серву»), и, главное, пластину поцарапали. Головки переставлять бесполезно — чуть выше я уже объяснял почему. Да, бывает, что со всего диска нужен один небольшой файл (типа черная касса.xls или kompromat.doc), известно его точное местоположение и файловая система не повреждена. Тогда можно успеть вычитать «инфу» прежде, чем все безнадежно застучит. Но это, конечно, редкое исключение. А в данном случае клиент сам похоронил свои данные. Все шаловливые ручки виноваты да необыкновенная легкость в мыслях.

Переходники для подключения HDD к программно-аппаратному комплексу. Как видно, их требуется довольно много. Обратите внимание на плату красного цвета: она позволяет работать с дисками 1,8”, имеющими нестандартный шлейфовый разъем. Такие диски ставят в дорогие видеокамеры и плееры (в частности, iPod classic).

#Смена ориентации? Легко!

Пользователи часто спрашивают, в каком положении лучше закреплять жесткий диск 3,5” внутри системного блока. Отвечаю: ориентация может быть вертикальная или горизонтальная, крышкой или электроникой вверх. По заверениям всех производителей, положение HDD на его функционирование и надежность не влияет. Единственное ограничение — отклонение от вертикали либо горизонтали не должно превышать 5°, то есть работающий накопитель должен лежать или стоять ровно.

Первый в мире жесткий диск емкостью 5 Мбайт (1956 год). И это только тело вращения — с электроникой и питанием вся конструкция размером с хороший шкаф. Проблема расположения накопителя не стояла еще долго — как минимум до начала 90-х годов, когда из конструкции HDD исчезли шаговые двигатели

Имеются, однако, эффекты «второго порядка». Так, заводскую разметку и тестирование диск проходит в горизонтальном положении крышкой вверх. Логично предположить, что наиболее стабильно накопитель будет работать именно при такой ориентации, поскольку распределение температур и напряжений в механике (а с ними и тонких настроек микропрограммы) приближено к исходным параметрам. Вместе с тем плата электроники при отсутствии обдува хуже охлаждается и легче выходит из строя. Чаще других перегревается и выгорает микросхема управления двигателем (на жаргоне ремонтников «крутилка»).

Противоположное расположение — электроникой вверх — неблагоприятно уже для механики (банки): она может перегреваться, что снижает ресурс накопителя. Кроме того, двигатель оказывается сверху, из него со временем могут выпадать продукты износа и портить ближайшую пластину и головку. Ремонтникам такие случаи известны.

В вертикальной позиции диск лучше охлаждается за счёт конвекции, а подшипнику, вопреки распространенному мнению, ничто не угрожает. Это подтверждается тем, что многие компьютеры и серверы известных марок, а также NAS-хранилища имеют вертикальные отсеки для своих дисков (правда, в обычных корпусах такое крепление встречается реже).

#Клиенты о восстановлении данных

В заключение этой части материала — несколько цитат из общения с пользователями. Как говорится, кто восстановлением данных занимался, тот на концертах Петросяна не смеется…

— Сколько? Да мне бухгалтершу проще запрячь на восстановление по первичке!

— Как, информацию снять стоит дороже диска???

— Почему так дорого? Мои админы сказали, что на диске нужно только плату поменять, они пробовали, но у них не получилось — диск всё равно стучит...

— У моего диска сгорела плата, вы можете мне дать на время такую же? Я ее поставлю на диск и сам сниму данные, а вам 300 рублей заплачу.

— Как диск мог сломаться? Я же его только две недели назад купил...

— Как диск мог сломаться? Он у меня уже целых два года нормально работал...

— Мне диск не нужно чинить, вы просто данные с него снимите...

— А почему вы говорите, что диск не будет работать? Вы же на нем головки замените...

— А вы дадите мне заключение, что я у вас диск восстанавливал, чтобы я мог пойти с ним в магазин и мне там вернули деньги за восстановление данных?

— А вы можете восстановить данные с диска, если я снимал сам блины и мыл их с мылом?

— У меня RAID-массив, и умер только один диск. Вы можете мне сделать посекторную копию с него на новый диск, чтобы я его вставил в сервер и всё заработало? Ну чтобы не платить за восстановление всего массива.

— А у меня нет другого диска для записи восстановленной информации, вы можете записать мне 200 Гбайт на болванки?

Продолжение следует

 
← Предыдущая страница
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥