О сайте |  Контакты |  Реклама Сегодня 04 февраля 2012 RSS потоки 3DNews  3DNews Вконтакте  3DNews на Facebook  3DNews в Twitter

Сбои ОЗУ: кошмар на улице DIMM

08.10.2009 [16:16], Александр Харьковский  

Наблюдения за десятками тысяч серверов Google, проводившиеся в течение двух с половиной лет, показали, что частота ошибок в модулях памяти превышает в сотни и тысячи раз общепринятые представления о возможной интенсивности сбоев данного типа. В среднем на один модуль DIMM пришлось 3751 корректируемых ошибок в течение года. В исследовании рассматривались разнообразные платформы от множества производителей, и различные типы динамической памяти, включая DDR1, DDR2 и FB-DIMM.

статистика проявления сбоев динамической памяти

В серверах Google применяется память со схемами коррекции ошибок (Error Correcting Code, ECC), которая обеспечивает исправление одиночных ошибок и регистрацию двойных. И в том и в другом случае есть возможность фиксировать информацию об их проявлении. В пользовательских системах, за редким исключением, используется память без ECC, поэтому сбои в DIMM могут сопровождаться разнообразнейшими эффектами и разрушением данных, но при этом непосредственного указания на первоисточник неприятностей пользователь не получит.

Отражение сложившихся представлений о надежности памяти можно найти в старом FAQ сайта AnandTech. Там приводятся данные IBM, полагающей вероятность проявления ошибок в модуле 128 Мб PC100 SDRAM на уровне одной в месяц, и Micron, говорящей об одной ошибке в течение полугода. Исследования, проведенные Google, заставляют пересмотреть столь благодушные надежды по поводу надежности динамической памяти.

И все же некоторые аспекты исследования можно трактовать оптимистично. Вот они:
- было обнаружено, что температурные условия слабо влияют на интенсивность проявления ошибок и, следовательно, героические усилия по охлаждению модулей в общем случае не нужны;
- ситуация не имеет тенденции к ухудшению. Большая плотность компоновки DRAM в более современных типах памяти не сопровождается пропорциональным ростом ошибок;
- нет существенных различий по надежности между модулями различных типов (DDR1, DDR2 или FB-DIMM), или между модулями от различных производителей. Следовательно, можно выбирать более выгодные по цене варианты (по меньшей мере, среди модулей с ECC);
- в среднем только 8% DIMM подвержены ошибкам в течение года. Меньше модулей – меньше проблем, и это утешительные новости для владельцев систем с небольшим объемом памяти.

Исследование выявило большую интенсивность проявления ошибок на системных платах определенных моделей, вне зависимости от производителей DIMM, которые на них использовались. Это означает, что некоторые платы реализованы неудачно с точки зрения влияния электромагнитных излучений от их компонентов друг на друга. Шины памяти, расположенные слишком близко к «шумным» компонентам, или «земля» недостаточного сечения – источники постоянных ошибок.

В завершение – еще немного любопытных статистических данных. «Неудачные» серверы существуют вне зависимости от платформы – на долю 20% систем с зарегистрированными ошибками пришлось долее чем 90% ошибок, зафиксированных на каждой из разновидностей платформ. Сбойные модули надо менять – в более чем 93% случаев количество корректируемых ошибок в следующем году хоть на одну превышало количество в предыдущем, то есть с течением времени DIMM не «самоисправляются». Ну и, наконец, полученные результаты развеивают сомнения в целесообразности применения памяти с ECC для серверов, и дают повод всерьез задуматься о переходе на ее массовое использование и для пользовательских систем.

Материалы по теме:

- IDF 2009: Intel и VMware о будущем серверной памяти;
- Модули памяти DDR3 от Transcend с датчиками температуры.

Самое интересное - новости:
Самое интересное - обзоры:

Новости hardware

Новости software


Новое на форуме:
ТемаАвторОтветов
Нужна Ваша помощь! Спасибо! Виктория. Victotia2012 0
Проблема с цветопередачей Troy90 12
dell poweredge 840 Gaiwer 3
Asus K52JC Проблемы Tifosi 4
Чистый XP. Не работает интернет. Нет драйверов Sevy 3
не получается авторизироватся на сайтах Spacoom 0
Белый экран при запуске Outlook в Win7 oodav33 14
Микрофон Doktoryga 4
Сгорел компьютер из-за замыкания? Dimon777 7
Radeon 5770, ошибка - Драйвер перестал отвечать и был восстановлен Invasion 8
Яндекс.Метрика