Makeuseof

Industrial Server-Grade Computers with ECC Memory Support

Premio’s latest industrial computers leverage rich performance enhancements provided by Intel 10th Generation Core and Xeon-W processors with a W480E chipset. The Xeon processors ensure ECC memory support for robust and reliable performance benchmarks amid the most computing-intensive applications for mission-critical data acquisition and telemetry in edge computing deployments.

RCO-6000-CML Modular AI Edge Inference Computer Series

Key Features

  • 10th Gen Intel Core & Intel Xeon W processors with W480E chipset
  • Access to Error Correction Code (ECC) Memory
  • Modular EDGEBoost Nodes for inference and machine learning workloads
  • Plug and Play Dual-SIM 5G & 4G/LTE cellular network module
  • Workload consolidation at the edge with versatile I/O
  • Ruggedized and Tested for rugged edge computing

ACO-6000-CML Fanless In-Vehicle Computer Series

Key Features

  • Intel 10th Gen Core and Xeon-W processors with W480E chipset
  • EN50155 Railway Certification Ready
  • Wide Power Supply Input 9-48VDC and 48-110VDC
  • Support up to 18x LAN, 16x PoE, and 16x USB
  • Built-in CAN Bus Transportation Protocol
  • Power Ignition Management
  • ECC Memory Support
  • 5G Ready

ECC memory vs. non-ECC memory

 Factors ECC Memory Non-ECC Memory Winner
Number of Chips  9 Memory Chips (one for ECC) 8 Volatile Memory Chips
Reliability Ultra-Reliable (0.09% Failure Rate) Normal (0.6% Failure Rate)
Durability Highly Durable for 24/7 usage Less Durable for constant usage
Protection Features Can detect and recover data errors Can only detect data errors
Speed  Slower Speed (1%-2% Slower for Registered ECC RAM) Faster Speed (don’t require constant encrypting)
Price 10-20% Higher Price (due to additional ECC chip and lower supply) Lower Price (more mainstream and affordable)
Power Consumption It might use slightly more power for the additional ECC chip Use less energy compared to ECC RAM with only eight chips
Compatability It only works for ECC-enabled CPUs, Motherboards, and Chipsets Works for a wider range of CPUs, Motherboards, and Chipsets

Особенности выбора материнской платы для работы с ECC памятью

Выбор правильной материнской платы для работы с ECC (Error Correcting Code) памятью является важным шагом для обеспечения надежности и стабильности системы

ECC память используется для обнаружения и исправления ошибок в данных, что особенно важно в серверных и профессиональных системах, где сохранность информации имеет первостепенное значение

При выборе материнской платы для работы с ECC памятью следует обратить внимание на следующие особенности:

Поддержка ECC функции: Первое и главное требование к материнской плате — наличие поддержки ECC памяти. Это следует уточнить в спецификации материнской платы или на официальном сайте производителя.

Совместимость с процессором: Еще один важный момент — совместимость выбранной материнской платы с процессором, который будет устанавливаться в систему. Обязательно проверьте, поддерживает ли выбранный процессор ECC память.

Количество слотов для памяти: Убедитесь, что материнская плата имеет достаточное количество слотов для установки нужного количества ECC модулей памяти

Это особенно важно, если вам требуется большой объем памяти или вы планируете возможность расширения в будущем.

Типы поддерживаемой памяти: Проверьте совместимость выбранной материнской платы с использованием различных типов ECC памяти (например, DDR3 ECC, DDR4 ECC и т. д.).

Частота работы памяти: Узнайте максимально поддерживаемую материнской платой частоту работы ECC памяти

Высокая частота может повысить производительность системы, но требует подбора совместимых модулей памяти.

Надежность и качество: Исследуйте отзывы и рейтинги производителя материнской платы, чтобы узнать о качестве и надежности их продукции. Выбирайте известных и надежных производителей.

Также стоит отметить, что ECC функция работает только в том случае, если и процессор, и память поддерживают эту технологию. Отсутствие хотя бы на одном из компонентов приведет к тому, что ECC память будет работать в обычном режиме, без обнаружения и исправления ошибок.

Учитывая все эти особенности, правильно подобранная материнская плата позволит вам построить стабильную и надежную систему с ECC памятью, которая пригодится вам во многих профессиональных областях.

Что такое память ECC?

Чтобы понять, как работает код исправления ошибок (ECC), сначала нужно понять, что такое однобитовая ошибка. Потому что это основная проблема, для решения которой был создан ECC.

Однобитовая ошибка возникает, когда один бит (двоичный 0 или 1) в данных в ОЗУ случайно изменяется на противоположное значение.

Ошибки такого типа незначительны, и компьютер может не распознать их автоматически, что может привести ко многим проблемам.

Вы можете думать об однобитовых ошибках как о сорняках на газоне. Ваш газон — это ваша память, а ECC-часть вашей памяти — это выбор доступного гербицида.

Память без ECC не избавит вас от «сорняков».

ECC уничтожит все сорняки, но немного медленнее.

Однобитовые ошибки могут возникать из-за магнитных или электрических помех внутри компьютера, которые присутствуют в каждой системе в виде фонового излучения.

Напряжение, изменение температуры, ударное воздействие или даже чтение или запись данных не так, как предполагалось изначально, также могут привести к однобитовой ошибке.

Память ECC позаботится об этих ошибках и исправит их до того, как они превратятся в более серьезную проблему.

Память с ECC очень похожа на память без ECC. Самая большая разница между ними заключается в том, что в памяти ECC обычно есть немного дополнительной памяти, предназначенной исключительно для обеспечения того, чтобы фактическая память не зависала и не сгорала, если что-то случилось.

ECC — это, по сути, небольшой чип на обычной планке ОЗУ, который гарантирует, что каждый бит данных, входящих и исходящих, является именно тем, чем он должен быть.

Что он делает, так это создает зашифрованный фрагмент кода из данных, записываемых в основную память, и сохраняет этот код в дополнительном бите памяти, о котором я вам говорил.

Когда необходимо получить доступ к данным, хранящимся в основной памяти, он создает новый код и сравнивает этот фрагмент кода с кодом, который был создан ранее.

Если он обнаружит, что они одинаковы и что данные не были каким-либо образом изменены, он разрешает чтение данных.

Но если он обнаружит, что новый код отличается от сохраненного кода, он попытается решить проблему, расшифровав код, чтобы точно определить, в чем проблема.

А если не может, то по крайней мере гарантирует, что вы знаете, что что-то пошло не так, вместо того, чтобы молча продолжать работу.

Это похоже на сравнение хэшей MD5 при загрузке программы, чтобы убедиться, что вы скачали именно то, что вам действительно нужно, а не другой мошеннический секретный файл.

Вот как ECC становится немного медленнее, потому что ему приходится создавать дополнительные коды, но более эффективным способом заботы о вашем метафорическом газоне.

По данным Intelligent Memory, вероятность возникновения такой ошибки составляет одну однобитовую ошибку каждые 14–40 часов на гигабит (125 МБ) ОЗУ.

Оперативная память ECC (код исправления ошибок) и ОЗУ без ECC:

Ecc Ram и Non Ecc Ram имеют разную конструкцию. Если вы установите ECC RAM на материнскую плату, которая не поддерживает ECC, память не сможет работать должным образом. Это также верно, если вы измените настройки BIOS со значения по умолчанию на «без ECC».

В большинстве случаев код с исправлением ошибок требует дополнительных схем для сложных математических вычислений при передаче/хранении данных, чем код без исправления ошибок, который использует более простые математические методы, что приводит к менее дорогим компонентам, необходимым для хранения и передачи данных при выполнении компьютера общего назначения. задачи.

Примеры материнских плат без ECC:

Несмотря на то, что для него требуются более сложные компоненты, его способность обнаруживать и исправлять ошибки делает его более надежным типом памяти. Вот почему серверы, где велика вероятность потери данных из-за огромных объемов и скорости транзакций, используют ОЗУ ECC.

Наиболее распространенным примером являются жесткие диски (HDD), которые используются в настольных компьютерах, но не в ноутбуках, где вместо них часто используются твердотельные накопители. Жесткие диски имеют более высокую частоту отказов, чем твердотельные накопители, поэтому использование ОЗУ ECC помогает предотвратить потерю важных файлов, которые они сохранили на периферийном устройстве жесткого диска, в случае его сбоя.

По этой причине, если у вас есть старый ноутбук только с устройствами хранения без ECC, такими как SDD или HDD, вы можете установить на свой ноутбук ОЗУ с ECC, чтобы он дольше работал лучше, несмотря на его возраст.

Поэтому, если вы не используете сервер для своего компьютера, вы все равно можете воспользоваться преимуществами оперативной памяти ECC и ее выдающейся производительностью, особенно при работе с программами, требующими большого объема данных, такими как редактирование фото/видео.

Примеры материнских плат, поддерживающих ECC RAM:

Не-ECC не имеет дополнительных схем, что делает его дешевле, чем ECC, что делает его более доступным для тех, кому не нужны все дополнительные функции материнской платы ECC. И если вы действительно не уверены в назначении и функциональности ECC, этого, вероятно, достаточно для ваших целей, и вы можете сэкономить деньги, выбрав вместо этого материнскую плату без ECC.

Итак, если вы не используете сервер для своего компьютера, вам не нужна оперативная память ECC. А если материнская плата не поддерживает non-ECC, то ставить на нее оперативную память с такой функцией бесполезно. В конечном итоге вы можете повредить свою систему и лишиться гарантии, если что-то пойдет не так или ваша система перестанет работать должным образом.

Если вы хотите еще раз проверить, поддерживает ли ваш ЦП ECC, прежде чем покупать новую материнскую плату, просто введите в Google запрос «поддерживает ли ECC?»

Вот несколько примеров:

Чипсеты AMD с Radeon Graphics используют системную память для кадрового буфера. Графика на материнской плате в этом случае бесполезна, поэтому, если у вас есть процессор AMD, но вы все еще используете материнскую плату без ECC, пора переключиться на ECC!

Если на вашем компьютере уже есть оперативная память ECC, нет необходимости покупать новую материнскую плату только потому, что эта ее не поддерживает. Покупка новой оперативной памяти необходима только в том случае, если ваша текущая оперативная память слишком медленная для вашего компьютера, потому что ваша ОС использует эту оперативную память в течение длительного периода времени и может потребовать обновления.

Вы ищете память, которая имеет доступ к более высоким скоростям и совместима с большим количеством платформ? Или вы ищете долговечную память, которая может работать 24 часа в сутки, 7 дней в неделю, выявлять больше ошибок, но при этом немного жертвует скоростью?

Модули ОЗУ (оперативной памяти) являются важной частью каждой системы, но не все модули одинаковы. Помимо емкости, частоты и задержки, модули могут быть либо модулями с кодом исправления ошибок (ECC), либо модулями без ECC

Разница между ними заключается в том, что память ECC защитит вашу систему от потенциального сбоя, исправив любые ошибки в данных, в то время как память без ECC не исправляет такие ошибки.

Подумайте о памяти без ECC как о памяти, ориентированной на скорость, а ECC — о памяти, обеспечивающей выносливость/надежность.

Поскольку не все платформы поддерживают память ECC и не каждой системе она нужна, давайте обсудим, что такое память ECC, как она работает и нужна ли она вам.

Что такое буферизованная оперативная память

Буферизованная RAM похожа на обычную RAM, но добавляет дополнительный регистр или буфер между основной DRAM и контроллером памяти вашего ПК.

Этот буфер служит нескольким различным целям, но, в основном, он используется для снижения электрической нагрузки на контроллер памяти системы и, как следствие, позволяет использовать больше оперативной памяти, чем это обычно возможно.

Серверы, например, часто имеют 12 или более модулей ОЗУ (по сравнению с 2-4 на потребительских ПК), поэтому буфер снижает нагрузку на контроллер памяти (который обычно находится внутри ЦП), исключая возникновение узкого места в контроллере памяти.

Другое распространенное название буферизованной ОЗУ – регистровая ОЗУ, поскольку буфер создаётся путём добавления дополнительного регистра. Эти два термина, в основном, взаимозаменяемы, но я буду придерживаться буферизованной оперативной памяти для согласованности в остальной части этой статьи.

Термин, который часто объединяется с буферизованной ОЗУ, – это ОЗУ с ECC, и на то есть веская причина, поскольку почти всё буферизованное ОЗУ также будет поддерживать функциональность ECC.

Однако, не вся оперативная память ECC является буферизованной, поскольку основное использование буферизованной ОЗУ заключается в обеспечении большего объёма оперативной памяти в одной системе, в то время как ОЗУ ECC служит для очень специфических целей.

Давайте немного поговорим об использовании ECC RAM и Buffered RAM ниже.

Назначение ECC RAM

Компьютеры чувствительны к внешним помехам, таким как излучение и радиоволны. Компьютерное оборудование также может вносить свои собственные ошибки, особенно с возрастом. Хотя эти ошибки могут вызывать такие проблемы, как сбои и синий экран смерти для большинства потребителей, они, как правило, недостаточно критичны, чтобы гарантировать дополнительную стоимость ОЗУ ECC.

Однако, если вы работаете над важными задачами, такими как передовые вычислительные науки, финансовый рынок данные, системы военной защиты и даже результаты выборов, вы хотите защитить целостность своей данные.

Связанный: Как создать список наблюдения за акциями в Google Финансах

Например, в 2003 году кандидат на выборах в Бельгии получил больше голосов, чем было возможно. Эта ошибка была обнаружена только из-за того, как работает бельгийская система преференциального голосования. Когда сотрудники избирательной комиссии вручную пересчитали бюллетени, они обнаружили, что у одного кандидата было дополнительно 4096 голосов.

Они не обнаружили ошибок после перепроверки всей системы на предмет нарушений безопасности или нечестной игры. Однако единственная причина, по которой они могли придумать, заключалась в том, что космический луч попал в один из компьютеров и вызвал небольшой переворот на 2-13-м транзисторе, таким образом добавив к общему количеству дополнительных 4096 голосов.

Безопасность данных при использовании ЕСС в оперативной памяти

Использование Единого Системного Контейнера (ЕСС) в оперативной памяти предоставляет ряд преимуществ в области производительности и эффективности. Однако, при работе с данными в оперативной памяти, особенно критично обеспечить их безопасность и защиту.

Важным аспектом безопасности данных при использовании ЕСС в оперативной памяти является защита от несанкционированного доступа. Это достигается путем определения и реализации механизмов аутентификации и авторизации. Аутентификация использует различные методы проверки подлинности пользователя, такие как пароли, биометрические данные или аппаратные ключи. Авторизация определяет права доступа пользователя к определенным данным и функциям системы.

Другим важным аспектом безопасности является защита данных от несанкционированного копирования или изменения. Для этого применяются различные механизмы шифрования данных в оперативной памяти. Шифрование позволяет защитить данные от доступа злоумышленников, даже в случае физического доступа к памяти.

Еще одним важным аспектом безопасности данных при использовании ЕСС в оперативной памяти является мониторинг и обнаружение внешних атак. Механизмы мониторинга позволяют отслеживать активность пользователей и обнаруживать необычное поведение или несанкционированные попытки доступа к данным. Такие механизмы позволяют быстро реагировать на угрозы и принимать необходимые меры по защите данных.

Также, важно обеспечить защиту данных от случайного удаления или потери. Для этого используются различные механизмы резервного копирования, восстановления и репликации данных

Эти механизмы позволяют восстановить данные в случае их потери или повреждения.

В целом, безопасность данных при использовании ЕСС в оперативной памяти играет важную роль в защите информации. Правильная реализация механизмов аутентификации, авторизации, шифрования, мониторинга и резервного копирования позволяет обеспечить безопасность данных и предотвратить утечку или уничтожение конфиденциальной информации.

В Google не использовали ECC в 1999 году

B. Вызывайте пожары в своих собственных центрах обработки данных.

Некоторые могут взглянуть на эти ранние серверы Google и увидеть непрофессионализм в отношении опасности пожара. Не я. Я вижу здесь дальновидное понимание того, как недорогое стандартное оборудование будет формировать современный интернет.

Последняя часть высказанного — это правда. Но и в первой части есть доля правды. Когда Google начал разрабатывать свои собственные платы, одно их поколение имело проблему «роста» ( ), вызвавшую ненулевое число возгораний.

Кстати, если вы перейдёте к посту Джеффа и посмотрите на фотографию, на которую ссылается цитата, то вы увидите, что на платах много кабелей-перемычек. Это вызывало проблемы и было исправлено в следующем поколении оборудования. Также можно видеть довольно неряшливо выполненную кабельную разводку, что дополнительно вызывало проблемы и что также было быстро устранено. Были и другие проблемы, но я оставлю их в качестве упражнения для читателя.

D. Создавайте свою погоду в ваших центрах обработки данных

Обратите внимание, что всё указанное Google попробовал, а затем изменил. Делать ошибки, а затем устранять их — распространённое явление в любой организации, успешно занимающейся разработками

Если вы боготворите инженерную практику, то следует держаться, по крайней мере, за современную практику, а не за сделанное в 1999 году .

Когда Google использовал серверы без ECC в 1999 году, на них проявился ряд симптомов, которые, как в конце концов выяснилось, были вызваны повреждением памяти. В том числе индекс поиска, который возвращал фактически случайные результаты в запросы. Реальный режим сбоя здесь поучителен. Я часто слышу, что на этих машинах можно игнорировать ECC, потому что ошибки в отдельных результатах являются допустимыми. Но даже если вы считаете для себя случайные ошибки допустимыми, их игнорирование означает, что существует опасность полного повреждения данных, если только не проводить тщательный анализ с целью убедиться, что одна ошибка может лишь незначительно исказить один результат.

В исследованиях, проведённых на файловых системах, неоднократно было показано, что, несмотря на героические попытки создания систем, устойчивых к одной ошибке, сделать это крайне сложно. По существу, каждая сильно тестируемая файловая система может иметь серьёзный сбой из-за единственной ошибки (). Я не собираюсь нападать на разработчиков файловых систем. Они лучше разбираются в таком анализе, чем 99,9% программистов. Просто неоднократно уже было показано, что эта проблема настолько трудная, что люди не могут достаточно обоснованно обсуждать её, и автоматизированное инструментальное средство для такого анализа ещё далеко от процесса простого нажатия кнопки. В своём справочнике по компьютерной обработке складских данных Google обсуждает обнаружение и исправление ошибок, и память ECC рассматривается как самый правильный вариант, когда очевидно, что необходимо использовать исправление ошибок аппаратного обеспечения ( ).

Google имеет отличную инфраструктуру. Из того, что я слышал об инфраструктуре в других крупных инфотехнологических компаниях, Google представляется лучшим в мире. Но это не значит, что следует копировать всё, что они делают. Даже если рассматривать только их хорошие идеи, для большинства компаний нет смысла копировать их. Они создали замену планировщику перехвата работ Linux, который использует как аппаратную информацию времени выполнения, так и статические трассировки, чтобы позволить им использовать преимущества нового оборудования в серверных процессорах Intel, что позволяет динамически разбивать кэш между ядрами . Если использовать это на всём их оборудовании, то Google сэкономит за неделю больше денег, чем компания Stack Exchange потратила на все свои машины за всю свою историю. Означает ли это, что вы должны скопировать Google? Нет, если на вас уже не свалилась манна небесная, например, в виде того, что ваша основная инфраструктура написана на высокооптимизированном C++, а не на Java или (не дай бог) Ruby. И дело в том, что для подавляющего большинства компаний написание программ на языке, который влечёт 20-кратное снижение производительности, — совершенно разумное решение.

Выбор между ECC и ECC REG памятью: что следует учитывать

Когда приходит время выбирать между ECC и ECC REG памятью, необходимо учесть несколько ключевых факторов, чтобы принять обоснованное решение. Здесь мы рассмотрим основные аспекты, которые следует учитывать при выборе между этими двумя типами памяти.

  • Размер и цена: ECC память без буфера (ECC) обычно имеет меньший объем и более доступную цену по сравнению с ECC памятью с зарегистрированным буфером (ECC REG). Поэтому, если вам требуется большой объем памяти, ECC REG может оказаться более дорогостоящей опцией.
  • Производительность: ECC REG память обычно обладает более высокой производительностью и низкой задержкой. Она использует зарегистрированный буфер, который снижает нагрузку на память и улучшает производительность системы. Если вы ищете максимальную производительность, ECC REG память может быть предпочтительнее.
  • Совместимость и поддержка: Проверьте совместимость выбранной памяти с вашим системным железом. Некоторые системы могут быть ограничены в поддержке ECC REG памяти. Убедитесь, что ваша система поддерживает выбранный тип памяти.
  • Надежность: Оба типа памяти обеспечивают коррекцию ошибок (ECC), но ECC REG память также предлагает дополнительную защиту от потери данных посредством зарегистрированного буфера. Если для вас очень важна надежность данных, ECC REG может быть предпочтительнее.
  • Цель использования: В конечном счете, выбор между ECC и ECC REG зависит от целей использования памяти. Если вам важна производительность и вы готовы заплатить за нее дополнительную стоимость, то ECC REG память может быть лучшим выбором. Если же на первом месте стоит доступность и надежность, то ECC память без буфера является разумным выбором.

Не забывайте, что правильный выбор между ECC и ECC REG памятью может значительно повлиять на производительность и надежность вашей системы

Поэтому, перед принятием окончательного решения, важно учитывать все вышеперечисленные факторы и оценивать свои потребности и бюджет

What Can Trigger Single-Bit Errors?

There are two types of single-bit memory errors, hard and soft errors. Unfortunately, some of these triggers are pretty common, especially for industrial computing applications. This is why RAM can easily experience around five single-bit errors within an hour of use on an 8 GB memory. 

Hard Single-Bit Errors (caused by physical factors):

  • Voltage Stress
  • Extreme Temperature
  • Shock and Vibration Impact
  • Manufacturing Defect

Soft Single-Bit Errors (factors harder to detect):

  • Improper Read/Write Process
  • Electromagnetic Interference (EMI)
  • Electrical Interference
  • Magnetic Interference
  • Alpha particles
  • Cosmic Rays

Стоит ли использовать ЕСС память

Несмотря на то, что земной диск медленно дрейфует по Космическому океану, покоясь на спинах трех китов, вероятность искажения данных под воздействием вредоносных лучей, на самом-то деле крайне мала. При этом самое страшное, что может случиться при таких неполадках – вылет операционной системы в синий экран.

Впрочем, это может быть действительно страшно – например, в случае, если вы в течение пары часов монтировали видеоролик, забывая сохраняться в процессе, или же у вас последний и решительный бой, от которого зависит судьба клана, в какой-нибудь ММОРПГ.

Такая память работает медленнее обычной – в среднем, на 2-3%, так как для проверки контрольных сумм необходим один дополнительный такт контроллера. Такой режим работы требует больше логических ресурсов.

Как уже сказано выше, в основном такая память почти всегда регистровая (Registered), то есть имеет дополнительный регистр для считывания и хранения двоичных кодов. Существуют модули ECC памяти без регистров (UDIMM), которые можно использовать в домашних ПК.

Однако учтите, что такое удовольствие обойдется дороже, так как цена на такие модули ОЗУ обычно выше. Кроме того, требуется наличие материнской платы, чипсета и процессора (к слову, такие модели есть и у Intel, и у AMD), поддерживающих ЕСС память. Стоят они внезапно тоже, как правило, дороже.

И если вы решили проапгрейдить комп для использования ЕСС памяти, проверьте спецификации упомянутых выше компонентов. Если в описании написано что нет поддержки такого режима, деталь придется менять на более подходящую, что значит дополнительные расходы.

Не исключено, что придется менять и мать, и «камень», и планки оперативки. При сборке нового компьютера несколько проще: можно сразу купить соответствующие компоненты. Однако, на мой взгляд, это уже лишнее – страховка от мнимых сбоев не стоит потери быстродействия.

Как проверить, работает ли ECC на вашем компьютере?

Прежде всего, необходимо убедиться, что ваш компьютер поддерживает ECC. Для этого можно заглянуть в документацию или на сайт производителя.

При запуске MemTest86 необходимо выбрать тестирование ECC и запустить процесс. Если на вашем компьютере работает ECC, то в отчете тестирования должно быть указано, что проверка ECC прошла успешно.

Также можно проверить наличие ECC на компьютере, перейдя в BIOS и проверив настройки памяти. Если ECC включен, то в настройках должно быть указано, что память работает в режиме ECC.

В любом случае, если вы не уверены, что ECC работает на вашем компьютере, рекомендуется связаться с производителем или специалистом в области информационных технологий, чтобы получить консультацию и помощь в настройке.

Страница 4: Полезные сведения для профессионалов (серверы)

Что такое Registered (регистровые) DIMM?

Выше мы отметили, что в настольных платформах используются UDIMM (Unbuffered, небуферизованные), а в серверных часто встречаются RDIMM (Registered, регистровые). В случае UDIMM адресация памяти выполняется напрямую контроллером памяти, как и передача данных. В случае же RDIMM адресацию на себя берет отдельный чип-регистр, передача данных по-прежнему осуществляется напрямую контроллером памяти.

Цель RDIMM заключается в уменьшении нагрузки на контроллер, в результате на серверную материнскую плату можно устанавливать больше DIMM, существенно увеличивая емкость памяти сервера по сравнению с настольной системой. Стандарт LRDIMM (Load Reduced) является дальнейшей разработкой регистровой памяти, он предлагает буфер IMB (Isolation Memory Buffer) по сравнению с классическими RDIMM, отличаясь от реализации Intel FB-DIMM (Fully Buffered) с буфером AMB (Advanced Memory Buffer) – поэтому такие планки ближе к обычным RDIMM и устанавливаются в те же слоты. У LRDIMM буферизуются не только сигналы управления, но и данные. Совершенствование технологий позволило и дальше увеличить емкость памяти.

Кроме обычных планарных чипов памяти разработана технология «бутерброда» из нескольких чипов под названием 3DS DIMM. Она позволяет значительно увеличить емкость модулей. Наконец, есть модули NVDIMM (Non-volatile), данные в которых не стираются в случае сбоя питания. Их имеет смысл использовать для RAM-диска, то есть когда определенный объем оперативной памяти выделяется для виртуального накопителя.

Модули NVDIMM разделяются на NVDIMM-F (Flash Storage), NVDIMM-N (DRAM), NVDIMM-P (Persistent Memory) и NVDIMM-X (NAND Flash Storage).

Что такое ECC?

ECC означает «Error Correction Code» или код коррекции ошибок. При чтении данных из памяти или записи в память код ECC позволяет исправлять одиночные битовые ошибки. Что повышает надежность работы памяти в окружениях, где это необходимо. Например, в серверах и рабочих станциях. Для кода ECC добавляются 8 дополнительных бит (64 базовых + 8 дополнительных = 72).

Алгоритм ECC позволяет исправлять битовые ошибки, а также определять два ошибочных бита, но уже не исправлять их. Технологии Chipkill или Advanced ECC расширяют алгоритм ECC, позволяя корректировать до 4 ошибочных битов и определять до 8 ошибочных битов. Если ошибок будет много, то данная функция позволяет скрыть сбойный чип в системе без перезагрузки (отсюда и название «Chipkill»), при этом сервер продолжает стабильную работу.

Технологии Chipkill или Advanced ECC работают как массив RAID на жестких дисках, опираясь на распределенное избыточное хранение данных. Например, если система работает с шестью модулями памяти, данные передаются в виде шести 64-битных блоков, к которым добавляются шесть 8-битных для избыточности и ECC. В итоге данные расширяются до 432 бит (шесть 72-битных блоков с ECC), алгоритм chipkill может использовать 12 бит для каждого из шести модулей.

Технология Memory Scrubbing производит постоянную проверку памяти на наличие ошибок, результаты отправляются серверным утилитам управления, например, IPMI (Intelligent Platform Management Interface) в BMC (Baseboard Management Controller). Если возникает большое количество ошибок, в журнал записывается соответствующее сообщение.

Но для работы ECC вместе с функцией ChipKill/Advanced ECC необходимо чтобы процессор, материнская плата с BIOS и оперативная память поддерживали ECC. Данная технология обязательна для всех RDIMM, но также встречаются и UDIMM с ECC.

<> Полезные сведения для опытных пользователейКакой объем памяти будет достаточным?
 

Практические советы и рекомендации при выборе оперативной памяти с ECC функцией

Оперативная память (ОЗУ) с ошибками исправления кода (ECC) — это особый тип ОЗУ, который может обнаруживать и исправлять некоторые ошибки памяти, которые в противном случае приводят к сбоям системы и потере данных. Однако, выбор правильной ОЗУ с ECC может быть непростым. В данном разделе мы рассмотрим практические советы и рекомендации, которые помогут вам выбрать правильную ОЗУ с ECC для вашей системы.

  • Проверьте совместимость — убедитесь, что оперативная память с ECC совместима с вашей материнской платой и процессором. Чтобы узнать, какая оперативная память будет работать на вашей системе, обратитесь к руководству пользователя или сайту производителя вашей материнской платы.
  • Выберите надежный бренд — ECC память от известных производителей вряд ли будет страдать от проблем с совместимостью и качеством. Также, выбирая надежную марку, вы можете получить дополнительные гарантии, такие как ограниченная гарантия на протяжении многих лет использования.

В итоге, выбор между ECC и non-ECC памятью зависит от конкретных потребностей и возможностей пользователей. Как правило, ECC память рекомендуется использовать в серверах и критических системах, где надежность и целостность данных являются первостепенными задачами. Однако, если вы не занимаетесь серьезными вычислениями и работаете на обычном компьютере, то, вероятно, non-ECC памяти будет достаточно

В любом случае, следует учитывать, что ECC память может быть дороже, поэтому важно взвесить все за и против, прежде чем принять решение. Надеемся, что данная статья помогла вам разобраться в различиях между ECC и non-ECC памятью, и сделать правильный выбор

Что такое non-REG?

Non-REG (нерегистровая) память, также известная как небуферизованная память, не обладает дополнительными регистрами. Она обратно отличается от регистровой памяти гибкостью и низким уровнем задержки. Non-REG память подходит для использования в домашних компьютерах, играх и интегрированных системах, где требуется высокая скорость и низкое энергопотребление.

Когда вы выбираете ОЗУ для своей системы, вам нужно учесть следующие особенности:

  • РЕГ и non-REG модули не взаимозаменяемы.
  • Регистровая память имеет более высокие требования по напряжению и потребляет больше энергии, чем нерегистровая.
  • Серверная память (REG) поддерживает более высокие частоты и больше модулей в системе.
  • Буферизованная память рекомендуется для систем с большим количеством модулей и длинной шиной данных.
  • Небуферизованная память (non-REG) обладает меньшими таймингами и лучше работает при разгоне системы.

Какие параметры памяти важно учитывать при выборе камней ОЗУ?

Как проверить работу ECC памяти и обнаружить ошибки

ECC (Error-Correcting Code) память является особой формой оперативной памяти, способной обнаруживать и исправлять ошибки. Однако, даже при использовании ECC памяти, ошибки все равно могут возникать. Для этого существуют специальные инструменты, позволяющие проверить работу ECC памяти и выявить возможные ошибки.

Вот несколько способов проверки работы ECC памяти:

  1. Используйте встроенную утилиту для проверки ECC памяти, если такая предусмотрена производителем материнской платы или операционной системы.
  2. Запустите тестирование памяти с помощью Memtest86 или другой подобной программы. Эта утилита позволяет определить ошибки в памяти, включая ECC ошибки.
  3. Проверьте системные журналы на наличие сообщений об ECC ошибках. В большинстве операционных систем такие сообщения могут быть записаны в журналы системы или ядро операционной системы.
  4. Возможно, BIOS материнской платы имеет опции для проверки и контроля ECC памяти. Просмотрите настройки BIOS и активируйте соответствующую функцию, если она доступна.
  5. Периодически выполняйте проверку и тестирование ECC памяти с использованием специализированных программ или тестовых сценариев. Это поможет выявить возможные ошибки до их критического воздействия.

Если в результате проверки были обнаружены ошибки в работе ECC памяти, то требуется принять соответствующие меры для их устранения. Попробуйте переустановить модули памяти, обновить BIOS материнской платы или заменить неисправные компоненты.

Важно помнить, что ECC память не может полностью гарантировать отсутствие ошибок. Однако, она существенно увеличивает надежность и стабильность работы системы

Регулярная проверка и контроль работы ECC памяти помогает убедиться в ее надлежащей функциональности и предотвратить возможные проблемы.

Понравилась статья? Поделиться с друзьями:
Jsk-oren
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: