English

Архив публикаций

Тезисы

XXII-ая конференция

Использование контрольных карт для мониторинга суперкомпьютера "Чебышев"

Никольский И.М.

Москва, Воробьевы горы, ГСП-2

1  стр. (принято к публикации)

Параллельные вычисления находят все более широкое применение в решении научных задач. Суперкомпьютерные кластеры работают круглосуточно, семь дней в неделю. Выход из строя одного или нескольких вычислительных узлов может остановить вычислительный процесс на несколько часов или даже суток. Поэтому проблема мониторинга многопроцессорных ЭВМ является весьма актуальной.

Суперкомьютер "Чебышев", входящий в суперкомпьютерный комплекс МГУ, обладает системой мониторинга, которая периодически снимают различные показатели работы суперкомпьютера (средняя загрузка вычислительных узлов, доля обрабатываемых задач и т.д.). Временные ряды, получаемые системой, помогают отследить текущее состояние суперкомпьютера. Отклонение от нормы в работе суперЭВМ может быть обнаружено путем выявления аномальных участков на одном (или нескольких) из данных временных рядов. Подобные задачи успешно решаются в теории статического контроля качества с помощью методики контрольных карт.

В предлагаемом докладе приводятся результаты анализа данных, полученных с "Чебышева", с помощью нескольких типов контрольных карт (Western Electrical Rules, Shewhart, EWMA и CUSUM). Анализ проводился с помощью среды статистического анализа R. Было установлено, что контрольные карты весьма эффективны для выявления аномального поведения различных характеристик суперкомпьютера.

Литература

1. Gerhard Munz and Georg Carle. Application of forecasting techniques and

control charts for traffic anomaly detection // In proceedings of the 19th

ITC Specialist Seminar on Network Usage and Traffic, Berlin, Germany, October 2008

2. Celso Mendes and Daniel Reed Monitoring large systems via statistical sampling //

International Journal of High Performance Computing Applications May 2004 18: 267-277,

3. Douglas Montgomery Introduction to statistical quality control // Wiley,

6th edition, 2008, 734 p.



© 2004 Дизайн Лицея Информационных технологий №1533