Научный отчет № 4806
- Название
- Среда активного функционального мониторинга больших вычислительных систем FLAME.
- Авторы
- Васенин В.А., Надежкин Д.А., Макаров А.А., Астапов И.С., Коршунов А.А., Роганов В.А., Дзыба М.С., Раевский Д.А., Васильева Е.Л.
- Аннотация
- Система активного мониторинга FLAME (FunctionaL Active Monitoring Environment) предназначена для контроля состояния больших вычислительных систем (кластеров), а также сложной сетевой инфраструктуры, работоспособность которых является критичным фактором потребителей ресурсов подобных систем. Целью работы является поиск механизмов, моделей и их программной реализации, обеспечивающих эффективное построение систем мониторинга, и встраивание в них компонентов автономного компьютинга. Проведены работы по расширению функциональности ядра системы и встраиванию в него подсистем сбора и анализа данных на основе статических алгоритмов. Реализована новая версия консоли и "тонкий клиент", в качестве которого может выступать любая клиентная программа для просмотра WEB. Разработана подсистема автоматического определения логической топологии сети. Проведены исследования и предложены решения по архитектуре подсистемы сбора, статистического анализа данных и прогнозирования состояния системы. Для визуализации текущей динамики контролируемых параметров и прогноза их состояния разработан программный модуль графического отображения информации как на графической консоли, так и на тонком клиенте через http-сервер. Для ввода и изменения параметров сбора статистики системы Flame разработан тонкий клиент по уравнению режимами мониторинга. Проведено тестирование и апробация подсистемы сбора, анализа, прогноза и отображения результатов мониторинга на кластерах Института механики МГУ, Межведомственного суперкомпьютерного центра РАН, ФГУП "НИИ "Квант".
- Год публикации
- 2005 г.
- Объём
- 60 с.
- Научный руководитель
- Васенин В.А.
- Ключевые слова
- параллельные вычисления, многопроцессорные системы, мониторинг состояния вычислительных ресурсов, протокол snmp, отказоустойчивые вычисления, системы распределенной сетевой параллельной обработки, статистический анализ данных, прогнозирование, базы данных.
регистрация
наука
экспериментальная база
инновации