Научный отчет № 5151

Название
Анализ алгоритмов мониторинга цифрового контента с целью решения задач безопасности.
Авторы
Васенин В.А., Афонин А.С., Козицын А.С., Голомазов Д.Д., Коршунов А.А., Титов А.С., Шундеев А.С., Морозова Н.А.
Аннотация
Объектом исследования является процесс автоматического анализа больших коллекций документов при решении задач обеспечения безопасности. Целью работы является проведение аналитический обзора современной научно-технической, нормативной и методической литературы в области информационного поиска, автоматической обработки текстов, анализа поиска закономерностей в данных, методов эффективной обработки коллекций текстовых данных применительно к задачам обеспечения безопасности. Методология отбора информационных источников для последующего анализа состоит в проведении поиска по ключевым словам в специализированных поисковых систем по научно-техническим источникам и расширения полученного множества источников за счет анализа графа цитируемости. В число используемых поисковых систем входят ISI Web Science, Springer Online, ACM Digital Library, содержащие данные о научных публикациях в англоязычных изданиях, и elibrary.ru, которая охватывает ведущие отечественные периодические издания. В ходе выполнения данного этапа были решены следующие задачи. Выполнен аналитический обзор современной научно-технической, нормативной, методической литературы, затрагивающей исследуемую в рамках проекта научно-техническую проблему, проведен анализ опыта ведущих зарубежных и отечественных разработчиков поисковых систем. Описан опыт ведущих зарубежных и отечественных разработчиков в области использования высокопроизводительных систем для решения ресурсоемких задач и проведена оценка применимости таких систем к задачам интеллектуального анализа текстов. Выполнен анализ структуры информации в информационных источникам СМИ. Основной областью применения полученных результатов могут стать адаптация существующих и создание новых математических моделей и алгоритмов для системы мониторинга открытых информационных источников Интернет с целью выявления информации террористической направленности, в области нарушений информационной безопасности и о потенциальных угрозах критически важным объектам. Результаты данного этапа НИР рекомендуется использовать при построении специализированных систем обработки текстов на естественном языке в различных предметных, в частности, в области безопасности, анализа научно-технических данных, в области медицины.
Год публикации
2011 г.
Объём
248 с.
Научный руководитель
Васенин В.А.
Ключевые слова
безопасность, информационный поиск, анализ данных, автоматическая обработка текста, семантика.
о нас
Об институте
60 лет
Библиотека
Презентация
регистрация