Научный отчет № 5151
- Название
- Анализ алгоритмов мониторинга цифрового контента с целью решения задач безопасности.
- Авторы
- Васенин В.А., Афонин А.С., Козицын А.С., Голомазов Д.Д., Коршунов А.А., Титов А.С., Шундеев А.С., Морозова Н.А.
- Аннотация
- Объектом исследования является процесс автоматического анализа больших коллекций документов при решении задач обеспечения безопасности. Целью работы является проведение аналитический обзора современной научно-технической, нормативной и методической литературы в области информационного поиска, автоматической обработки текстов, анализа поиска закономерностей в данных, методов эффективной обработки коллекций текстовых данных применительно к задачам обеспечения безопасности. Методология отбора информационных источников для последующего анализа состоит в проведении поиска по ключевым словам в специализированных поисковых систем по научно-техническим источникам и расширения полученного множества источников за счет анализа графа цитируемости. В число используемых поисковых систем входят ISI Web Science, Springer Online, ACM Digital Library, содержащие данные о научных публикациях в англоязычных изданиях, и elibrary.ru, которая охватывает ведущие отечественные периодические издания. В ходе выполнения данного этапа были решены следующие задачи. Выполнен аналитический обзор современной научно-технической, нормативной, методической литературы, затрагивающей исследуемую в рамках проекта научно-техническую проблему, проведен анализ опыта ведущих зарубежных и отечественных разработчиков поисковых систем. Описан опыт ведущих зарубежных и отечественных разработчиков в области использования высокопроизводительных систем для решения ресурсоемких задач и проведена оценка применимости таких систем к задачам интеллектуального анализа текстов. Выполнен анализ структуры информации в информационных источникам СМИ. Основной областью применения полученных результатов могут стать адаптация существующих и создание новых математических моделей и алгоритмов для системы мониторинга открытых информационных источников Интернет с целью выявления информации террористической направленности, в области нарушений информационной безопасности и о потенциальных угрозах критически важным объектам. Результаты данного этапа НИР рекомендуется использовать при построении специализированных систем обработки текстов на естественном языке в различных предметных, в частности, в области безопасности, анализа научно-технических данных, в области медицины.
- Год публикации
- 2011 г.
- Объём
- 248 с.
- Научный руководитель
- Васенин В.А.
- Ключевые слова
- безопасность, информационный поиск, анализ данных, автоматическая обработка текста, семантика.
регистрация
наука
экспериментальная база
инновации