• Научно-исследовательский
    вычислительный центр
    Московского государственного
    университета имени М. В. Ломоносова

    Интеллектуальный анализ текста

  • В Лаборатории анализа информационных ресурсов под руководством Б.В.Доброва и В.Лукашевич ведутся научные разработки по широкому кругу задач обработки больших потоков текстов различных жанров, прежде всего деловой прозы, научно-технических документов, сообщений социальных медиа и т.п. С участием сотрудников лаборатории разработаны следующие технологии:

    • тематический анализ текстов (классификация, аннотирование, многоязычный поиск), прежде всего на основе больших лингвистических онтологий;
    • технологии оценки тональности, извлечения фактографической информации;
    • технологии кластеризации, классификации и обзорного реферирования новостного потока;
    • информационно-поисковая система корпоративного уровня;
    • информационно-аналитическая система, включая обработку и интеграцию неструктурированных и структурированных (статистических) данных.

    Основные методы исследования связаны с использованием больших лингвистических онтологий. Также широко применяются методы машинного обучения.