78642

Автор(ы): 

Автор(ов): 

4

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ ТЕМАТИЧЕСКОЙ СЕГМЕНТАЦИИ ТЕКСТОВ НА ОСНОВЕ ГРАФОВ ЗНАНИЙ

ISBN/ISSN: 

1029-3620

Наименование источника: 

  • Известия Российской академии наук. Теория и системы управления

Обозначение и номер тома: 

№ 4

Город: 

  • Москва

Издательство: 

  • Наука

Год издания: 

2024

Страницы: 

93-117
Аннотация
Тематическая сегментация – это задача разделения неструктурированного текста на тематически связные сегменты (такие, в которых речь идет об одном и том же). Граф знаний – графовая структура, вершинами которой являются различные объекты, а ребрами – отношения между ними. Как задача тематической сегментации, так и задача автоматического построения графа знаний не будут новыми, поэтому существует множество алгоритмов для их решения. Однако методы решения задачи тематической сегментации с помощью графов знаний до сих пор исследованы мало. Более того, пока еще нельзя сказать, что задача тематической сегментации решена в общем виде, т.е.существуют алгоритмы, способные при должной настройке решить задачу с требуемым качеством на конкретном наборе данных. Предлагается новый метод решения задачи тематической сегментации на основе графов знаний. Применение графов знаний при сегментации позволяет использовать больше информации о словах в тексте: помимо того чтобы основываться на co-occurrance и семантических расстояниях (как классические алгоритмы), методы на базе графов знаний могут применять расстояние между словами на графе, инкорпорируя тем самым фактологическую информацию из графа знаний в процесс принятия решений о биении текста на сегменты.

Библиографическая ссылка: 

Авдеева З.К., Гаврилов М.С., Лемтюжникова Д.В., Шарафиев А.Ф. МЕТОДЫ РЕШЕНИЯ ЗАДАЧИ ТЕМАТИЧЕСКОЙ СЕГМЕНТАЦИИ ТЕКСТОВ НА ОСНОВЕ ГРАФОВ ЗНАНИЙ // Известия Российской академии наук. Теория и системы управления. 2024. № 4. С. 93-117.