54117

Автор(ы): 

Автор(ов): 

3

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Обзор алгоритмов фонетического кодирования

Электронная публикация: 

Да

DOI: 

10.25728/ubs.2018.73.4

Наименование источника: 

  • Управление большими системами

Обозначение и номер тома: 

Вып. 73

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2018

Страницы: 

67-94.
Аннотация
Приведен обзор алгоритмов фонетического кодирования, предназначенных для определения схожести слов по звучанию (произношению). Алгоритмы фонетического кодирования разделены на алгоритмы для сравнения слов и алгоритмы определения расстояния между словами. Описаны алгоритмы сравнения слов SoundEx, NYSIIS, Daitch-Mokotoff, Metaphone, Polyphone и алгоритмы вычисления расстояния между словами Левенштейна, Джаро, на основе N-грамм. Для каждого алгоритма указаны его достоинства и недостатки, приводится аналог алгоритма для русского языка. Для устранения общих недостатков алгоритмов фонетического кодирования предложено использовать не последовательности букв слов, а последовательности их элементарных звуков.

Библиографическая ссылка: 

Выхованец В.С., Сакулин С.А., Цзяньмин Д.н. Обзор алгоритмов фонетического кодирования // Управление большими системами. 2018. Вып. 73. С. 67-94.