82544

Автор(ы): 

Автор(ов): 

7

Параметры публикации

Тип публикации: 

Тезисы доклада

Название: 

Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов

ISBN/ISSN: 

978-5-907366-77-0

Наименование конференции: 

  • 14-я Международная конференция "Интеллектуализация обработки информации" (Москва, 2022)

Наименование источника: 

  • Материалы 14-й Международной конференции "Интеллектуализация обработки информации" (Москва, 2022)

Город: 

  • Москва

Издательство: 

  • Российская Академия наук

Год издания: 

2022

Страницы: 

361-362
Аннотация
В работе рассматривается задача поиска почти-дубликатов текстов школьных сочинений в больших коллекциях данных. Предпосылками к решению данной задачи является возможность школьников применять для написания выпускных сочинений заранее заготовленные тексты, в том числе полученные из открытых коллекций школьных сочинений. Актуальность задачи подтверждается работами [1, 2], посвященными анализу нарушений при написании академических испытаний, а также частичному переходу школьного образования на удаленный режим. Задача поиска почти-дубликатов рассматривается как задача информационного поиска, где сочинению ставится в соответствие заимствованный текст из коллекции. В рамках рассматриваемой задачи сочинение представляется набором изображений рукописного текста, написанного автором, в то время как документы из коллекции представимы в виде машиночитаемых текстов.

Библиографическая ссылка: 

Бахтеев О.Ю., Грабовой А.В., Каприелова М.С., Кильдяков А.С., Сейил Т.Б., Финогеев Е.Л., Чехович Ю.В. Методы поиска почти-дубликатов рукописных документов в больших коллекциях текстов / Материалы 14-й Международной конференции "Интеллектуализация обработки информации" (Москва, 2022). М.: Российская Академия наук, 2022. С. 361-362.