Москва

82375

Автор(ы): 

Автор(ов): 

1

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

ВолшебнИИк для страны ОЗ

ISBN/ISSN: 

1726-6726

Наименование источника: 

  • Университетская книга

Обозначение и номер тома: 

№ 8

Город: 

  • Москва

Издательство: 

  • ООО "ИД Университетская книга"

Год издания: 

2023

Страницы: 

61-65
Аннотация
В статье критически анализируется распространённый редукционистский подход к оценке научных и учебных работ, при котором сложная экспертиза на наличие некорректных заимствований подменяется автоматическим определением «уровня плагиата». Автор обосновывает необходимость использования квалифицированных экспертов, но отмечает связанные с этим субъективность, временные и коррупционные риски. В качестве решения рассматривается интеграция технологий искусственного интеллекта в системы обнаружения заимствований (СОЗ) для создания гибридных инструментов. Демонстрируется, как методы машинного обучения позволяют решать ранее недоступные задачи: выявление кросс-языкового плагиата, парафраза, маскировки совпадений и машинно-сгенерированного текста. Также исследуются перспективы расширения функциональности СОЗ за счёт анализа нетекстового контента (изображений, формул, таблиц) и структурно-метаданных особенностей документов. Делается вывод, что полноценное внедрение ИИ-решений, охватывающее полный цикл от постановки задачи до валидации результатов, является ключевым фактором повышения эффективности и объективности проверки академических текстов.

Библиографическая ссылка: 

Чехович Ю.В. ВолшебнИИк для страны ОЗ // Университетская книга. 2023. № 8. С. 61-65.

82372

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Доклад

Название: 

ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА ДЛЯ МОНИТОРИНГА СРЕДНЕЙ И МЕДИАННОЙ ЗАРАБОТНОЙ ПЛАТЫ ПРЕПОДАВАТЕЛЕЙ ВУЗОВ РОССИИ

ISBN/ISSN: 

978-5-91450-283-3

Наименование конференции: 

  • 18-я Международная конференция «Управление развитием крупномасштабных систем» (MLSD'2025, Москва)

Наименование источника: 

  • Труды 18-й Международной конференции «Управление развитием крупномасштабных систем» (MLSD'2025, Москва)

Обозначение и номер тома: 

Т.1

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2025

Страницы: 

1090-1095
Аннотация
Abstract—In order to clarify socially significant aspects in managing the development of large-scale educational systems in Russia, a computing system for monitoring the salaries of university teachers has been developed. Differential calculations are given for calculating annual threshold salary coefficients according to the specification (positions) of teachers (assistant, associate professor, etc.) of a hypothetical Moscow university. A functional diagram of an analog device for calculating the threshold wage coefficient according to the minimum wage is presented.

Библиографическая ссылка: 

Русяева Е.Ю., Ахобадзе Г.Н. ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА ДЛЯ МОНИТОРИНГА СРЕДНЕЙ И МЕДИАННОЙ ЗАРАБОТНОЙ ПЛАТЫ ПРЕПОДАВАТЕЛЕЙ ВУЗОВ РОССИИ / Труды 18-й Международной конференции «Управление развитием крупномасштабных систем» (MLSD'2025, Москва). М.: ИПУ РАН, 2025. Т.1. С. 1090-1095.

82371

Автор(ы): 

Автор(ов): 

7

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Поиск текстовых заимствований в рукописных текстах

ISBN/ISSN: 

2686-9543

DOI: 

10.31857/S2686954323601720

Наименование источника: 

  • Доклады Российской академии наук. Математика, информатика, процессы управления

Обозначение и номер тома: 

Т. 514, № 2

Город: 

  • Москва

Издательство: 

  • ФГБУ "Издательство "Наука"

Год издания: 

2023

Страницы: 

297-307
Аннотация
Поиск заимствований в учебных работах становится в последнее время все более актуальной задачей. Повышение популярности онлайн-образования, активная экспансия онлайн-платформ, ориентированных на среднее образование, формируют потребность в инструменте, способном проверять на заимствования рукописные работы школьников. Существующие подходы к поиску рукописных заимствований не подходят для быстрой проверки значительного количества работ по большими коллекциям потенциальных источников. Это существенно ограничивает их применимость. Кроме того, на практике требуется обрабатывать изображения текстовых страниц посредственного качества, выполненные, как правило, с помощью фотокамер мобильных телефонов. Мы предлагаем метод, который позволяет выявлять заимствованные фрагменты текста в документах, представленных в виде изображений (фотографий) рукописных текстов, при сопоставлении с большими коллекциями источников. Метод включает в себя три этапа: распознавание символов рукописного текста, поиск кандидатов и последующий точный поиск источника заимствований. В работе приведены результаты экспериментов по оценке качества и производительности разработанной системы. Полнота поиска заимствований в рукописных документах достигает 83.3% при обработке изображений высокого качества и 77.4% при обработке изображений худшего качества. Время выполнения поиска для одного документа по коллекции источников из 100 000 документов составляет в среднем 3.2 с при использовании CPU. Результаты показали, что созданная нами система может быть масштабирована и использована для промышленных задач, требующих быстрой проверки сотен тысяч школьных сочинений по большому количеству потенциальных источников заимствований. Все эксперименты проводились на открытом наборе данных HWR200.

Библиографическая ссылка: 

Грабовой А.В., Каприелова М.С., Кильдяков А.С., Потяшин И.О., Сейил Т.Б., Финогеев Е.Л., Чехович Ю.В. Поиск текстовых заимствований в рукописных текстах // Доклады Российской академии наук. Математика, информатика, процессы управления. 2023. Т. 514, № 2. С. 297-307.

Публикация имеет версию на другом языке или вышла в другом издании, например, в электронной (или онлайн) версии журнала: 

Да

Связь с публикацией: 

82367

Автор(ы): 

Автор(ов): 

4

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Поиск искусственно сгенерированных текстовых фрагментов в научных документах

ISBN/ISSN: 

2686-9543

DOI: 

10.31857/S2686954323601677

Наименование источника: 

  • Доклады Российской академии наук. Математика, информатика, процессы управления

Обозначение и номер тома: 

Т. 514, № 2

Город: 

  • Москва

Издательство: 

  • ФГБУ "Издательство "Наука"

Год издания: 

2023

Страницы: 

308-317
Аннотация
Недавние достижения в области текстовых генеративных моделей позволяют получать искусственные тексты, едва отличимые от написанных человеком при беглом прочтении. Прогресс подобных моделей ставит новые задачи перед научным сообществом, ведь их развитие влечет за собой появление и распространение ложной информации, спама, способствует распространению неэтичных практик. В области обработки естественного языка уже разработано большое количество методов для детектирования текстов, полученных при помощи моделей машинного обучения, включая большие языковые модели. Однако улучшению методов выявления искусственных текстов происходит одновременно с улучшением методов генерации текстов, поэтому требуется изучение появляющихся моделей, искусственных текстов – результатов их работы и модернизации существующих подходов к детекции. В настоящей работе представлен детальный анализ ранее созданных методов детекции, а также исследование лексических, синтаксических и стилистических особенностей генерируемых фрагментов. В вычислительном эксперименте сравниваются различные методы детектирования машинной генерации в документах с точки зрения их дальнейшего применения для научных и учебных текстов. Эксперименты проводились для русского и английского языков на собранных авторами наборах данных. Разработанные методы позволили довести качество детектирования до значения 0.968 по метрике F1-score для русского и до 0.825 для английского языков соответственно. Созданные методы используются в практических системах для выявления сгенерированных фрагментов в научных, исследовательских и выпускных работах.

Библиографическая ссылка: 

Грицай Г.М., Грабовой А.В., Кильдяков А.С., Чехович Ю.В. Поиск искусственно сгенерированных текстовых фрагментов в научных документах // Доклады Российской академии наук. Математика, информатика, процессы управления. 2023. Т. 514, № 2. С. 308-317.

Публикация имеет версию на другом языке или вышла в другом издании, например, в электронной (или онлайн) версии журнала: 

Да

Связь с публикацией: 

82364

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

О комбинированном алгоритме обнаружения заимствований в текстовых документах

ISBN/ISSN: 

2079-8156

DOI: 

10.15514/ISPRAS-2022-34(1)-11

Наименование источника: 

  • Труды Института системного программирования РАН

Обозначение и номер тома: 

Т. 34, № 1

Город: 

  • Москва

Издательство: 

  • Институт системного программирования РАН

Год издания: 

2022

Страницы: 

151-160
Аннотация
Поиск заимствований в текстовом документе по отношению к обширной коллекции потенциальных источников является вычислительно тяжелой задачей. При этом существуют так называемые внутренние методы поиска заимствований, которые не используют внешний корпус, а анализируют исключительно проверяемый документ. Эти методы не отличаются точностью, но обеспечивают довольно высокую производительность. В работе предложен комбинированный подход к обнаружению текстовых заимствований, основанный на использовании внутренних методов для выявления высокооригинальных документов, проверка которых по внешней коллекции не требуется. Предлагаемый алгоритм призван разгрузить систему поиска заимствований по внешней коллекции, отфильтровывая документы с высокой степенью оригинальности. В работе предлагается алгоритм поиска внутренних заимствований, описываются результаты вычислительных экспериментов.

Библиографическая ссылка: 

Сафин К.Ф., Чехович Ю.В. О комбинированном алгоритме обнаружения заимствований в текстовых документах // Труды Института системного программирования РАН. 2022. Т. 34, № 1. С. 151-160.

Страницы