Online-заседание общемосковского семинара "Экспертные оценки и анализ данных", 13 мая 2020 г.

Уважаемые коллеги!
 
13 мая 2020 г., в 14:30 состоится онлайн ZOOM-трансляция заседания Общемосковского семинара "Экспертные оценки и анализ данных". Трансляция производится средствами сервиса видеоконференций ZOOM (zoom.us)
Адрес для подключения к трансляции:
https://us02web.zoom.us/j/86809172959
Meeting ID 868-0917-2959
 
П.Д.Бахтин (НИУ ВШЭ)
Машинное обучение модели SciBERT для оценки тематической близости между научно-техническими текстами на основе триплетов со-цитирования.
 
Аннотация:
В докладе будет представлен новый подход к машинному обучению нейросетевых языковых моделей для получения сопоставимых векторных представлений научных текстов (в основном коротких текстов, т. е. аннотаций) на примере трансформера SciBERT. Будет продемонстрирована стратегия создания эталонного набора триплетных данных тематически связанных (так называемых якорных и положительных примеров) и тематически несвязанных (якорных и отрицательных примеров) научных нарративов с использованием сети со-цитирования, построенной на основе данных Microsoft Academic Graph. Этот набор данных используется для до-обучения и настройки SciBERT с целью получения возможности оценивать тематические сходство между исследовательскими работами. Эксперименты показывают, что одна эпоха обучения позволяет превзойти базовую модель one-hot-embedding, а также вариации SciBERT, обученные на других задачах, и установить значения показателя точности F1 в районе 0,82 для дальнейшего сравнения языковых моделей.
 
Для подключения к видеоконференции через сервис ZOOM необходимо перейти по ссылке:
https://us02web.zoom.us/j/86809172959
 

 

Дата: 

13.05.2020 - 14:30

Место: 

  • online