Рассматривается задача обнаружения переводных заимствований. Для решения предлагается использовать моноязыковой подход — свести задачу обнаружения заимствований к одному языку,
используя машинный перевод. В связи со спецификой рассматриваемой задачи предлагаемый алгоритм
обнаружения должен быть устойчив к неоднозначностям перевода. Предлагается декомпозировать задачу на несколько этапов. Сначала отбираются документы-кандидаты, устойчивость к неоднозначности
перевода достигается за счет замены слов на метки кластеров, полученных с помощью дистрибутивной
модели. Затем происходит сравнение найденных кандидатов и рассматриваемого документа, для этого
используется отображение текстовых фрагментов документов в векторное пространство высокой размерности. Вычислительный эксперимент проводится для языковой пары «русский–английский» на двух
выборках — синтетическом корпусе и на статьях из журналов, входящих в Российский индекс научного
цитирования (РИНЦ).