Существует два глобальных подхода к задаче поиска заимствований в тексте: обнаружение «внешних» и «внутренних» заимствований. Первый подход представляет собой поиск по внешней коллекции документов, которые могли были быть использованы для заимствования. Второй подход же, наоборот, не использует никаких внешних данных, а анализирует текст изолированно. Корпус документов для поиска внешних заимствований, как правило, довольно большой, а значит и поиск по нему является тяжелой вычислительной задачей. Поэтому корпус документов заранее подготавливают (например, индексируют). Тем не менее, задача поиска заимствований по внешнему корпусу остается ресурсоемкой. При поиске внутренних заимствований внешний корпус документов не используется. При поиске анализируются различные стилистические, синтаксические, орфографические особенности текста. Предлагается совместить эти два подхода для ускорения поиска текстовых заимствований. При большом потоке документов, которые необходимо проверить на наличие заимствований, система поиска по внешнему корпусу обрабатывает каждый документ и в каждом находит блоки заимствований, если такие имеются. Однако можно использовать поиск внутренних заимствований для определения факта наличия заимствований как таковых. Предлагаемый метод позволяет фильтровать тексты с высоким показателем оригинальности, которые не нуждаются в дополнительной проверке. Поэтому основной метрикой при настройке параметров алгоритма является полнота среди текстов с заимствованиями. В работе используется корпус текстов, подготовленных и размеченных в рамках конкурса PAN-2020. Корпус содержит документы на английском языке. Каждый документ может содержать от 0 до 10 вставок текста другого авторства.