Современные онлайн-переводчики прошли очень долгий путь в своем развитии, и благодаря трудам разработчиков они с каждым днем становятся только лучше. Они уже научились отличать контекст и благодаря внедрению нейросетей могут самостоятельно обучаться. И все же, на них нельзя полностью положиться, и уж тем более, они не могут заменить профессионального переводчика. Но почему же машинные переводчики до сих пор не научились выполнять свою работу идеально без помощи людей? На самом деле, для этого есть ряд причин, и в этой статье мы разберемся, с какими именно текстами онлайн-переводчики справляются плохо и почему так происходит.
Как устроены онлайн-переводчики?
Для начала нужно разобраться, что из себя представляют онлайн-переводчики и согласно каким алгоритмам они работают. Большинство онлайн-переводчиков используют алгоритмы машинного перевода, которые анализируют входящий текст и генерируют перевод на основе моделей, обученных на больших корпусах текстов. Также они применяют методы обработки естественного языка NLP. Natural Language Processing — это направление в машинном обучении, посвящённое распознаванию, генерации и обработке устной и письменной человеческой речи. Кроме того, с развитием нейросетей появились два разных вида машинного перевода: статический и нейронный.
- Статистический: основан на вероятностях, вычисленных на основании существующих переводов. Этот метод анализирует большие объемы текстов и ищет соответствия между словами и фразами на разных языках.
- Нейронный: использует искусственные нейронные сети для создания более адекватного перевода, который учитывает контекст и отношения между словами.
Очевидно, что онлайн-переводчики на базе нейросетей работают куда лучше статических, которые не способны производить анализ текстов и осуществляют перевод согласно образцам из текстов, которые есть в их базе данных. Но даже нейропереводчики не всегда работают идеально.
С какими текстами онлайн-переводчики справляются отлично?
Одно бюро переводов недавно опубликовало исследование, в котором был выявлен лучший онлайн-переводчик 2024 года. Принцип исследования заключался в том, чтобы предоставить всем участникам тексты 6 различных тематик: художественный текст, договор, технический текст, научная статья, маркетинг и общая тематика. Профессиональные переводчики оценивали качество выполненной работы каждого онлайн-переводчика по десятибалльной шкале.
Мы возьмем общую статистику и проанализируем, с каким типом текстов онлайн-переводчики справляются лучше всего. Самый высокий результат машинные переводчики получили за перевод научной статьи.
Неплохие результаты также были при переводе технического текста. И этот факт довольно легко объяснить. Тексты подобной тематики содержат в себе клишированные фразы, схожие однотипные синтаксические конструкции и стандартизированный язык. В таком случае онлайн-переводчик может просто опереться на свою базу данных и перевести текст согласно имеющемуся образцу. Если сказать проще, все технические и научные тексты имеют особый единый стиль написания, поэтому онлайн-переводчики так легко с ними справляются.
А какие тексты не по силам онлайн-переводчикам?
Есть и такие тексты, с которыми машинные переводчики еще не научились работать так же хорошо, как с научными и техническими. Самая большая проблема для онлайн-переводчика — перевести художественный текст.
Эксперты оценили почти всех участников довольно низко, и это не случайность. Дело в том, что художественные тексты считаются самыми сложными из-за своей специфичности.
- Культурные особенности. Художественная литература насыщена культурными отсылками, шутками, метафорами и идиомами. И для того чтобы их перевести, нужно сначала заметить их в тексте и понять их смысл, пока это под силу только человеку.
- Стиль. Перевод художественного текста требует передачи не только смысла, но и стиля, ритма и настроения автора. Онлайн-переводчики, часто грешат буквализмами, что может привести к потере стилистических особенностей.
- Контекст. Художественные произведения часто имеют в себе множество отсылок, которые влияют на перевод, а онлайн-переводчики еще не научились учитывать контекст.
- Сложные лексические и синтаксические конструкции. Автор может использовать сложные языковые конструкции, элементы или уникальные словосочетания, которые требуют переводческого анализа и решения.
Таким образом, можно сказать, что машинные переводчики не могут определять индивидуальный стиль автора, переводить средства художественной выразительности и учитывать контекст, как раз из-за этого и возникают сложности при переводе, справиться с которыми может только человек. Но даже несмотря на это, они все еще могут служить хорошими помощниками для перевода более простых текстов.