«Потрачено»: сможет ли машина заменить живого переводчика

Не секрет, что роботы скоро заменят нас во многих профессиях, и кажется, что переводчики стоят в первых рядах: уже сейчас есть средства для перевода текста и распознавания речи

Но пока «живые» специалисты не остаются без работы. Почему компьютер пока не может догнать человека? И может ли это все-таки произойти? Об этом мы расскажем в кратком изложении лекции Алексея Малова.

О спикере: Алексей Малов — практикующий переводчик-синхронист, кандидат филологических наук, координатор переводчиков и редакторов студии «Vert Dider».

Алексей Малов — Переводчик умер, да здравствует переводчик!

Как работают современные автоматические системы перевода

В общих чертах, существует три системы:

Перевод на основе правил.

С этого начинались первые системы машинного перевода. Их проблема состоит в том, что машина, зачастую, переводит слишком дословно, строго следуя заданным параметрам и не используя синонимы, из-за чего текст оказывается некорректным. Примером могут служить меню кафе или странички в путеводителях где-нибудь за границей лет десять тому назад, где можно было встретить совершенно невероятные блюда вроде «овощей с нефтью» и рассказы о поездке на «говяжьей упряжке». Правда, вряд ли какая-то из существующих систем перевода на основе правил сейчас выдаст такую же ошибку, так как их постоянно совершенствуют.

Статистический перевод.

На настоящий момент существует множество параллельных текстов (на русском и иностранном языке), которые оцифрованы и загнаны на сервера и оформлены в параллельный корпус (текст оригинала и его перевод на другой язык выровнены так, что все фрагменты оригинала совпадают с соответствующими фрагментами перевода). С их помощью человек может понять, в каких случаях то или иное слово употреблялось, с какими зависимыми словами, в каком контексте и т.д. Задача системы в данном случае — найти максимально подходящее соответствие, которое уже перевели, и выдать этот вариант. Проблема: наиболее частый вариант перевода не всегда соответствует конкретной ситуации. Самый яркий пример — слово «wasted», всплывающее после смерти персонажа в игре GTA, которое на русский язык было неверно переведено как «потрачено».

Машинный перевод.

Машины хорошо учатся и уже обыгрывают нас в го и шахматы, рисуют картины, сочиняют песни и оценивают работы студентов не хуже преподавателей. Когда они заменят человека в вопросах перевода и заменят ли?

Они уже (чаще всего) разбираются в синонимах, и это, на первый взгляд, действительно создает угрозу «живым» специалистам. Но все не так просто.

Одна из проблем машинного перевода заключается в распознавании нюансов, оттенков эмоций и контекста. Во многом люди и сами не до конца умеют распознавать эти тонкости: учитывая, что машины пока обучаются людьми, говорить о полной замене переводчиков роботами некорректно.

Как научить машины распознавать эмоции, которые мы сами не всегда ясно определяем?

Можно обратиться к лингвистам и филологам, однако никто из них не даст точную оценку того, что конкретно считать яростью, что — гневом, а что — злостью. Но можно обратиться к нейропсихологам.

Существует квартетная теория человеческих эмоций, согласно которой в нашем мозге есть несколько зон, отвечающих за то, что мы чувствуем: ствол, диэнцефалон, гиппокамп и орбитофронтальная кора. Понимание того, как работают эти зоны, может существенно облегчить работу специалистов по машинному переводу. Идя дальше, можно проанализировать с помощью МРТ активность мозга различных людей, вызвав у них определенные эмоции и попросив описать то, что они при этом чувствуют, после чего сравнить результаты с ответами иностранных испытуемых. А эти данные уже подвергнуть оцифровке и использовать в обучении машин. Но МРТ — дорогая диагностика, используемая в медицине, и ее применение в лингвистических вопросах не всегда целесообразно. Однако Университет Беркли все же задался похожей целью: ученые зачитывали тексты испытуемым и мониторили их активность мозга, после чего сравнили слова, которые были зачитаны, с тем, какая часть мозга была активна в это время. В результате была составлена семантическая карта мозга.

Также в определении эмоций и последующем обучении этому машин может помочь скалярный подход (суть заключается в том, что любому эмоциональному стимулу, в том числе и вербальному, присваивается числовое значение по шкалам, каждая из которых отражает одну из характеристик). Эксперименты с его применением уже проводились: носителям разных языков называли определенные слова и просили оценить, используя шкалы, что они при этом чувствуют. С помощью этих опросов были сформированы несколько баз данных для разных языков, но русского там нет.

Проведя собственное исследование, Алексей выяснил интересную вещь: слова англоязычные и русскоязычные носители «чувствуют» с совершенно с разной интенсивностью. Его респондентам нужно было оценить то, насколько позитивную или негативную эмоцию они испытывают при упоминании слова «sad», то есть грусть, печаль. Англоговорящие респонденты оценили ее по шкале от 1 до 9 на 1,6, то есть это — почти самая негативная эмоция, которую они могли бы испытать. Русскоязычные участники исследования же оценили эмоцию примерно на 3,5. Вероятно, в нашем сознании сильны такие понятия как приятная грусть или светлая печаль. Это еще раз доказывает важность контекста, а также происхождения, опыта и эмоционального интеллекта конкретного человека.

Пока мы сами до конца не разобрались, как все это работает, мы не сможем научить этому машину. И пока ни одна из существующих систем перевода не лучше человека. Лишат ли они работы переводчиков в будущем? Плохих — скорее всего. Хороших — вряд ли.

Больше информации и новостей о трендах образования в нашем Telegram-канале. Подписывайтесь.

Обновлено 30.06.2020

Текст

Анастасия Андреева

HR и рынок труда Искусственный интеллект Нейросети