Искусственный интеллект перевел записи на древних глиняных табличках
А в чем тренд?
Масштабная эволюция искусственного интеллекта привела к тому, что за последние несколько лет он стал помощником в решении глобальных задач в науке. ИИ-инструменты могут заменить или дополнить работу человека почти во всех случаях, когда решение нужно принимать на основе предыдущего опыта — в том числе в сфере перевода с древних языков.
Перевод — это не просто замена слов. При переводе важно понимать, как оба языка связывают мысли между собой, а затем использовать эти знания для сохранения нюансов оригинала. Этот процесс значительно усложняется в задачах по адаптации древних языков, которые нужно не только воскресить, но и восполнить культурный контекст, который часто утерян из-за нехватки источников.
Пример — аккадский язык, который использовался в Древней Месопотамии (территория современных Сирии и Ирака) в период между 2800 годом до н. э. и 500 годом н. э. Чтобы ускорить его изучение, группа из археологов и IT-специалистов разработала ИИ-инструмент, способный практически мгновенно переводить с аккадского.
Сохранившийся язык
Аккадский язык дошел до нашего времени в виде текстов, нанесенных на таблички, — писец наносил клинопись тростниковым стилусом на влажные глиняные прямоугольники перед их обжигом. Это оказалось на руку современным археологам — материал лучше противостоит пожарам и наводнениям, чем папирус или пергамент.
Трудности перевода
Несмотря на обилие табличек, крайне трудно правильно перевести древние библиотеки. Дело в том, что аккадский язык поливалентен: клинописные знаки могут иметь несколько различных прочтений в зависимости от того, как каждый из них функционирует в предложении, какое место в нем занимает.
Перевод с аккадского языка состоит из двух этапов. Сначала ученые должны транслитерировать клинописные знаки — зафиксировать схожие по фонетике звуки. После этого наступает этап адаптации с учетом поливалентных особенностей.
Машинный перевод от ИИ
Команда израильских исследователей разработала нейронную модель машинного перевода с аккадского. Похожая технология лежит в основе «Google Переводчика». Ученые обучили модель ИИ на выборке из клинописных текстов. После этого она смогла переводить их двумя способами — через транслитерацию или напрямую, адаптируя знаки в слова. В итоге модель прошла оценку способностей. Она продемонстрировала, что результаты работы ИИ были «высококачественными» в обоих случаях. Исследователи отмечают: «Практически в каждом случае тип речи текста был узнаваем. Перспективный сценарий на будущее заключается в том, чтобы модель показывала еще и список источников, от которых отталкивалась при переводе, что было бы особенно полезно для научных целей».
Работа над ошибками
Над результатами еще предстоит поработать. В обоих случаях некоторые из тестовых предложений были переведены неправильно. Как и другие модели ИИ, эта склонна к «галлюцинациям» — моментам, когда ответ не имеет никакой связи с исходным текстом.
Пример галлюцинации ИИ
Перевод, сделанный человеком: «Почему мы должны вести судебный процесс перед человеком из Либби-Али?»
Перевод ИИ: «Они находятся во Внутреннем городе во Внутреннем городе».
Модель ИИ лучше всего работает при переводе коротких и средних по длине предложений. Кроме того, она эффективнее справляется с более шаблонными жанрами вроде указов и отчетов, чем с мифами, гимнами и пророчествами. С увеличением числа тренировок на большем наборе данных команда намерена повысить точность ИИ и использовать его в качестве ассистента, результаты работы которого проверяют ученые.