Искусственный интеллект перевел записи на древних глиняных табличках

Фото: Unsplash

Группа израильских ученых обучила модель искусственного интеллекта переводить клинопись древнего аккадского языка. Результаты их работы уже радуют археологов

А в чем тренд?

Масштабная эволюция искусственного интеллекта привела к тому, что за последние несколько лет он стал помощником в решении глобальных задач в науке. ИИ-инструменты могут заменить или дополнить работу человека почти во всех случаях, когда решение нужно принимать на основе предыдущего опыта — в том числе в сфере перевода с древних языков.

Перевод — это не просто замена слов. При переводе важно понимать, как оба языка связывают мысли между собой, а затем использовать эти знания для сохранения нюансов оригинала. Этот процесс значительно усложняется в задачах по адаптации древних языков, которые нужно не только воскресить, но и восполнить культурный контекст, который часто утерян из-за нехватки источников.

Пример — аккадский язык, который использовался в Древней Месопотамии (территория современных Сирии и Ирака) в период между 2800 годом до н. э. и 500 годом н. э. Чтобы ускорить его изучение, группа из археологов и IT-специалистов разработала ИИ-инструмент, способный практически мгновенно переводить с аккадского.

Сохранившийся язык

Аккадский язык дошел до нашего времени в виде текстов, нанесенных на таблички, — писец наносил клинопись тростниковым стилусом на влажные глиняные прямоугольники перед их обжигом. Это оказалось на руку современным археологам — материал лучше противостоит пожарам и наводнениям, чем папирус или пергамент.

Трудности перевода

Несмотря на обилие табличек, крайне трудно правильно перевести древние библиотеки. Дело в том, что аккадский язык поливалентен: клинописные знаки могут иметь несколько различных прочтений в зависимости от того, как каждый из них функционирует в предложении, какое место в нем занимает.

Перевод с аккадского языка состоит из двух этапов. Сначала ученые должны транслитерировать клинописные знаки — зафиксировать схожие по фонетике звуки. После этого наступает этап адаптации с учетом поливалентных особенностей.

Индустрия 4.0 GPT-4: что умеет самая продвинутая языковая модель

Машинный перевод от ИИ

Команда израильских исследователей разработала нейронную модель машинного перевода с аккадского. Похожая технология лежит в основе «Google Переводчика». Ученые обучили модель ИИ на выборке из клинописных текстов. После этого она смогла переводить их двумя способами — через транслитерацию или напрямую, адаптируя знаки в слова. В итоге модель прошла оценку способностей. Она продемонстрировала, что результаты работы ИИ были «высококачественными» в обоих случаях. Исследователи отмечают: «Практически в каждом случае тип речи текста был узнаваем. Перспективный сценарий на будущее заключается в том, чтобы модель показывала еще и список источников, от которых отталкивалась при переводе, что было бы особенно полезно для научных целей».

Работа над ошибками

Над результатами еще предстоит поработать. В обоих случаях некоторые из тестовых предложений были переведены неправильно. Как и другие модели ИИ, эта склонна к «галлюцинациям» — моментам, когда ответ не имеет никакой связи с исходным текстом.

Пример галлюцинации ИИ

Перевод, сделанный человеком: «Почему мы должны вести судебный процесс перед человеком из Либби-Али?»

Перевод ИИ: «Они находятся во Внутреннем городе во Внутреннем городе».

Модель ИИ лучше всего работает при переводе коротких и средних по длине предложений. Кроме того, она эффективнее справляется с более шаблонными жанрами вроде указов и отчетов, чем с мифами, гимнами и пророчествами. С увеличением числа тренировок на большем наборе данных команда намерена повысить точность ИИ и использовать его в качестве ассистента, результаты работы которого проверяют ученые.

Обновлено 11.08.2023

Авторы

Теги

Семен Башкиров

Искусственный интеллект Научные открытия Исследования и доклады