Home » Этот ИИ-бот переводит мертвые древние языки на английский

Этот ИИ-бот переводит мертвые древние языки на английский

В любом количестве мест по всему миру, где находятся древние артефакты и остатки некогда процветающих обществ, в земле есть глиняные таблички с сообщениями, которые ждали, чтобы их прочитали более 5000 лет. Эти сообщения, написанные с помощью тростникового стилуса, вдавленного в глину, чтобы образовать клиновидные отметки для создания письма, известного как клинопись, обычно считаются самыми ранними образцами письменности в истории человечества.

За последние несколько столетий было обнаружено около 600 000 этих загадочных табличек, и они неуклонно накапливаются в университетских и музейных коллекциях по всему миру. Благодаря этим открытиям исследователи, известные как ассириологи, смогли расшифровать и перевести вымершие языки и вдохнуть в них новую жизнь, например, в аккадский, на котором когда-то говорили люди, жившие в первых цивилизациях мира в Месопотамии.

Однако очень мало ассириологов, способных перевести эти древние тексты. По мере того, как каждый год обнаруживаются новые глиняные таблички, задача перевести эти древние послания на современные языки становится все более и более сложной.

Это своего рода книжная зарисовка человеческой письменной истории, так что это действительно захватывающая работа.

Уиллис Монро, Университет Британской Колумбии

«Очень немногие люди могут действительно хорошо его читать, — сказал The Daily Beast Шай Гордин, ассириолог из Университета Ариэля. «Это также 3000 лет письменной истории, верно? Поэтому, если кто-то может очень хорошо читать клинопись одного периода, это не обязательно означает, что он может действительно хорошо читать другие периоды».

Итак, чтобы помочь им перевести растущее число древних языков на современные, Гордин и его коллеги решили обратиться за помощью к передовой технологии: искусственному интеллекту. В частности, команде удалось разработать нейронную сеть, способную переводить аккадскую и шумерскую клинопись на английский язык. Исследователи опубликовали статью о своих выводах 2 мая в журнале ПНАС Нексус.

Подобная модель может не только значительно ускорить процесс перевода для исследователей, но и дать историкам и ассириологам возможность получить новое и более глубокое понимание этих древних цивилизаций. Авторы также видят потенциал в демократизации ассириологии, предоставляя доступ к таким инструментам непрофессионалам.

«Нам очень хотелось иметь [Assyriology] быть более интегрированным с технологиями», — сказал Гордин. «С одной стороны, это делает процесс более цельным и стандартизированным. С другой стороны, это на самом деле помогает нам задавать новые и интересные вопросы, потому что позволяет нам видеть закономерности, которых мы раньше не видели».

Read more:  Вот ваш маршрутный номер Bank of America

К лучшему или к худшему, ИИ можно рассматривать как следующую эволюцию отношений человечества с языком. Не только мощные инструменты ИИ, такие как Google Translate, помогают людям общаться и понимать друг друга, независимо от того, в каком уголке мира они родились, но и большие языковые модели (LLM), такие как ChatGPT от OpenAI и Бард Google начинают коренным образом менять то, как некоторые люди пишут и взаимодействуют с контентом, который они видят в Интернете.

Поэтому неудивительно, что ИИ в конечном итоге возник из одного из древнейших языков, известных человечеству. Уиллис Монро, историк древнего Ближнего Востока из Университета Британской Колумбии, не участвовавший в исследовании, считает почти поэтическим то, что Гордин и его коллеги разработали модель искусственного интеллекта для взаимодействия с одним из самых ранних письменных языков. в истории человечества.

«Кинопись очень, очень старая», — сказала Монро The Daily Beast. «Это один из самых ранних, если не самый ранний письменный сценарий в мире. Так что самое интересное в этом — это сочетание современных цифровых подходов, таких как нейронные сети и машинное обучение, с первым письмом. Это своего рода книжная зарисовка человеческой письменной истории, так что это действительно захватывающая работа».

Сама модель является продолжением Вавилонский двигатель, платформа для цифровой ассириологии, которая стремится объединить новые технологии с изучением этих ранних письменных языков. «Его цель — интегрировать модели искусственного интеллекта и машинного обучения в реальную работу, которую мы делаем как историки и исследователи прошлого», — сказал Гордин.

Это последнее исследование — большой шаг к этой цели, хотя и огромный, учитывая ограничения клинописи. Во-первых, сценарий сродни «трехмерному почерку», — сказала Монро. «Это все равно, что пытаться заставить компьютер автоматически генерировать перевод того, кто пишет на пляже палкой по-французски. Это очень сложно».

Он добавил, что, хотя есть команды, работающие над моделями, которые могут напрямую переводить клинопись, до этого еще далеко, поскольку сценарий предназначен для чтения в «перемещающемся свете». Это неотъемлемое ограничение даже для самого мощного компьютера.

Read more:  «Последний из нас»: настоящий ли Джексон? Как HBO изменил Кэнмор

Поэтому, чтобы обойти это, команда на самом деле обучила две версии нейронной сети. Первый преобразует аккадский язык, транслитерированный в латинском тексте, в английский (T2E), а другой переводит unicode — международный стандарт кодирования, который присваивает числа сценариям и буквам — представлениям клинописи на английский язык (C2E). Хотя этот метод не использовал напрямую клинопись, он позволил исследователям создать модели, которые эффективно переводили аккадский язык.

Чтобы измерить успех переводов, команда использовала Лучший дублер двуязычной оценки (BLEU), рубрику, которая измеряет точность перевода. В результате T2E были получены наиболее точные переводы двух моделей — средняя оценка составила 37,47, а C2E — 36,52. Это относительно высокие оценки по BLEU, которые указывают на то, что модель способна создавать понятные переводы.

Хотя нейронная сеть подает большие надежды, были некоторые предостережения. Во-первых, модель склонна к галлюцинациям, извечной проблеме LLM и другого генеративного ИИ, когда система выдает неточные или полностью ложные ответы. Гордин отметил, что это часто случалось, когда модель пыталась перевести текст длиннее 118 символов.

Например, один перевод, который они пропустили через нейросеть, звучал так: «Если день исчезновения луны достигнет своей нормальной длины: дни правителя будут длинными». Однако модель перевела это как «Если день достигает своей нормальной длины: царство длинных дней».

«Так что это очень близко, но не так точно, как переводчик-человек», — сказал Гордин.

Гордин сказал, что этот пример подчеркивает важность того, чтобы человек всегда был в курсе, когда речь заходит об этом инструменте и других подобных ему ИИ. С распространением LLM эти системы следует рассматривать как инструменты, помогающие реальным людям в их работе, а не полностью их заменяющие. Какой бы полезной ни была аккадская нейронная сеть, когда дело доходит до работы, которую делают Гордин и его коллеги-ассириологи, она все же не может полностью заменить интуицию и надзор человека-ученого.

«Все еще присутствует человеческий фактор», — сказал Монро. «С точки зрения перевода аккадского мира это очень эффективно. Это убирает один или два шага из процесса, но люди все еще должны держать глиняные таблички и изучать их».

Read more:  Примечания к выпуску программы предварительной оценки Xbox — альфа-версия (2311.231030-2200)

Вы можете этого не осознавать, но вы многим обязаны жителям Месопотамии. Все, от нашей системы счисления до наших знаний в астрономии и нашей системы верховенства права, можно проследить до этой очень древней цивилизации и их системы письма. Вот почему ассириологи, такие как Гордин и Монро, работают над переводом этих табличек, чтобы мы могли больше узнать о происхождении, которое привело к нашему нынешнему состоянию мира.

Но еще многое предстоит сделать даже с моделью ИИ, чтобы облегчить нагрузку. Однако, как мы видели всего за последние несколько месяцев после выпуска ChatGPT, технологии могут развиваться с невероятной скоростью, и это особенно касается искусственного интеллекта.

По словам Гордина, модель можно модернизировать и обучать клинописи разных периодов. Это позволит перевести еще больший корпус аккадского языка и получить еще больше информации об этих древних культурах. Более того, команда планирует разместить модель на Babylonian Engine, чтобы к ней могли получить доступ больше людей.

Мы хотим сделать его более доступным для людей, которые не обязательно являются историками или ассириологами.

Шай Гордин, Университет Ариэля

«Мы хотим сделать его более доступным для людей, которые не обязательно являются историками или ассириологами», — сказал Гордин. «Мы хотим, чтобы им было проще подобрать текст и получить перевод с помощью этой модели».

Эта демократизация исследования может помочь раскрыть еще больше информации об этих древних цивилизациях и о том, как жили их люди. Между тем обучение нейронных сетей на этих языках помогает совершенствовать и обучать их способами, которые они не обязательно смогли бы сделать, переводя «живые» языки. Таким образом, очень, очень старый и вымерший язык все еще способен научить нас новым вещам о жизни сегодня.

«Есть удивительные вещи, которые мы находим в клинописи», — сказала Монро. «Есть все эти вещи, которые действительно резонируют с нами сейчас и показывают общность, которую мы имеем с древними людьми, которые так далеки, не только язык, но и время».

2023-05-16 08:27:45


1684228104
#Этот #ИИбот #переводит #мертвые #древние #языки #на #английский

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.