Машинний переклад дозволить кожному почитати нотатки давністю 5000 років

У музеях зберігаються тисячі глиняних табличок, які розповідають нам про життя найдавніших цивілізацій тисячі років тому. Сьогодні прочитати їх можуть лише обрані науковці, але фахівці вирішили залучити машинний переклад, щоб, подібно до «гугл транслейту», дати доступ для цих нотаток усім бажаючим. Учені обіцяють доступність давніх матеріалів уже наступного року.

Клинопис виник понад 5 тисяч років тому в Межиріччі – землях між Тигром і Євфратом, на яких нині знаходиться Ірак. Цивілізація цього регіону заклала ґрунт для людства в його сьогоднішньому вигляді, подарувавши багато цікавих винаходів та наукових досягнень.

Це – літописи підйому і падіння перших імперій світу: Аккадської, Ассирійської і Вавилонської. «Більшість людей не усвідомлюють, як Месопотамія вплинула на нашу власну культуру», – зазначає ассиріолог з Університету Торонто Емілі Паже-Перрон. Цивілізація Межиріччя дала нам колесо, астрономію, 60-хвилинну годину, мапи, історію про потоп і ковчег, а також першу літературну пам’ятку – «Епос про Гільгамеша».

Археологи вже розкопали близько півмільйона клинописних табличок, і ще більше все ще поховані в землі. Глиняні клинописні таблички дозволяють зазирнути в історії кривавих міжусобних воєн між царським династіями, а також містять поради, як заспокоїти вередливу дитину.

Хоча клинопис розшифрували приблизно 150 років тому, дізнатися таємниці, приховані в цих стародавніх текстах, може лише невелика група вчених. Сам клинопис дозволила розшифрувати випадкова вдача – напис на колоні царського палацу в Персеполі було зроблено трьома мовами. У такий же спосіб Розетський камінь допоміг дослідникам розібратися в єгипетських ієрогліфах.

Близько 90% клинописних текстів залишаються неперекладеними. Ситуацію може змінити машинний переклад, який дозволить автоматизувати процес. Проект координує Паже-Перрон, яка займається машинною обробкою 69 тисяч адміністративних записів Месопотамії, датованих XXI століттям до нашої ери.

На прикладі 4 тисяч адміністративних текстів з оцифрованої бази даних Паже-Перрон та її команда навчають машинного перекладача розпізнавати клинопис. Тексти на цих табличках – це переважно торговельні угоди про постачання овець, очерету чи пива до храму чи окремому замовнику.

Адміністративні записи вибрали через те, що вони мають прості формулювання, приміром, «11 кіз для кухні 15 дня». Для автоматичного перекладу це велика перевага. Тексти на глиняних табличках уже транслітеровано латиницею вченими. Щойно алгоритм навчиться перекладати ці зразки на англійську мову, він автоматично перекладе решту транслітерованих табличок.

«Тексти, над якими ми працюємо, не дуже цікаві окремо, але становлять значний науковий інтерес разом», – каже Паже-Перрон. Дослідниця сподівається, що вже наступного року їхня англійська версія стане доступною в інтернеті.

Доступні в інтернеті переклади дадуть змогу дослідникам з інших галузей вивчати різноманітні аспекти життя в античному світі. «Ці люди так відрізняються від нас і жили так давно, але водночас вони мають такі самі проблеми, – пояснює Паже-Перрон. – Розуміння Месопотамії – це спосіб зрозуміти, що означає бути людиною».

Шумерська мова також була дуже особливою, якщо порівнювати з тими, які існують сьогодні, і багато її аспектів не розкрито. «Шумерська може бути останньою у великій групі мов, які існували тисячі і тисячі років тому, – каже Ірвінг Фінкел, куратор експозиції Британського музею, яка містить 130 тисяч клинописних табличок. – Писемність виникла дуже вчасно, щоб зберегти для нас шумерську. Нам пощастило, що з’явився своєрідний «мікрофон», який записав цю мову, адже вона могла канути в небуття, як і багато інших».

За матеріалами: BBC

The post Машинний переклад дозволить кожному почитати нотатки давністю 5000 років appeared first on TechToday.

Джерело та деталі: Машинний переклад дозволить кожному почитати нотатки давністю 5000 років

TechToday – це інтернет-видання про високі технології, їх розвиток та вплив на нас.

Updated: 24.12.2018 — 02:30
2012 - 2018 © Іменка - RSS новини з сайтів України | Підтримка: Діал інформаційна система | Двигунець: Wordpress | Тема: Frontier