Кажется, что у ИИ с лингвистикой не должно возникнуть проблем. Но так ли это?

Популярная механикаHi-Tech

Распознать любой ценой: как искусственный интеллект научился понимать арабский язык

Автор: Владимир Арлазаров, к.т.н., генеральный директор Smart Engines

Каждому из нас хотелось бы говорить на любом языке мира, не прилагая к этому никаких усилий. При этом мы примерно понимаем, что овладеть английским чуть легче, чем китайским, а испанским - легче, чем арабским. Кажется, что у искусственного интеллекта с лингвистикой вообще не должно возникнуть никаких проблем. Но так ли это на самом деле, расскажет Владимир Арлазаров, к.т.н., генеральный директор компании Smart Engines.

Самое интересное, что шкала сложности изучения языков действительного существует. Например, американский Институт зарубежной службы при Госдепе делит все языки на 4 категории в зависимости от того, сколько часов нужно носителям английского языка на их изучение до уровня свободного владения. Самые сложные языки — это арабский, китайский, корейский и японский, и на их изучение придется потратить не менее 2200 часов. Тогда как на испанский, к примеру, не более 600 часов.

В этой статье мы расскажем, допустимо ли считать арабский язык сложным для человека и искусственного интеллекта (спойлер — да), и почему распознавание арабской вязи — это отдельная ачивка для ИИ.

82100b993fd7d4121834fe92ff32874b.jpg

Что делает арабский таким сложным для человека?

Чтобы ответить на этот вопрос, достаточно вспомнить знаменитый анекдот:

— Ты француз?

— Да.

— О, а скажи что-нибудь на арабском?

Особенность номер один — это отсутствие единого арабского. Арабский язык является основным языком сразу во многих странах мира, что неизбежно ведет к возникновению различных местных диалектов, отличающихся друг от друга так же сильно, как русский от польского, и ни у одного из этих диалектов нет письменного варианта.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Отправить 10000 сообщений и не сойти с ума: зачем компаниям нужен чат-бот Отправить 10000 сообщений и не сойти с ума: зачем компаниям нужен чат-бот

Сегодня социальные сети - основной инструмент коммуникации

Популярная механика
Карина Андоленко. В потоке Карина Андоленко. В потоке

Карина Андоленко не боится залезть в кроличью нору и узнать что-то новое

Коллекция. Караван историй
Горе от интеллекта: как хайп вокруг ИИ вредит IT-продуктам Горе от интеллекта: как хайп вокруг ИИ вредит IT-продуктам

В каких случаях ИИ навредит продукту, а в каких — поможет

Forbes
Наши тритоны Наши тритоны

Мини-пруд на садовом участке — интересный опыт общения с природой

Наука и жизнь
Стесняюсь спросить: как распознать болезнь Альцгеймера? Стесняюсь спросить: как распознать болезнь Альцгеймера?

Альцгеймер: как распознать на ранних этапах и встречается ли он у молодых?

Правила жизни
Рентгеновская спектроскопия никелатов подтвердила современную теорию сверхпроводимости Рентгеновская спектроскопия никелатов подтвердила современную теорию сверхпроводимости

Физики применили метод рентгеновской спектроскопии для исследования никелата

N+1
Представлен Range Rover нового поколения. Подробности и фото Представлен Range Rover нового поколения. Подробности и фото

Пять фактов о новом Range Rover

РБК
Назло суперфудам Назло суперфудам

Среди простых продуктов есть настоящие чемпионы по содержанию витаминов

Лиза
Насколько научны современные гороскопы и астрология Насколько научны современные гороскопы и астрология

Есть ли какая-нибудь наука в гороскопах и астрологии?

Популярная механика
Где кататься в России Где кататься в России

Мы провели инвентаризацию российских горнолыжных курортов

Men’s Health
Древние сибиряки оказались предками таримских мумий Древние сибиряки оказались предками таримских мумий

Палеогенетики разобрались в происхождении населения Синьцзяна бронзового века

N+1
Здесь звезда не падала: что не так с гипотезой о «содомском метеорите» Здесь звезда не падала: что не так с гипотезой о «содомском метеорите»

Почему научное сообщество усомнилось в гипотезе о «содомском метеорите»

N+1
Театр одного актера: Джейк Джилленхол устраивает драму в фильме «Виновный» Театр одного актера: Джейк Джилленхол устраивает драму в фильме «Виновный»

Почему «Виновный» — достойное кино о полицейском произволе

Forbes
Актерское мастерство Актерское мастерство

Гостевой дом в частном охотничьем хозяйстве недалеко от Москвы

AD
Незнакомцы в нашей постели: ЗППП с неожиданной стороны Незнакомцы в нашей постели: ЗППП с неожиданной стороны

Венерические заболевания — результат беспорядочной половой жизни. Или наоборот?

СНОБ
«Человек будет постепенно становиться небольшим киборгом» «Человек будет постепенно становиться небольшим киборгом»

Немногие понимают разницу между квантовым симулятором и квантовым компьютером

Наука
Опасная литература: что было написано в первой в мире запрещенной книге Опасная литература: что было написано в первой в мире запрещенной книге

Самой первой в мире запрещенной книгой стал труд колониста Томаса Мортона

Популярная механика
Три года в Долине строил мессенджер и закрыл его: что сделал не так Юрий Лифшиц и какие уроки вынес из провала Три года в Долине строил мессенджер и закрыл его: что сделал не так Юрий Лифшиц и какие уроки вынес из провала

Какие проблемы могут возникнуть при создании мессенджера — рассказал Юрий Лифшиц

VC.RU
Когда машины научатся слушать музыку Когда машины научатся слушать музыку

История о том, как симфонический оркестр уместился в ноутбуке

GQ
Майкл Холл – о возвращении Декстера, новом мире и сторонних проектах Майкл Холл – о возвращении Декстера, новом мире и сторонних проектах

Интервью с Майклом Холлом — о новом сезоне «Декстера» и своем персонаже

GQ
Рыцарь футуризма Рыцарь футуризма

Как Джанни Маттиоли очистил итальянский футуризм от политики

Weekend
Клеймо «плюс-сайз». Что не так с появлением Джилл Кортлев на обложке российского Vogue Клеймо «плюс-сайз». Что не так с появлением Джилл Кортлев на обложке российского Vogue

В таком контексте дискурс о бодипозитиве выглядит очередным глянцевым лицемерием

СНОБ
Ivan Is Back Ivan Is Back

Алексей Чадов — сценарист, режиссер и актер в фильме «Своя война»

OK!
Одна вокруг света: преграды на пути в Колумбию и жизнь на яхте Одна вокруг света: преграды на пути в Колумбию и жизнь на яхте

142-я серия о кругосветном путешествии москвички Ирины Сидоренко

Forbes
Невеста для покойника и посмертная вечеринка: самые странные похоронные обряды Невеста для покойника и посмертная вечеринка: самые странные похоронные обряды

В некоторых культурах ритуал прощания с человеком выглядит довольно пугающе

Cosmopolitan
Им под стать? Как выглядят жены и подруги красавчиков из турецких сериалов Им под стать? Как выглядят жены и подруги красавчиков из турецких сериалов

Ради кого известные турки закрыли для себя мир других женщин и соблазнов

VOICE
Раны планеты: метеоритные кратеры на Земле Раны планеты: метеоритные кратеры на Земле

Земля постоянно подвергается «космическому обстрелу» космическими снарядами

Популярная механика
Секс и саспенс в Белграде Секс и саспенс в Белграде

«Дунай» Любови Мульменко, поляроидный снимок докарантинной эпохи

Weekend
Как выбирать зимнюю резину и почему шипы — прошлый век и отстой Как выбирать зимнюю резину и почему шипы — прошлый век и отстой

Если ты намерен купить новые покрышки, помни о реальности и теории вероятностей

Maxim
Михаил Вишневский Михаил Вишневский

Михаил Вишневский: «Грибы могут примерно всё»

Собака.ru
Открыть в приложении