Кажется, что у ИИ с лингвистикой не должно возникнуть проблем. Но так ли это?

Популярная механикаHi-Tech

Распознать любой ценой: как искусственный интеллект научился понимать арабский язык

Автор: Владимир Арлазаров, к.т.н., генеральный директор Smart Engines

Каждому из нас хотелось бы говорить на любом языке мира, не прилагая к этому никаких усилий. При этом мы примерно понимаем, что овладеть английским чуть легче, чем китайским, а испанским - легче, чем арабским. Кажется, что у искусственного интеллекта с лингвистикой вообще не должно возникнуть никаких проблем. Но так ли это на самом деле, расскажет Владимир Арлазаров, к.т.н., генеральный директор компании Smart Engines.

Самое интересное, что шкала сложности изучения языков действительного существует. Например, американский Институт зарубежной службы при Госдепе делит все языки на 4 категории в зависимости от того, сколько часов нужно носителям английского языка на их изучение до уровня свободного владения. Самые сложные языки — это арабский, китайский, корейский и японский, и на их изучение придется потратить не менее 2200 часов. Тогда как на испанский, к примеру, не более 600 часов.

В этой статье мы расскажем, допустимо ли считать арабский язык сложным для человека и искусственного интеллекта (спойлер — да), и почему распознавание арабской вязи — это отдельная ачивка для ИИ.

82100b993fd7d4121834fe92ff32874b.jpg

Что делает арабский таким сложным для человека?

Чтобы ответить на этот вопрос, достаточно вспомнить знаменитый анекдот:

— Ты француз?

— Да.

— О, а скажи что-нибудь на арабском?

Особенность номер один — это отсутствие единого арабского. Арабский язык является основным языком сразу во многих странах мира, что неизбежно ведет к возникновению различных местных диалектов, отличающихся друг от друга так же сильно, как русский от польского, и ни у одного из этих диалектов нет письменного варианта.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Продукты, снижающие и повышающие холестерин: правильное питание для сердца и сосудов Продукты, снижающие и повышающие холестерин: правильное питание для сердца и сосудов

Что именно нужно есть, а от чего лучше отказаться для здоровья сердца и сосудов

Популярная механика
Дэвид Гордон Грин —  о фильме «Хэллоуин убивает» и трэшовом насилии Майка Майерса Дэвид Гордон Грин —  о фильме «Хэллоуин убивает» и трэшовом насилии Майка Майерса

Дэвид Гордон Грин — кто сыграл бы маньяка Майкла Майерса без маски?

GQ
CERN разрабатывает роботов-собак для работы в подземных лабиринтах Большого адронного коллайдера CERN разрабатывает роботов-собак для работы в подземных лабиринтах Большого адронного коллайдера

Новый робот-собака очень нужен: он может пройти там, где другие роботы не могут

ТехИнсайдер
«День, когда я влюбилась в себя» «День, когда я влюбилась в себя»

Иногда самые близкие люди заставляют нас сомневаться в себе

Psychologies
Как защитить детей от сексуализированного насилия: инструкция для родителей Как защитить детей от сексуализированного насилия: инструкция для родителей

Почему важно говорить о сексуализированном насилии над детьми?

Psychologies
С ними каши на сваришь:  худшие сериальные мужья и бойфренды С ними каши на сваришь:  худшие сериальные мужья и бойфренды

У этих героев на лбу должно быть написано: «Никогда с ним не связывайся!»

VOICE
Диета одного часа Диета одного часа

Диета одного часа (она же «Золотой час») стремительно набирает популярность

Cosmopolitan
Фильмы и сериалы, которые — случайно или нарочно — учат зрителей плохому Фильмы и сериалы, которые — случайно или нарочно — учат зрителей плохому

Иногда киноделы могут случайно научить опасным вещам

Maxim
61 год громкой истории про то, как Хрущев стучал ботинком по столу в ООН 61 год громкой истории про то, как Хрущев стучал ботинком по столу в ООН

История о Хрущеве с ботнком

Maxim
Вторичный рынок Jeep Renegade. Итальянский внук американского дедушки Вторичный рынок Jeep Renegade. Итальянский внук американского дедушки

Jeep Renegade — отличное сочетание озорной внешности и отличной динамики

4x4 Club
Вместо школы: несколько эффективных способов заняться собственным образованием Вместо школы: несколько эффективных способов заняться собственным образованием

Чтобы самообразование было продуктивным, к нему следует относиться как к проекту

Inc.
Дирижабли, визы и рулетка: как и зачем путешествовали в первой половине XX века Дирижабли, визы и рулетка: как и зачем путешествовали в первой половине XX века

Как, куда и ради чего ехали путешественники в первой трети XX века

Популярная механика
Актеры, которые напортачили в первый день съемок Актеры, которые напортачили в первый день съемок

И даже среди звезд кинематографа найдутся те, кто испортят все в первый день!

Maxim
Черный углерод в ледяных кернах указал на время прибытия маори в Новую Зеландию Черный углерод в ледяных кернах указал на время прибытия маори в Новую Зеландию

Около 1297 года произошел резкий рост выбросов черного углерода

N+1
Рыжие — бесстыжие: как цвет кота влияет на его характер? Рыжие — бесстыжие: как цвет кота влияет на его характер?

Правда ли, что рыжие коты самые наглые, белые — ленивые, а черные — злые?

Maxim
«Я предала мужа и подругу — и за это наказана»: расплата за измену «Я предала мужа и подругу — и за это наказана»: расплата за измену

Как неверность и ложь «аукнулись» нашей героине

Psychologies
В отличной норме В отличной норме

Нормальной жизни достоин каждый вне зависимости от диагноза

Harper's Bazaar
Модернизация легенды Модернизация легенды

ВССМ «Винторез» и АСМ «Вал»

Популярная механика
Машины растут Машины растут

Машиностроительные компании нацеливаются на экспорт

Эксперт
«Мы же не можем круглыми сутками размышлять о мире во всём мире​»: как рок-звезда Боно из U2 стал венчурным инвестором «Мы же не можем круглыми сутками размышлять о мире во всём мире​»: как рок-звезда Боно из U2 стал венчурным инвестором

Боно из U2 пока что не накопил миллиард, но стремится к этому

VC.RU
Автор подкаста Автор подкаста

Мари Новосад только что вернулась с SNCTM в Нью-Йорке и рапортует нам

Playboy
Углеродные нанотрубки помогут создать плазмонный интерферометр на чипе Углеродные нанотрубки помогут создать плазмонный интерферометр на чипе

Плазменные волны (плазмоны) — это коллективные возбуждения электронов

Популярная механика
Герои всегда идут в обход Герои всегда идут в обход

Истории из жизни «Большой Перемены»: как ребятам помогают педагоги и кураторы?

ПУСК
В Баварии нашли останки раннесредневековой модницы и мужчины-воина В Баварии нашли останки раннесредневековой модницы и мужчины-воина

Немецкие археологи раскопали раннесредневековый некрополь

N+1
Клин клином вышибают: когда белковая и углеводная диеты могут работать одинаково Клин клином вышибают: когда белковая и углеводная диеты могут работать одинаково

Решение сесть на диету не означает, что ты отныне обречена терпеть муки голода

Cosmopolitan
Зеленый маршрут: как начать свой путь в эковолонтерстве и увидеть мир Зеленый маршрут: как начать свой путь в эковолонтерстве и увидеть мир

Как присоединиться к эковолонтерскому проекту?

Популярная механика
25 отличных хорроров, которые можно посмотреть на Netflix прямо сейчас 25 отличных хорроров, которые можно посмотреть на Netflix прямо сейчас

Хорроры: от признанной классики до глупых фильмов категории B

Правила жизни
«В лесу много подводных камней» «В лесу много подводных камней»

Можно ли добиться углеродной нейтральности отказом от угля и высадкой деревьев?

РБК
Почему зубная эмаль светло-желтая, а не идеально белая Почему зубная эмаль светло-желтая, а не идеально белая

Идеально белых от природы зубов практически не существует

Популярная механика
Эрве Ле Теллье: Аномалия. Лауреат Гонкуровской премии 2020 года Эрве Ле Теллье: Аномалия. Лауреат Гонкуровской премии 2020 года

Отрывок из книги Эрве Ле Теллье. За этот роман он получил Гонкуровскую премию

СНОБ
Открыть в приложении