Ошибочные машинные переводы забивают интернет словесным мусором
Исследователи из лаборатории искусственного интеллекта Amazon Web Services и Калифорнийского университета в Санта-Барбаре собрали в интернете более 6 миллиардов предложений. Ученые показали, что более половины из случайно выбранных предложений являются переводами с одного языка на другой, и эти переводы часто содержат грубые ошибки. Сильнее всего от неточностей страдают языки, мало представленные в интернете.
В конце прошлого века Билл Гейтс увидел перспективу взаимопонимания граждан почти 200 стран, говорящих на более чем 7000 языков: «Интернет становится главной площадью нашей глобальной деревни». Но оказалось, что на этой площади слышно не всех.
Интернет, безусловно, сделал людей ближе и неизмеримо обогатил глобальные коммуникации, торговлю, исследования и развлечения. Но новая работа напоминает нам, что вместе с прогрессом приходят и проблемы.
Исследователи из лаборатории искусственного интеллекта Amazon Web Services и Калифорнийского университета в Санта-Барбаре собрали более 6 миллиардов предложений в сети. Ученые показали, что более половины из случайно выбранных предложений являются переводами с одного языка на другой, и эти переводы часто содержат грубые ошибки и неточности. Многие переводы являются многошаговыми (таких шагов ученые находили иногда до восьми-девяти). С каждым последующим переводом на новый язык, результаты становятся все хуже.