Машинный перевод Google Neural Machine Translation
Путь к изучению языка, часто может быть долгим и бесконечным. Существует так много мелких нюансов, что мы теряемся в море слов. Однако с онлайн-сервисами перевода все стало намного проще. Нейросеть Google Translate научилась переводить между парами языков, с которыми ее не учили работать. Для этого система изобрела собственный язык-посредник. За последние десять лет система автоматического перевода текстов Google Translate выросла с нескольких языков до 103, а сейчас она переводит 140 млрд слов ежедневно. Но вы даже не представляете, что совсем скоро перевод станет намного лучше. Как и почему? А вот давайте узнаем о новой нейросети Google - Google Neural Machine Translation.
Начало Google Translate: момент 2016 года – как всё устроено
Google Translate начал использовать нейросеть для перевода между восемью европейскими языками и китайским. Ее подход отличается от классического машинного перевода. Вместо того, чтобы разбивать предложение на слова и переводить их по-отдельности, нейросеть фокусируется на всей фразе. Сегодня система поднаторела в переводе настолько, что справляется с переводом между языковыми парами, которым ее не «учили».
Для этого она создала нечто вроде собственного кода, который, хоть и непонятен ни одному человеку и не пригоден ни для какой работы, кроме перевода, все-таки похож на язык. С его помощью система, запрограммированная на перевод с японского на английский и с корейского на английский и обратно, может переводить тексты с корейского на японский и наоборот, минуя промежуточный этап перевода на английский.
Специалисты Google поясняют, что система делает это, выискивая общие свойства у предложений, несущих один смысл, на разных языках. В этом смысле Google Translate действительно пользуется языком-посредником. В переводах, сделанных с помощью языка-посредника, до сих пор больше неточностей, чем в переводе через, например, английский, но разработчики утверждают, что это исправимо. «Уверен, в будущем мы сможем научить нейросеть переводить с сотни языков, не прибегая к промежуточному переводу между знакомыми системе парами