Милые голосовые помощники и слежка за гражданами: чем занимается китайский разработчик iFlytek с капитализацией $10 млрд
Компания, начинавшая с автоматизации колл-центра Huawei, теперь обслуживает 700 млн клиентов и больше половины прибыли получает от правительственных контрактов. Пересказ материала Wired.
Предыстория
Джулиан Чен родился в 1937 году в Китае. В школе мальчик глубоко заинтересовался языками. Дома с семьей он разговаривал на шанхайском наречии, но изучал мандаринский китайский, английский, русский, следом занялся французским, немецким и японским.
В 1949-м к власти пришёл Мао Цзэдун, изучать иностранные языки стало опасно. В конце 1950-х интеллектуальную элиту Китая подвергали гонениям, ссылали в трудовые лагеря и даже казнили. Чена, который в то время был студентом, отправили работать на Пекинский стекольный завод.
После смерти Мао руководители партии поняли, что без умных людей невозможно развивать экономику, и Чену позволили продолжить обучение. В 1979 году, в возрасте 42 лет, он получил степень магистра и стал одним из немногих, кому разрешили выехать за границу.
Чен улетел в США и получил PhD по физике в Колумбийском университете. После он устроился на работу в IBM в отдел научных исследований. Компания разработала одну из первых программ для распознавания речи, чтобы специалисты могли диктовать текст, а не печатать его. В 1994 году её решили адаптировать под китайский язык, Чен предложил свои услуги. Ещё работая на заводе, он составил брошюру по этнографии пекинского наречия.
Чен сразу же осознал, насколько значимой программа будет для его родного языка в эпоху цифрового общения. Вместить 50 тысяч символов на клавиатуру невозможно, и в 1980-х программисты выкручивались с помощью пиньиня — романизированного китайского.
Чтобы написать слово «кот» (mao), пользователь писал буквы «m», «a» и «o» и затем выбирал иероглиф из выпадающего меню, в котором, помимо нужного ему 猫, были «торговля», «шляпа» и фамилия Мао.
Чтобы построить систему речевого ввода, Чен разбил мандаринский китайский на фонемы. Затем он попросил 54 китайцев, живущих в Нью-Йорке, прочитать несколько статей из газеты “People’s Daily” и записал их речь.
Исследовательская лаборатория в Пекине предоставила записи ещё 300 человек. В 1996 году Чен прилетел в Китай, чтобы презентовать программу ViaVoice на конференции по речевой технологии. Программу приняли с восторгом.
IBM рассказывает о ViaVoice в 1998 году. Ролик с таймкодом на Джулиане Чене
Вскоре производители ПК, даже конкуренты IBM, предустанавливали ViaVoice на устройства. У программы были свои минусы, но среди офисных сотрудников она приобрела невероятную популярность: вводить текст на китайском стало гораздо проще.