Владимир Васильев – о влиянии больших языковых моделей на будущее человека

РБКHi-Tech

Владимир Васильев: «Гонка технологических «вооружений» уже началась»

Какое влияние на экономику и будущее человека окажет стремительное развитие больших языковых моделей и почему переход к общему искусственному интеллекту по степени влияния на мир сопоставим с изобретением ядерного оружия? Ответы на эти вопросы — в колонке эксперта Владимира Васильева

Автор: Владимир Васильев, исследователь данных, академический руководитель онлайн-магистратуры Skillfactory и ТГУ «Анализ естественного языка в лингвистике и IT»

NLP как средство общения машины и человека

Natural Language Processing, или обработка естественного языка, — это одна из трех основных областей знаний в науке о данных. Две другие области — классическое машинное обучение (Machine Learning) и компьютерное зрение (Computer Vision). Многие называют эти области искусственным интеллектом, хотя специалисты предпочитают термин Data Science.

С использованием NLP-технологий построены все виртуальные ассистенты, которых вы знаете: «Алиса», «Маруся», «Салют» и многие другие. А также все большие языковые модели вроде ChatGPT, Bard, LLaMa или GigaChat. NLP-алгоритмы обрабатывают текстовые данные, которые накопились в процессе использования человеческого языка. Все то, что мы произносим, пишем, печатаем и слышим, можно привести к текстовому формату и обработать с помощью NLP-алгоритмов.

Большие языковые модели: от кладезя знаний до генератора фейков

Современные GPT-подобные модели представляют собой класс больших языковых моделей (LLM, Large Language Models) на основе трансформерной архитектуры, которые еще называют генеративными нейросетями. Основным элементом трансформерной архитектуры является механизм внимания (Attention Mechanism), который позволяет модели фокусироваться на наиболее важных элементах последовательности текста при его обработке. У современных LLM большое число параметров. Например, GPT-3 (модель из семейства GPT) содержит 175 млрд параметров, а T5 (Text-to-Text Transfer Transformer) — более чем 11 млрд параметров.

Параметры модели — это множество весовых коэффициентов, которые изменяются и оптимизируются в процессе обучения модели. Итоговые значения этих параметров являются результатом обучения модели — они определяют, как модель обрабатывает и генерирует информацию. Считается, что языковая модель является большой, если содержит больше одного миллиарда параметров.

Современные большие языковые модели смогут «поговорить» с вами человеческим языком, помогут найти информацию из интернета или написать компьютерный код, а также сформулируют правдоподобный ответ. Неудивительно, что такие не виданные ранее способности современных LLM впечатлили за минувший год многих пользователей и подогрели интерес к ИИ во всем мире.

Однако LLM опираются в основном на знания, которые им «скормили» во время обучения, и используют базовые логические операции с доступной информацией, поэтому их ответ не всегда будет полным или полностью верным. Кроме того, модель может по-разному отвечать на один и тот же вопрос и даже галлюцинировать, то есть выдавать за факт попросту не соответствующую действительности информацию.

Например, ChatGPT в ответ на запрос о конкретном человеке может выдумать несуществующую биографию, приукрасив ее различными ложными фактами. Такое поведение больших языковых моделей повышает риски их использования в тех отраслях, где цена ошибки особенно высока.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Движение вокруг недвижимости Движение вокруг недвижимости

Как искусственный интеллект захватывает один из ключевых рынков

РБК
Елизавета Туктамышева: «С детства любила выигрывать и не показывала слез» Елизавета Туктамышева: «С детства любила выигрывать и не показывала слез»

Фигуристка Елизавета Туктамышева раскрывает секрет своей внутренней стойкости

VOICE
Ирина Калабихина: «Демографический взрыв уже у нас за спиной» Ирина Калабихина: «Демографический взрыв уже у нас за спиной»

Экономист Ирина Калабихина — что с нами будет дальше и хватит ли всем места?

РБК
Открытки на память Открытки на память

Новогодние ассоциации от команды Seasons

Seasons of life
Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT» Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT»

Рубен Ениколопов: сможет ли Россия в одиночку совершить технологический рывок

РБК
«Семья — место силы и благополучия» «Семья — место силы и благополучия»

С Анной Снаткиной и Виктором Васильевым у ОK! давние и очень добрые отношения

OK!
Сергей Шумский: «У роботов не будет инстинкта власти, как у человека» Сергей Шумский: «У роботов не будет инстинкта власти, как у человека»

Минувший год имеет шансы войти в историю как время взрывного роста нейросетей

РБК
Заткнуть за пояс Заткнуть за пояс

Все модели Jetour в одном путешествии

Автопилот
Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента» Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента»

Евгений Колбин рассказал о том, как развиваются облака в России

РБК
Ничего личного Ничего личного

Несколько правил, которые позволят сохранить часть личных сведений при себе

Цифровой океан
Миф глубокой заморозки Миф глубокой заморозки

Какова настоящая роль Северного морского пути в развитии Российской Арктики?

Монокль
Ветроэнергетика: освоение новых территорий Ветроэнергетика: освоение новых территорий

Что произошло с ветроэнергетикой за последнее десятилетие?

Наука и жизнь
Масса за горизонтом событий Масса за горизонтом событий

О том, как удалось обнаружить и «взвесить» одну из сверхмассивных чёрных дыр

Наука и жизнь
Дайте лыжню! Дайте лыжню!

История российского биатлона

Men Today
Бесполезные данные Бесполезные данные

Андрей Чугунов исследует человеческую душу с помощью Big Data

Цифровой океан
Современные «Отцы и дети»: психологический разбор героев нового российского сериала «Цикады» Современные «Отцы и дети»: психологический разбор героев нового российского сериала «Цикады»

На что могут повлиять детско-родительские отношения? Разбираем на «Цикадах»

Psychologies
Упразднение города Н. Упразднение города Н.

Красный командир Яков Тряпицын воплотил фантасмагорию великого сатирика в жизнь

Дилетант
От авторства до монополии От авторства до монополии

Как лучше защищать свои творческие и инновационные достижения

Наука и Техника
Информационная война Информационная война

В Древнем Риме борьба пропагандистов была не менее напряженной, чем сейчас

Дилетант
3 серьезных минуса блестящего маникюра с втиркой — самого модного нейл-дизайна последних лет 3 серьезных минуса блестящего маникюра с втиркой — самого модного нейл-дизайна последних лет

Что не так с блестящим маникюром с втиркой?

VOICE
Анализ экспорта вооружений КНР в страны Ближнего Востока Анализ экспорта вооружений КНР в страны Ближнего Востока

Продукция китайского оборонно-промышленного комплекса для ближневосточных стран

Обозрение армии и флота
Римские скрепы Римские скрепы

Через 12 лет после гибели Клеопатры Октавиан Август занялся семейными ценностями

Дилетант
Впереди — Москва: как устроена столичная система инноваций Впереди — Москва: как устроена столичная система инноваций

Москва начала создавать комплексную систему поддержки инновационного бизнеса

РБК
На ошибках учатся: что случилось с первым в мире реактивным самолетом «Комета» с квадратными окнами На ошибках учатся: что случилось с первым в мире реактивным самолетом «Комета» с квадратными окнами

Почему иллюминаторы самолетов имеют округлую форму

ТехИнсайдер
Будущее сейчас Будущее сейчас

Андрей Лихачёв рассказал о том, что делает СберСити уникальным для России и мира

Robb Report
Дела сердечные: 8 причин срочно записаться к кардиологу Дела сердечные: 8 причин срочно записаться к кардиологу

8 наиболее частых причин для обращения к врачу при проблемах с сердцем

ТехИнсайдер
Политический пейзаж Политический пейзаж

Павел Отдельнов: живопись в расширенном поле

Weekend
От Сервантеса до Эль Греко: каким был «золотой век» испанской культуры От Сервантеса до Эль Греко: каким был «золотой век» испанской культуры

Что такое «золотой век» испанской живописи

СНОБ
Милош Бикович: «Если ты сам себя не удивляешь, ты уже ни кого не удивишь» Милош Бикович: «Если ты сам себя не удивляешь, ты уже ни кого не удивишь»

Актер Милош Бикович — о ностальгии и «ярмарке тщеславия»

VOICE
Малая авиация большой страны: куда долетит ТВС-2МС Малая авиация большой страны: куда долетит ТВС-2МС

О возможностях и перспективах легких самолетов в России и за ее пределами

ФедералПресс
Открыть в приложении