Владимир Васильев – о влиянии больших языковых моделей на будущее человека

РБКHi-Tech

Владимир Васильев: «Гонка технологических «вооружений» уже началась»

Какое влияние на экономику и будущее человека окажет стремительное развитие больших языковых моделей и почему переход к общему искусственному интеллекту по степени влияния на мир сопоставим с изобретением ядерного оружия? Ответы на эти вопросы — в колонке эксперта Владимира Васильева

Автор: Владимир Васильев, исследователь данных, академический руководитель онлайн-магистратуры Skillfactory и ТГУ «Анализ естественного языка в лингвистике и IT»

NLP как средство общения машины и человека

Natural Language Processing, или обработка естественного языка, — это одна из трех основных областей знаний в науке о данных. Две другие области — классическое машинное обучение (Machine Learning) и компьютерное зрение (Computer Vision). Многие называют эти области искусственным интеллектом, хотя специалисты предпочитают термин Data Science.

С использованием NLP-технологий построены все виртуальные ассистенты, которых вы знаете: «Алиса», «Маруся», «Салют» и многие другие. А также все большие языковые модели вроде ChatGPT, Bard, LLaMa или GigaChat. NLP-алгоритмы обрабатывают текстовые данные, которые накопились в процессе использования человеческого языка. Все то, что мы произносим, пишем, печатаем и слышим, можно привести к текстовому формату и обработать с помощью NLP-алгоритмов.

Большие языковые модели: от кладезя знаний до генератора фейков

Современные GPT-подобные модели представляют собой класс больших языковых моделей (LLM, Large Language Models) на основе трансформерной архитектуры, которые еще называют генеративными нейросетями. Основным элементом трансформерной архитектуры является механизм внимания (Attention Mechanism), который позволяет модели фокусироваться на наиболее важных элементах последовательности текста при его обработке. У современных LLM большое число параметров. Например, GPT-3 (модель из семейства GPT) содержит 175 млрд параметров, а T5 (Text-to-Text Transfer Transformer) — более чем 11 млрд параметров.

Параметры модели — это множество весовых коэффициентов, которые изменяются и оптимизируются в процессе обучения модели. Итоговые значения этих параметров являются результатом обучения модели — они определяют, как модель обрабатывает и генерирует информацию. Считается, что языковая модель является большой, если содержит больше одного миллиарда параметров.

Современные большие языковые модели смогут «поговорить» с вами человеческим языком, помогут найти информацию из интернета или написать компьютерный код, а также сформулируют правдоподобный ответ. Неудивительно, что такие не виданные ранее способности современных LLM впечатлили за минувший год многих пользователей и подогрели интерес к ИИ во всем мире.

Однако LLM опираются в основном на знания, которые им «скормили» во время обучения, и используют базовые логические операции с доступной информацией, поэтому их ответ не всегда будет полным или полностью верным. Кроме того, модель может по-разному отвечать на один и тот же вопрос и даже галлюцинировать, то есть выдавать за факт попросту не соответствующую действительности информацию.

Например, ChatGPT в ответ на запрос о конкретном человеке может выдумать несуществующую биографию, приукрасив ее различными ложными фактами. Такое поведение больших языковых моделей повышает риски их использования в тех отраслях, где цена ошибки особенно высока.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Колода джокеров и сорок сценариев будущего Колода джокеров и сорок сценариев будущего

Прогнозист Александр Чулок — о том, по какому пути может пойти развитие общества

РБК
Мужчина, это биохак! Мужчина, это биохак!

Как современные мужчины и женщины поддерживают молодость, красоту и здоровье

Men Today
Сергей Шумский: «У роботов не будет инстинкта власти, как у человека» Сергей Шумский: «У роботов не будет инстинкта власти, как у человека»

Минувший год имеет шансы войти в историю как время взрывного роста нейросетей

РБК
«Один на один с малышом»: как общественное осуждение разлучало соло-матерей с детьми «Один на один с малышом»: как общественное осуждение разлучало соло-матерей с детьми

Отрывок из «Книги украденных детей» Джуди Кристи и Лизы Уингейт

Forbes
Язык в поисках понятия о себе Язык в поисках понятия о себе

Можно спорить о начальной точке, когда любой язык стал пониматься как система

Знание – сила
Удивительные шишки Удивительные шишки

У каких деревьев бывают шишки? И какие они?

Наука и жизнь
Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT» Рубен Ениколопов: «В вопросах на миллиарды долларов нельзя консультироваться с ChatGPT»

Рубен Ениколопов: сможет ли Россия в одиночку совершить технологический рывок

РБК
Дела сердечные: 8 причин срочно записаться к кардиологу Дела сердечные: 8 причин срочно записаться к кардиологу

8 наиболее частых причин для обращения к врачу при проблемах с сердцем

ТехИнсайдер
Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента» Евгений Колбин: «Мы построили бизнес-процессы вокруг клиента»

Евгений Колбин рассказал о том, как развиваются облака в России

РБК
Шуба, золото, икра: почему тренд Slavic Girl захватил соцсети и как сделать его модным Шуба, золото, икра: почему тренд Slavic Girl захватил соцсети и как сделать его модным

Почему западные блогеры переодеваются в пушистые шубы и меховые шапки?

Правила жизни
Железо выходит на улицы, чтобы загнать людей в «качалки» Железо выходит на улицы, чтобы загнать людей в «качалки»

Как из любимого школьного предмета сделать два производства

Эксперт
Сквозные и критические: как изменилась стратегия развития технологий Сквозные и критические: как изменилась стратегия развития технологий

Сектор инноваций в России продолжает развиваться благодаря господдержке

РБК
«Сфера» развлечений «Сфера» развлечений

Летом 2023 года над Лас-Вегасом засветилась Луна и превратилась в огромный глаз

ТехИнсайдер
Дорогие коллеги Дорогие коллеги

Как подобрать подарок для коллег или подчиненных и не прогадать

Лиза
Тонкое искусство пофигизма Тонкое искусство пофигизма

Парадоксальный способ жить счастливо

kiozk originals
Насколько безопасны облачные хранилища: обсуждаем с экспертом Насколько безопасны облачные хранилища: обсуждаем с экспертом

Насколько защищена информация в облачных хранилищах?

CHIP
Лана Дель Рей, Blur, Дельфин: лучшие музыкальные альбомы 2023 года Лана Дель Рей, Blur, Дельфин: лучшие музыкальные альбомы 2023 года

2023 год стал важной вехой в истории современной музыки

Forbes
Человек, который по ночам сочиняет музыку Человек, который по ночам сочиняет музыку

Возможно ли больше 30 лет провести в шоу-бизнесе, не заигрывая с низким вкусом?

СНОБ
«Лучше всего за людей говорит то, что они делают» «Лучше всего за людей говорит то, что они делают»

Тихон Жизневский славы не ищет, а к своей популярности относится с иронией

OK!
Анализ экспорта вооружений КНР в страны Ближнего Востока Анализ экспорта вооружений КНР в страны Ближнего Востока

Продукция китайского оборонно-промышленного комплекса для ближневосточных стран

Обозрение армии и флота
Еще раз о числе π и о неразрешимой проблеме «квадратуры круга» Еще раз о числе π и о неразрешимой проблеме «квадратуры круга»

Два феномена – число π и египетские пирамиды – связаны невидимыми нитями

Зеркало Мира
Завал на работе Завал на работе

Как все успевать и грамотно снизить нагрузку на работе

Лиза
Хибины. Таинственное чудо Севера Хибины. Таинственное чудо Севера

Красоты и тайны Хибин, расположенных на Кольском полуострове

Зеркало Мира
«Берлога» для геолога «Берлога» для геолога

Колоритное пространство для увлечённого и компанейского парня

Идеи Вашего Дома
Антидворянец: «Вилла Родэ» Антидворянец: «Вилла Родэ»

Предлагаем вниманию читателя самые свежие слухи и сплетни столетней давности

Правила жизни
Интервью с балериной Мариинского театра Ренатой Шакировой о премьере спектакля «Анюта» Интервью с балериной Мариинского театра Ренатой Шакировой о премьере спектакля «Анюта»

Интервью с балериной Ренатой Шакировой о том, как проходили репетиции балета

СНОБ
Повзрослел или разлюбил: почему муж вас больше не ревнует Повзрослел или разлюбил: почему муж вас больше не ревнует

Стоит ли беспокоиться, если ревности в отношениях нет вообще?

Psychologies
Парк развлечений Парк развлечений

Александр Борода том, как устроен один из лучших частных музеев столицы

Robb Report
Пить русское вино: выносимая легкость и яркость вкуса Пить русское вино: выносимая легкость и яркость вкуса

Российское виноделие идет в рост, но до появления развитой индустрии пока далеко

Монокль
Очень важные персональные данные Очень важные персональные данные

На что повлияет ужесточение наказания за незаконный сбор личных данных граждан

Монокль
Открыть в приложении