SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Абсолютный рекорд: в России существует железная дорога с шириной колеи 9 метров. Но зачем она нужна? Абсолютный рекорд: в России существует железная дорога с шириной колеи 9 метров. Но зачем она нужна?

Почему железные дороги в странах мира отличаются по ширине и какая самая широкая

ТехИнсайдер
Список продуктов с низким гликемическим индексом: что это и зачем нужен Список продуктов с низким гликемическим индексом: что это и зачем нужен

Какие продукты имеют низкий ГИ и как правильно вводить их в рацион

РБК
Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников Как Мэй Хабиб заработала $285 млн на ИИ-агентах, способных заменить 90% работников

Как Мэй Хабиб создает ПО на базе ИИ, которое берет на себя рутинные задачи

Forbes
Просто добавь воды Просто добавь воды

Как восполнить недостаток влаги в коже

Лиза
Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог Почему женщины выбирают мужчин с криминальным прошлым: объясняет психолог

По каким причинам девушки выбирают парней с криминальным прошлым?

VOICE
«Я больше не боюсь»: как Симона Байлз боролась, побеждала и снимала президентов «Я больше не боюсь»: как Симона Байлз боролась, побеждала и снимала президентов

История спортсменки, которая прошла через нищету, насилие и проблемы с психикой

Forbes
Ночное освещение сделало листья городских деревьев слишком прочными для поедания насекомыми Ночное освещение сделало листья городских деревьев слишком прочными для поедания насекомыми

Искусственное освещение делает листья городских деревьев прочнее

N+1
«Швабе» о человеческом капитале: «От нашей работы с людьми зависит успех компании» «Швабе» о человеческом капитале: «От нашей работы с людьми зависит успех компании»

О том, как с непростой ситуацией кадрового голода справляется холдинг «Швабе»

ФедералПресс
Как договариваться всегда со всеми и обо всем: интервью с конфликтологом Как договариваться всегда со всеми и обо всем: интервью с конфликтологом

Как наладить семейные отношения и стать профессионалом в сфере конфликтологии?

РБК
Дело сдвинулось: новый общественный электротранспорт Калининграда Дело сдвинулось: новый общественный электротранспорт Калининграда

Любопытно, какие именно троллейбусы приедут в Калининград?

ФедералПресс
«Граф Аверин»: как детективная история про альтернативную Россию и демонического кота влюбила в себя читателей «Граф Аверин»: как детективная история про альтернативную Россию и демонического кота влюбила в себя читателей

«Граф Аверин»: в чем феномен серии книг, как на её популярность повлиял кот?

Psychologies
Трон во крови: истории таинственных исчезновений наследников престола Трон во крови: истории таинственных исчезновений наследников престола

Борьба за власть — вечный сюжет из школьных учебников истории

ТехИнсайдер
Эрика: суровая крaсoта вереска Эрика: суровая крaсoта вереска

Белый, розовый, а может, фиолетовый? Эрика позволяет не мучиться с выбором

КАНТРИ Русская азбука
Ресторан на магазинной полке: как устроено производство готовой еды Ресторан на магазинной полке: как устроено производство готовой еды

Ресторан на магазинной полке: как производится готовая еда для «Перекрестка»

СНОБ
Три митрополита Три митрополита

Роль церкви в период правления Ивана Калиты

Дилетант
Как США создали «город грехов» и мировую столицу азартных игр? Интересные факты о Лас-Вегасе! Как США создали «город грехов» и мировую столицу азартных игр? Интересные факты о Лас-Вегасе!

Как менее чем за сто лет Лас-Вегас превратился в «мировую столицу развлечений»?

ТехИнсайдер
Как Николо Макиавелли рассуждал о природе власти Как Николо Макиавелли рассуждал о природе власти

Отрывок из книги «Никколо Макиавелли. Стяжать власть, не стяжать славу»

СНОБ
Новая реальность морских сражений Новая реальность морских сражений

Назначение БЭКов и особенности боевого применения

Обозрение армии и флота
Маленькие трагедии Маленькие трагедии

Что определяет детскую моду? В первую очередь то, кем взрослые видят детей

Grazia
Муж приковал ее на 40 дней к дереву! Как американка пережила домашнее насилие Муж приковал ее на 40 дней к дереву! Как американка пережила домашнее насилие

История женщины, которую бывший муж оставил в джунглях умирать

ТехИнсайдер
5 типов алкоголиков: к какому можно отнести вас? 5 типов алкоголиков: к какому можно отнести вас?

Наркологи распределили выпивающих людей на несколько групп

Psychologies
Баклуши бить Баклуши бить

Кто из нас не мечтал хоть разок побить баклуши?

КАНТРИ Русская азбука
Двигатель Renault К4М: описание и характеристики Двигатель Renault К4М: описание и характеристики

Все о двигателе K4M: надежность, особенности, характеристики

РБК
Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля

В 2024 году в России соберут на 1,4 млн т, или на 16% меньше картофеля

Forbes
Медиатор: кто это и чем занимается Медиатор: кто это и чем занимается

В каких ситуациях медиатор незаменим и чем он отличается от психолога?

Psychologies
Денег нет, но я держусь: как психологически справиться с финансовым кризисом Денег нет, но я держусь: как психологически справиться с финансовым кризисом

Как помочь себе справиться с денежным кризисом?

VOICE
Письмена доколумбовой Америки Письмена доколумбовой Америки

Системы письма у майя, ацтеков, мештеков и инков

Знание – сила
Вредные советы: 5 способов навсегда остаться матерью-одиночкой Вредные советы: 5 способов навсегда остаться матерью-одиночкой

Какие ошибки совершают одинокие матери, пытаясь наладить личную жизнь?

Psychologies
Сверху вниз Сверху вниз

Чтобы добраться до лучших точек с панорамными видами, порой приходится попотеть

2Xplore
Древесину липы случайно превратили в суперчерный материал Древесину липы случайно превратили в суперчерный материал

Материаловеды случайно превратили древесину липы в суперчерный материал

N+1
Открыть в приложении