SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Отнюдь не проявление грусти: почему у кота слезятся глаза и когда стоит бить тревогу Отнюдь не проявление грусти: почему у кота слезятся глаза и когда стоит бить тревогу

Почему кошки иногда плачут?

ТехИнсайдер
Правила взаимности: при каких условиях деловые знакомства превращаются в бизнес-связи Правила взаимности: при каких условиях деловые знакомства превращаются в бизнес-связи

Как нетворкинг-туры помогают договариваться о выгодных контрактах и партнерствах

Forbes
Рано списывать: 5 главных преимуществ HDD перед SSD Рано списывать: 5 главных преимуществ HDD перед SSD

Почему в некоторых случаях лучше купить HDD, а не SSD?

CHIP
Почему взаимная любовь превращается во взаимные претензии Почему взаимная любовь превращается во взаимные претензии

Почему со временем мы начинаем ценить лишь практические выгоды в отношениях?

Psychologies
6 причин, по которым ты не испытываешь оргазм, и способы это исправить: советы нейробиолога 6 причин, по которым ты не испытываешь оргазм, и способы это исправить: советы нейробиолога

Аноргазмия: думаешь, с тобой что-то не так? Ничего подобного!

VOICE
Вопрос века Вопрос века

Как правильно ухаживать за кожей вокруг глаз, чтобы не было «вековых» проблем?

Лиза
Тандыр Тандыр

Тандыры и еду из них можно встретить на всем протяжении Великого шелкового пути

Bones
Трогательная история! Как стоматолога из Сирии воспитал отец с синдромом Дауна Трогательная история! Как стоматолога из Сирии воспитал отец с синдромом Дауна

Люди с синдромом Дауна не могут стать хорошими отцами? Джад Исса с этим поспорит

ТехИнсайдер
Сербская литиевая драма Сербская литиевая драма

Руководство Сербии дало добро на разработку крупного месторождения лития

Монокль
Крушение «Осоавиахима» Крушение «Осоавиахима»

В 1933 году граждане СССР праздновали триумф науки и техники — полёт стратостата

Дилетант
Топ самых опасных для здоровья поз за рулем Топ самых опасных для здоровья поз за рулем

Самые опасные положения водителя в длительном путешествии на автомобиле

Maxim
Это должен знать каждый: что делать, если подавился? Как оказать помощь себе и ребенку? Это должен знать каждый: что делать, если подавился? Как оказать помощь себе и ребенку?

Как помочь себе или близкому, если кто-то подавился

ТехИнсайдер
История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое

Кто и как изобрел первый компактный аналоговый информационный носитель

Правила жизни
Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей

Грифонаж, страпонтен, петрикор: вы точно знаете эти вещи

ТехИнсайдер
Злата и Мирослава Злата и Мирослава

Непо-бейби и топ-блогеры Мирослава и Злата Быковы стремительно делают карьеру

Собака.ru
Мнение эксперта: Фрейда «неправильно поняли»! Он не был одержим сексом, как принято считать Мнение эксперта: Фрейда «неправильно поняли»! Он не был одержим сексом, как принято считать

Зигмунд Фрейд не считал, что все фантазии во сне — это подавленная эротика

ТехИнсайдер
Магия волос Магия волос

Традиции, ритуалы и суеверия, связанные с волосами

Лиза
Математика в реальной жизни: как транспортные модели помогают избавляться от пробок и строить новые маршруты Математика в реальной жизни: как транспортные модели помогают избавляться от пробок и строить новые маршруты

О том, как создаются транспортные модели и как они работают

ТехИнсайдер
Люди перестали пить? Вот что такое «трезвые бары»: интересный факт! Люди перестали пить? Вот что такое «трезвые бары»: интересный факт!

Почему «трезвые бары» становятся всё популярнее? О чем говорит эта тенденция?

ТехИнсайдер
11 идей прелюдии, которые должна попробовать каждая женщина 11 идей прелюдии, которые должна попробовать каждая женщина

Собрали лучшие идеи для прелюдии — выбирай и тестируй!

VOICE
FIgure представила робота-гуманоида второго поколения FIgure представила робота-гуманоида второго поколения

У нового робота FIgure  кисти рук с шестнадцатью степенями свободы

N+1
Что такое джиу-джитсу: виды, приемы, советы мастера с черным поясом Что такое джиу-джитсу: виды, приемы, советы мастера с черным поясом

Джиу-джитсу: шахматы в мире единоборств

РБК
Химики использовали иодид самария как катализатор Химики использовали иодид самария как катализатор

Как химики научились применять иодид самария в каталитических количествах

N+1
Руководитель Форума креативного бизнеса Елена Маринина: Резко вырос спрос на специалистов в креативной сфере Руководитель Форума креативного бизнеса Елена Маринина: Резко вырос спрос на специалистов в креативной сфере

Почему игрокам креативных индустрий важно объединяться, а не конкурировать

СНОБ
Мысли вслух Мысли вслух

Антон Лапенко: из социальных сетей в большое кино

Men Today
Китай строит поезд-снаряд, летящий в вакууме со скоростью 1000 км/ч Китай строит поезд-снаряд, летящий в вакууме со скоростью 1000 км/ч

Поезд на магнитной подушке, который способен развить скорость 1000 км/ч

ТехИнсайдер
Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля Мороз, жара и низкая рентабельность: почему Россия потеряла часть урожая картофеля

В 2024 году в России соберут на 1,4 млн т, или на 16% меньше картофеля

Forbes
Морская граница на замке Морская граница на замке

Почему Береговая охрана Пограничной службы ФСБ должна стать резервом для флота

Обозрение армии и флота
Мария Орлова: «Чтение – это в первую очередь удовольствие» Мария Орлова: «Чтение – это в первую очередь удовольствие»

Как привить ребенку любовь к чтению – не обязательно расти на классике

Grazia
Старость – не данность Старость – не данность

Можно ли на самом деле хотя бы замедлить старение?

Вокруг света
Открыть в приложении