SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

9 признаков того, что вы едите излишне много соли 9 признаков того, что вы едите излишне много соли

Что указывает на большое количество соли в организме, и как это исправить

ТехИнсайдер
От полосатой робы до красных галифе: изломы судьбы Мишки Япончика От полосатой робы до красных галифе: изломы судьбы Мишки Япончика

Как главарь одесских уголовников Мишка Япончик оказался в Красной армии?

Правила жизни
Как ИИ копирует голоса и помогает мошенникам вымогать деньги Как ИИ копирует голоса и помогает мошенникам вымогать деньги

Как мошенники используют уникальную способность нейросетей к копированию голоса

Inc.
Отдел замученных поэтесс: самые популярные новые женские музыкальные альбомы Отдел замученных поэтесс: самые популярные новые женские музыкальные альбомы

Женские музыкальные альбомы, которые объединили все новые тренды в поп-музыке

Forbes
«Он совершенно чокнутый»: как гипнотизер проклял «Манчестер Сити» и его тренера «Он совершенно чокнутый»: как гипнотизер проклял «Манчестер Сити» и его тренера

Почему футбольный клуб «Манчестер Сити» переживает самый глубокий кризис

Forbes
Социальный заказ на большую семью: как власти будут развивать демографию Социальный заказ на большую семью: как власти будут развивать демографию

Власти пытаются поднять рождаемость в стране, создав тренд на многодетность

ФедералПресс
Как поймать северное сияние и сфотографировать его: по этим 4 шагам даже школьник сделает классные снимки Как поймать северное сияние и сфотографировать его: по этим 4 шагам даже школьник сделает классные снимки

Как, наконец, увидеть это злосчастное сияние?!

ТехИнсайдер
Что такое адсорбер: из чего состоит и как проверить его работоспособность Что такое адсорбер: из чего состоит и как проверить его работоспособность

Зачем нужен современному автомобилю адсорбер и на что он влияет

РБК
Нужно ли рассказывать всю правду о себе партнеру: 3 истории Нужно ли рассказывать всю правду о себе партнеру: 3 истории

Три истории, которые доказывают: иногда не стоит раскрывать всю правду партнеру

Psychologies
Маленькие трагедии Маленькие трагедии

Что определяет детскую моду? В первую очередь то, кем взрослые видят детей

Grazia
Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей Грифонаж, страпонтен, глабелла, нёрдл: необычные названия привычных вещей

Грифонаж, страпонтен, петрикор: вы точно знаете эти вещи

ТехИнсайдер
10 способов натренировать «мускулы храбрости» 10 способов натренировать «мускулы храбрости»

Храбрость — не врожденное качество, а навык, который можно натренировать

Psychologies
«Идущая впереди»: как художница Кэролайн Уэлдон защищала права индейцев севера «Идущая впереди»: как художница Кэролайн Уэлдон защищала права индейцев севера

Как художница-эмигрантка стала секретарем вождя

Forbes
Наш человек! Наш человек!

11 звезд Голливуда с русскими корнями

Лиза
Глава холдинга АО «Росхим»: «Стране нужна сильная химическая промышленность» Глава холдинга АО «Росхим»: «Стране нужна сильная химическая промышленность»

Российская промышленность стремится освоить новые импортозамещающие механизмы

ФедералПресс
Чай по всем канонам Чай по всем канонам

Как приготовить правильный чай и что при этом важно не упустить из виду

КАНТРИ Русская азбука
Шерстяное овцеводство: быть или не быть Шерстяное овцеводство: быть или не быть

Что может способствовать возрождению сектора производства шерсти?

Агроинвестор
Подо льдами Подо льдами

Плавание подводных лодок подо льдами теперь стало обыденным явлением

Наука и техника
Сергей Безруков: «Как выдерживаю? Привычка, самодисциплина и терпение» Сергей Безруков: «Как выдерживаю? Привычка, самодисциплина и терпение»

Любознательность — то, что в себе нужно культивировать, развивать

Караван историй
Троян-шпион у пользователей Android: этичный хакер Песковский рассказал, как обезопасить смартфон от вирусов Троян-шпион у пользователей Android: этичный хакер Песковский рассказал, как обезопасить смартфон от вирусов

Как защитить свой телефон от любых вирусов

ТехИнсайдер
Бубновая дама Бубновая дама

Отрывок из книги об истории российского ретейла и концепт-сторе КМ20

Правила жизни
Хочу так же! Хочу так же!

6 фильмов с красивыми интерьерами

Лиза
Крах по расписанию: продажи московских новостроек рухнули в июле Крах по расписанию: продажи московских новостроек рухнули в июле

В июле количество заключенных ДДУ в Москве снизилось на 40%

Forbes
Посмотрите на «устрицу-монстра»! Эксперты: это не самая большая устрица, но она поражает Посмотрите на «устрицу-монстра»! Эксперты: это не самая большая устрица, но она поражает

Устрицы могут достигать колоссальных размеров

ТехИнсайдер
Времена года повлияли на моральные ценности американцев Времена года повлияли на моральные ценности американцев

Одобрения сплачивающих моральных ценностей зависит от времени года

N+1
Она — легенда: как Сьюзен Войджицки стала ролевой моделью для многих женщин в бизнесе Она — легенда: как Сьюзен Войджицки стала ролевой моделью для многих женщин в бизнесе

Почему Войджицки была не просто легендой в технологической индустрии

Forbes
Галопом по Востоку Галопом по Востоку

Помимо острова Беринга, в восточной части России есть масса удивительных мест

2Xplore
Самые интересные фэнтези-романы, основанные на мифах и легендах Самые интересные фэнтези-романы, основанные на мифах и легендах

Семь историй, вдохновением для которых послужили мифы и легенды разных народов

Maxim
Мир Шрёдингера Мир Шрёдингера

«Черный пес»: китайский неовестерн о сломе времен

Weekend
Остерегаться в лесу: ученый назвал самые опасные дикие растения России Остерегаться в лесу: ученый назвал самые опасные дикие растения России

Что нужно учитывать при заготовке травяных сборов

ТехИнсайдер
Открыть в приложении