SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

А вы знали? Вот как обтягивающая одежда может навредить вашему здоровью! А вы знали? Вот как обтягивающая одежда может навредить вашему здоровью!

Почему вам стоит убрать обтягивающую одежду из своего гардероба

ТехИнсайдер
4 простых лайфхака, как вывести плесень с одежды 4 простых лайфхака, как вывести плесень с одежды

Как убрать плесень на одежде — ловите целых четыре способа

ТехИнсайдер
Как United Airlines обслуживает клиентов с помощью ИИ и сколько она на этом выиграла, а не потеряла Как United Airlines обслуживает клиентов с помощью ИИ и сколько она на этом выиграла, а не потеряла

United Airlines использует ИИ, чтобы передавать клиентам важную информацию

Inc.
5 главных трикстеров из мира кино 5 главных трикстеров из мира кино

Самые яркие примеры архетипов трикстера из кино

Psychologies
Как мужчине удовлетворить женщину? Как мужчине удовлетворить женщину?

Как узнать, что женщина хочет в постели?

Maxim
Гроссмейстеры больших данных Гроссмейстеры больших данных

Как стать гроссмейстером по машинному обучению

ТехИнсайдер
Сколько можно пить за рулем в разных странах Сколько можно пить за рулем в разных странах

Где вообще нельзя, а где можно немного выпить за рулем?

Maxim
Ваш язык может стать ключом к раннему выявлению заболеваний Ваш язык может стать ключом к раннему выявлению заболеваний

Искусственный интеллект может определить ваше состояние по вашему языку

ТехИнсайдер
Сверху вниз Сверху вниз

Чтобы добраться до лучших точек с панорамными видами, порой приходится попотеть

2Xplore
Не подходи ко мне! Не подходи ко мне!

Если муж раздражает: почему так происходит и что с этим делать

Лиза
Россия по-итальянски Россия по-итальянски

Все подробности жизни и «невероятных приключений итальянца в России»

2Xplore
Согласование времен Согласование времен

Как в средневековой Европе измеряли и воспринимали время

Вокруг света
«Вселенная 25» — страшный эксперимент, который показал, что станет с человечеством, если создать «рай на Земле» «Вселенная 25» — страшный эксперимент, который показал, что станет с человечеством, если создать «рай на Земле»

Джон Кэлхун доказал: удовлетворение всех потребностей человека ведет к гибели

ТехИнсайдер
Терраформирование Марса уже не фантастика Терраформирование Марса уже не фантастика

Для терраформирования Марса необходимо увеличить его температуру на 10°C

ТехИнсайдер
Нежная бегония Нежная бегония

Хочешь, чтобы у тебя дома постоянно были живые прекрасные цветы?

Лиза
6 фаз отношений с нарциссом 6 фаз отношений с нарциссом

Какого сценария придерживаются в отношениях люди-нарциссы?

Psychologies
Будущее из розетки: чего ждать от электромобилей Будущее из розетки: чего ждать от электромобилей

В каком направлении развивается электротранспорт?

ТехИнсайдер
«Уже и китайские бренды заменяются отечественными» «Уже и китайские бренды заменяются отечественными»

О растущей локализации производств и госпрограммах поддержки промышленности

РБК
«Я встретила любовь, когда шла покупать швабру»: 14 историй о любви «Я встретила любовь, когда шла покупать швабру»: 14 историй о любви

Истории людей, которые романтично встретили по-настоящему близкого человека

Psychologies
Магия волос Магия волос

Традиции, ритуалы и суеверия, связанные с волосами

Лиза
Что такое фенхель, в чем его польза и вред: комментарий врача и рецепты Что такое фенхель, в чем его польза и вред: комментарий врача и рецепты

Фенхель — травянистое растение, но едят его как овощ

РБК
11 вещей, которые сделают жизнь ребенка с аутизмом проще 11 вещей, которые сделают жизнь ребенка с аутизмом проще

Как создать комфортную и поддерживающую среду для ребенка с РАС

Psychologies
Спортивный характер Спортивный характер

О, спорт, ты стиль: мода, идущая со стадионов

Men Today
8 фраз, которые вредно говорить детям 8 фраз, которые вредно говорить детям

Фразы, которые не оказывают воспитательного эффекта и портят отношения с детьми

Psychologies
Синхронное плавание Синхронное плавание

Владимир Кристовский и его жена Ольга о вдохновении для всех, кто его ищет

Psychologies
От помощника в обучении до будущей профессии От помощника в обучении до будущей профессии

Как меняются школы и вузы под влиянием искусственного интеллекта

РБК
Три митрополита Три митрополита

Роль церкви в период правления Ивана Калиты

Дилетант
Времена года повлияли на моральные ценности американцев Времена года повлияли на моральные ценности американцев

Одобрения сплачивающих моральных ценностей зависит от времени года

N+1
История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое

Кто и как изобрел первый компактный аналоговый информационный носитель

Правила жизни
«Болячки прикладывали прямо к экрану»: псевдоцелители и «натуропаты» в новейшей истории России «Болячки прикладывали прямо к экрану»: псевдоцелители и «натуропаты» в новейшей истории России

«Целители», которые обещали людям из СССР лекарство от всех болезней

Правила жизни
Открыть в приложении