SSM-модель — что нового она привнесла для мира нейросетей?

ТехИнсайдерHi-Tech

Сможет ли ИИ написать «Войну и мир-2»

Архитектура, разработанная T-Bank AI Research, делает шаг к решению такой масштабной задачи, как эффективная обработка очень длинных контекстов. Добиться такого серьезного продвижения удалось с помощью построения гибридной модели ИИ.

Владимир Губайловский

93bdccc482553ce1d8211fdf9f59daad_ce_1280x854x0x258.jpg
Толстой-ИИ. Midjourney

Революции ИИ продолжается. Но, кажется, время восторгов и безудержного хайпа проходит. Стали видны проблемы. Одна из них — это энергоэффективность. На ИИ работают целые мощные электростанции, а потребности только растут. И не видно, чтобы они стали снижаться. Но есть и другой момент. Уже возникла необходимость ставить ИИ-модели максимально близко к пользователю — и на компьютеры, и на смартфоны. Мощности этих устройств никогда не приблизятся к дата-центрам. А значит надо наращивать эффективность работы самих моделей, и здесь нужны новые решения.

Пока публика рисует картинки и развлекается разговорами с чат-ботами происходит глубокая внутренняя перестройка ИИ-моделей. Революция ИИ во многом началась не в тот момент, когда Microsoft в 2019 году выделила миллиард на развитие OpenAI и ее линейку GPT и дала компании доступ к своим дата-центрам.

Революция началась раньше: когда в 2017 году группа ученых опубликовала статью «Внимание — это все что нужно» («Attention Is All You Need»). После этого и появилась возможность развития с позиции силы: ученые открыли дорогу, по которой можно двигаться, бизнес оценил перспективу и включился по полной. Но не все решается «грубой силой» — простым наращиванием вычислительной мощности. Идеи, которые придумывают люди, все-таки важнее.

В этой статье 2017 года исследователи описали архитектуру трансформера и заявили, что нужен только механизм «внимания», а другие подходы, — рекуррентные и сверточные сети — «не нужны». Трансформер победил. Но исследователи и создатели ИИ, конечно, не забыли ни о рекуррентных, ни о сверточных сетях. Эти архитектуры тоже развивались хотя не и так громко, как трансформер.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что такое «изометрические упражнения» и почему они полезны Что такое «изометрические упражнения» и почему они полезны

Что такое изометрические тренировки и как они отличаются от динамических

ТехИнсайдер
Милая агрессия и боязнь счастья: 5 необычных психологических явлений Милая агрессия и боязнь счастья: 5 необычных психологических явлений

Странные и забавные научные предположения о психологии человека

ТехИнсайдер
Осторожно, очень горячо! Что делать, если телефон перегрелся Осторожно, очень горячо! Что делать, если телефон перегрелся

Как реанимировать смартфон после перегрева?

ТехИнсайдер
Остерегаться в лесу: ученый назвал самые опасные дикие растения России Остерегаться в лесу: ученый назвал самые опасные дикие растения России

Что нужно учитывать при заготовке травяных сборов

ТехИнсайдер
45 способов изменить жизнь. Выберите для себя хотя бы 10 45 способов изменить жизнь. Выберите для себя хотя бы 10

Список привычек, которые помогают жить более полной, яркой и счастливой жизнью

Psychologies
Можно ли мыть фрукты и овощи в посудомоечной машине Можно ли мыть фрукты и овощи в посудомоечной машине

Стоит ли следовать лайфхакам из интернета и мыть фрукты в посудомоечной машине?

ТехИнсайдер
Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило Перегрелись: зачем останавливать глобальное потепление, если оно уже наступило

О том, как бороться с изменением климата, когда оно уже наступило

Forbes
Гид в уверенное будущее Гид в уверенное будущее

Какие специалисты помогают выстроить образовательную и карьерную траектории

РБК
Тетёрки: насукали и жуём Тетёрки: насукали и жуём

Приготовление весенних тетерок — это всегда импровизация

КАНТРИ Русская азбука
Деликатесы со всего мира Деликатесы со всего мира

Необычные деликатесы, которые вы есть не стали бы

Зеркало Мира
Людмила Вебер: Нажимается кнопочка «выкл» — и ты оказываешься в полной темноте, в которой надо как-то учиться жить Людмила Вебер: Нажимается кнопочка «выкл» — и ты оказываешься в полной темноте, в которой надо как-то учиться жить

Художница Людмила Вебер — о том, что она пережила по ту сторону решетки

СНОБ
Сатурн выбросил комету за пределы Солнечной системы Сатурн выбросил комету за пределы Солнечной системы

Комета A117uUD встретилась с Сатурном и теперь улетает из Солнечной системы

ТехИнсайдер
Как измерить силу своих чувств: шкала Клода Штайнера Как измерить силу своих чувств: шкала Клода Штайнера

Можете ли вы описать, что вы чувствуете прямо сейчас?

Psychologies
Почему собаки и кошки дергаются во сне Почему собаки и кошки дергаются во сне

Разгадываем сонные тайны наших питомцев

Maxim
«Включение в систему» «Включение в систему»

Как немецкий народ приобщали к обязательной для всех нацистской идеологии

Дилетант
Лесото обладает самым высоким уровнем самоубийств в мире! Вот где расположена эта страна Лесото обладает самым высоким уровнем самоубийств в мире! Вот где расположена эта страна

В Лесото наблюдается один из самых высоких уровней самоубийств в мире

ТехИнсайдер
История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое История одной вещи: как кассета изменила шоу-бизнес и кинорынок, а затем ушла в прошлое

Кто и как изобрел первый компактный аналоговый информационный носитель

Правила жизни
Иногда «Оно» возвращается Иногда «Оно» возвращается

Возвращение хоррор-хита «Оно приходит за тобой», прославившего Майку Монро

Weekend
Лариса Долина отдала мошенникам миллионы — почему она и тысячи россиян доверяют им? Лариса Долина отдала мошенникам миллионы — почему она и тысячи россиян доверяют им?

Почему десятки тысяч россиян готовы отдавать деньги и квартиры мошенникам?

Psychologies
Нейробиологи рассказали, как в мозге возникает память о страхе Нейробиологи рассказали, как в мозге возникает память о страхе

Память о страхе связана не только с работой нейротрансмиттеров в мозгу

ТехИнсайдер
Разумный рацион Разумный рацион

9 способов экономить на еде, продолжая питаться нормально

Лиза
«Наша служба и опасна, и трудна»: самые рискованные профессии в мире «Наша служба и опасна, и трудна»: самые рискованные профессии в мире

Самые опасных специальностях в мире, которые требуют силы духа и устойчивости

ТехИнсайдер
Крушение «Осоавиахима» Крушение «Осоавиахима»

В 1933 году граждане СССР праздновали триумф науки и техники — полёт стратостата

Дилетант
Факторы, определяющие вызовы и угрозы национальной безопасности России в Северо-Восточной Азии Факторы, определяющие вызовы и угрозы национальной безопасности России в Северо-Восточной Азии

Региональная нестабильность России может быть выгодна отдельным государствам

Обозрение армии и флота
Мозг людей, рожденных слепыми, обладает уникальной пластичностью Мозг людей, рожденных слепыми, обладает уникальной пластичностью

Нейронные паттерны визуальной коры у слепых уникальны и не меняются со временем

ТехИнсайдер
США запутались в ключах от Белого дома США запутались в ключах от Белого дома

Замена кандидата в президенты оживила предвыборную борьбу в США

Монокль
Жизнь без слез! Что делать, если постоянно хочется плакать: 10 советов психолога Жизнь без слез! Что делать, если постоянно хочется плакать: 10 советов психолога

Разбираемся в ситуации постоянных слез без причины вместе с психологом

Лиза
Это должен знать каждый: что делать, если подавился? Как оказать помощь себе и ребенку? Это должен знать каждый: что делать, если подавился? Как оказать помощь себе и ребенку?

Как помочь себе или близкому, если кто-то подавился

ТехИнсайдер
Что такое датчик Холла и как его проверить: инструкция Что такое датчик Холла и как его проверить: инструкция

Все о датчике Холла: насколько он важен в автомобиле и как его проверить

РБК
Имплантация зубов Имплантация зубов

Что важно сделать до, во время и после процедуры имплантации зубов

Лиза
Открыть в приложении