Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему рацион японцев считается таким полезным Почему рацион японцев считается таким полезным

Как японская традиционная диета влияет на продолжительность жизни?

ТехИнсайдер
И вечное лето И вечное лето

Как заготовить фрукты, ягоды и овощи на зиму, сохранив максимум витаминов?

Лиза
DDoSтать до потолка: как и почему за 2024 год изменились сетевые кибератаки DDoSтать до потолка: как и почему за 2024 год изменились сетевые кибератаки

Как изменился ландшафт DDoS и что этому способствовало

Forbes
«Я плакал от обиды»: бывший бойфренд Николь Кидман рассказал, как она сбежала от него к Тому Крузу «Я плакал от обиды»: бывший бойфренд Николь Кидман рассказал, как она сбежала от него к Тому Крузу

Отношения Маркуса Грэма с Николь Кидман разрушились из-за голливудского актера

VOICE
Дорамы, мелодрамы или классика? Что о тебе говорит кино, которое ты смотришь Дорамы, мелодрамы или классика? Что о тебе говорит кино, которое ты смотришь

Какие тайны личности выдаст твой любимый жанр кино?

VOICE
Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет Неандертальским следам с пляжа Маталасканьяс оказалось около 151 тысячи лет

Группа ученых повторно исследовала отпечатки ног древних людей

N+1
На пороге квантового превосходства На пороге квантового превосходства

Квантовые компьютеры: чем они отличаются об обычных и какие задачи выполняют?

Наука и жизнь
Как улучшить работу мозга в старости? Простое решение — волонтерство! Как улучшить работу мозга в старости? Простое решение — волонтерство!

Как волонтерство помогает поддерживать когнитивные способности на пенсии

ТехИнсайдер
Оценить перспективы и бизнес-план: как НКО могут развивать коммерческое направление Оценить перспективы и бизнес-план: как НКО могут развивать коммерческое направление

На что стоит обратить внимание, запуская коммерческое направление?

Forbes
Детское время Детское время

Когда игрушки были металлическими и деревянными

Автопилот
Исследование: мозг использует для сохранения памяти не только соединения нейронов, но и электрические поля Исследование: мозг использует для сохранения памяти не только соединения нейронов, но и электрические поля

Информация, сохраняемая в памяти, координируется электрическим полем

ТехИнсайдер
Не только секретность: из чего состоит измена — 3 основных компонента Не только секретность: из чего состоит измена — 3 основных компонента

Универсальные маркеры и компоненты, которые, как правило, включает в себя измена

Psychologies
«Я хотел показать, как общество может довести человека до безумия» «Я хотел показать, как общество может довести человека до безумия»

Стэнли Кубрик о том, как легко сойти с ума

Weekend
Ноги на экспорт: самые дорогие продажи в истории российского футбола Ноги на экспорт: самые дорогие продажи в истории российского футбола

Рейтинг самых дорогостоящих трансферов «на выход» из РПЛ

Forbes
Почему трюфели такие дорогие. Это же просто грибы! Почему трюфели такие дорогие. Это же просто грибы!

Почему именно трюфели стоят так много?

ТехИнсайдер
Как сооснователи банка «Точка» строят чат-бот для бизнеса в Великобритании Как сооснователи банка «Точка» строят чат-бот для бизнеса в Великобритании

Борис Дьяконов и Эдуард Пантелеев и их финтехстартап в Великобритании

Forbes
Как заморозить клубнику на зиму: продлеваем вкус лета на весь год Как заморозить клубнику на зиму: продлеваем вкус лета на весь год

Наслаждаться клубникой можно не только в начале лета, главное — заморозить

ТехИнсайдер
К китам и оленям: как в России растет спрос на приключенческий туризм К китам и оленям: как в России растет спрос на приключенческий туризм

Приключенческий туризм, который раньше был незаметен, выходит в массовый сегмент

Forbes
5 способов защититься от сглаза: советы ведьм и шамана 5 способов защититься от сглаза: советы ведьм и шамана

Добавь эти украшения в свою коллекцию — они помогают, даже если в них не веришь!

VOICE
90 процентов морепродуктов оказались под угрозой из-за человека 90 процентов морепродуктов оказались под угрозой из-за человека

Антропогенная деятельность загрязняет и нагревает природные воды

N+1
На юге Италии нашли похороненного ничком мужчину эпохи неолита На юге Италии нашли похороненного ничком мужчину эпохи неолита

Палеогенетики изучили останки мужчины, которого похоронили в эпоху неолита

N+1
Что такое глютен: мифы и правда Что такое глютен: мифы и правда

Что такое глютен и может ли он причинить вред?

РБК
«Мне жутко не понравился Эйлат, но потрясло Мертвое море»: Саша Савельева рассказала, почему с мужем переехала в Израиль «Мне жутко не понравился Эйлат, но потрясло Мертвое море»: Саша Савельева рассказала, почему с мужем переехала в Израиль

Певица Саша Савельева заявила, что Мертвое море стало для нее «местом силы»

VOICE
Отрывок из книги «Алексей Щусев: Архитектор № 1» писателя и историка Александра Васькина Отрывок из книги «Алексей Щусев: Архитектор № 1» писателя и историка Александра Васькина

Глава из книги Александра Васькина «Алексей Щусев: Архитектор № 1»

СНОБ
«У вас есть Birkin? Любая»: истории байера, разбогатевшего на сумках Hermès «У вас есть Birkin? Любая»: истории байера, разбогатевшего на сумках Hermès

Истории Майкла Тонелло, который заработал миллионы на перепродаже сумок Birkin

РБК
Это не лень: как обмануть свой мозг и победить прокрастинацию Это не лень: как обмануть свой мозг и победить прокрастинацию

Отрывок из книги Дэна Уиллингема «Учись как профи»

Forbes
Чтобы осознать власть кофе, надо от него на время отказаться Чтобы осознать власть кофе, надо от него на время отказаться

Как африканское дерево использовало нас для покорения мира

VC.RU
Палеонтологи описали древнего аллигатора из Таиланда Палеонтологи описали древнего аллигатора из Таиланда

Описан вид аллигаторов, который жил на территории Таиланда 230 тысяч лет назад

N+1
Вечная жизнь: нужно ли людям бессмертие — размышления философа Вечная жизнь: нужно ли людям бессмертие — размышления философа

Вы бы хотели жить вечно? Давайте пофантазируем

Psychologies
Когда женщины начали носить лифчики? Интересные факты! Когда женщины начали носить лифчики? Интересные факты!

Бюстгальтер — привычное нижнее белье на пересечении моды и функциональности

ТехИнсайдер
Открыть в приложении