Новый способ оптимизации предварительного обучения Больших языковых моделей

ТехИнсайдерHi-Tech

Разработан более дешевый способ обучения Больших языковых моделей

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы. Это позволит значительно удешевить разработку Больших языковых моделей и сделать их создание более доступным независимым разработчикам.

Владимир Губайловский

ce9cebf76db8bc7877647f1250420a14_ce_1974x1316x0x83.jpg
Unsplash.com. DeepMind

Цель таких работ — сделать Большие языковые модели (такие как GPT), требующие миллионы на обучение, работающие на мощнейших компьютерах с огромными дата-центрами, доступными на домашнем компьютере или смартфоне. И разработчики двигаются в этом направлении.

Команда ученых из Стэнфорда разработала новый способ оптимизации предварительного обучения Больших языковых моделей, который в два раза быстрее, чем существующие подходы.

ChatGPT и другие приложения, использующие Большие языковые модели (LLM), находят все более широкое применение и привлекают пристальное внимание СМИ. Однако в сфере LLM доминируют несколько крупных технологических компаний, поскольку предварительное обучение этих моделей является чрезвычайно дорогостоящим процессом: стоимость начинается с 10 миллионов долларов. Сколько стоило обучение GPT не сообщается, но оценить его в миллиард долларов не будет серьезным преувеличением.

«Большие языковые модели не очень-то доступны для небольших организаций или академических групп», — говорит Хонг Лю, аспирант факультета информатики Стэнфордского университета.

Чтобы изменить ситуацию, Лю и его коллеги решили усовершенствовать существующие методы оптимизации LLM. В результате был разработан подход под названием Sophia, который сокращает время предварительного обучения вдвое. 

Оптимизация оптимизации

507231df3ff536c824bc47835115b915.jpg
Unsplash.com. DeepMind

Чтобы оптимизировать предварительное обучение LLM ученые использовали два приема. Первый, известный как оценка кривизны, не нов, но команда Стэнфорда нашла способ сделать его более эффективным.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как работа за столом в офисе приводит к десятилетним проблемам со сном Как работа за столом в офисе приводит к десятилетним проблемам со сном

С трудом засыпаете по ночам? Возможно, в этом виновато ваше офисное кресло

ТехИнсайдер
Старт дан: что дальше? Старт дан: что дальше?

Для успешного развития проекты фермеров нуждаются в нефинансовой поддержке

Агроинвестор
Как мошенники используют дипфейки и почему не стоит выкладывать в интернет свои фотографии Как мошенники используют дипфейки и почему не стоит выкладывать в интернет свои фотографии

Дипфейки: можно ли обезопасить себя от мошенников?

Inc.
Как три предпринимательницы помогают женщинам создавать собственный бизнес Как три предпринимательницы помогают женщинам создавать собственный бизнес

Как Collabroom помогает женщинам преодолеть неуверенность в собственных силах

Forbes
Что такое «высокофункциональная тревожность» и есть ли у вас ее признаки Что такое «высокофункциональная тревожность» и есть ли у вас ее признаки

Девять признаков «высокофункциональной тревожности»

Maxim
Снесший в XII веке одну из гималайских вершин мегаобвал пролил свет на эволюцию высокогорных систем Снесший в XII веке одну из гималайских вершин мегаобвал пролил свет на эволюцию высокогорных систем

Как может протекать долгосрочная топографическая эволюция высокогорных регионов

N+1
Birkin, корзинки, показы: главные модные моменты Джейн Биркин Birkin, корзинки, показы: главные модные моменты Джейн Биркин

Чем модная индустрия обязана Джейн Биркин?

Правила жизни
Чему учить детей, чтобы они стали успешными: 5 вещей Чему учить детей, чтобы они стали успешными: 5 вещей

Чему именно стоит уделить внимание, воспитывая ребенка?

Psychologies
«Силой воли художника происходит мощная ежесекундная редактура реальности». Интервью Андрея Бартенева и Вовы Перкина «Силой воли художника происходит мощная ежесекундная редактура реальности». Интервью Андрея Бартенева и Вовы Перкина

Художники Вова Перкин и Андрей Бартенев — о социальной ответственности

СНОБ
Ресурсное проклятие: как таланты могут препятствовать нашему развитию Ресурсное проклятие: как таланты могут препятствовать нашему развитию

Почему люди, обладая определенными талантами, не реализовывают свой потенциал?

Psychologies
Русские породы собак, которые ценятся во всем мире Русские породы собак, которые ценятся во всем мире

От среднеазиатской овчарки до русского той-терьера: русские породы собак

Maxim
Самые странные и уродливые смартфоны последних 15 лет Самые странные и уродливые смартфоны последних 15 лет

После первого айфона все смартфоны выглядели одинаково? А вот и нет!

Maxim
«Ласковый убийца»: что надо знать о гепатите С «Ласковый убийца»: что надо знать о гепатите С

Чем опасен гепатит С, легко ли им заразиться и как защитить от инфекции себя?

Psychologies
Говорить «нет»: 6 ситуаций, когда это необходимо Говорить «нет»: 6 ситуаций, когда это необходимо

Это маленькое слово имеет большой вес, но сказать его непросто

Psychologies
Современные «Одиссеи»: пять лучших фильмов в жанре роуд-муви Современные «Одиссеи»: пять лучших фильмов в жанре роуд-муви

Фильмы о кочевниках нового времени, неожиданных попутчиках и отчаянных искателях

Forbes
Головная боль всех кошатников: как отучить питомца царапать мебель Головная боль всех кошатников: как отучить питомца царапать мебель

Почему кота больше привлекает не когтеточка, а ваш диван?

ТехИнсайдер
Как преодолеть стереотипы общества и позволить себе быть просто женщиной Как преодолеть стереотипы общества и позволить себе быть просто женщиной

Как стереотипы заставляют женщину быть кем-то другим?

Psychologies
Без лишних затрат: как сделать когтеточку для кота своими руками Без лишних затрат: как сделать когтеточку для кота своими руками

Как сделать когтеточку с минимальными тратами?

ТехИнсайдер
«Если любишь, докажи!»: как перестать требовать этого от партнера — 3 сценария «Если любишь, докажи!»: как перестать требовать этого от партнера — 3 сценария

Почему нам постоянно нужны доказательства любви?

Psychologies
Как в русском фольклоре появились русалки? Как в русском фольклоре появились русалки?

Кого на Руси называли русалками?

Культура.РФ
Застройщик взмывает в небо Застройщик взмывает в небо

Девелоперская группа «Самолет» планирует стать крупнейшим застройщиком Европы

Эксперт
Ловушка Джокера: история Арлекина Ненависти от Фингера до Леджера Ловушка Джокера: история Арлекина Ненависти от Фингера до Леджера

Пройдемся по основным вехам жизни Джокера

Правила жизни
Просто дети стали старше: чем хороша и чем плоха «Барби» Греты Гервиг Просто дети стали старше: чем хороша и чем плоха «Барби» Греты Гервиг

С какими концептуальными проблемами сталкивается игрушечная сатира

Правила жизни
Ноги на экспорт: самые дорогие продажи в истории российского футбола Ноги на экспорт: самые дорогие продажи в истории российского футбола

Рейтинг самых дорогостоящих трансферов «на выход» из РПЛ

Forbes
Феномен ночной прокрастинации: почему мы откладываем отход ко сну даже тогда, когда очень сильно хотим спать Феномен ночной прокрастинации: почему мы откладываем отход ко сну даже тогда, когда очень сильно хотим спать

А вы знали, что залипание в телефоне в ущерб своему сну – это такая форма мести?

ТехИнсайдер
Данные GPS указали на ускоренный сдвиг геодезических станций перед сильными землетрясениями Данные GPS указали на ускоренный сдвиг геодезических станций перед сильными землетрясениями

Ученые продвинулись в прогнозировании землетрясений

N+1
Бизнес на автоматизации рутины: как войти в топ богатейших женщин США Бизнес на автоматизации рутины: как войти в топ богатейших женщин США

Как Кристина Качоппо вошла в число богатейших self-made женщин Америки

Forbes
Объекты масс-культуры: почему растет количество частных театров Объекты масс-культуры: почему растет количество частных театров

Как они живут и за счет чего развиваются частные театры

Forbes
«Барби» Греты Гервиг: почему кукле в розовом больше нет места в этом мире «Барби» Греты Гервиг: почему кукле в розовом больше нет места в этом мире

Как режиссеру удалось создать настоящий летний блокбастер

Forbes
Охота за иконами: как СССР создавал мировой спрос на древнерусское искусство Охота за иконами: как СССР создавал мировой спрос на древнерусское искусство

Глава из книги «Судьбы икон в Стране Советов. 1920–1930-е»

Forbes
Открыть в приложении