Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не только дождь и снег: топ самых странных и шокирующих осадков Не только дождь и снег: топ самых странных и шокирующих осадков

Представьте: вы возвращаетесь домой и начинается... денежный дождь!

ТехИнсайдер
Живу и радуюсь! Живу и радуюсь!

Удовольствие – это жизненная необходимость

Добрые советы
Чем заменить Notion: 7 российских альтернатив Чем заменить Notion: 7 российских альтернатив

Приложения, которые помогут собрать все файлы в одном месте и ничего не потерять

VC.RU
Как вырастить... джонджоли Как вырастить... джонджоли

Клекачки можно вырастить на участке и приготовлять джонджоли по своему вкусу

Наука и жизнь
Думай как миллионер Думай как миллионер

17 уроков состоятельности для тех, кто готов разбогатеть

kiozk originals
Если не будут подтверждать, отключим связь: как ужесточатся условия покупки сим-карт Если не будут подтверждать, отключим связь: как ужесточатся условия покупки сим-карт

Как в России поменяются правила покупки сим-карт и услуги мобильной связи

Forbes
Уютное и доброе фэнтези: 5 бестселлеров и новинок для осеннего чтения Уютное и доброе фэнтези: 5 бестселлеров и новинок для осеннего чтения

Атмосферные, согревающие истории поднимут настроение холодными вечерами

Maxim
Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона

Пинкертоны: одно из первых детективных агентств

ТехИнсайдер
11 ложных представлений о любви, которые нам часто навязывают 11 ложных представлений о любви, которые нам часто навязывают

Действительно ли произносящий слова о чувствах человек искренне нас любит?

Psychologies
Бегущий по шейкеру: как набрать массу, когда нет времени Бегущий по шейкеру: как набрать массу, когда нет времени

Что нужно делать, когда на весах нужен плюс, а на часах везде минус?

Правила жизни
Две классические ошибки садоводов Две классические ошибки садоводов

Что мы сплошь и рядом видим в саду? А видим мы… джунгли

Наука и жизнь
Ярко и со вкусом Ярко и со вкусом

Необычная, очень солнечная по настроению квартира в ярком и цветном интерьере

Идеи Вашего Дома
Автомобили Автомобили

Рекорды мощности, внимание к деталям и всеобщая цифровизация лучших автомобилей

RR Люкс.Личности.Бизнес.
Леонардо Ди Каприо, Люк Бессон и Марион Котийяр: как звезды пытаются спасти планету Леонардо Ди Каприо, Люк Бессон и Марион Котийяр: как звезды пытаются спасти планету

Почему Леонардо Ди Каприо и другие звезды занялись защитой планеты?

Forbes
Сезон не охоты Сезон не охоты

Как вдохновиться на подвиг вернуться к тренировкам?

Men Today
Что будет, если заменить батареи теплым полом: ваше сердце не скажет спасибо, считает ученый из МЭИ Что будет, если заменить батареи теплым полом: ваше сердце не скажет спасибо, считает ученый из МЭИ

Можно ли отопить дом только теплым полом?

ТехИнсайдер
На Alibaba нашлась машинка для производства алмазов за скромные деньги. Но есть подвох На Alibaba нашлась машинка для производства алмазов за скромные деньги. Но есть подвох

Можно ли делать алмазы в гараже?

ТехИнсайдер
«Подай знак»: режиссерский дебют актрисы Зои Кравиц о злоупотреблении властью «Подай знак»: режиссерский дебют актрисы Зои Кравиц о злоупотреблении властью

Как фильм «Подай знак» привлекает к проблеме гендерного неравенства?

Forbes
Дрон-охранник с искусственным интеллектом: как разработчики научили беспилотник следить за порядком в городе Дрон-охранник с искусственным интеллектом: как разработчики научили беспилотник следить за порядком в городе

«Контур» — комбинация дрона-охранника и стационарной камеры наблюдения

ТехИнсайдер
Во власти вещей Во власти вещей

Как получать удовольствие от покупок, но не впадать в крайности

Psychologies
Эпигенетика: стресс (не) по наследству Эпигенетика: стресс (не) по наследству

Действительно ли все эпигенетические феномены являются эпигенетическими

Наука и жизнь
Что значит на подростковом языке слово «эщкере»? Что значит на подростковом языке слово «эщкере»?

Почему подростки используют сленговые слова?

Psychologies
Природная связь Природная связь

Как общаются существа, у которых нет мозга и вообще нервной системы?

Вокруг света
Чистоплотный, примерный семьянин и настоящий пловец: 12 впечатляющих фактов об образе жизни дикобразов Чистоплотный, примерный семьянин и настоящий пловец: 12 впечатляющих фактов об образе жизни дикобразов

Как дикобразы обустраивают своё жилище? Какие у них отношения в семье?

ТехИнсайдер
Без воды Без воды

Какие у безводной косметики преимущества и недостатки?

Лиза
Время в саду Время в саду

Как успешный предприниматель становится садоводом?

Новый очаг
У кошек есть весомый аргумент, чтобы спать на вещах своего хозяина У кошек есть весомый аргумент, чтобы спать на вещах своего хозяина

Зачем кошки спят на вашей одежде?

ТехИнсайдер
«Кометы. Странники Солнечной системы» «Кометы. Странники Солнечной системы»

Как определить параметры ядра кометы

N+1
Явления одного тика Явления одного тика

Нервный тик: чем вызвано это расстройство и как правильно на него реагировать?

Лиза
Большое плавание Крузенштерна Большое плавание Крузенштерна

Во сколько обошлась первая русская кругосветка

Деньги
Открыть в приложении