Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Исследование: в мозге человека нанопластика хватит на целую пластиковую ложку! Исследование: в мозге человека нанопластика хватит на целую пластиковую ложку!

Какие последствия может иметь для здоровья наличие в мозге нанопластика?

ТехИнсайдер
Трудно пить богу Трудно пить богу

Как Алексей Герман снял фильм-запой

Weekend
В этом вся соль: из чего делают противогололедные реагенты и почему они плавят лед В этом вся соль: из чего делают противогололедные реагенты и почему они плавят лед

Из чего вообще сделана техническая соль и точно ли она безопасна для нас?

ТехИнсайдер
Время в саду Время в саду

Как успешный предприниматель становится садоводом?

Новый очаг
Оседлать единорога: 10 шагов невротика к спокойной жизни Оседлать единорога: 10 шагов невротика к спокойной жизни

Какие действия помогают обрести долгожданное спокойствие

Psychologies
Что сильнее губит экологию: электрокары или двигатели внутреннего сгорания Что сильнее губит экологию: электрокары или двигатели внутреннего сгорания

С ростом популярности электромобилей появляются сомнения насчет их экологичности

Maxim
Разговоры о страшном Разговоры о страшном

Как обэриуты изучали мир, где остановилось время

Weekend
Правильный холодец Правильный холодец

Холодец: как выбрать продукты и приготовить легендарное русское блюдо

Добрые советы
Рано списывать: 5 главных преимуществ HDD перед SSD Рано списывать: 5 главных преимуществ HDD перед SSD

Почему в некоторых случаях лучше купить HDD, а не SSD?

CHIP
Один раз, еще не жена Один раз, еще не жена

Однажды я провел за два года три свадьбы у одной и той же невесты!

Men Today
Опубликованы первые результаты лабораторных исследований грунта с обратной стороны Луны Опубликованы первые результаты лабораторных исследований грунта с обратной стороны Луны

Что из себя представляют образцы грунта с обратной стороны Луны?

N+1
Опухоли повысили риск развития сердечно-сосудистых заболеваний Опухоли повысили риск развития сердечно-сосудистых заболеваний

Частота развития сердечно-сосудистых заболеваний выше у пациентов с опухолями

N+1
Ничего личного: как строительная корпорация США создавала советскую индустрию Ничего личного: как строительная корпорация США создавала советскую индустрию

Как американская компания Bechtel Corporation помогала строить СССР

Forbes
Ученые доказали эффективность наночастиц золота при лечении рака Ученые доказали эффективность наночастиц золота при лечении рака

Как ученые доказали результативность наночастиц золота для борьбы с раком

ТехИнсайдер
У кошек есть весомый аргумент, чтобы спать на вещах своего хозяина У кошек есть весомый аргумент, чтобы спать на вещах своего хозяина

Зачем кошки спят на вашей одежде?

ТехИнсайдер
Автомобили Автомобили

Рекорды мощности, внимание к деталям и всеобщая цифровизация лучших автомобилей

RR Люкс.Личности.Бизнес.
Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона Аналог полиции и прототип ФБР: история Национального детективного агентства Пинкертона

Пинкертоны: одно из первых детективных агентств

ТехИнсайдер
Французские и русские Сент-Илеры Французские и русские Сент-Илеры

Чем знамениты русские представители фамилии Сент-Илеров

Наука и техника
Почему так важно разъехаться с родителями вовремя? Почему так важно разъехаться с родителями вовремя?

Что мы теряем, продолжая жить под родительской крышей?

Psychologies
Как повысить уровень жизни: техника маленьких шагов Как повысить уровень жизни: техника маленьких шагов

Что такое «денежный потолок» и как его расширить, улучшив качество жизни

Psychologies
«Пума на охоте»: почему женщин критикуют за выбор мужчин младше себя «Пума на охоте»: почему женщин критикуют за выбор мужчин младше себя

Откуда взялись стереотипы о возрасте в паре

Forbes
Кто придумал Гамлета? Кто придумал Гамлета?

Гамлет, принц датский, впервые увидел свет задолго до Шекспира

Дилетант
Озоновый слой в этом году восстанавливается особенно быстро Озоновый слой в этом году восстанавливается особенно быстро

Ученые заметили, что дыра в атмосфере постепенно затягивается

ТехИнсайдер
Что сказать зависимому Что сказать зависимому

Как уговорить близкого с аддикцией обратиться к психотерапевту

Psychologies
Гений, миллиардер, плейбой: уроки пикапа от Илона Маска Гений, миллиардер, плейбой: уроки пикапа от Илона Маска

Как сделать так, чтобы на тебя обратили внимание? Учит Илон Маск

Maxim
Генетики выделили ДНК из семи неандертальских зубов из пещеры Стайня Генетики выделили ДНК из семи неандертальских зубов из пещеры Стайня

С кем по материнской линии связаны неандертальцы из пещеры Стайня?

N+1
Пираты в юбке: 5 неочевидных вопросов про разбойничьих капитанш Золотого века пиратства Пираты в юбке: 5 неочевидных вопросов про разбойничьих капитанш Золотого века пиратства

​​​​​​​Как пираткам удавалось избежать виселицы, когда мужчины уже были обречены

ТехИнсайдер
Что значит на подростковом языке слово «эщкере»? Что значит на подростковом языке слово «эщкере»?

Почему подростки используют сленговые слова?

Psychologies
Мнение психологов: 5 обычных вечерних привычек мешают вашему успеху! Стоит узнать Мнение психологов: 5 обычных вечерних привычек мешают вашему успеху! Стоит узнать

Многие из ежедневных действий могут быть вреднее, чем вам кажется

ТехИнсайдер
История прямохождения. Отрывок из книги палеоантрополога «Первые шаги» История прямохождения. Отрывок из книги палеоантрополога «Первые шаги»

Отрывок из книги о том, как и почему люди стали прямоходящими

СНОБ
Открыть в приложении