Сегодня активно обсуждается «коллапс модели». Насколько это опасно?

ТехИнсайдерHi-Tech

Что такое «коллапс модели», чем он угрожает развитию ИИ и человека

Сегодня активно обсуждается так называемый «коллапс модели», явление при котором нейросеть деградирует и перестает работать. Но насколько реалистичны эти прогнозы и что вообще такое этот «коллапс модели»? С этим попробовал разобраться Аарон Дж. Сносвелл научный сотрудник по вопросам ИИ, Квинслендского технологического университета.

Владимир Губайловский

5925e3452d7f503fd3b5c03aa9bd4895_ce_900x600x293x0.jpg
Когда модели изображений искусственного интеллекта обучаются на собственных результатах, они могут создавать искаженные изображения, изуродованные пальцы или странные узоры. Изображения, созданные Sina Alemohammad and others.

Обсуждавшийся еще 2023 году, но ставший популярным совсем недавно «коллапс модели» относится к гипотетическому сценарию, при котором будущие системы ИИ деградируют, потому что обучаются на данных генерируемых ИИ.

Современные системы ИИ строятся на основе машинного обучения. Программисты закладывают математическую структуру, но реальный «интеллект» появляется в результате обучения системы на определенных дата-сетах.

Это не любые данные. Современным генеративным системам ИИ нужны высококачественные данные, причем в большом количестве. 

Сколько надо данных

«Чтобы обучить GPT-3, OpenAI понадобилось более 650 миллиардов английских слов текста — примерно в 200 раз больше, чем вся английская Википедия. Но для этого требовалось собрать почти в 100 раз больше исходных данных из интернета и 98% которых было затем отфильтровано и отброшено», — пишет Аарон Дж. Сносвелл со ссылкой на статью, размещенную на сервере arxiv.

Чтобы получить эти данные, крупные технологические компании, такие как OpenAI, Google, Meta (признана экстремистской организацией на территории РФ) и Nvidia, постоянно сканируют интернет, собирая терабайты контента, чтобы «накормить» машины. Но после появления в 2022 году широкодоступных и полезных систем генеративного ИИ люди все чаще загружают и делятся контентом, частично или полностью созданным ИИ.

В 2023 году исследователи начали задумываться о том, нельзя ли обойтись для обучения только данными, созданными ИИ, вместо данных, сгенерированных человеком.

Для этого есть огромные стимулы. Контент, созданный ИИ гораздо дешевле, чем данные, созданные человеком. Кроме того, его собирание не вызывает сомнений с этической и юридической точек зрения. На него ни у кого нет авторских прав, кроме компании которая его создает. 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Тревожное исследование: ChatGPT убивает наше критическое мышление Тревожное исследование: ChatGPT убивает наше критическое мышление

Чем чрезмерное использование нейросетей крайне вредно для нашего мозга

ТехИнсайдер
На пике тренда На пике тренда

Где приобщиться к моде на летний отдых на горнолыжных курортах?

Men Today
Робопчелу научили садиться по-комарьи Робопчелу научили садиться по-комарьи

Инженеры разработали шасси для миниатюрного орнитоптера RoboBee

N+1
Подруги довели девушку до суицида. Психолог разъяснила, как проявляется «дружеская» травля Подруги довели девушку до суицида. Психолог разъяснила, как проявляется «дружеская» травля

Как определить, что в дружеских отношениях начинаются травля и буллинг

Psychologies
Всегда желанные Всегда желанные

Как сохранить страсть в длительных отношениях

kiozk originals
Александр Никишин Александр Никишин

Знакомьтесь, капитан ХК СКА Александр Никишин — лидер клуба-фаворита

Собака.ru
Как этично дать совет дочери: 6 вопросов, которые должна задать мать Как этично дать совет дочери: 6 вопросов, которые должна задать мать

Почему лучше воздержаться от советов, если ребенок о них не просит

Psychologies
Избыток сахара ускоряет старение клеток и сокращает продолжительность жизни Избыток сахара ускоряет старение клеток и сокращает продолжительность жизни

Избыток сахара может изменить работу клеток в организме человека

ТехИнсайдер
«Так живет большинство семей в России»: 4 типа невротичных пар «Так живет большинство семей в России»: 4 типа невротичных пар

Что такое невротичные отношения? Почему мы в них вступаем?

Psychologies
Самые умные и самые богатые Самые умные и самые богатые

Кто такие кванты и почему за ними охотятся еще в университетах

ТехИнсайдер
Что следует делать и как ни в коем случае нельзя поступать, если ты узнала об измене Что следует делать и как ни в коем случае нельзя поступать, если ты узнала об измене

Как не наломать дров, пока пытаешься справиться с болью от измены партнера

VOICE
Где посмотреть современный арт в Казанском кремле Где посмотреть современный арт в Казанском кремле

Как в Казани старинные постройки получают новую жизнь и новые смыслы

Psychologies
Ах, какая женщина! Ах, какая женщина!

История жизни и любви Софи Лорен

Лиза
Яхты Яхты

В люксовом яхтинге гигантоманию сменила компактность

RR Люкс.Личности.Бизнес.
Пьет значит жив Пьет значит жив

Как запой оказался единственной живой темой «Живого трупа»

Weekend
Болен деньгами: как связаны финансы и психологическое здоровье Болен деньгами: как связаны финансы и психологическое здоровье

Money disordes: как проявляются такие расстройства и как их распознать у себя?

Forbes
Дмитрий Астрахан: «Страшно не объясниться в любви, может порушиться жизнь» Дмитрий Астрахан: «Страшно не объясниться в любви, может порушиться жизнь»

«Хотелось сделать театр, про который зритель знает: там будет ярко, зрелищно»

Караван историй
Ханты-Мансийск: мамонты и современное искусство Ханты-Мансийск: мамонты и современное искусство

В равнинах Западной Сибири, на слиянии Оби и Иртыша находится Ханты-Мансийск

Psychologies
Средневековые жители Заполярья поели сырой головной мозг северных оленей Средневековые жители Заполярья поели сырой головной мозг северных оленей

Как средневековые обитатели Ямала могли заразиться гельминтами

N+1
«Бриджертоны» — 80 миллионов поклонников и мгновенная слава актеров «Бриджертоны» — 80 миллионов поклонников и мгновенная слава актеров

О закулисье «Бриджертонов» и историях актеров, сыгравших самые яркие роли

Караван историй
Как никогда не выйти замуж. 7 вредных советов Как никогда не выйти замуж. 7 вредных советов

Если не хочешь брака, следуй нашим рекомендациям – и оставайся свободной!

Лиза
Как вычислить нарцисса по переписке: 7 тревожных звоночков Как вычислить нарцисса по переписке: 7 тревожных звоночков

Как распознать, что вы переписываетесь с нарциссом? Вот семь признаков

Psychologies
Из разведчиков в «шпионы» Из разведчиков в «шпионы»

При сталинской диктатуре государство всегда с подозрением относилось к гражданам

Дилетант
Элемент революции Элемент революции

Автомобильный спорт стоит на пороге революции. И имя ей – водород

ТехИнсайдер
«Записки сумасшедших»: как Дмитрий Крымов превращает свою и чужую боль в метафоры «Записки сумасшедших»: как Дмитрий Крымов превращает свою и чужую боль в метафоры

Какой получилась новая работа режиссера Дмитрия Крымова

Forbes
Тайна Ивана Павлова Тайна Ивана Павлова

Аспекты научной биографии Ивана Павлова, которые обычно остаются за кадром

Знание – сила
Зайти в IT: зачем отраслевые компании выходят на рынок информтехнологий Зайти в IT: зачем отраслевые компании выходят на рынок информтехнологий

Зачем крупные отраслевые игроки решают коммерциализировать свои IT-решения?

Forbes
Опыт, который имел реальную цену: 3 бизнес-ошибки основательницы exeDrive Юлии Воликовой Опыт, который имел реальную цену: 3 бизнес-ошибки основательницы exeDrive Юлии Воликовой

Основательница exeDrive Юлия Воликова — о своих предпринимательских неудачах

Inc.
Путешествия Путешествия

Уникальные локации, эталонный сервис и необычные предложения в отелях мира

RR Люкс.Личности.Бизнес.
Ржавое золото Ржавое золото

Автомобильные реликвии, которые обнаруживают слишком поздно

Men Today
Открыть в приложении