Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Большая перемена Большая перемена

Как понять, что именно нужно менять, насколько быстро, а главное, ради чего?

Psychologies
Три секрета правильной стирки, о которых знают не все Три секрета правильной стирки, о которых знают не все

Если вы хотите, чтобы стиральная машина служила долго, помните вот что

CHIP
Открыто соединение, способное «включаться» под действием лазера Открыто соединение, способное «включаться» под действием лазера

Созданный фосфонат позволит точнее и безопаснее воздействовать на организм

Популярная механика
Сын сварщика, первый муж Умы Турман: посмотри, каким стал красавец Гэри Олдмен Сын сварщика, первый муж Умы Турман: посмотри, каким стал красавец Гэри Олдмен

Каким был и каким стал сердцеед и сердцекрад Гэри Олдмен

VOICE
Идеальный источник белка: карри с тунцом по рецепту мальдивского повара Идеальный источник белка: карри с тунцом по рецепту мальдивского повара

Диетологи прославили тунца за то, что его мясо — идеальный источник белка

Вокруг света
Синдром ежика Орфея, или Как не стать хулиганом Синдром ежика Орфея, или Как не стать хулиганом

Для чего дети устраивают дебош в школе и дома и как этого избежать

СНОБ
Модестова ушла, умер в 40: трагическая судьба Модестова ушла, умер в 40: трагическая судьба

Как сложилась судьба звезды "Последнего героя" Сергея Сакина?

VOICE
«Жена зависима от компьютерных игр и забывает о ребенке» «Жена зависима от компьютерных игр и забывает о ребенке»

Что делать, если у близкого человека игровая зависимость?

Psychologies
10 фраз-киллеров для брака 10 фраз-киллеров для брака

Словом можно ранить — эту истину хорошо знают семейные терапевты

Psychologies
5 обязательных книг, которые должен прочесть каждый, кто хочет стать писателем 5 обязательных книг, которые должен прочесть каждый, кто хочет стать писателем

Советы о том, как написать книгу, от признанных мастеров

Maxim
Как пилотов защищают от серьезных аварий в «Формуле-1»? Как пилотов защищают от серьезных аварий в «Формуле-1»?

Как работает система защиты пилотов в «Формуле-1»?

Maxim
Химики превратили аммиак в аминокислоты Химики превратили аммиак в аминокислоты

Аминокислоты из диазосоединений получились с высокими выходами

N+1
Лицо и фронт русского прорыва Лицо и фронт русского прорыва

Нашим дизайнерам и конструкторам есть что предложить миру

Эксперт
Матерятся все: почему же тогда брань под запретом? Матерятся все: почему же тогда брань под запретом?

Историческое расследование психолингвиста о брани

Вокруг света
Номер по абонементу: зачем отели тестируют систему подписки на свои услуги Номер по абонементу: зачем отели тестируют систему подписки на свои услуги

Зачем отели по всему миру вводят системы подписки на номера и услуги

Forbes
«Коллега тянется ко мне, но не решается на первый шаг: стоит ли делать его самой?» «Коллега тянется ко мне, но не решается на первый шаг: стоит ли делать его самой?»

Как понять, стоит ли делать первый шаг самой?

Psychologies
Неизведанная Калмыкия Неизведанная Калмыкия

Не обязательно ехать на край света, чтобы увидеть буддистские реликвии

Лиза
«Комемадре» Роке Ларраки: сюрреалистичный роман о жестоком научном эксперименте, который на деле оказывается высказыванием о гуманизме «Комемадре» Роке Ларраки: сюрреалистичный роман о жестоком научном эксперименте, который на деле оказывается высказыванием о гуманизме

Отрывок из жутковатого философского романа «Комемадре» Роке Ларраки

Правила жизни
Никогда не говори «Не могу». Две недели в детском хосписе Никогда не говори «Не могу». Две недели в детском хосписе

Как детский хоспис может изменить человека

СНОБ
Капкан ипотеки Капкан ипотеки

За что могут выселить из квартиры и как этого избежать

Лиза
10 современных романов, которые стоит прочитать на майских 10 современных романов, которые стоит прочитать на майских

Десять современных романов, которые помогут скоротать время

СНОБ
Последняя сигарета: как бросить курить и изменить жизнь Последняя сигарета: как бросить курить и изменить жизнь

Как помочь себе справиться с пагубной привычкой и бросить курить?

Psychologies
Профессор Эйнштейн. Распространённые ошибки его биографов Профессор Эйнштейн. Распространённые ошибки его биографов

Рассказывать о жизни Эйнштейна часто берутся люди, слабо знакомые с предметом

Наука и жизнь
Борьба с глобальным потеплением при помощи диеты: что такое редукторианство и с чем его едят Борьба с глобальным потеплением при помощи диеты: что такое редукторианство и с чем его едят

Ученые ищут все новые способы борьбы с изменениями климата

Вокруг света
6 главных качеств Владимира Этуша 6 главных качеств Владимира Этуша

Как Владимир Этуш получил народную славу и признание коллег

СНОБ
Выдача ипотеки в России обвалилась более чем втрое за месяц Выдача ипотеки в России обвалилась более чем втрое за месяц

Рынок розничного кредитования в России откатился до уровней 2015-2016 годов

Forbes
Осторожно, злой хомяк: ученые случайно вывели агрессивных грызунов Осторожно, злой хомяк: ученые случайно вывели агрессивных грызунов

Эксперимент, который поможет людям с психическими проблемами

Вокруг света
Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров

Какие автомобили пользуются популярностью у россиян даже во время обвала рынка

РБК
Игры со смертью и небесный роман Амелии Эрхарт Игры со смертью и небесный роман Амелии Эрхарт

Амелия Эрхарт буквально играла с небом и «отобрала» его у мужчин

Вокруг света
Управлять можно каждым: как правильно манипулировать знаками зодиака Управлять можно каждым: как правильно манипулировать знаками зодиака

Наш Магический шар решил раскрыть самый главный секрет каждого знака зодиака

VOICE
Открыть в приложении