Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как посмотреть температуру процессора: тестируем CPU и боремся с перегревом Как посмотреть температуру процессора: тестируем CPU и боремся с перегревом

Как контролировать и поддерживать нормальную температуру процессора

CHIP
Мастер рассказал, как выбрать подходящий кухонный нож и не прогадать Мастер рассказал, как выбрать подходящий кухонный нож и не прогадать

Каким должен быть кухонный нож

ТехИнсайдер
Сменить колею: что не так с транспортной политикой в России Сменить колею: что не так с транспортной политикой в России

Почему транспортная политика в России не работает

Forbes
Страшная правда демографических пирамид Страшная правда демографических пирамид

В Азии, Индии и Южной Африке сформируются новые центры экономической активности

Эксперт
Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа

Они сражались не ради славы и оваций, а за то, что любили — за Родину!

ТехИнсайдер
Три любви Иосифа Кобзона: истории с трагическим и счастливым концом Три любви Иосифа Кобзона: истории с трагическим и счастливым концом

Первые два брака Иосифа Кобзона не принесли счастья ни ему, ни его женам

VOICE
«Родители, дети и бабушка»: как выжить в этом треугольнике «Родители, дети и бабушка»: как выжить в этом треугольнике

Что делать, если бабушка конкурирует с родителями за любовь внуков?

Psychologies
Крионика: есть ли жизнь после заморозки? Крионика: есть ли жизнь после заморозки?

Крионика – это игра с малыми шансами, но с колоссальным джекпотом

Популярная механика
Тело — это просто тело: что такое бодипозитив и бодинейтральность Тело — это просто тело: что такое бодипозитив и бодинейтральность

Отрывок из книги «Мудрость тела» Хиллари Л. МакБрайд

Forbes
Как снять гель-лак без помощи мастера: советы эксперта Как снять гель-лак без помощи мастера: советы эксперта

Как убрать гель-лак с ногтей самостоятельно?

РБК
С кошками не так: от какой болезни защищает детей присутствие собаки в доме С кошками не так: от какой болезни защищает детей присутствие собаки в доме

Ученые выявили необычную особенность домашних животных

Вокруг света
Русский комиссар при Наполеоне Русский комиссар при Наполеоне

Как опрометчиво отдавать себя в руки врага, рассчитывая на его благородство!

Дилетант
Как появилась традиция праздновать Последний звонок? Как появилась традиция праздновать Последний звонок?

Последний звонок придумал советский педагог из Краснодара

Вокруг света
«Нервные клетки не восстанавливаются»: 12 разрушительных мифов о старении мозга «Нервные клетки не восстанавливаются»: 12 разрушительных мифов о старении мозга

Развенчиваем распространенные мифы о старении мозга

Вокруг света
Музей боли и страха: выставка одежды жертв насилия с их историями Музей боли и страха: выставка одежды жертв насилия с их историями

Зачем нужны выставки, посвященные жертвам насилия?

VOICE
Кровавые узы: судьбы жен и детей великих диктаторов Кровавые узы: судьбы жен и детей великих диктаторов

Имена диктаторов XX века вошли в историю, но судьбы их близких остаются в тени

Вокруг света
7 альбомов хип-хопа последних десяти лет, которые обожают интеллектуалы 7 альбомов хип-хопа последних десяти лет, которые обожают интеллектуалы

Изучили рейтинги меломанских сайтов и составили любопытный список хип-хопа

Maxim
Насколько реально самовозгорание человека? Насколько реально самовозгорание человека?

Возможен ли феномен спонтанного самовозгорания человека

ТехИнсайдер
Царь Петр: труды и дни Царь Петр: труды и дни

Как дата рождения Петра I вновь стала праздником в России

Караван историй
Мем как легенда Мем как легенда

Культура – всего лишь скопище вирусов, или мемов. «Но это не точно»

Вокруг света
Бесконечное число самых прекрасных форм. 10 внезапных фактов о разнообразии видов Бесконечное число самых прекрасных форм. 10 внезапных фактов о разнообразии видов

Неожиданные факты о биоразнообразии — в нашей подборке

N+1
Сгладить ситуацию Сгладить ситуацию

Причины появления растяжек на теле и как с ними бороться

Лиза
«Будь сильным как лев». Как научить детей противостоять буллингу «Будь сильным как лев». Как научить детей противостоять буллингу

Как учить детей вести себя в конфликтных ситуациях — отрывок из книги

СНОБ
Убираем жир, но не теряем мышцы Убираем жир, но не теряем мышцы

Рассказываем, как худеть так, чтобы не довести себя до истощения

Лиза
На это может попасться каждый. Самые обидные случаи лишения прав На это может попасться каждый. Самые обидные случаи лишения прав

Неочевидные случаи, когда водитель надолго может превратиться в пешехода

РБК
10 красивых имен со всего света, которые приносят счастье 10 красивых имен со всего света, которые приносят счастье

Подборка редких имен с историей

Вокруг света
Что такое хакатоны и зачем они нужны? Обратная сторона IT-марафона Что такое хакатоны и зачем они нужны? Обратная сторона IT-марафона

Как же попасть на работу в IT, если ты без опыта?

ТехИнсайдер
Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов

Книги о том, как люди преодолевают любые невзгоды

СНОБ
Умные лайфхаки для вашего автомобиля: комфортное вождение Умные лайфхаки для вашего автомобиля: комфортное вождение

Эти хитрости для автовладельцев помогут продлить срок жизни вашего автомобиля

ТехИнсайдер
Как экономить, если денег и так ни на что не хватает? Способы, которые работают Как экономить, если денег и так ни на что не хватает? Способы, которые работают

Как экономить еще сильнее, если ты уже экономишь?

VOICE
Открыть в приложении