Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Отсюда взошла Россия Отсюда взошла Россия

В Пскове молятся древним святыням и играют на коряге

Отдых в России
Семь причин боли в животе Семь причин боли в животе

Причин боли в животе очень много, и они самые разные

Здоровье
Три очень красивые актрисы 90-х, карьеру которых испортил строптивый нрав Три очень красивые актрисы 90-х, карьеру которых испортил строптивый нрав

Из-за сложного характера об этих актрисах все забыли

VOICE
Почему современные тренды ЗОЖ чаще всего ошибочны Почему современные тренды ЗОЖ чаще всего ошибочны

С чего на самом деле надо начинать заботу о своем здоровье

СНОБ
Миллиардер Уоррен Баффет: 10 советов, как экономить деньги Миллиардер Уоррен Баффет: 10 советов, как экономить деньги

Как правильно относиться к деньгам, чтобы не потерять, а приумножить

Psychologies
Шесть парадоксов похудения Шесть парадоксов похудения

Почему у нас не всегда получается похудеть?

Здоровье
Без имени на бумаге: как Марион Махони Гриффин повлияла на архитектуру Австралии Без имени на бумаге: как Марион Махони Гриффин повлияла на архитектуру Австралии

Как Марион Махони Гриффин хотела построить рай на Земле

Forbes
Редчайшие автомобили на дорогах советской Москвы: уникальные кадры Редчайшие автомобили на дорогах советской Москвы: уникальные кадры

Думаете, только банальными “Волгами” ограничивался столичный трафик времен СССР?

ТехИнсайдер
Икра хариуса, галаган и конина: какие локальные продукты станут новыми деликатесами Икра хариуса, галаган и конина: какие локальные продукты станут новыми деликатесами

Какие локальные продукты заслужат звание новых российских деликатесов

Forbes
Ночницы пожужжали как пчелы и шершни и отпугнули сов Ночницы пожужжали как пчелы и шершни и отпугнули сов

Пример бейтсовской мимикрии, при котором млекопитающее подражает насекомому

N+1
«О становлении одного гения». Отрывок из новой книги о Моцарте «О становлении одного гения». Отрывок из новой книги о Моцарте

Как прошло детство Амадея Моцарта — отрывок из книги

СНОБ
Удушающая забота: что такое синдром Мюнхгаузена и почему он опасен Удушающая забота: что такое синдром Мюнхгаузена и почему он опасен

Расстройство, при котором человек имитирует симптомы реальных заболеваний

Forbes
ТОП-5 самых дорогих пород собак ТОП-5 самых дорогих пород собак

На покупке этих собак можно разориться: топ-5 дорогих пород

ТехИнсайдер
Интервью с триумфатором фестиваля «Санденс» Блертой Башоли Интервью с триумфатором фестиваля «Санденс» Блертой Башоли

В интервью Блерта Башоли рассказала о том, какое будущее хочет для своей страны

СНОБ
Одна сгубила десятки женихов, другая — возглавила армию. Какими были воительницы из легенд викингов Одна сгубила десятки женихов, другая — возглавила армию. Какими были воительницы из легенд викингов

Знаменитые воительницы из Мидгарда

ТехИнсайдер
Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце

Трогательные, иногда трагические, порой смешны фильмы о любви

VOICE
Два по цене одного: как халява заставляет человека совершать неразумные поступки и драться за товары Два по цене одного: как халява заставляет человека совершать неразумные поступки и драться за товары

Почему мы так бурно реагируем на бесплатные товары и услуги?

VC.RU
Как выбрать одежду и экипировку для летних пробежек Как выбрать одежду и экипировку для летних пробежек

Как сделать пробежки в жаркое время года удобными и безопасными

Maxim
Ископаемые биомолекулы указали на теплокровность тираннозавра Ископаемые биомолекулы указали на теплокровность тираннозавра

Общий предок динозавров был теплокровным

N+1
Сохраняем спокойствие в условиях внешнего кризиса: чем компаниям помогут специалисты-психологи Сохраняем спокойствие в условиях внешнего кризиса: чем компаниям помогут специалисты-психологи

Как российские компании прибегают к помощи внешних и штатных психологов

Inc.
Последняя минута войны Последняя минута войны

Советский генерал подписал Акт о капитуляции Германии без разрешения Сталина

Вокруг света
Ничего лишнего Ничего лишнего

Маруся Фомина — о характере и профессии актрисы

OK!
Двойная мораль: как суд между Деппом и Херд вскрыл отношение общества к женщинам Двойная мораль: как суд между Деппом и Херд вскрыл отношение общества к женщинам

Почему общество все еще легко прощает мужчин и так яростно осуждает женщин?

VOICE
Цена паранджи: как дискриминация женщин повлияет на экономику Афганистана Цена паранджи: как дискриминация женщин повлияет на экономику Афганистана

Невидимые женщины Афганистана: как дискриминация губит экономику страны

Forbes
Один дом, две собаки, трое детей, четыре года брака: союз Тарасовых в цифрах Один дом, две собаки, трое детей, четыре года брака: союз Тарасовых в цифрах

Анастасия и Дмитрий Тарасовы уже четыре года в браке. Как развивался этот союз?

VOICE
Понты дороже денег Понты дороже денег

«Самый дорогой коньяк», или Как решались вопросы долгов в начале нулевых

СНОБ
Свои виды Свои виды

Три яхтенных маршрута, стартующие в Москве и Петербурге

Robb Report
7 колоссальных проектов, которые так и не были возведены 7 колоссальных проектов, которые так и не были возведены

Небоскребы, отели, башни и другие огромные постройки, которые не увидел свет

ТехИнсайдер
Простой способ начисто отмыть бытовую технику, чтобы плита и холодильник сияли как новые Простой способ начисто отмыть бытовую технику, чтобы плита и холодильник сияли как новые

Как можно избежать утомительного отдраивания старых засохших пятен

ТехИнсайдер
Открыть в приложении