Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Наши любимые звери: чему они учат нас Наши любимые звери: чему они учат нас

Смыслы самой нежной и чистой звериной привязанности

Psychologies
5 аудиокниг от известных психологов и психотерапевтов, которые помогут справиться с тревогой 5 аудиокниг от известных психологов и психотерапевтов, которые помогут справиться с тревогой

Аудиокниги для снижения тревоги, отвлечения от новостей и дурных мыслей

Maxim
Как в «Гарри Поттере»: туристы съезжаются к грандиозному мосту-призраку в Чувашии Как в «Гарри Поттере»: туристы съезжаются к грандиозному мосту-призраку в Чувашии

Мокринский мост в Чувашии — оживший пейзаж из романа о мальчике, который выжил

Вокруг света
Почему современные тренды ЗОЖ чаще всего ошибочны Почему современные тренды ЗОЖ чаще всего ошибочны

С чего на самом деле надо начинать заботу о своем здоровье

СНОБ
Насколько вредно готовить на гриле или мангале? И как сделать шашлык полезнее? Насколько вредно готовить на гриле или мангале? И как сделать шашлык полезнее?

Как наслаждаться шашлыками без страха и тревоги?

ТехИнсайдер
5 главных критериев здоровых отношений с мужчиной — проверь свои! 5 главных критериев здоровых отношений с мужчиной — проверь свои!

Проверь, все ли у тебя хорошо с твоим партнером!

VOICE
Завтрак на балконе Завтрак на балконе

Волнующая история любви Александра Бенуа и Анны Кинд

Караван историй
Лгать и хранить секреты: какие навыки осваивают ученые во время войн Лгать и хранить секреты: какие навыки осваивают ученые во время войн

Отрывок из книги «Разум в тумане войны: наука и технологии на полях сражений»

Forbes
Черное дело Черное дело

Традиционное – не значит устаревшее, считают Елена и Олег Малышевы

Вокруг света
Цветок дьявола: как живет король богомолов Цветок дьявола: как живет король богомолов

Удивительное насекомое, которое притворяется растением, чтобы поймать добычу

Вокруг света
База тренера База тренера

Как отличить коуча здорового человека от коуча курильщика?

Собака.ru
Психологи выяснили, как мужчины реагируют на внезапное отцовство Психологи выяснили, как мужчины реагируют на внезапное отцовство

Что может помочь справиться с новостью о незапланированной беременности?

Psychologies
Астрология и Таро: как правильно к ним относиться — рассказывает психолог Астрология и Таро: как правильно к ним относиться — рассказывает психолог

Зачем нам это нужно и как правильно относиться к советам астрологов и тарологов?

VOICE
Синдром ежика Орфея, или Как не стать хулиганом Синдром ежика Орфея, или Как не стать хулиганом

Для чего дети устраивают дебош в школе и дома и как этого избежать

СНОБ
Беременные и кормящие самки мышей отпугнули самцов мочой с банановым запахом Беременные и кормящие самки мышей отпугнули самцов мочой с банановым запахом

Как самки домовых мышей защищают свое потомство?

N+1
«Мы пытались спасти свой брак, но поняли, что это невозможно...» «Мы пытались спасти свой брак, но поняли, что это невозможно...»

Петр Кислов о Полине Гагариной

Коллекция. Караван историй
Любопытные факты о женской груди: красота с точки зрения науки Любопытные факты о женской груди: красота с точки зрения науки

А вы знали, что дополнительная молочная железа может вырасти хоть на пятке?

ТехИнсайдер
«Операция «Мясной фарш»: военная драма про гениальный обман «Операция «Мясной фарш»: военная драма про гениальный обман

«Операция «Мясной фарш» — о чем на самом деле это кино

Forbes
Трагедия вундеркинда: почему поэтесса Ника Турбина пострадала от своей ранней славы Трагедия вундеркинда: почему поэтесса Ника Турбина пострадала от своей ранней славы

Что отличает фильм «Ника» от традиционных байопиков

Forbes
Француз с русской душой: удивительные забайкальские приключения Егора Барбота де Марни Француз с русской душой: удивительные забайкальские приключения Егора Барбота де Марни

История выдающегося горного администратора Егора Егоровича Барбота де Марни

Вокруг света
Русский комиссар при Наполеоне Русский комиссар при Наполеоне

Как опрометчиво отдавать себя в руки врага, рассчитывая на его благородство!

Дилетант
Гонконг, Казахстан или Грузия: куда лучше перевозить IT-компанию из России Гонконг, Казахстан или Грузия: куда лучше перевозить IT-компанию из России

Преимущества и недостатки оформления бизнеса в Армении, Грузии, Узбекистане

Forbes
Бразильский Чернобыль: радиоактивное заражение в Гоянии в 1987 году Бразильский Чернобыль: радиоактивное заражение в Гоянии в 1987 году

Катастрофа произошла через полтора года после аварии на Чернобыльской АЭС

Maxim
Гантели на пенсию Гантели на пенсию

Как будет выглядеть спорт в ближайшем и отдаленном будущем?

Forbes Life
География чтения: 5 книг о Северной Африке География чтения: 5 книг о Северной Африке

Книги о загадочном континенте, который манит авантюристов и путешественников

Вокруг света
Новые возможности и заслуженные победы: семь лучших мотивирующих фильмов Новые возможности и заслуженные победы: семь лучших мотивирующих фильмов

Картины о неунывающих энтузиастах и мечтателях, которые не боятся трудностей

Forbes
На двух колесах: сколько стоит аренда самоката в Москве На двух колесах: сколько стоит аренда самоката в Москве

Какой из множества сервисов поминутной аренды самокатов предпочесть

CHIP
«Добрый дядя»: история «вампира» Фрица Хаармана, делавшего пирожки из детей «Добрый дядя»: история «вампира» Фрица Хаармана, делавшего пирожки из детей

«Ганноверский вампир», «немецкий Дракула» — так называли этого человека

VOICE
История одной вещи: кипятильник, незаменимый в командировке и путешествии История одной вещи: кипятильник, незаменимый в командировке и путешествии

Рассказываем его историю советского кипятильника

Правила жизни
Открыть в приложении