Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика

Фэшн-провалы Кендалл Дженнер

VOICE
Почему измена причиняет нам такую боль Почему измена причиняет нам такую боль

Почему предательство партнера приносит столько страданий

Psychologies
Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире Как люди, сами того не замечая, массово уничтожают самых крупных рыб в мире

Как морские магистрали нарушают среду обитания самых крупных рыб в мире

Популярная механика
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
Там дыра. Что астрономы увидели в центре Млечного Пути Там дыра. Что астрономы увидели в центре Млечного Пути

Почему на построение изображений из космоса уходит так много времени?

N+1
Российские и немецкие теоретики предсказали самоостановку света в нелинейной среде Российские и немецкие теоретики предсказали самоостановку света в нелинейной среде

Новая структура обладает свойствами, которые еще никогда не наблюдались

N+1
«Сознание как инстинкт. Загадки мозга: откуда берется психика»: Как нейроны приводят в действие разум «Сознание как инстинкт. Загадки мозга: откуда берется психика»: Как нейроны приводят в действие разум

Отрывок из книги «Сознание как инстинкт» — о модульном устройстве нашего мозга

N+1
Почему не нужно бояться родов и какие методики применять для борьбы со страхом Почему не нужно бояться родов и какие методики применять для борьбы со страхом

Как перестать бояться родов и помочь телу сделать его работу

VOICE
6 главных качеств Владимира Этуша 6 главных качеств Владимира Этуша

Как Владимир Этуш получил народную славу и признание коллег

СНОБ
Биоархеологи разобрались в рационе первых греческих земледельцев Биоархеологи разобрались в рационе первых греческих земледельцев

Биоархеологи повторно исследовали палеодиету людей Греции

N+1
Неизведанная Калмыкия Неизведанная Калмыкия

Не обязательно ехать на край света, чтобы увидеть буддистские реликвии

Лиза
«Москвич» для москвичей: стоит ли возрождать советские бренды «Москвич» для москвичей: стоит ли возрождать советские бренды

Если применять мифологему СССР, то только чтобы создавать что-то новое

Forbes
Осторожно: цветы! Осторожно: цветы!

Цветы и возможные опасности, которые они могут таить в себе

Здоровье
Как художник Винсент Ван Гог добился феноменального успеха: мнение ученых Как художник Винсент Ван Гог добился феноменального успеха: мнение ученых

Почему Винсент Ван Гог стал знаменитым только под конец своей жизни?

ТехИнсайдер
Что бесит и радует в новых странах: Латвия, Нидерланды, Германия, Кипр, Канада Что бесит и радует в новых странах: Латвия, Нидерланды, Германия, Кипр, Канада

Релоканты рассказывают, что им нравится в новых странах, а что — нет

VC.RU
Хозяева древних морей Хозяева древних морей

Кем были самые опасные морские хищники прошлого?

Вокруг света
10 красивых имен со всего света, которые приносят успех 10 красивых имен со всего света, которые приносят успех

Не самые редкие имена, о значениях которых вы, скорее всего, не подозревали

Вокруг света
5 автомобилей-амфибий, которые можно купить на рынке 5 автомобилей-амфибий, которые можно купить на рынке

Это не фантастика, а реальность – прямо сейчас можно купить автомобиль-амфибию

ТехИнсайдер
В это сложно поверить: 5 диких ритуалов древних племен, которые проводятся до сих пор В это сложно поверить: 5 диких ритуалов древних племен, которые проводятся до сих пор

На одной планете с нами живут люди, далекие от современных забот

ТехИнсайдер
Хэви-метал и мода: рассказываем как менялся стиль, прикид и гламур тяжелой музыки на антигламурных примерах Хэви-метал и мода: рассказываем как менялся стиль, прикид и гламур тяжелой музыки на антигламурных примерах

Вряд ли металлистов можно назвать самыми стильными и модными

Maxim
7 фактов о загадочных, но величественных баобабах 7 фактов о загадочных, но величественных баобабах

Баобаб — настоящий супергерой среди растений!

ТехИнсайдер
Романская империя: что Роман Абрамович значит для футбола Романская империя: что Роман Абрамович значит для футбола

За что болельщики полюбили Абрамовича и что вообще миллиардер значит для футбола

Правила жизни

Четвертый сезон "Очень странных дел": братья Даффер не разочаровали.

Правила жизни
Лунная ванна: магический СПА-ритуал для каждого знака зодиака Лунная ванна: магический СПА-ритуал для каждого знака зодиака

Тебе не хватает энергии, или ты слишком раздражена? Прими лунную ванну!

VOICE
Что такое эйфория и можно ли ее вызвать Что такое эйфория и можно ли ее вызвать

Приливы счастья, от которых хочется взлететь, — вполне естественное явление

РБК
«Жена зависима от компьютерных игр и забывает о ребенке» «Жена зависима от компьютерных игр и забывает о ребенке»

Что делать, если у близкого человека игровая зависимость?

Psychologies
Орнитологи сфальсифицировали голосование галок за время вылета с ночевки Орнитологи сфальсифицировали голосование галок за время вылета с ночевки

Галки принимают решение покинуть место, основываясь на результатах голосования

N+1
Гляжусь в тебя, как в зеркало: 6 фильмов о клонировании Гляжусь в тебя, как в зеркало: 6 фильмов о клонировании

Как фильмы рассматривают проблему поведения клонов?

Правила жизни
«Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда «Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда

Балерина проводит отпуск в Турции в компании нового избранника

VOICE
Открыть в приложении