Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Спорносексуал: новый вид мужчин? Спорносексуал: новый вид мужчин?

Спорносексуалы — новые нарциссы или сторонники здоровой жизни без компромиссов?

Psychologies
Ламинирование желатином и кое-что еще: топ-альтернатив салонным процедурам Ламинирование желатином и кое-что еще: топ-альтернатив салонным процедурам

Классные домашние методы, которые смогут заменить салонные процедуры

Cosmopolitan
Малина круглый год Малина круглый год

«Юнионпарк» построил тепличный комплекс для выращивания ягоды за 400 млн руб.

Агроинвестор
9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте) 9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте)

Учиться никогда не поздно, но как делать это эффективно

Playboy
Новые Новые

Круизные лайнеры не гарантируют выживания пассажиров в кораблекрушении

ТехИнсайдер
Старые авто в состоянии новых. Как купить классическую машину без пробега Старые авто в состоянии новых. Как купить классическую машину без пробега

Автопроизводители взяли моду «допечатывать» тиражи старых машин

РБК
Химики превратили аммиак в аминокислоты Химики превратили аммиак в аминокислоты

Аминокислоты из диазосоединений получились с высокими выходами

N+1
Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе

Крики приматов помогут понять, как формировался человеческий язык

Вокруг света

Четвертый сезон "Очень странных дел": братья Даффер не разочаровали.

Правила жизни
Модный приговор: к чему может привести резкая смена образа? Модный приговор: к чему может привести резкая смена образа?

В чем опасность несоответствия имиджа и самого человека?

Psychologies
Что такое классы автомобилей: в чем их разница Что такое классы автомобилей: в чем их разница

Разбираемся, что такое классы авто, какие они бывают и нужно ли знать их все

РБК
Блокчейн-обменник Блокчейн-обменник

Как основатели Via Protocol запустили платежную систему для криптовалюты

Forbes
Джонни Депп и Кейт Мосс: что заставило расстаться самую скандальную пару 90-х Джонни Депп и Кейт Мосс: что заставило расстаться самую скандальную пару 90-х

Почему распалась самая эпатажная звездная пара конца XX века

VOICE
5 самых глубоких озер мира: невиданные красоты природы 5 самых глубоких озер мира: невиданные красоты природы

Глубочайшие озера, которые будоражат воображение

ТехИнсайдер
Точки матери: как наладить отношения с мамой Точки матери: как наладить отношения с мамой

Почему важно принять в себе материнскую часть и наладить с ней связь

Psychologies
Гонки на Гонки на

Представляем вашему вниманию пять самых безумных автомобильных гонок в мире!

Популярная механика
Не только ценный мех: в России впервые в мире создали трехпородного кролика Не только ценный мех: в России впервые в мире создали трехпородного кролика

Первый в мире трехпородный кролик по имени Родник

Вокруг света
Почему искусственный интеллект обыгрывает всех в Dota, но пока не выживет в реальном мире Почему искусственный интеллект обыгрывает всех в Dota, но пока не выживет в реальном мире

Почему машины быстро эволюционируют в виртуальном, а не в реальном мире?

ТехИнсайдер
Кто вами пользуется? Кто вами пользуется?

Почему иногда вы чувствуете, что кто-то или что-то истощает вашу энергию?

Psychologies
Среди благовоний времен династии Тан оказались ладан и алойное дерево Среди благовоний времен династии Тан оказались ладан и алойное дерево

Китайские ученые исследовали образцы, обнаруженные в храме Фамэнь

N+1
Страсти Леонида Ильича Брежнева: без чего генсек не представлял жизни Страсти Леонида Ильича Брежнева: без чего генсек не представлял жизни

Брежнев любил домино и обожал женщин

ТехИнсайдер
История стандарта 90-60-90: почему те, кто его придумал, не любили женщин История стандарта 90-60-90: почему те, кто его придумал, не любили женщин

Почему 90-60-90 считается «золотым» стандартом женской красоты

VOICE
Токсичность Илона Маска, атака сверчков и визиты спецслужб: как создавался SpaceX Токсичность Илона Маска, атака сверчков и визиты спецслужб: как создавался SpaceX

Отрывок из книги «Старт: история успеха SpaceX. Илон Маск и команда»

Forbes
Полная гармония Полная гармония

Знать гормональный профиль так же важно, как и следить за весом и давлением

Лиза
Как «Евгения Онегина» читали современники Пушкина. Отрывок из книги проекта «Полка» Как «Евгения Онегина» читали современники Пушкина. Отрывок из книги проекта «Полка»

Отрывок из книги «Полка: О главных книгах русской литературы»

СНОБ
Как работают роботы, устраняющие последствия аварии в Чернобыле Как работают роботы, устраняющие последствия аварии в Чернобыле

Использование роботов при ликвидации последствий катастрофы на Чернобыльской АЭС

ТехИнсайдер
Как люди жили до изобретения электричества: не принимайте его как должное Как люди жили до изобретения электричества: не принимайте его как должное

Как люди жили без электрического освещения и холодильников?

Популярная механика
Эти автомобили провалились, потому что опередили свое время Эти автомобили провалились, потому что опередили свое время

Преждевременный выход на рынок загубил эти автомобили

ТехИнсайдер
Романская империя: что Роман Абрамович значит для футбола Романская империя: что Роман Абрамович значит для футбола

За что болельщики полюбили Абрамовича и что вообще миллиардер значит для футбола

Правила жизни
Открыть в приложении