Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Раздражительность: что ее провоцирует и как бороться Раздражительность: что ее провоцирует и как бороться

Раздражение — это сигнал, призывающий к более внимательному отношению к себе

Psychologies
Даже не пытайся: 5 видов пирсинга, которые никогда не заживают Даже не пытайся: 5 видов пирсинга, которые никогда не заживают

Виды пирсинга, которые даже не стоит рассматривать для себя

Cosmopolitan
Мы оба «альфы»: как остановить конкуренцию с супругом Мы оба «альфы»: как остановить конкуренцию с супругом

Иногда в отношениях появляется соперничество. Почему и как этого избежать?

Psychologies
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Учимся у визажистов Крыгиной: макияж для нависшего века на каждый день Учимся у визажистов Крыгиной: макияж для нависшего века на каждый день

Как стоит краситься девушкам с нависшим веком. Скорее смотри!

VOICE
Палеогенетики подтвердили угорское происхождение венгров Палеогенетики подтвердили угорское происхождение венгров

Ученые выяснили, как был сформирован генофонд венгров

N+1
Как общаться с нарциссами: 5 подсказок Как общаться с нарциссами: 5 подсказок

Способы противостоять нарциссическим личностям

Psychologies
5 вопросов о сердце и стрессе 5 вопросов о сердце и стрессе

Можно ли предотвратить влияние стресса на организм? Отвечает эксперт

Здоровье
Небожители и чудовища: как представляли чужаков в корейских мифах Небожители и чудовища: как представляли чужаков в корейских мифах

«Фантазии о чужаках» — одна из характерных черт мифологических историй

Вокруг света
Цианобактерии полгода питали процессор энергией: биотехнологии в жизни Цианобактерии полгода питали процессор энергией: биотехнологии в жизни

Как работает энергия сине-зеленых водорослей?

ТехИнсайдер
Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы» Иосиф Бродский: «У меня нет ни философии, ни принципов… У меня есть только нервы»

Иосиф Бродский — о смысле жизни, добре и зле, вере и умении прощать

Psychologies
Управлять можно каждым: как правильно манипулировать знаками зодиака Управлять можно каждым: как правильно манипулировать знаками зодиака

Наш Магический шар решил раскрыть самый главный секрет каждого знака зодиака

VOICE
«Модерация в метавселенной — самая отвратительная работа в мире. Она вызывает стресс и подрывает психическое здоровье» «Модерация в метавселенной — самая отвратительная работа в мире. Она вызывает стресс и подрывает психическое здоровье»

Почему определить нарушителя в настоящем клубе проще, чем в виртуальном

VC.RU
Как менялся российский рубль и что на него можно было купить Как менялся российский рубль и что на него можно было купить

Старые вши, ефимки, русы, моржовки — чем только не расплачивались на Руси

Вокруг света
Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда

Отрывок из книги ​«Семь с половиной уроков о мозге» ​

Популярная механика
«Нет друзей, нет смысла, жизнь однообразна» «Нет друзей, нет смысла, жизнь однообразна»

Как начать принимать то, что у нас есть уже сейчас?

Psychologies
Какие средства по уходу за собой можно украсть у своей девушки? Какие средства по уходу за собой можно украсть у своей девушки?

Сколько якобы женских средств можно вполне использовать и мужчинам тоже

Maxim
Бесконечное число самых прекрасных форм. 10 внезапных фактов о разнообразии видов Бесконечное число самых прекрасных форм. 10 внезапных фактов о разнообразии видов

Неожиданные факты о биоразнообразии — в нашей подборке

N+1
Лучшие фильмы Ирана Лучшие фильмы Ирана

Разбираемся, что из себя представляет иранское кино

Maxim
Архитектура неспешного отдыха Архитектура неспешного отдыха

Пространство гостевого дома стало продолжением концепта архитектурного решения

SALON-Interior
Миллиарды на интернет-маркетинге: история агентства «Риалвеб», пережившего четыре кризиса Миллиарды на интернет-маркетинге: история агентства «Риалвеб», пережившего четыре кризиса

«Риалвеб» — как убедить основателей в том, что им нужны инвестиции

Inc.
Личинки одиночных ос съели собственных братьев и сестер Личинки одиночных ос съели собственных братьев и сестер

Как личинки одиночных ос решили проблему нехватки пищи в гнезде

N+1
Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров

Какие автомобили пользуются популярностью у россиян даже во время обвала рынка

РБК
Самые странные авиакомпании мира Самые странные авиакомпании мира

Странные авиакомпании: их самолеты не взлетали, а стюардессы носили бикини

Maxim
Мэрилин Монро в черном и еще 6 необычных свадебных платьев звезд XX века Мэрилин Монро в черном и еще 6 необычных свадебных платьев звезд XX века

Вдохновляемся нетипичными свадебными луками

VOICE
Заметить вовремя Заметить вовремя

10 признаков начинающейся болезни Альцгеймера

Лиза
Кровавые узы: судьбы жен и детей великих диктаторов Кровавые узы: судьбы жен и детей великих диктаторов

Имена диктаторов XX века вошли в историю, но судьбы их близких остаются в тени

Вокруг света
Как выбрать материнскую плату для домашнего, офисного, игрового компьютера? Как выбрать материнскую плату для домашнего, офисного, игрового компьютера?

Материнская плата: размер, сокет и чипсет — как выбрать?

CHIP
Без резких движений: 7 опасных животных, которых можно встретить в походе Без резких движений: 7 опасных животных, которых можно встретить в походе

Порой встреча человека и зверя оказывается неизбежной

Вокруг света
Открыть в приложении