Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Верим в слово «спасибо» Верим в слово «спасибо»

Как научиться быть благодарным себе, окружающим и миру?

Psychologies
Николаевская Россия Николаевская Россия

Интервью с великим и прекрасным Николаем Усковым

GQ
Управлять можно каждым: как правильно манипулировать знаками зодиака Управлять можно каждым: как правильно манипулировать знаками зодиака

Наш Магический шар решил раскрыть самый главный секрет каждого знака зодиака

VOICE
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Кто изобрел тротил: эссенция разрушения Кто изобрел тротил: эссенция разрушения

Тротил считается официальным эквивалентом разрушительной силы взрывчатых веществ

ТехИнсайдер
Что могли позволить себе Цветаева и ее сын в СССР конца 30-х годов. Главы из нового романа Сергея Белякова «Парижские мальчики в сталинской Москве» Что могли позволить себе Цветаева и ее сын в СССР конца 30-х годов. Главы из нового романа Сергея Белякова «Парижские мальчики в сталинской Москве»

Роман о жизни семьи Цветаевой в предвоенной Москве и во время войны. Отрывок

СНОБ
А почему ее не хейтили? Эта звезда задолго до Ким надевала платье Мэрилин Монро А почему ее не хейтили? Эта звезда задолго до Ким надевала платье Мэрилин Монро

Прошедший Met Gala можно описать одной фразой: «Все обсуждали Ким»

VOICE
Моя ужасная мама: 10 худших матерей в истории человечества Моя ужасная мама: 10 худших матерей в истории человечества

В истории найдется немало матерей, чьи поступки ужаснут любого

Вокруг света
Дельфины узнали знакомых по вкусу мочи Дельфины узнали знакомых по вкусу мочи

Зоологи узнали, что афалины способны различать знакомых особей по вкусу их мочи

N+1
47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер 47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер

Вспоминаем их удивительную историю любви Алишера Усманова и Ирины Винер

VOICE
Не только чайник и тазик: 4 неожиданных способа помыться, если отключили горячую воду Не только чайник и тазик: 4 неожиданных способа помыться, если отключили горячую воду

Рассказываем, как мыть туды и сюды, если в кране нет воды

Maxim
Саша Стоун: «Мужчина — это гора» Саша Стоун: «Мужчина — это гора»

Саша Стоун об участии в шоу «Звезды в Африке» и отношениях с Валей Карнавал

ЖАРА Magazine
Старение замедлилось: английские ученые протестировали на мышах «средство для вечной молодости» Старение замедлилось: английские ученые протестировали на мышах «средство для вечной молодости»

Трансплантация кишечных микробов замедлила старение у пожилых грызунов

Вокруг света
«Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю «Где они все?» Ученые объяснили, почему инопланетяне до сих пор не прилетели на Землю

Астробиологи попытались разрешить парадокс Ферми

Вокруг света
Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой Высота сиденья, регулировка спинки и колёсики: как выбрать офисный стул домой

Выбираем эргономичный офисный стул

VC.RU
Что такое сверхбыстрая мода и чем она опасна Что такое сверхбыстрая мода и чем она опасна

Ultra fast fashion — что это за феномен и причем тут Shein?

РБК
Это вовсе не дружелюбие: 3 неожиданных причины, по которым собака виляет хвостом Это вовсе не дружелюбие: 3 неожиданных причины, по которым собака виляет хвостом

Какие сигналы подает собака, виляя хвостом?

Cosmopolitan
Верхом на реакторе: как в СССР разрабатывали секретный атомный самолет Верхом на реакторе: как в СССР разрабатывали секретный атомный самолет

Атомные самолеты были хороши всем, кроме гигантской радиации

ТехИнсайдер
Сильнее удовольствия. Как страх может круто изменить твою жизнь к лучшему Сильнее удовольствия. Как страх может круто изменить твою жизнь к лучшему

Можно ли заставить страхи работать на себя?

Лиза
Невидимый Бреттон-Вудс: почему мировая экономика нуждается в новых правилах Невидимый Бреттон-Вудс: почему мировая экономика нуждается в новых правилах

Неспособность регуляторов взять под контроль инфляцию становится проблемой

Forbes
Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда Мозг нужен не для мышления: 5 неожиданных фактов от профессора Гарварда

Отрывок из книги ​«Семь с половиной уроков о мозге» ​

Популярная механика
Как сбросить настройки Андроид до заводских Как сбросить настройки Андроид до заводских

Сбрасываем настройки андроида через меню, recovery и сервисный код

CHIP
Отсюда взошла Россия Отсюда взошла Россия

В Пскове молятся древним святыням и играют на коряге

Отдых в России
Как правильно восстанавливаться после травмы Как правильно восстанавливаться после травмы

Восстановление после травмы — своего рода искусство

ТехИнсайдер
Скелеты в шкафу: как и когда одежда выдает твою самооценку — разбор стилиста Скелеты в шкафу: как и когда одежда выдает твою самооценку — разбор стилиста

Можно ли по одному костюму определить, что о себе думает женщина?

VOICE
Почему был убит Александр II и как он мог спастись после покушения Почему был убит Александр II и как он мог спастись после покушения

От судьбы не уйдешь, даже если ты император

ТехИнсайдер
Физики поймали магноны за превращением в фононы Физики поймали магноны за превращением в фононы

Магноны превращаются в фононы за десятки наносекунд

N+1
10 знаменитых средневековых путешественников 10 знаменитых средневековых путешественников

История каждого средневекового путешественника — это приключенческий роман

Популярная механика
«Тело помнит все эмоции»: как работает методика хакоми «Тело помнит все эмоции»: как работает методика хакоми

Методика «хакоми» — как понять, кто я?

Psychologies
Открыть в приложении