Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
«Холодная американская машина»: кто пострадает от банкротства «дочки» Google в России «Холодная американская машина»: кто пострадает от банкротства «дочки» Google в России

Российская «дочка» Google решила начать процедуру банкротства

Forbes
Физики получили поляритоны из волн материи Физики получили поляритоны из волн материи

Физики изучили поведение поляритонов на основе волн материи

N+1
«Дочь приняла решение о разводе на эмоциях — как ее отговорить?» «Дочь приняла решение о разводе на эмоциях — как ее отговорить?»

Как вести себя, если ваша дочь вдруг решилась на развод?

Psychologies
9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте) 9 советов, как лучше запоминать новую информацию (это полезно в любом возрасте)

Учиться никогда не поздно, но как делать это эффективно

Playboy
Следы на воде Следы на воде

Проекты верфей, которым не помешал карантин

Robb Report
Памяти Энди Флетчера: кем на самом деле был тихоня из Depeche Mode Памяти Энди Флетчера: кем на самом деле был тихоня из Depeche Mode

Клавишник легендарной группы Depeche Mode скончался 26 мая

Maxim
Изменщики! Все скандалы, связанные с неверностью членов королевской семьи Изменщики! Все скандалы, связанные с неверностью членов королевской семьи

И члены королевской семьи изменяют

VOICE
20 признаков коренного москвича 20 признаков коренного москвича

Как узнать коренного москвича?

Maxim
Бегство в себя: причины и опасности внутренней эмиграции Бегство в себя: причины и опасности внутренней эмиграции

Полезна или губительна внутренняя эмиграция?

Psychologies
10 самых перспективных альтернативных источников энергии для экологичного будущего 10 самых перспективных альтернативных источников энергии для экологичного будущего

Перспективы использования альтернативных источников энергии

ТехИнсайдер
Пока ты спал: ученые разгадали механизм обработки эмоций во сне Пока ты спал: ученые разгадали механизм обработки эмоций во сне

Открытие, которое поможет людям с бессонницей и психологическими травмами

Вокруг света
Три любви Иосифа Кобзона: истории с трагическим и счастливым концом Три любви Иосифа Кобзона: истории с трагическим и счастливым концом

Первые два брака Иосифа Кобзона не принесли счастья ни ему, ни его женам

VOICE
Поступки, которые нам кажутся умными, но на самом деле совсем нет Поступки, которые нам кажутся умными, но на самом деле совсем нет

Рано или поздно почти всем нам приходят в голову эти идеи

Maxim
Оборотная сторона стресса Оборотная сторона стресса

Наша жизнь – сплошной стресс и от него все беды. Но так ли это?

Лиза
Синтез пептида прошел на двух цепях РНК без участия рибосомы Синтез пептида прошел на двух цепях РНК без участия рибосомы

Как мог проходить синтез пептидов до возникновения жизни на Земле

N+1
Как сделать расклад Таро на любовь? Самая полная инструкция Как сделать расклад Таро на любовь? Самая полная инструкция

Написали инструкцию по самому интересному раскладу таро — на любовь!

VOICE
Выйти из треугольника драмы: как начать конструктивный диалог в критической ситуации Выйти из треугольника драмы: как начать конструктивный диалог в критической ситуации

Как выйти из ситуации, если вы оказались в одной из ролей треугольника Карпмана

Forbes
Как превратить обычный M.2 SSD во внешний накопитель: наш опыт Как превратить обычный M.2 SSD во внешний накопитель: наш опыт

Как с минимальными затратами превратить обычный M.2 SSD во внешний накопитель?

CHIP
Личинки одиночных ос съели собственных братьев и сестер Личинки одиночных ос съели собственных братьев и сестер

Как личинки одиночных ос решили проблему нехватки пищи в гнезде

N+1
15 секс-привычек интеллектуалов 15 секс-привычек интеллектуалов

Что выдаст в тебе секс-интеллектуала?

Maxim
Эти загадочные черные грибы породила чернобыльская радиация Эти загадочные черные грибы породила чернобыльская радиация

Жизнь способна даже смертоносную радиацию использовать на благо новых существ

ТехИнсайдер
Все дуэли Пушкина: сколько раз на самом деле стреляли во вспыльчивого Александра Сергеевича? Все дуэли Пушкина: сколько раз на самом деле стреляли во вспыльчивого Александра Сергеевича?

Взглянув на список дуэлей, можно увидеть, что редкий год Пушкина был без нее

ТехИнсайдер
Режиссер Яна Гладких о сериале Amore more Режиссер Яна Гладких о сериале Amore more

О консерватизме русской публики и поиске того, что делает человека счастливым

СНОБ
Мария Бразговская: «Мечта должна заставлять сердце петь» Мария Бразговская: «Мечта должна заставлять сердце петь»

О процессах мышления, человеческой воли и том, как правильно идти к своей мечте

VOICE
Как выбрать материнскую плату для домашнего, офисного, игрового компьютера? Как выбрать материнскую плату для домашнего, офисного, игрового компьютера?

Материнская плата: размер, сокет и чипсет — как выбрать?

CHIP
Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко» Чтение выходного дня: Ивлин Во документирует тридцатые годы в книге «Когда шагалось нам легко»

«Когда нам шагалось легко»: путевые заметки Ивлина Во 1929-1935 годов

Правила жизни
Бросила его по почте: кем был первый муж Меган Маркл и что с ним стало теперь Бросила его по почте: кем был первый муж Меган Маркл и что с ним стало теперь

Меган Маркл сказала да и обещала быть с ним. Нет, речь не о принце Гарри

VOICE
«Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда «Мой мужчина по-русски не говорит»: Волочкова раскрыла секреты бойфренда

Балерина проводит отпуск в Турции в компании нового избранника

VOICE
10 рабочих советов, как скинуть вес, от людей, которым удалось победить ожирение 10 рабочих советов, как скинуть вес, от людей, которым удалось победить ожирение

Только проверенные жизнью советы по похудению от реальных людей

Maxim
Открыть в приложении