Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа Актеры-фронтовики СССР: через что прошли любимцы публики, прежде чем стали кумирами народа

Они сражались не ради славы и оваций, а за то, что любили — за Родину!

ТехИнсайдер
Какое произведение толстого было самым популярным при жизни писателя? Какое произведение толстого было самым популярным при жизни писателя?

Главное произведение Толстого отнюдь не «Война и мир» или «Анна Каренина»

Культура.РФ
Режиссер Блерта Башолли о кино в Косово, попадании на «Оскар» и победе на «Сандэнсе» Режиссер Блерта Башолли о кино в Косово, попадании на «Оскар» и победе на «Сандэнсе»

Режиссер Блерта Башолли — возможностях для женщин-режиссеров в Косово

Forbes
Криптобудущее Криптобудущее

Жизненный цикл цивилизаций и наступающая эпоха свободы

Популярная механика
Это вовсе не дружелюбие: 3 неожиданных причины, по которым собака виляет хвостом Это вовсе не дружелюбие: 3 неожиданных причины, по которым собака виляет хвостом

Какие сигналы подает собака, виляя хвостом?

Cosmopolitan
Никогда не говори «Не могу». Две недели в детском хосписе Никогда не говори «Не могу». Две недели в детском хосписе

Как детский хоспис может изменить человека

СНОБ
Как общаться с нарциссами: 5 подсказок Как общаться с нарциссами: 5 подсказок

Способы противостоять нарциссическим личностям

Psychologies
Амазонские дельфины поиграли с анакондой и случайно убили ее Амазонские дельфины поиграли с анакондой и случайно убили ее

Необычный случай произошел на одной из боливийских рек

N+1
Почему у нас возникают «спорные» сексуальные фантазии и что с ними делать Почему у нас возникают «спорные» сексуальные фантазии и что с ними делать

Как связаны удовольствие и здоровье, зачем женщине игрушки?

VOICE
Как продлить жизнь покрышкам: 5 простых советов, которые реально работают Как продлить жизнь покрышкам: 5 простых советов, которые реально работают

Как действовать, чтобы покрышки прослужили дольше

Вокруг света
Древних китайцев заподозрили в крупномасштабном производстве киновари Древних китайцев заподозрили в крупномасштабном производстве киновари

Ученые исследовали материалы из гробниц времен династии Шан

N+1
Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан

Как в Эмилия-Романье варят пармиджано-реджано по древнему рецепту монахов

Вокруг света
Материнский и отцовский комплекс: как они влияют на нас Материнский и отцовский комплекс: как они влияют на нас

Мы часто не понимаем, откуда берется наше мнение. Давайте разберемся!

Psychologies
Изменщики! Все скандалы, связанные с неверностью членов королевской семьи Изменщики! Все скандалы, связанные с неверностью членов королевской семьи

И члены королевской семьи изменяют

VOICE
Как перестать заедать стресс? Как перестать заедать стресс?

Заедать стресс абсолютно естественно для людей. Но как перестать?

Maxim
Бесчеловечный сервис Бесчеловечный сервис

Роботы в гостиницах — за и против

СНОБ
Репортаж из патруля ГИБДД: погоня, поиск пьяных и психологические трюки Репортаж из патруля ГИБДД: погоня, поиск пьяных и психологические трюки

Как проходит Ночное дежурство у патруля ГИБДД

РБК
Жених не узнает: невесты до и после свадебного макияжа (новые фото) Жених не узнает: невесты до и после свадебного макияжа (новые фото)

Удивительные фото невест до и после свадебного макияжа

VOICE
50 – это новые 30? 50 – это новые 30?

За последние десятилетия возрастные рамки «раздвинулись» – старение отодвинулось

Лиза
Лидары помогли обнаружить в Амазонии сеть древних поселений и остатки крупных пирамид Лидары помогли обнаружить в Амазонии сеть древних поселений и остатки крупных пирамид

Археологи исследовали памятники культуры Касарабе 500–1400 годов

N+1
Лучшие настолки: самые интересные настольные игры для маленькой и большой компании Лучшие настолки: самые интересные настольные игры для маленькой и большой компании

Как не утонуть среди ярких коробок и выбрать самую лучшую и увлекательную игру?

ТехИнсайдер
Коуч-2022: выбор цели Коуч-2022: выбор цели

Как коучинг помогает собирать и развивать сильные команды

СНОБ
Без резких движений: 7 опасных животных, которых можно встретить в походе Без резких движений: 7 опасных животных, которых можно встретить в походе

Порой встреча человека и зверя оказывается неизбежной

Вокруг света
Что случилось с детьми-актерами из советского фильма «Приключения Буратино» Что случилось с детьми-актерами из советского фильма «Приключения Буратино»

Что стало с актерами-детьми из любимого многими «Приключения Буратино»

Maxim
Сохраняем спокойствие в условиях внешнего кризиса: чем компаниям помогут специалисты-психологи Сохраняем спокойствие в условиях внешнего кризиса: чем компаниям помогут специалисты-психологи

Как российские компании прибегают к помощи внешних и штатных психологов

Inc.
Одна вокруг света: автополомка в джунглях и открытие границ Одна вокруг света: автополомка в джунглях и открытие границ

171-я серия о кругосветном путешествии москвички Ирины Сидоренко

Forbes
«Будь сильным как лев». Как научить детей противостоять буллингу «Будь сильным как лев». Как научить детей противостоять буллингу

Как учить детей вести себя в конфликтных ситуациях — отрывок из книги

СНОБ
Как эффективно использовать моменты, когда ничего не хочется делать Как эффективно использовать моменты, когда ничего не хочется делать

Как вести себя, чтобы зарядиться энергией

Psychologies
Ставим на паузу: как перерыв в ссоре помогает сохранить любовь Ставим на паузу: как перерыв в ссоре помогает сохранить любовь

момент возникновения конфликта многие склонны усугублять его, а не решать

Psychologies
Открыть в приложении