Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Три очень красивые актрисы 90-х, карьеру которых испортил строптивый нрав Три очень красивые актрисы 90-х, карьеру которых испортил строптивый нрав

Из-за сложного характера об этих актрисах все забыли

VOICE
Большая перемена Большая перемена

Как понять, что именно нужно менять, насколько быстро, а главное, ради чего?

Psychologies
Парфюм в бокале: зачем бары сотрудничают с косметическими брендами Парфюм в бокале: зачем бары сотрудничают с косметическими брендами

Синтез парфюмерии и косметики в напитках — тренд в барных столица мира

Forbes
Открыто соединение, способное «включаться» под действием лазера Открыто соединение, способное «включаться» под действием лазера

Созданный фосфонат позволит точнее и безопаснее воздействовать на организм

Популярная механика
Пылевые вихри и восходящие ветра оказались ответственны за пылевую дымку на Марсе Пылевые вихри и восходящие ветра оказались ответственны за пылевую дымку на Марсе

Ветра поднимают пыль на Марсе

N+1
Не все дома Не все дома

Где безопасно хранить коллекции произведений искусства

Forbes
47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер 47 лет вместе и вдруг развод? История любви Алишера Усманова и Ирины Винер

Вспоминаем их удивительную историю любви Алишера Усманова и Ирины Винер

VOICE
Капкан ипотеки Капкан ипотеки

За что могут выселить из квартиры и как этого избежать

Лиза
8 способов продлить молодость 8 способов продлить молодость

Несколько простых советов, которые помогут тебе жить дольше

Лиза
Числа не от мира сего: о чем до сих пор спорят математики? Числа не от мира сего: о чем до сих пор спорят математики?

Споры о культурном значении математики переживают острую фазу

Вокруг света
Топ-10 видеорегистраторов 2022 года: рейтинг лучших моделей Топ-10 видеорегистраторов 2022 года: рейтинг лучших моделей

Если вы еще не купили видеорегистратор для автомобиля, самое время это сделать

CHIP
«Мне жалко его, очень жалко» «Мне жалко его, очень жалко»

Сергей Бодров-старший о своем сыне и своем новом фильме «Дышите свободно»

Weekend
Монеты с места кораблекрушения XV века рассказали о денежных проблемах датского короля Монеты с места кораблекрушения XV века рассказали о денежных проблемах датского короля

Деньги были найдены среди обломков корабля «Грипсхунден»

N+1
Черное дело Черное дело

Традиционное – не значит устаревшее, считают Елена и Олег Малышевы

Вокруг света
Летописец богемного андерграунда, поймавший в кадре дух свободы и перемен: жизнь и творчество классика фотографии Сергея Борисова Летописец богемного андерграунда, поймавший в кадре дух свободы и перемен: жизнь и творчество классика фотографии Сергея Борисова

Сменив десяток профессий, Сергей Борисов пришел к фотографии

Правила жизни
Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе Сложнее, чем кажется: ученые раскрыли ранее неизвестный язык шимпанзе

Крики приматов помогут понять, как формировался человеческий язык

Вокруг света
5 современных методов лечения рака: на что надеяться в 2020-е годы 5 современных методов лечения рака: на что надеяться в 2020-е годы

Способы лечить и останавливать развитие онкологических заболеваний

Psychologies
Проще, чем кажется. Очистка стиральной машины от грязи и запаха Проще, чем кажется. Очистка стиральной машины от грязи и запаха

Белье после стирки уже не становится таким чистым и пахнет не так, как раньше?

Лиза
«Добрый дядя»: история «вампира» Фрица Хаармана, делавшего пирожки из детей «Добрый дядя»: история «вампира» Фрица Хаармана, делавшего пирожки из детей

«Ганноверский вампир», «немецкий Дракула» — так называли этого человека

VOICE
Вопрос психологу: я узнала, что у мужа есть другая женщина. Как себя вести? Вопрос психологу: я узнала, что у мужа есть другая женщина. Как себя вести?

Стоит ли что-то предпринимать, если муж вам изменяет?

VOICE
Вернуть свою жизнь: как перестать зависеть от капризов пожилых родителей Вернуть свою жизнь: как перестать зависеть от капризов пожилых родителей

Если вы в свои 40+ подчинены воле родителей, то у нас для вас плохие новости

Psychologies
«Теория сексуальной экономики»: почему одних женщин раздражает откровенная одежда на других «Теория сексуальной экономики»: почему одних женщин раздражает откровенная одежда на других

Как и почему срабатывает внутриполовая конкуренция?

Psychologies
Всемирный фарватер Всемирный фарватер

Как люди путешествовали, когда не было авиасообщения

Вокруг света
Красотки в законе: модели, которые породнились с президентскими кланами Красотки в законе: модели, которые породнились с президентскими кланами

Кто из моделей одерживал победу над сердцами президентов?

VOICE
Действующий персонаж: как зарабатывать на героях метавселенной Действующий персонаж: как зарабатывать на героях метавселенной

Основатель Superplastic Пол Будниц создает персонажей в метавселенной

Forbes
Человек, который боялся воды: путешествия Тура Хейердала Человек, который боялся воды: путешествия Тура Хейердала

Когда Тур Хейердал вышел в море под парусом «Кон-Тики», ему предрекали фиаско

Вокруг света
Кто виноват и что делать: мужское бесплодие и как его определить Кто виноват и что делать: мужское бесплодие и как его определить

Можно ли что-то сделать, если бесплоден мужчина?

VOICE
10 незабываемых фильмов, которые нужно посмотреть вместе с любимым 10 незабываемых фильмов, которые нужно посмотреть вместе с любимым

Какие фильмы можно посмотреть вместе с парнем? Мы подскажем

VOICE
Остановить мгновенье Остановить мгновенье

Самые эффективные ингредиенты на страже красоты

Robb Report
Открыть в приложении