Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров Топ-10 самых популярных авто в России. Реальные цены и наличие у дилеров

Какие автомобили пользуются популярностью у россиян даже во время обвала рынка

РБК
Обед во дворце: 7 продуктов, которые Елизавета II запретила есть своей семье Обед во дворце: 7 продуктов, которые Елизавета II запретила есть своей семье

Принадлежность к королевской семье – это масса ограничений

Cosmopolitan
Идеальный источник белка: карри с тунцом по рецепту мальдивского повара Идеальный источник белка: карри с тунцом по рецепту мальдивского повара

Диетологи прославили тунца за то, что его мясо — идеальный источник белка

Вокруг света
Где лечиться? Где лечиться?

В какую поликлинику идти – государственную или частную

Домашний Очаг
7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах! 7 фактов об автомобилях, которые стыдно не знать даже начинающему водителю. Проверим, разбираетесь ли вы в машинах!

5 вещей об автомобилях, которые должен знать даже «чайник»

ТехИнсайдер
История одной вещи: авоська, которая всюду сопровождала советского гражданина История одной вещи: авоська, которая всюду сопровождала советского гражданина

Как сумка-сетка появилась в СССР и откуда взялось само слово «авоська»

Правила жизни
Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов Сказка для взрослых, тайный книжный клуб и новая жизнь пчел: 5 воодушевляющих романов

Книги о том, как люди преодолевают любые невзгоды

СНОБ
Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан Без антибиотиков, по древнему рецепту монахов: как и где делают настоящий пармезан

Как в Эмилия-Романье варят пармиджано-реджано по древнему рецепту монахов

Вокруг света
С двух на четыре. Самые крутые машины с моторами от мотоциклов С двух на четыре. Самые крутые машины с моторами от мотоциклов

Какие автомобили оснащались двигателями от мотоциклов и что из этого получалось

РБК
Как мужчине одеваться после сорока, чтобы не выглядеть нелепо Как мужчине одеваться после сорока, чтобы не выглядеть нелепо

С возрастом кое-какие элементы гардероба следует менять и обновлять

Maxim
Киста яичника: признаки, лечение и последствия Киста яичника: признаки, лечение и последствия

Что такое киста яичника, может ли она пройти сама и как ее лечить?

VOICE
«Кэнди»: бенефис Джессики Бил в роли хладнокровной убийцы «Кэнди»: бенефис Джессики Бил в роли хладнокровной убийцы

«Кэнди» — сериал о том, как Кэндис Монтгомери хладнокровно убила свою подругу

Forbes
«Нет друзей, нет смысла, жизнь однообразна» «Нет друзей, нет смысла, жизнь однообразна»

Как начать принимать то, что у нас есть уже сейчас?

Psychologies
«Неплодородная почва»: как бесплодие стало поводом для стигматизации женщин «Неплодородная почва»: как бесплодие стало поводом для стигматизации женщин

Как на протяжении столетий женщины подвергались стигматизации из-за бесплодия

Forbes
Забудь про Фрейда: что означают самые распространенные эротические сны Забудь про Фрейда: что означают самые распространенные эротические сны

Приснился бывший? Уверяем, это совсем не повод ему звонить!

VOICE
Отказ от алкоголя: как бросить раз и навсегда Отказ от алкоголя: как бросить раз и навсегда

Даже если вы выпиваете понемногу, это все равно может превратиться в проблему

Psychologies
«Не принимаю себя как женщину: не хочу быть нежной и нравиться мужчинам» «Не принимаю себя как женщину: не хочу быть нежной и нравиться мужчинам»

Что делать, если вы не принимаете себя?

Psychologies
Мальчик продал свою коллекцию карточек Pokémon, чтобы оплатить лечение своей собаки Мальчик продал свою коллекцию карточек Pokémon, чтобы оплатить лечение своей собаки

Трогательная история, что любовь может победить любые трудности

ТехИнсайдер
Ничего лишнего Ничего лишнего

Маруся Фомина — о характере и профессии актрисы

OK!
Коллективная победа Коллективная победа

Как заработать деньги на спортивном сообществе?

Forbes Life
Настоящие гиганты: 5 самых больших динозавров, когда-либо существовавших на Земле Настоящие гиганты: 5 самых больших динозавров, когда-либо существовавших на Земле

Некоторые динозавры могли бы заглядывать в окна 9-этажного дома.

ТехИнсайдер
Разложи по полочкам Разложи по полочкам

Сколько денег тебе сэкономит порядок в холодильнике

Лиза
Игорь Манн Игорь Манн

Как Игорь Манн ищет (и находит!) точки роста в кризисные времена?

Собака.ru
10 интересных фактов об Анне Павловой 10 интересных фактов об Анне Павловой

Мы собрали 10 фактов из жизни одной из самых известных балерин XX века

Культура.РФ
Что такое сверхбыстрая мода и чем она опасна Что такое сверхбыстрая мода и чем она опасна

Ultra fast fashion — что это за феномен и причем тут Shein?

РБК
Беспилотники в тяжелой промышленности: цифровые решения по видеоаналитике «Норникеля» Беспилотники в тяжелой промышленности: цифровые решения по видеоаналитике «Норникеля»

Как летающий аппарат с датчиками и камерами используется в строительстве

ТехИнсайдер
Примитивный птерозавр оказался двумя видами птерозавроморфов Примитивный птерозавр оказался двумя видами птерозавроморфов

Птерозавроморфы обитали на территории Бразилии 225 миллионов лет назад

N+1
Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце Это надо увидеть: 10 великих фильмов о любви, которые растопят ваше сердце

Трогательные, иногда трагические, порой смешны фильмы о любви

VOICE
Ископаемые биомолекулы указали на теплокровность тираннозавра Ископаемые биомолекулы указали на теплокровность тираннозавра

Общий предок динозавров был теплокровным

N+1
Открыть в приложении