Самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах

Популярная механикаHi-Tech

Накликали беду: как правильно применять AI в работе с небольшим количеством данных

Когда люди слышат словосочетание «искусственный интеллект», многие представляют большие массивы данных. В этом есть смысл – самые известные AI-модели, такие как GPT-3, обучены на гигантских датасетах. Тем не менее, большинство методов обучения моделей страдают от так называемого “data hunger”, когда модели требуются десятки и сотни тысяч примеров для обучения, а также от чрезмерно высоких ресурсных затрат. Тем не менее, чаще всего данных в наличии у компаний сравнительно мало. Это может быть связано с политикой сбора данных, отсутствием единых правил хранения. А еще стоимостью разметки, так как для подготовки использования данных в AI-системе часто необходимо привлекать квалифицированных специалистов.

Рассмотрим один из популярных на сегодняшний день кейсов – основанную на AI проверку договоров (Kira Systems, Embedica). Предположим, что вы решили сделать аналогичную систему внутри компании, для этого вам потребуется множество договоров с правками юристов, чтобы обучить модель. Если с самими текстами проблем не будет, то получить размеченные данные окажется довольно сложно – к процессу нужно будет подключить целый штат специалистов. И даже спустя несколько месяцев дорогостоящей работы у вас будет всего несколько тысяч размеченных документов. А это никак нельзя назвать большими данными.

Чтобы подобные системы работали, компаниям нужно научиться строить AI-решения с данными из «наличия». 

Проблема малых данных в AI

Чтобы изучить новый материал, человеку не нужны сотни тысяч примеров, достаточно прочитать пару статей. Почему же ИИ так не может? 

В действительности человеческий мозг не обучается на маленьком объеме данных. Подумайте, ведь мы с рождения потребляем непрерывный поток информации через все органы чувств и только спустя несколько месяцев такого обучения начинаем говорить, различать объекты и людей, и то не всегда правильно. К моменту взросления нам уже не требуется много данных, чтобы решать простейшие задачи по распознаванию лиц друзей или чтению нового материала. Что касается юристов, с которых мы начинали, то даже профессионал своего дела за многолетнюю практику исследует тысячи, а не сотни тысяч договоров. Но ему это и не нужно, ведь он знает главное – язык. Так можно ли строить ИИ-системы, основываясь на том же принципе? 

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа? Как ученые отправляют послания иным цивилизациям и сколько нам ждать ответа?

METI — попытки передачи межзвездных посланий

Популярная механика
Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику? Что делать, если у вас с девушкой или даже женой противоположные взгляды на политику?

Как уживаться вместе, если ваши политические взгляды не совпадают?

Maxim
Искусство путешествовать Искусство путешествовать

Узнайте, как получить максимум от вашего следующего путешествия

kiozk originals
Жених не узнает: невесты до и после свадебного макияжа (новые фото) Жених не узнает: невесты до и после свадебного макияжа (новые фото)

Удивительные фото невест до и после свадебного макияжа

VOICE
Сила воли: что мешает нам добиваться цели Сила воли: что мешает нам добиваться цели

Проблема отсутствия силы воли – в образе жизни, который ее ослабляет

Psychologies
Легенды кухонь народов мира: 5 классических греческих блюд Легенды кухонь народов мира: 5 классических греческих блюд

Пусть Греция материализуется на вашей кухне!

Вокруг света
Военный Hummer: подборка интересных фактов о знаменитом армейском джипе Военный Hummer: подборка интересных фактов о знаменитом армейском джипе

В прошлом Hummer удалось положить на лопатки Lamborghini

ТехИнсайдер
Конаковская ГРЭС: титан советской энергетики Конаковская ГРЭС: титан советской энергетики

Конаковская ГРЭС издали выглядит как большой трехмачтовый корабль

Популярная механика
Ирина Млодик: «Игнорирование — самое жестокое наказание для ребенка» Ирина Млодик: «Игнорирование — самое жестокое наказание для ребенка»

В чем разница между наказанием и унижением

Psychologies
Пирамида Маслоу Пирамида Маслоу

Как понимание основных потребностей поможет добиться успеха

Лиза
Встать и идти Встать и идти

Как понять, куда и для чего двигаться?

Psychologies
Гиперэкстензия: как правильно выполнять упражнение на тренажерах и дома Гиперэкстензия: как правильно выполнять упражнение на тренажерах и дома

Что такое гиперэкстензия и почему она необходима при сидячем образе жизни?

РБК
Цианобактерии полгода питали процессор энергией: биотехнологии в жизни Цианобактерии полгода питали процессор энергией: биотехнологии в жизни

Как работает энергия сине-зеленых водорослей?

ТехИнсайдер
Опра Уинфри: трагическая и невероятная история главной женщины Америки Опра Уинфри: трагическая и невероятная история главной женщины Америки

Если вы заглянете в прошлое Опры, у вас перехватит дыхание

VOICE
Что посмотреть в Калужской области: маршрут на выходные для любителей истории и мистики Что посмотреть в Калужской области: маршрут на выходные для любителей истории и мистики

Калужская область — что посмотреть в «столице» русского старообрядчества

Вокруг света
Вода Сасси: все о легендарном напитке для похудения Вода Сасси: все о легендарном напитке для похудения

Может ли вода Сасси помочь избавиться от лишних килограммов?

РБК
Борьба с самим собой. В прокат выходит «Клон» — хит фестиваля «Санденс» Борьба с самим собой. В прокат выходит «Клон» — хит фестиваля «Санденс»

«Клон» — триллер о ненависти к самому себе

СНОБ
От жимолости до гортензии От жимолости до гортензии

8 декоративных кустарников, которые хорошо растут в тени

Лиза
Как настроить фары автомобиля без помощи автосервиса Как настроить фары автомобиля без помощи автосервиса

Как правильно отрегулировать фары автомобиля?

ТехИнсайдер
Чай, хлопья и хлеб из гречихи Чай, хлопья и хлеб из гречихи

Гречневые чай, хлопья и хлеб могут внести разнообразие в привычную еду

Наука и жизнь
«Императоры приходят к власти с помощью женщин и ядов». Отрывок из книги о том, как и почему убивали римляне «Императоры приходят к власти с помощью женщин и ядов». Отрывок из книги о том, как и почему убивали римляне

Отрывок из книги «Пришел, увидел и убил. Как и почему римляне убивали»

СНОБ
Физики намагнитили гелиевый газ с помощью света Физики намагнитили гелиевый газ с помощью света

Физики навели наносекундную намагниченность на газ атомов гелия с помощью света

N+1
«Боюсь, что парень пользуется мной, чтобы забыть другую девушку» «Боюсь, что парень пользуется мной, чтобы забыть другую девушку»

Как справиться с тревогой в начале новых отношений?

Psychologies
Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов Португальский «Шиндлер»: история дипломата, который ценой карьеры спас тысячи человек от нацистов

Португальский консул Аристидеш де Соуза Мендеш оказался перед непростым выбором

Вокруг света
Почему в зеркале мы выглядим красивее, чем на фото, и чему надо верить Почему в зеркале мы выглядим красивее, чем на фото, и чему надо верить

Ты когда-нибудь смотрела на фотографию с мыслями: «Какой ужас! Неужели это я?!»

VOICE
10 знаменитых средневековых путешественников 10 знаменитых средневековых путешественников

История каждого средневекового путешественника — это приключенческий роман

Популярная механика
Дело Эрлиха — Альтера Дело Эрлиха — Альтера

80 лет назад в Советском Союзе создали Еврейский антифашистский комитет

Дилетант
Светлана Жарова. Мой дядя Миша Светлана Жарова. Мой дядя Миша

О дяде Мише ходили слухи, что он бабник и пьяница — неправда!

Коллекция. Караван историй
Кризис 30 лет: как повзрослеть, не теряя себя Кризис 30 лет: как повзрослеть, не теряя себя

Как справиться с резкой сменой жизненных ориентиров?

Psychologies
От Деппа до Ефремова: как одеваются в суде и на что это влияет От Деппа до Ефремова: как одеваются в суде и на что это влияет

Рассказываем, что какие основания стоят за судебной модой

РБК
Открыть в приложении