Компания OpenAI представила мультимодальную генеративную модель GPT-4o

N+1Hi-Tech

OpenAI представила мультимодальную генеративную модель GPT-4o

Она умеет разговаривать, видеть, и имитирует эмоции

Андрей Фокин

0feba817682cb3557f5dd3b9a38f3ae7.jpg
OpenAI / YouTube

Компания OpenAI представила мультимодальную генеративную модель GPT-4o, которая может работать с текстом, аудио и изображениями, включая видео. Модель может общаться с пользователем голосом и поддерживает 50 языков. Она может имитировать различные интонации, шепот, пение, смех. При этом модель работает гораздо быстрее предшествующей версии — время задержки ответа в голосовом режиме составляет в среднем около 0,3 секунды, что сравнимо с временем реакции человека. Также модель может видеть, получая и интерпретируя изображение с камеры в реальном времени. Трансляция презентации велась на YouTube.

Первая генеративная языковая модель уровня GPT-4 была представлена компанией OpenAI в марте 2023 года. В отличие от более ранней версии GPT-3.5, которая могла работать только с текстовой информацией, GPT-4 впервые получила способность принимать в качестве входных данных также и изображения. Кроме этого, в том же году состоялся релиз приложения на основе чат-бота ChatGPT с возможностью распознавания речи и синтеза голоса, что позволяло пользователям разговаривать с моделью и использовать ее в роли голосового ассистента.

В понедельник 13 мая 2024 года во время прямой трансляции на YouTube состоялась презентация новой версии GPT-4, которая получила обозначение GPT-4o (символ «о» в конце означает «omni»). Теперь модель принимает в качестве входных данных любую комбинацию текста, звука и изображения, включая видео. При этом она работает гораздо быстрее своей предшественницы, в том числе и во время голосового общения. Генерация ответа происходит со средней задержкой всего лишь 320 миллисекунд, что сравнимо со временем реакции человека в разговоре.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Окислительное присоединение на палладии прошло по радикальному механизму Окислительное присоединение на палладии прошло по радикальному механизму

Представление о реакции окислительного присоединения на палладии было неполным

N+1
По капле крови По капле крови

Донорство крови: главные факты, которые важно знать

Лиза
Работа с умом: каков потенциал генеративного ИИ для роста производительности в России Работа с умом: каков потенциал генеративного ИИ для роста производительности в России

Ученые проанализировали влияние генеративного ИИ на задачи и профессии

Forbes
Каннский кинофестиваль–2024. Британская драма «Птица» с Барри Кеоганом и Францом Роговски Каннский кинофестиваль–2024. Британская драма «Птица» с Барри Кеоганом и Францом Роговски

На 77-м Каннском кинофестивале состоялась премьера фильма «Птица»

СНОБ
Эмоциональный интеллект Эмоциональный интеллект

Новое представление о том, что значит быть «умным»

kiozk originals
Готовы ли мы оказать помощь: за это отвечает определенный регион мозга, который нашли ученые Готовы ли мы оказать помощь: за это отвечает определенный регион мозга, который нашли ученые

Нейробиологи установили регион мозга, ответственный за помощь другим

ТехИнсайдер
«Трудные подростки»: создатели социального проекта вокруг сериала — о его влиянии на общество «Трудные подростки»: создатели социального проекта вокруг сериала — о его влиянии на общество

Создатели сериала «Трудные подростки» о проблемных тинейджерах и обществе

СНОБ
7 фраз, с помощью которых легко завести друзей в любом возрасте 7 фраз, с помощью которых легко завести друзей в любом возрасте

Друзей можно завести и в солидном возрасте: помогут эти фразы

Maxim
Верю – не верю Верю – не верю

7 мифов о вине, которые раздражают истинных ценителей популярного напитка

Лиза
Что вас ждет, если вы влюбились в пассивно-агрессивного человека Что вас ждет, если вы влюбились в пассивно-агрессивного человека

Что движет пассивным агрессором?

Psychologies
Путаница или логическая цепочка? По какому принципу распределены коды регионов на автономерах Путаница или логическая цепочка? По какому принципу распределены коды регионов на автономерах

Подробно разбираемся, как «раздавали» коды регионов для госномеров

ТехИнсайдер
Не только нейроны, но и астроциты мозга обрабатывают информацию Не только нейроны, но и астроциты мозга обрабатывают информацию

Открытие: астроциты могут накапливать информацию о событиях, как и нейроны

ТехИнсайдер
Всё что вам нужно знать об обновлённом Skoda Kodiaq Всё что вам нужно знать об обновлённом Skoda Kodiaq

Что изменилось в новом поколении Skoda Kodiaq?

4x4 Club
Зеркальце, перышко и пучок льна: как на Руси без врачей определяли наступление смерти Зеркальце, перышко и пучок льна: как на Руси без врачей определяли наступление смерти

Как и кто на Руси констатировал смерть в момент её наступления?

ТехИнсайдер
Как нейросети проваливаются в «долину разочарования» и почему это хорошо Как нейросети проваливаются в «долину разочарования» и почему это хорошо

Когда большие языковые модели займут уверенную позицию и достигнут пика?

Forbes
Максимальное уважение: почему японцы вместо рукопожатий предпочитают поклоны? Максимальное уважение: почему японцы вместо рукопожатий предпочитают поклоны?

Почему японцы так трепетно относятся к одзиги, поклонам?

ТехИнсайдер
Куракины Куракины

Княжеский род Куракиных был одним из самых знатных во всём Русском государстве

Дилетант
Восемь простых способов улучшить сон Восемь простых способов улучшить сон

Эти несложные действия помогут справиться с бессонницей и начать высыпаться

РБК
Любовный треугольник: можно ли любить одновременно двоих? Любовный треугольник: можно ли любить одновременно двоих?

Что такое любовь? Почему люди заводят романы на стороне?

Psychologies
Какие бывают огнетушители для автомобиля, какой лучше, и как его выбрать Какие бывают огнетушители для автомобиля, какой лучше, и как его выбрать

Все об автомобильных огнетушителях: выбор, требования ГИБДД, сравнение

РБК
5 «вредных» напитков, которые полезны для здоровья 5 «вредных» напитков, которые полезны для здоровья

Соки, кофе и какао — чем полезны эти «вредные» напитки?

ТехИнсайдер
Победители Каннского кинофестиваля — 2024 Победители Каннского кинофестиваля — 2024

Фильм про стриптизёршу и иранские протесты: Канны 2024

СНОБ
Как избавиться от заевшей в голове песни: 3 простых шага Как избавиться от заевшей в голове песни: 3 простых шага

Практический способ стряхнуть наваждение от заевшей песни

Psychologies
Успешные правила Успешные правила

Андрей Малахов и психолог Нигина Абаева – о побочке соцсетей и чувстве стыда

Psychologies
Ностальгия по великому: 4 самые крутые гидростройки СССР Ностальгия по великому: 4 самые крутые гидростройки СССР

Как решить, какую стройку считать великой, а какую нет?

ТехИнсайдер
Робозмею научили локоманипулировать предметами Робозмею научили локоманипулировать предметами

Робот-змея может двигаться и перемещать предметы одновременно

N+1
Почему важно читать книги: 5 неожиданных преимуществ для здоровья Почему важно читать книги: 5 неожиданных преимуществ для здоровья

Если вы до сих пор не любите читать, узнайте, какую пользу для здоровья теряете

ТехИнсайдер
В зоне особого внимания В зоне особого внимания

Зональная диета: что это за система питания и как она работает?

Лиза
Сумасшедшие бактерии меняют главную догму биологии: они сами себе создают новые гены Сумасшедшие бактерии меняют главную догму биологии: они сами себе создают новые гены

Как показали ученые, бактерии могут создавать сами себе новые гены

ТехИнсайдер
Как навсегда избавиться от запаха в посудомоечной машине: советы профессиональных клинеров Как навсегда избавиться от запаха в посудомоечной машине: советы профессиональных клинеров

Что делать, чтобы в посудомоечной машине не появлялся неприятный запах?

VOICE
Открыть в приложении