Что умеет GPT-4 и как пользоваться новым ChatGPT
CPT-4 - новая версия софта, на котором основан чат-бот ChatGPT. Что умеет новая нейросеть и как ее протестировать, рассказываем в статье.

Что такое GPT-4
GPT-4 - это новая мультимодальная модель от OpenAI, анонсированная 14 марта 2023 года. Мономодальные языковые модели (например, GPT-3 и GPT-3.5) понимают только текст, в то время как мультимодальные версии умеют также распознавать изображения.
Что нового в GPT-4
В GPT-4 появилось много улучшений: перечислим основные.
Умеет распознавать изображения
Чат-бот ChatGPT не сразу будет работать с картинками - пока такая возможность доступна только разработчикам и некоторым пользователям. Но после окончания бета-тестирования бот будет понимать не только текстовые запросы, но и фотографии, мемы и прочие изображения.
Заявлено, что GPT-4 сможет распознавать и описать даже сюжет на фото, а не только отдельные объекты. Эта полезная возможность уже используется в приложении Be My Eyes для слепых и слабовидящих людей. Hейросеть рассказывает, что изображено на экране смартфона: читает карты и этикетки, распознает растения и узоры на одежде, подсказывает, как добраться до нужного тренажера в спортзале и т.д.
В официальном релизе OpenAI показали пример, как GPT-4 понимает шутки. Боту отправили забавную фотографию и попросили пошагово описать, что на ней изображено и почему это смешно.
Мы перевели ответ бота через ChatGPT:
На изображении показана упаковка адаптера «Lightning Cable» с тремя панелями.
Панель 1: Смартфон с подключенным к порту зарядки VGA-коннектором (большой синий 15-контактный разъем, обычно используемый для компьютерных мониторов).
Панель 2: Упаковка адаптера «Lightning Cable» с изображением VGA-коннектора на ней.