GPT-4o: представлено новое поколение нейросети ChatGPT от OpenAI

Новая модель ИИ лучше воспринимает изображение и аудио, общается с пользователем и реагирует на голос за 320 миллисекунд

#Бизнес и технологии

5848

15 мая 2024

Представлено новое поколение генеративного искусственного интеллекта ChatGPT от OpenAI. Модель получила название GPT-4o: буква «О» в названии означает «omni» и отсылает к мультинаправленности GPT-4o. Новая версия ИИ работает различными типами информации: аудио, видео, изображениями и текстом. Кроме того, отмечается новая модель реагирует на голос пользователя примерно за 320 миллисекунд, что сравнимо с реакцией человека в обычном разговоре.

По заверениям разработчиков новое поколение ИИ-модели позволит пользователям с легкостью общаться с ChatGPT голосом и получать ответы в реальном времени без задержек и ожидания. Также можно будет прерывать и перебивать генеративный ответ чат-бота во время разговора, и ИИ будет реагировать в соответствии с контекстом.

View this post on Instagram

A post shared by OpenAI (@openai)

Помимо скорости было улучшено качество: теперь искусственный интеллект лучше воспринимает графическую информацию и аудио по сравнению с уже существующими моделями.

«В случае с GPT-4o мы обучили новую модель сквозному анализу текста, изображений и аудио, это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — говорится в релизе компании OpenAI. В настоящее время GPT-4o свободно разговаривает на более чем 50 языках.

Новая разработка пока доступна ограниченной группе пользователей в рамках релиза, однако разработчики заверяют, что в июне эта опция появится у платных подписчиков. Возможности искусственного интеллекта были представлены в демо на OpenAI Spring Update.