Представлено новое поколение генеративного искусственного интеллекта ChatGPT от OpenAI. Модель получила название GPT-4o: буква «О» в названии означает «omni» и отсылает к мультинаправленности GPT-4o. Новая версия ИИ работает различными типами информации: аудио, видео, изображениями и текстом. Кроме того, отмечается новая модель реагирует на голос пользователя примерно за 320 миллисекунд, что сравнимо с реакцией человека в обычном разговоре.
По заверениям разработчиков новое поколение ИИ-модели позволит пользователям с легкостью общаться с ChatGPT голосом и получать ответы в реальном времени без задержек и ожидания. Также можно будет прерывать и перебивать генеративный ответ чат-бота во время разговора, и ИИ будет реагировать в соответствии с контекстом.
Помимо скорости было улучшено качество: теперь искусственный интеллект лучше воспринимает графическую информацию и аудио по сравнению с уже существующими моделями.
«В случае с GPT-4o мы обучили новую модель сквозному анализу текста, изображений и аудио, это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — говорится в релизе компании OpenAI. В настоящее время GPT-4o свободно разговаривает на более чем 50 языках.
Новая разработка пока доступна ограниченной группе пользователей в рамках релиза, однако разработчики заверяют, что в июне эта опция появится у платных подписчиков. Возможности искусственного интеллекта были представлены в демо на OpenAI Spring Update.