Generative Fill от Adobe стал лучшим ИИ-сервисов для редактирования изображений.
Добавлять, удалять или расширять содержимое изображений можно прямо в Adobe Photoshop с помощью простых текстовых подсказок на основе генеративного искусственного интеллекта Adobe Firefly.
GPT-4 от OpenAI назвали лучшим чат-ботом.
GPT-4, новая модель искусственного интеллекта от OpenAI, отличается от предыдущих версий ChatGPT и GPT-3 мультимодальными возможностями. Теперь она может анализировать и обрабатывать изображения, извлекая из них информацию.
В отличие от простого описания изображений, GPT-4 может идентифицировать и объяснять визуальные шутки, распознавать узоры на одежде, определять растения, читать карты и переводить надписи.
Эти возможности делают GPT-4 ценным инструментом для приложений, например, Be My Eyes, где слепые и слабовидящие люди могут получить помощь в описании содержимого камеры своего телефона.
GEN-2 от Runway стал лучшим генератором видео.
Суть этой нейросети довольно проста: она похожа на Midjourney, только генерирует по запросам не изображения, а видео. Слоган у Gen-2: «Если ты можешь это представить, ты можешь это сгенерировать» (If you can imagine it, you can generate it).
SeamlessM4T от Meta* получил лавры лучшего нейропереводчика.
SeamlessM4T — нейросеть, которая умеет распознавать речь, преобразовывать её в текст и переводить на около 100 языков. Также модель умеет создавать из текста речь на 35 языках.
Stable Audio от Stability AI заслуженно стал лучшим генератором музыки.
Stable Audio — диффузионная модель, которая генерирует аудиозаписи по текстовым запросам, рассказала Stability AI. Её обучали на дата-сете из текстовых метаданных и более чем 800 тысяч аудиофайлов с готовыми композициями, звуковыми эффектами и инструментальными партиями общей длительностью свыше 19,5 тысячи часов.
DALLE-3 от OpenAI — генератор изображений.
DALL·E 3 — это настоящий прорыв в области генерации изображений и понимания текстовых запросов. Обновленная модель нейросети может не только генерировать качественные изображения, но и более точно понимать текстовые промпты, уделяя внимание каждому слову в процессе генерации.
С полным списком лучших инноваций 2023 по версии Time можно ознакомиться на сайте.
*Meta признана экстремистской организацией и запрещена в России.