ChatGPT теперь может поддерживать голосовую беседу в реальном времени

ChatGPT теперь может поддерживать голосовую беседу в реальном времени

Компания OpenAI анонсировала новую флагманскую модель генеративного искусственного интеллекта под названием GPT-4o, где «o» означает omni. Разработчики заявляют, что модель может обрабатывать текст, речь и видео и будет доступна пользователям в течение нескольких недель.

Платформа уже давно предлагает голосовой режим, который преобразует ответы чат-бота из текста в речь, но GPT-4o позволяет общаться человеку с ним как с реальным собеседником. Например, пользователи могут задать вопрос ChatGPT на базе GPT-4o и прервать ChatGPT во время ответа.

Судя по демонстрациям, модель обеспечивает отзывчивость практически в режиме реального времени и даже может уловить нюансы в голосе пользователя, в ответ генерируя голоса в «ряде различных эмоциональных стилей» (включая пение). Кроме того, ChatGPT на базе GPT-4o сможет буквально «видеть» мир вокруг через камеру мобильного телефона, описывать и анализировать происходящее вокруг.

https://theins.ru/news/271538

Архив

2024
2023
2022

Категории

Авторы

Ленты

RSS / Atom