Як інформує «Kreschatic» із посиланням на офіційну сторінку OpenAI, головною особливістю оновлення стала модель GPT-Realtime, яка працює за принципом «мова в мову», минаючи етап текстової транскрипції завдань.
Вищеописаний підхід дає змогу ШІ-асистентові реагувати значно швидше і вести спілкування більш природно, не перебиваючи співрозмовника. Нова система вловлює інтонацію, розрізняє емоції (наприклад, радість або смуток) користувача, й здатна відтворювати їх у відповідях.
Розробники підкреслили, що GPT-Realtime підтримує багатофункціональний режим і вміє перемикатися між мовами прямо під час розмови. Під час демонстрації ШІ декламував вірш, змінюючи мови «на льоту», а також виступив у ролі віртуального оператора техпідтримки, ввічливо взаємодіючи з вимогливим клієнтом.
Крім роботи з голосом, Realtime отримав функцію аналізу зображень та можливість використовувати їхні дані в діалозі. Також реалізована підтримка протоколу MCP, який відкриває моделі доступ до зовнішніх джерел — наприклад, корпоративних баз або технічної документації. При цьому, GPT-Realtime продовжує підтримувати розмову під час пошуку, уникаючи тривалих пауз.
Наразі відомо, що модель доступна тільки через API. Вартість використання становить 32 долари за мільйон вхідних токенів, 64 долари за мільйон вихідних і 0,40 долара за мільйон кешованих токенів. Інформації щодо впровадження GPT-Realtime у голосовий режим ChatGPT поки не надходило.
Раніше ми писали про те, що Nvidia розсекретила характеристики та вартість суперкомп’ютера Jetson AGX Thor.