Сегодня 16 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Амбициозный корейский боевик Crimson Desert от создателей Black Desert — это «премиальный опыт», а не рассадник микротранзакций 3 ч.
Ветераны разработки Diablo выпустили в Steam масштабную демоверсию экшен-RPG нового поколения Darkhaven 4 ч.
Тысячи пользователей пожаловались на сбои в работе соцсети X 5 ч.
Календарь релизов — 16–22 февраля: Styx: Blades of Greed, Norse: Oath of Blood и Forgotlings 5 ч.
Две Assassin’s Creed, эвакуационный шутер по Второй мировой и не только: инсайдер выяснил, какие игры Ubisoft отменила вместе с ремейком «Принца Персии» 5 ч.
Blizzard: несмотря на 14 лет с релиза, в Diablo III до сих пор играют «миллионы» 5 ч.
YouTube усугубил войну с блокировщиками рекламы — пользователям начали отключать комментарии и описания роликов 6 ч.
Для безопасности и совместимости: IT-гиганты сформировали трансграничное объединение Trusted Tech Alliance 7 ч.
Создатель завирусившегося ИИ-агента OpenClaw присоединился к OpenAI 7 ч.
Облачные сервисы в 2025 году росли в России самыми быстрыми темпами, опередив ИИ-сегмент 8 ч.
PlayStation 6, возможно, придётся подождать до 2028–2029 года — Sony рассматривает перенос из-за кризиса памяти 3 ч.
Следующее поколение графических процессоров Intel Xe Next будет оптимизировано для ИИ, а не для игр 3 ч.
Ту самую компьютерную колонку из 90-х увеличили до человеческого роста — и она работает 5 ч.
Apple проведёт презентацию 4 марта — ожидаются iPhone 17e, новые Mac и iPad 5 ч.
«Атомный ИИ»: Deep Atomic предлагает строить сразу и ЦОД, и АЭС для него 6 ч.
GPU видеокарты за $5090 буквально лопнул от экстремального разгона — MSI RTX 5090 Lightning Z не пережила эксперимент 6 ч.
Oxide Computer готовит блейд-платформу на базе AMD EPYC Turin 7 ч.
Одна из самых редких GeForce RTX 5090 всплыла на eBay по цене от $7000 до $15 000 9 ч.
МКС снова укомплектована космонавтами и астронавтами после экстренной эвакуации в январе 12 ч.
ASML готовится к массовому внедрению High-NA EUV в следующем году — для 1,4-нм и более тонких чипов 12 ч.