Сегодня 10 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ Voice Engine, который клонирует ваш голос по 15-секундному образцу

OpenAI представила результаты предварительного тестирования ИИ-модели Voice Engine, которая на основе 15-секундного образца может реалистично озвучить введённый текст, стараясь максимально точно передать голос и речевые особенности говорящего.

 Источник изображения: Unsplash, Igor Omilaev

Источник изображения: Unsplash, Igor Omilaev

Первые наработки Voice Engine появились в конце 2022 года и использовались в API для преобразования текста в речь, а также совместно с ChatGPT Voice and Read Aloud. В OpenAI осознают последствия возможного злоупотребления технологией синтезированных голосов, поэтому надеется получить отклик от общества по возможным опасностям и сферам применения. Что касается последних, с прошлого года OpenAI предложила протестировать Voice Engine небольшой группе партнёров — и получила примеры использования:

  • Помощь имеющим проблемы с чтением людям и детям посредством естественных, эмоциональных и разнообразных голосов. Так, специализирующаяся на образовательных технологиях компания Age of Learning использует Voice Engine для озвучки контента, а также, совместно с GPT-4, персонализированных ответов учащимся в реальном времени.
  • Перевод контента, например, видеороликов и подкастов, позволит авторам и компаниям расширить аудиторию по всему миру, сообщая информацию собственными голосами и голосами сотрудников. Одним из первопроходцев стала компания HeyGen — ИИ-платформа визуального повествования для корпоративных клиентов, предназначенная для создания человекоподобных аватаров в различных целях — от продуктового маркетинга до торговых предложений. Voice Engine сохраняет родной акцент диктора, поэтому при озвучении английского текста французским диктором будет слышен французский акцент.
  • Поддержка людей с проблемами речи, терапевтические приложения, образовательные дополнения. Livox — ИИ-приложение для устройств альтернативной и дополненной коммуникации помогает людям с проблемами в общении. Используя Voice Engine, Livox предложит немым людям уникальные, нероботозированные голоса. Пользователь может выбрать наиболее подходящий ему голос, который будет говорить на разных языках.
  • Помощь в восстановлении голоса при внезапных и дегенеративных нарушениях речи. Институт Нейронаук Нормана Принца (NPNI) проводит пилотную программу помощи людям с онкологическими или неврологическими нарушениями речи. Благодаря способности Voice Engine воcпроизводить речь по 15-секундному образцу, доктора Фатима Мирза (Fatima Mirza), Рохаид Али (Rohaid Ali) и Константина Свокос (Konstantina Svokos) воспользовались аудиозаписью из видеоролика для школьного проекта и восстановили голос молодой пациентки с проблемами речи из-за сосудистой опухоли мозга.

Партнёры OpenAI согласились с правилами использования технологии, запрещающими с её помощью выдавать себя за другого человека, чего не скажешь о возможных злоумышленниках, всё чаще использующих нейросетевые технологии в преступных целях.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Atari решила выпустить метроидванию Adventure of Samsara в один день с Hollow Knight: Silksong — пиковый онлайн в Steam достиг 12 человек 5 ч.
«До сих пор отходим от похмелья»: разработчики Ghost of Yotei с размахом отпраздновали перенос GTA VI 6 ч.
Нейросеть Google Veo 3 научилась создавать вертикальные видео для соцсетей 7 ч.
По мотивам «Повести временных лет» выпустят MMORPG на стыке научной фантастики и фэнтези с «эпической историей» и геймплеем «нового уровня» 9 ч.
Антиспам-сервис Microsoft начал блокировать безопасные ссылки в Teams и Exchange Online, и отправлять письма в карантин 9 ч.
Пароли «admin» и другие дыры в кибербезопасности сети ресторанов Burger King выявили белые хакеры 10 ч.
Из Meta продолжается массовый исход специалистов в сфере ИИ — Цукерберг пытается его остановить, но безуспешно 10 ч.
Microsoft тестирует новые ИИ-функции в «Проводнике» Windows 11 10 ч.
Бывший сотрудник подал на WhatsApp в суд из-за игнорирования проблем с кибербезопасностью 12 ч.
Соцсети заполонили боты: Сэм Альтман пожаловался, что интернет стал искусственным из-за ИИ 14 ч.
До 300 000 рублей: объявлены российские цены на iPhone Air, iPhone 17, 17 Pro и 17 Pro Max 2 ч.
Apple представила смарт-часы Watch Ultra 3 со спутниковой связью и автономностью на 42 часа за $799 3 ч.
Новая статья: IFA 2025: выставки электроники уже не те, но без интересных новинок не обошлось 3 ч.
Apple объявила дату выхода iOS 26 со «стеклянным» дизайном для всех совместимых устройств 4 ч.
Представлен беспроводной контроллер Apple N1 для Wi-Fi 7 и Bluetooth 6 в новых iPhone 4 ч.
Apple представила плечевой ремешок для iPhone 17 Air за $59 и другие модные аксессуары 4 ч.
Fermi America, стоящая за мегапроектом 11-ГВт ИИ ЦОД HyperGrid с питанием от АЭС, собралась на биржу 4 ч.
Apple представила смарт-часы Watch Series 11 — самые тонкие, с 5G и детектором гипертонии за $399 4 ч.
Представлены беспроводные наушники Apple AirPods Pro 3 с живым переводом и датчиком пульса за $249 4 ч.
Дебютировали Apple Watch SE 3 с усиленным стеклом, AoD, повышенной автономностью и 5G — от $249 6 ч.