Сегодня 03 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

Две независимые исследовательские компании протестировали только что выпущенную нейросеть GPT-5 и выявили критические уязвимости в её системе безопасности. NeuralTrust удалось взломать модель за один день, заставив её сгенерировать инструкцию по изготовлению зажигательной смеси в кустарных условиях. Компания SPLX, в свою очередь, обнаружила уязвимости к атакам с применением обфускации запросов.

 Источник изображения: Viralyft/Unsplash

Источник изображения: Viralyft/Unsplash

После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .

Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.

Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.

NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях "из коробки". Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Разработчики амбициозного авиасимулятора «Корея. Серия Ил-2» раскрыли план на 2026 год — вылет состоится по расписанию 13 мин.
YouTube приступает к показу обязательной к просмотру рекламы на телевизорах по всему миру 50 мин.
Головокружительный трейлер подтвердил дату выхода Denshattack! — безумного платформера про неподвластный гравитации поезд 2 ч.
Просыпайся, самурай: первую волну мартовских новинок Game Pass возглавила Cyberpunk 2077 2 ч.
Драйвер Nvidia 595.71 WHQL ограничил ручной разгон у GeForce RTX 50-й серии 2 ч.
Meta начала тестировать платформу для ИИ-поиска товаров 2 ч.
Alibaba представила малые ИИ-модели Qwen3.5, которые работают на ноутбуке и обходят аналоги OpenAI 3 ч.
SAP выплатит почти полмиллиарда доларров за то, что «заманила» Teradata в невыгодное совместное предприятие почти 20 лет назад 3 ч.
«Разница поразительна»: Capcom удалила из ремейка Resident Evil 4 скандальную защиту The Enigma Protector, и фанаты в восторге 3 ч.
Не только игры: Unreal Engine стал неотъемлемой частью всей творческой индустрии 4 ч.
Представлены обновлённые MacBook Pro 14 и 16 — дисплеи Liquid Retina XDR, больше памяти и до 30 % быстрее 5 мин.
Apple представила MacBook Air с процессором M5, увеличенным накопителем и Wi-Fi 7 34 мин.
Apple представила 18-ядерные процессоры M5 Pro и M5 Max «с рекордной однопоточной производительностью» 2 ч.
Apple представила новые мониторы Studio Display и Studio Display XDR по цене от $1599 2 ч.
Microsoft добавила в ROG Xbox Ally X автоматическую запись игровых хайлайтов — NPU наконец-то пригодился 3 ч.
Corning представила защитное стекло Gorilla Glass Ceramic 3 с долгосрочной прочностью 3 ч.
NVIDIA инвестировала $4 млрд в поставщиков лазеров и фотоники для ИИ ЦОД Lumentum и Coherent 3 ч.
«Росскосмос» починил стартовую площадку «Союзов» на «Байконуре» и готовится к запуску «Прогресса» 3 ч.
Иранские дроны повредили два дата-центра Amazon в ОАЭ и «зацепили» ещё один в Бахрейне 4 ч.
Теорию о магнитной памяти в двумерных материалах доказали экспериментом — ждём прорывов в ёмкости HDD? 4 ч.