Сегодня 30 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проиндексированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft добавила поддержку русского и ещё 15 языков в Copilot для Microsoft 365 4 ч.
Создатели Commandos: Origins показали новый геймплейный трейлер и анонсировали закрытую «бету» 6 ч.
Верховный суд США отказался освободить Илона Маска от «Twitter-няни» 6 ч.
Самыми популярными модами для Fallout 4 после выхода крупного обновления стали инструменты для его отката 6 ч.
Meta подтвердила, что будет вознаграждать популярных авторов в Threads 7 ч.
Microsoft позволит открывать без подключения к интернету файлы в веб-версии OneDrive 7 ч.
Цифровые археологи восстановили контроль над червём PlugX и выявили глобальную эпидемию 8 ч.
Из-за бага крестьяне в Manor Lords предпочитают оставаться бездомными — разработчик отреагировал 8 ч.
Выручка Yandex Cloud выросла в I квартале 2024 года на 58 % благодаря росту спроса на облачные сервисы 9 ч.
Microsoft стала рекламировать свои продукты при первом запуске Windows 11 после обновления 10 ч.
Новая статья: Он вам не силикон! Часть вторая: сила, блеск и двумерность 5 ч.
Boston Dynamics показала Sparkles — мохнатого робопса, который умеет танцевать 6 ч.
MediaTek представит 7 мая флагманский процессор Dimensity 9300+ с расширенными ИИ-функциями 7 ч.
Razer грозит штраф на $1,1 млн за обман с масками с RGB-подсветкой Zephyr — они не защищали от COVID-19 7 ч.
У «Хаббла» снова засбоил гироскоп — космический телескоп прекратил работу и перешёл в безопасный режим 8 ч.
В США разработали экологичные печатные платы vPCB, которые легко перерабатывать 8 ч.
Квартальная выручка Western Digital в облачном сегменте выросла более чем на четверть 9 ч.
Infinix представила геймерский смартфон GT 20 Pro с чипом Dimensity 8200 Ultimate и RGB-подсветкой 10 ч.
Sparkle выпустила белые видеокарты Arc A770 и A750 ROC OC Luna Edition на синих платах 12 ч.
Huawei проведёт глобальную презентацию 7 мая — ожидается анонс ноутбука, планшета и смарт-часов, но не смартфонов Pura 70 12 ч.