Сегодня 01 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Reddit введёт жёсткие меры против сборщиков контента для обучения ИИ

Администрация платформы Reddit заявила, что обновит исключения для роботов (файл robots.txt), которые сообщают веб-ботам о разрешении или запрете сканировать сайт и его разделы. Ресурс также примет меры для фактического ограничения доступа некоторым ботам.

 Источник изображения: redditinc.com

Источник изображения: redditinc.com

Традиционно файл robots.txt использовался для того, чтобы помочь поисковым системам правильно сканировать сайт. Но с развитием систем искусственного интеллекта появились боты, которые выкачивают контент сайтов целиком для обучения моделей без указания источника этого контента. Поэтому вместе с обновлением файла robots.txt администрация Reddit продолжит ограничивать скорость неизвестных ботов и блокировать их доступ к платформе — меры будут приниматься, если эти системы не будут соблюдать «Политику открытого контента» (Public Content Policy) на сайте.

Новый режим работы не должен повлиять на большинство пользователей и добросовестных участников ресурса, включая исследователей и некоммерческие организации вроде Internet Archive, сообщили в администрации Reddit. Меры вводятся лишь для того, чтобы не позволить другим компаниям обучать большие языковые модели ИИ на контенте платформы. Администрация ресурса опубликовала заявление после того, как стало известно, что ИИ-стартап Perplexity занимается сбором контента вопреки директивам robots.txt — гендиректор компании Аравинд Шринивас (Aravind Srinivas) заявил, что эти директивы не являются правовым обязательством.

Предстоящие изменения Reddit не затронут партнёров, которые заключили соглашения с платформой: Google и OpenAI обучают свои модели ИИ на контенте ресурса на возмездной основе. В прошлом году Reddit для защиты от неправомерного сбора контента ввела плату за доступ к API, что вызвало массовые протесты среди пользователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Анонсирован симулятор железнодорожного магната Steam to Electric с безумными, но исторически достоверными поездами — первый трейлер и подробности 5 мин.
Разработчики Subnautica 2 раскрыли системные требования перед погружением в ранний доступ и пообещали оптимизировать игру 2 ч.
Это другое: Пентагон не перестал считать Anthropic неблагонадёжной — но не отказался от передовой ИИ-модели Mythos 3 ч.
Epic Games вернула Fortnite на iPhone ещё в одной стране — Mac остались в стороне 4 ч.
Cloudflare перестала маркировать мессенджер Max как шпионское ПО 4 ч.
Windows 11 получила крупное обновление для повышения стабильности — первый шаг к возвращению «доверия пользователей» 4 ч.
Олдскульный шутер Gravelord в духе Duke Nukem вырвется с кладбища раннего доступа Steam совсем скоро — новый трейлер и дата выхода 5 ч.
Microsoft показала ИИ-агента для работы с юридическими документами в Word 7 ч.
Microsoft разрешила удалять любые предустановленные приложения в Windows 11 7 ч.
Инструмент анализа данных на Python на полдня стал вредоносным — он крал ключи и токены 7 ч.
Китайские учёные создали воздушно-железный проточный аккумулятор, который проработает 16 лет без деградации 33 мин.
Virgin Galactic показала строящийся космический корабль для туристов — запуск планируют на конец 2026 года 38 мин.
Xiaomi готовит Smart Band 10 Pro с крупным дисплеем и керамическим корпусом 4 ч.
Полный потенциал DualSense на ПК раскрылся с помощью кустарного адаптера из Raspberry Pi Pico 5 ч.
Пентагон выбрал семёрку поставщиков ИИ-технологий для своих секретных сетей 5 ч.
Траты SpaceX на разработку Starship перевалили за $15 млрд 5 ч.
Intel раскрыла техпроцесс 18A-P: быстрее, экономичнее и с улучшенным теплоотводом 6 ч.
Blue Origin намерена потеснить SpaceX — в планах запускать по 100 тяжёлых ракет New Glenn в год 7 ч.
Процессоры Hygon C86-4G, китайские наследники AMD Zen1, получили поддержку AVX-512, DDR5 и PCIe 5.0 7 ч.
HPE представила серверы ProLiant Compute EL220/EL240 Gen12 для ИИ-задач на периферии 8 ч.