Сегодня 26 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → архивы

На Луну отправят цифровой архив для хранения в течение миллиардов лет данных о Земле и людях

Сообщается, что фонд Arch Mission Foundation готовит к отправке на Луну уникальный носитель для хранения в течение миллиардов лет данных о Земле и земной цивилизации. Подобные архивы планируется разбросать по другим небесным телам Солнечной системы, чтобы в далёком будущем люди смогли прикоснуться к истории планеты и людей, если по каким-то причинам на самой Земле эти данные будут утеряны.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Следует сказать, что это не первая попытка фонда сохранить память о людях и Земле. Ранняя версия архива в виде 5-слойного диска была отправлена в космос в бардачке автомобиля Tesla Roadster, который компания Илона Маска запустила в качестве доказательства способности доставлять полезную нагрузку на орбиту Марса. Второй архив в виде 25-слойного носителя был отправлен на Луну в израильском спускаемом аппарате Beresheet, но тот разбился при посадке.

Очередной накопитель фонда также должен был быть доставлен на лунную поверхность, что планировалось совершить на спускаемом аппарате Peregrine Mission One компании Astrobotic. Однако компания затянула с изготовлением аппарата, а потом произошёл взрыв на ракете-носителе Vulcan Centaur компании United Launch Alliance (UAL), которая готовит его запуск. Тем самым начало миссии задержалось больше чем на год, но возможно, состоится в ноябре этого года.

Носитель Arch Mission Foundation представляет собой 120-мм 4-граммовый диск в специальном картридже. Четыре верхних слоя содержат инструкцию в текстовом и графическом виде, как самому собрать DVD-проигрыватель. Это примерно 60 тыс. страниц, доступных для чтения с оптическим увеличением от 100 до 200 крат. Эта информация поможет читателю извлечь и интерпретировать данные, записанные на остальных 21 слоях уже как на DVD-диске.

Содержание первых слоёв также включает в себя учебник, состоящий из тысяч страниц, на которых раскрываются значения более миллиона слов и понятий на многих языках. Кроме того, в него входят коллекции знаний по многим предметным областям, например, набор жизненно важных статей из «Википедии».

 25-слойный носитель Arch Mission Foundation

25-слойный носитель Arch Mission Foundation

Каждый слой DVD-диска содержит свыше 100 Гбайт сжатых цифровых данных или более 200 Гбайт в распакованном виде. В набор для архива включены англоязычная «Википедия», книжная библиотека Project Gutenberg, интернет-архив, информация о почти 7000 языках мира с полным набором данных PanLex и многое другое.

Особняком стоят данные об известном фокуснике-иллюзионисте Дэвиде Копперфильде (David Copperfield). Он является одним из спонсоров проекта и позаботился, чтобы о нём было как можно больше данных в архиве, включая описание всех его знаменитых фокусов.

У «Яндекса» украли и опубликовали 45 Гбайт исходных кодов — в компании взлом отрицают

В Сети появились архивы с исходными кодами проектов «Яндекса». В компании признали их подлинность — материалы действительно были похищены из внутреннего репозитория, — но отвергли предположения, что это произошло в результате взлома.

 Источник изображения: yandex.ru/company

Источник изображения: yandex.ru/company

Общий объём опубликованных злоумышленниками архивов (.tar.bz2) составил более 44,7 Гбайт — хакеры утверждают, что им удалось получить доступ к исходным кодам проектов «Яндекса» за исключением правил антиспама. Произошло это, по версии похитителей данных, в июле 2022 года. В архивах представлены материалы на языках Python, C++, Go и TypeScript, а также методы работы с данными Protocol Buffers, YAML и JSON, говорится в публикации на «Хабре». К странным особенностям информации в архивах относятся большое количество вспомогательного кода на Python 2.7 и единая дата всех файлов и папок — «2022-02-24», что расходится с заявлениями хакеров.

Представители «Яндекса» признали подлинность опубликованных материалов, но заявили, что взлома не было: «Служба безопасности "Яндекса" обнаружила в открытом доступе фрагменты кода из внутреннего репозитория. Однако, их содержимое отличается от текущей версии репозитория, которая используется в сервисах "Яндекса"».

В компании также подчеркнули, что репозитории не предназначены для хранения персональных данных пользователей, так что угрозы им нет, но всё же проводят по факту инцидента расследование: «Мы проводим внутреннее расследование о причинах попадания фрагментов исходного кода в открытый доступ, но не видим какой-либо угрозы для данных наших пользователей или работоспособности платформы». Знакомый с ситуацией источник сообщил, что исходные коды проектов «Яндекса» попали в Сеть по вине одного из сотрудников.

Стоит отметить, что утекшие исходные коды в большей степени интересны для изучения, но напрямую использовать и запустить на их основе «собственный «Яндекс» вряд ли получится. Здесь задействовано множество специфичных решений, в том числе заточенных под инфраструктуру самого «Яндекса». А для ИИ-проектов нет самого главного — натренированных нейросетей и набора данных для обучения тоже нет.

«Яндекс» научил нейросеть расшифровывать архивные документы даже с дореволюционной орфографией

Специалисты «Яндекса» обучили нейросети расшифровке архивных записей — теперь препятствиями не являются ни рукописный текст, ни дореволюционная орфография. Поработать с технологией можно уже сейчас, открыв службу «Поиск по архивам», в которой доступны более 2,5 млн страниц исторических документов и их текстовая расшифровка.

 Источник изображения: Яндекс

Источник изображения: Яндекс

Нейросеть была обучена при помощи сотен тысяч рукописных строк в реальных архивных документах, датированных с XVIII по XIX вв., а также десятков миллионов примеров, которые были сгенерированы. В работе участвовали эксперты — они производили расшифровку и разметку документов, а также контролировали качество работы системы. Прочитать такие рукописи неподготовленному человеку очень сложно, но нейросеть «Яндекса» справляется с задачей почти мгновенно. При наличии расшифровки появилась возможность быстро находить документы с упоминанием ключевых слов, например, названий населённых пунктов и фамилий.

Служба «Поиск по архивам» поможет в работе историкам, социологам, демографам и генеалогам, а также тем, кто не обладает профессиональной подготовкой, но хочет больше узнать об истории своей семьи. Первыми в базе появились материалы Главархива Москвы, потому что нейросеть обучали на них; впоследствии коллекция пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем к проекту подключатся и другие архивы, документов станет больше.

Сейчас в поиске доступны материалы с XVIII до начала XX вв. — они наиболее популярны у пользователей. В базе есть метрические книги, исповедные ведомости, а также ревизские сказки, в которые внесены результаты переписи населения. Документы открываются как по каталогу, так и через поисковую строку — на странице приводится скан листа и его построчная расшифровка с подсветкой при наведении.


window-new
Soft
Hard
Тренды 🔥
Инсайдер: Capcom отложила релиз Resident Evil 9, но в 2025 году может выйти другая игра серии 2 ч.
Звёздный отчёт Alphabet вдохновил инвесторов: у компании быстро растёт выручка и рентабельность 2 ч.
Microsoft получает всё больше выгоды от ИИ — компания показала сильный квартальный отчёт 4 ч.
Газировка с Copilot: Microsoft получила миллиардный контракт на обеспечение Coca-Cola облачными и ИИ-сервисами 4 ч.
Продюсер «Смуты» раскрыл, что добавят в игру с обновлениями, и подтвердил работу над продолжением 4 ч.
ИИ-приложение Google Gemini стало совместимо с Android 10 и Android 11 5 ч.
В США вернули сетевой нейтралитет 6 ч.
Alphabet объявила о первых в своей истории дивидендах, акции выросли в цене на 11,4 % 6 ч.
Младенец-экстрасенс против секретной корпорации: соавторы Before Your Eyes анонсировали сюжетное приключение Goodnight Universe 6 ч.
AMD выпустила драйвер с поддержкой игры Manor Lords и исправлением множества ошибок 12 ч.
UserGate объявила о расширении портфеля услуг и продуктов, а также запуске центра мониторинга ИБ 45 мин.
CATL представила LFP-батареи Shenxing Plus, на которых электромобиль сможет проехать 1000 км 51 мин.
IBM представила СХД FlashSystem 5300 и подписку Storage Assurance 2 ч.
Выручка Western Digital выросла на 23 %, но число проданных жёстких дисков продолжает падать 2 ч.
«Закон о чипах» сработал: строительство полупроводниковых заводов в США активизировалось в 15 раз 2 ч.
Meta увеличит инвестиции в развитие инфраструктуры ИИ и готовит крупнейшие капиталовложения в истории компании 4 ч.
HPE построила самый мощный в Польше суперкомпьютер Helios производительностью 35 Пфлопс 4 ч.
AWS построит в Индиане кампус ЦОД стоимостью $11 млрд 5 ч.
США усиливают давление на Японию, Южную Корею и Нидерланды, требуя ужесточить антикитайские санкции 5 ч.
Honor вышел в лидеры китайского рынка смартфонов, на втором месте — Huawei 5 ч.