Моя презентация про современную веб-архивацию со вчерашнего мероприятия по цифровым архивам.
Специально для тех кто интересуется тем как устроены современные веб-архивы, как организуется индексация ресурсов, какие инструменты цифровой архивации существуют.
Ссылки:
[1] www.beautiful.ai
#webarchives #archives
_______
Источник | #begtin
Специально для тех кто интересуется тем как устроены современные веб-архивы, как организуется индексация ресурсов, какие инструменты цифровой архивации существуют.
Ссылки:
[1] www.beautiful.ai
#webarchives #archives
_______
Источник | #begtin
Beautiful.ai
Цифровые веб-архивы в России и в мире
Get started with Beautiful.ai today.
June 18, 2021
Собран и загружается архив Эха Москвы.
На текущий момент доступны сведения аккаунта в телеграм, сообщества в ВК и архив сайта.
Телеграм
Архив официального аккаунта Эха Москвы в телеграм [1] составляет 18GB и включает все опубликованные сообщения, видео, медиафайлы и изображения. Это более 50 тысяч заметок. Большую часть архива составляют видеофайлы, около 16GB. Архив создан с помощью экспорта данных Telegram Desktop
Сообщество в ВК
Архив сообщества в ВК составляет 134MB и включает только текст более чем 99 тысяч заметок в опубликованных в сообществе [2]. Архив собран волонтёром с помощью API VK.
Официальный сайт Эха Москвы
Архив официального сайта Эха Москвы (echo.msk.ru) собирался 3-4 марта, составляет примерно 176GB, включает веб страницы и mp3 файлы подкастов. Сейчас архив загружается в онлайн хранилище и готовится для облачного хранения. Из-за его объёмов одной из задач является разделение его на части или создание над ним веб интерфейса.
О архиве сайта я напишу ещё подробнее позже, по готовности.
Ссылка:
[1] cdn.ruarxive.org
[2] cdn.ruarxive.org
#digitalpreservation #webarchives #archives #echomskru
_______
Источник | #ruarxive
На текущий момент доступны сведения аккаунта в телеграм, сообщества в ВК и архив сайта.
Телеграм
Архив официального аккаунта Эха Москвы в телеграм [1] составляет 18GB и включает все опубликованные сообщения, видео, медиафайлы и изображения. Это более 50 тысяч заметок. Большую часть архива составляют видеофайлы, около 16GB. Архив создан с помощью экспорта данных Telegram Desktop
Сообщество в ВК
Архив сообщества в ВК составляет 134MB и включает только текст более чем 99 тысяч заметок в опубликованных в сообществе [2]. Архив собран волонтёром с помощью API VK.
Официальный сайт Эха Москвы
Архив официального сайта Эха Москвы (echo.msk.ru) собирался 3-4 марта, составляет примерно 176GB, включает веб страницы и mp3 файлы подкастов. Сейчас архив загружается в онлайн хранилище и готовится для облачного хранения. Из-за его объёмов одной из задач является разделение его на части или создание над ним веб интерфейса.
О архиве сайта я напишу ещё подробнее позже, по готовности.
Ссылка:
[1] cdn.ruarxive.org
[2] cdn.ruarxive.org
#digitalpreservation #webarchives #archives #echomskru
_______
Источник | #ruarxive
Telegram
Национальный цифровой архив
Собран и загружается архив Эха Москвы.
На текущий момент доступны сведения аккаунта в телеграм, сообщества в ВК и архив сайта.
Телеграм
Архив официального аккаунта Эха Москвы в телеграм [1] составляет 18GB и включает все опубликованные сообщения, видео…
На текущий момент доступны сведения аккаунта в телеграм, сообщества в ВК и архив сайта.
Телеграм
Архив официального аккаунта Эха Москвы в телеграм [1] составляет 18GB и включает все опубликованные сообщения, видео…
March 4, 2022