Save The Web Project
1.44K subscribers
113 photos
4 videos
1 file
242 links
This channel can’t be displayed because it violated Telegram's Terms of Service.
Download Telegram
Forwarded from &'a ::rynco::UntitledChannel (NetaP495L)
Twitter
Tong Bingxue 仝冰雪
中国最大最重的书:《清玉牒》,清代皇室家谱。用汉满双语写成。厚 1 米,重量逾 150 千克。中国第一历史档案馆藏。
5
丑搜加了个“人类时代”按钮,点一下就只搜索2023年前的文章。
不过 ChatGPT 是 2022 年 10 月发的,所以实际上还是能搜到一些。

没活了。
21😁3
xLog 怎么一声不吭地 ipfs 不 pin 了,我们还没存啊。
😇16
就让它去吧~
👍16
Save The Web Project
xLog 怎么一声不吭地 ipfs 不 pin 了,我们还没存啊。
xLog 的各种 API、以及链上的 RPC、以及数据导出网站 export.crossbell.io 都已经废了。

刚糊了个 xLog 博文导出工具 https://xlog-takeout.saveweb.org/ 出来。
整个 xLog 的博文去掉大部分 spam 后也才 34k,很小。懒得写后端,直接前端加载 300MiB 的全量 sqlite (gzip 后 100MiB)。

xlog 博主们尽快导出吧(IPFS 上的图片附件已经没了大半了)。
8
我们可能丢了 bcy 的 100TB 原始存档。(仅媒体,元数据还在)

三年前我们把存档全量给了一位愿意自掏腰包将这些存档存入 aws s3 冷存以备份的人士。

现在我们的灵车存储A寄了,昨日尝试联系并询问他这份备份的状况,暂无回复。 (搞错人了)
最坏的情况下,如果他这份全量备份也没了的话。我们就只剩灵车存储B上大约 3/4 总量的不完整备份,而且目前还不清楚数据存活状况。
🌚23
Save The Web Project pinned «完蛋。bcy 的 s3 备份持有者的 telegram 已经是 deleted account 了。他原来的昵称应该是“tr”。 https://t.iss.one/saveweb_projects/319/12141 有谁认识他的可以帮忙联系下吗?非常感谢!»
Save The Web Project
联系上了,好消息:数据还在。
坏消息:取出来太贵

现在的问题是我们需要从 AWS 里拉 100TB 数据出来,走正常路径大概需要花 $7k~$9k。

目前想到的低成本方案是利用这两个规则:

- 每月每账号 AWS S3 出站流量前 100G 免费
- S3 <-> CloudFront 流量免费 + CloudFront 每账号每月1T免费出站流量

所以,如果你有 AWS 账号,不用(或用不完)它每月的免费流量配额。不妨帮帮我们,谢谢。

如有意 https://t.iss.one/saveweb_projects/30491/30498 登记一下,感谢感谢。
春节快乐。
如有互联网产品倒闭,请留言。😭
Please open Telegram to view this post
VIEW IN TELEGRAM
15
Forwarded from tacwolfrevo
快过年了,不要再讨论什么 Wayback Machine、Glacier Deep Archive、Zeno 之类的了。你带你的 NAS 硬盘和 LTO 磁带机回到家并不能给你带来任何实质性作用,朋友们兜里掏出一大把钱吃喝玩乐,你默默在家里跑你的 warrior。
​亲戚朋友吃饭问你今年收获了什么,你说我抢救性抓取了一个即将关站的二次元论坛,存了几十个 TB 的 WARC。亲戚们懵逼了,你还在心里默默嘲笑他们,笑他们不懂 link rot,不懂怎么处理 JS 动态加载,也笑他们连网站是 SSR 还是 SSG 都分不清。
​你父母的同事都在说自己的子女一年的收获,儿子买了个房,女儿买了个车,姑娘升职加薪了。你的父母默默无言,说我的孩子电脑开着嗡嗡响,存了一堆没人看的网站,家里的电表转得越来越快了,S3 的账单也越来越多了。
13😭6🥰4🗿1
魅族要倒闭了。

有魅族用户可以来帮忙存档吗?(项目群)
🙊8
群友们谁的网站内容丰富多且带宽大?我跑跑 benchmark ,测爬虫(
静态网站优先。

(内容丰富指有 html、css、js 以及其它多样的媒体资源。不关心里面到底是什么)
Save The Web Project
开始存档 AcFun 视频! 回顾一些经典老物.jpg: https://archive.org/details/AcFun-1984_p1 https://archive.org/details/AcFun-1411_p1 https://archive.org/details/AcFun-3784_p1 https://archive.org/details/AcFun-7579_p1 https://archive.org/details/AcFun-2123_p1 ...... (目前还存在的早期…
有熟悉数据处理的好心人吗?

我们现在有 AcFun 全站的视频元数据信息,以及全站弹幕,以及 acwiki 的存档(可以用 acwiki 中出现过的 aid 号作为“好视频”的参考集)。现在的目标是从目前的 9,295,558 个有效视频中,自动打标(啥鬼畜、东方、vocaloid 啊)并筛选出值得存的视频。(降序排序)

有没有好心人喵?🐱

好心人请点这里:https://t.iss.one/saveweb_projects/2961
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5