duangsuse Throws
98 subscribers
3.41K photos
228 videos
100 files
2.75K links
没事乱水...
Author @duangsuse

©2016 No rights reserved. 🐃

🐶🌚🍎🏠💓💔👇
😔 🙇‍♂️🙌🚶‍♂️🏃‍♂️ 🏃‍♂️🚶‍♂️ 👆

🐸🐸🐸🐸🐸🐸🐸🐸🐸🐸
@dsuse
Download Telegram
鸡你太美了 DUO.
Forwarded from codedump的电报频道 (老C)
#分布式
#系统设计
Sriram Subramanian ( niledatabase 的创始人) 关于构建高可用系统的一些思考。原文见,引用部分是中文翻译。

这是一篇长文,是我在过去几十年构建大规模数据库和存储系统的经验总结和随想。

在超大規模(例如,超过10,000个节点)的系统中,故障随时都在发生。关联性故障(Correlated failures)甚至更为常见。在这样的规模下,要实现所有客户集群的零宕机时间是不切实际的。因此,所有的焦点都应该放在如何减小“爆炸半径”(blast radius)上。

所谓的“爆炸半径管理”(blast radius mgmt),指的就是减少受影响的客户数量,或降低某个特定客户受影响的操作百分比。

当您设计容错系统时,可以思考以下一些技术:

💥 实例崩溃(低爆炸半径):您通常会故障转移(failover)到另一个实例。对于有状态系统,这通过复制(replication)来实现。对于无状态系统,则是将连接重新平衡(rebalancing)到其他可用实例。如果连接本身是有状态的,那么重新建立连接会变得很棘手。此外,如果一个实例正在为多个客户提供服务,您不会希望将所有负载都转移到另一个实例上,从而导致该节点饱和。您需要将负载重新分配到多个实例上。

⚙️ 实例的某个子系统故障(低爆炸半径):例如,某个特定的卷(volume)可能会失败。在这种情况下,您通常也会选择直接关停整个实例并故障转移到另一个。因为处理局部故障(partial failures)比处理完全故障(full failure)更麻烦。这里适用第一点中的故障转移规则。

⚠️ 多个实例同时故障(中等爆炸半径):对于有状态系统,这归结为您愿意设置多少个副本(replica)。这变成了一个成本与可用性之间的权衡问题。同时还存在延迟问题。通过复制,您的写入延迟将取决于写入法定数量(write quorum)中最慢的那个副本的延迟。副本越多,法定数量中至少包含一个慢副本的概率就越大。对于无状态系统,您需要有足够的容量来承接故障实例的负载。一个好的系统建模方式是,预先决定系统应该能够承受多少个关联性故障。例如,N<=2意味着系统在最多2个实例故障时仍能保持可用。
这里有一个有趣的观点是,您可以在云上应用一些巧妙的爆炸半径技术来确保最小化关联性故障。例如,AWS EC2提供放置组(placement groups)。您可以将副本放置在不同的放置组中,这能确保所有副本都位于不同的物理硬件上。

🏢 物理机(Bare metal machine)故障(中等爆炸半径):为了成本效益,您可能会在一台物理机上托管多个虚拟机(VM)。当物理机发生故障时,爆炸半径会大得多。您需要具备将负载故障转移到不同物理机上的不同虚拟机上的能力。能够吸收负载的机器越多,故障转移就越容易。这需要在使用率和您希望为每台物理机维持的稳态(steady state)利用率之间进行权衡。

🌍 整个可用区(zone)和区域(region)故障(高爆炸半径):这需要可用区级别和区域级别的故障转移。通过跨区域同步复制(sync replication)可以实现无数据丢失的区域故障转移,但在大多数情况下这并不现实。对于跨可用区复制,您通常希望客户端也一同转移到相同的可用区,以避免跨可用区网络成本。如果您处理的是像Kafka这样的高带宽服务,这个问题会更加突出。

🌐 网络的部分或完全故障(高爆炸半径):网络的部分故障或网络分区(network partitions)是设计中最难应对的情况之一。您内部的健康检查可能认为一切正常,而客户却无法连接。因此,您总是需要一个从外部进行连接的健康检查。当网络发生故障时,困难的部分是快速检测到它。一旦检测到,标准的故障转移机制就是处理流程。

📡 DNS等全局系统故障(高爆炸半径):这类故障非常可怕,常常导致一些最大规模的服务中断。您通常需要为这些全局系统设置冗余,以确保您的系统能够抵御这些故障。

🔧 配置、软件和维护变更(爆炸半径可低可高,取决于您的系统设计):到目前为止,导致服务影响的最常见原因是发布新变更。您需要将您的集群划分为多个单元(cell),并严格控制部署的顺序以及在每个单元升级后如何进行测试。在我过去工作过的几乎所有公司中,我们都必须构建一个大规模的集群管理器(fleet mgr),以自动化地逐个单元地推送新配置、新软件或执行维护(如安全补丁、操作系统升级)。您还需要具备回滚(rollback)的能力。最关键的是,任何变更的回滚都不能有兼容性问题,以确保故障时间最小化。

☸️ Kubernetes故障(爆炸半径可低可高,取决于您打包了多少应用):K8s管理着成千上万的虚拟机(或物理机),单个K8s集群的故障无疑会影响大量客户。您通常需要进行K8s的健康检查并执行故障转移。这有点棘手,因为您需要构建一种能力,能将一个K8s集群中的实例故障转移到多个其他的K8s集群中,以实现良好的负载管理。您可以保留一些空的K8s集群,以便在这类故障发生时接管工作。

🧩 外部系统(爆炸半径可低可高,取决于您的设计):您的系统会依赖许多外部系统,如认证、存储、证书、指标等。您必须设计您的系统,使得非关键外部服务的故障绝不影响您的服务质量。例如,用量追踪服务的失败不应影响您的核心服务。您还应该将外部系统依赖的数量保持在最低限度。对于关键的第三方系统,您需要有冗余,并确保第三方提供高可用性保证。

🚦 数据平面(Data plane)与控制平面(Control plane):控制平面操作是辅助系统管理的元数据操作。数据平面操作是实际的业务数据读写。例如,对于数据库来说,配置一个数据库是控制平面操作,而写入和读取数据是数据平面操作。控制平面操作本身也分层级(层层嵌套)。有全局控制平面操作、区域控制平面操作和单系统级别的控制平面操作。将它们隔离开来,并确保它们的故障不影响数据平面操作,是至关重要的。

这里可能还有很多我没有涵盖到的内容,但重要的是要理解,将一个系统简单地归类为“可用”或“不可用”是非常困难的。故障有许多级别,而爆炸半径决定了受影响的客户数量。构建出色的弹性系统,并理解您在成本、时间和可用性之间所做的权衡。
Forwarded from MAGA 之声
Forwarded from dnaugsuz
谈到自身相等这个,前天刷到一个 SCP-150
比较猎奇但是哲学
https://www.youtube.com/watch?v=F97I5xYOop4

《寄生兽》《变形记》粉丝狂喜
Forwarded from Solidot
脸部的伤疤为什么不容易留痕?

2026-01-26 15:12 by 记忆

外科医生早就注意到一个令人费解的现象:同样的手术切口,脸上的往往愈合得更好,疤痕更不明显,而身体其他部位则容易留下显著的疤痕。 发表在《细胞》(Cell)上的一项研究揭示了这一现象背后的分子机制。斯坦福大学的研究团队通过小鼠模型发现,面部皮肤之所以具有“无痕愈合”的潜力,是因为其深层的成纤维细胞能抑制疤痕组织的过度生成。基于这一发现研制的药物有望让任何伤口都能不留疤痕地愈合。人体皮肤真皮层的主要细胞类型是成纤维细胞。研究指出,面部和头皮的成纤维细胞起源于胚胎发育早期的“神经嵴”(neural crest),而身体其他部位的成纤维细胞则源自“中胚层”(mesoderm)。这决定了这些细胞在成熟后的行为模式。研究团队发现,源自神经嵴的面部成纤维细胞高表达一种名为 ROBO2 的蛋白及其下游因子 EID1。这一信号通路就像一个分子层面的“抑制器”,它能有效阻断一种名为 EP300 的蛋白质的功能。在身体其他部位的成纤维细胞中,EP300 能够打开 DNA 的折叠结构,让负责制造胶原蛋白等疤痕成分的基因变得活跃。而在面部细胞中,由于 ROBO2 和 EID1 的存在,EP300 受到抑制,DNA 保持在一种相对“沉默”和紧密的状态,使得促纤维化基因无法被轻易读取和表达。这种状态让面部细胞更接近其原始的干细胞形态,从而倾向于再生修复而非填补式的疤痕修复。研究人员指出,这在进化上是非常合理的。对于躯干上的伤口,生物体的首要任务是活下去,因此需要快速封闭伤口以防失血过多或感染,哪怕代价是形成功能较差的疤痕组织。然而,面部承载着视觉、听觉、嗅觉和进食等关键功能,如果形成僵硬的疤痕,将严重影响生物的基本生存能力,因此进化赋予了面部更精细的再生能力。

https://doi.org/10.1016/j.cell.2025.12.014
澎湃 面部皮肤不易留疤背后的分子机制

#科学
Forwarded from 厘米碎碎念
第一张好笑,第二张扎心。
Forwarded from Solidot
字节跳动暂停 Seedance 2.0 的脸部照片转语音功能

2026-02-11 18:25 by 神童的陷阱

字节跳动最近发布了 AI 视频生成工具 Seedance 2.0,它能同时处理多达四种类型的输入:图像、视频、音频和文本。用户能组合九张图像、三个视频和三个音频文件最多十二个文件。生成的视频时长为 4-15 秒(或 60 秒),能自动添加音效或音乐。但由于潜在的安全风险,字节跳动禁用了 Seedance 2.0 的人脸转语音功能。模型展现了能仅仅根据面部图像生成高度精确的个人语音的能力。根据脸部照片生成个人声音不是新研究,早在 2024 年的 USENIX 安全会议上,新加坡国立大学的研究人员就发表论文《Can I Hear Your Face? Pervasive Attack on Voice Authentication Systems with a Single Face Image》,介绍根据人脸生成语音攻击语音身份验证系统,因为人脸特征与语音特征之间存在高度关联。

https://seedance.ai/
https://www.usenix.org/system/files/usenixsecurity24-jiang-nan.pdf

#安全
Forwarded from duangsuse::Echo
4条参考答案 #每日四问
https://gemini.google.com/share/74fc6695ed17 #神来之笔

自夸的意义在于: 最初的语料都是Gemini(无用户指令)推送与搜集的,但是没有我的HITL、我在基线上修改的大量细节,无法拿到外部的高评价。

这条对话里,Gemini 前端难得没有刷出无法预览的embed,4张图,还算图文并茂。
彩蛋:通胀的真实演练

顺序阅读AI #breakdown ,寻找答案

- 找出不可能三角的另一种图示。
- 钱只是“欠条”?? 不可能,现在的商店都不赊账,还能有人“赖掉”你的钱?
- 福特时刻、乔布斯时刻、特斯拉/Lululemon时刻,你身边发生了什么?
- 为什么经济体的周期状态,与我们的人生息息相关(而不仅仅是“职业规划”)? 提示:寻找AIGC时代“心流”的同义词

- 乔布斯之所以接住了往下落的苹果,不是因为他花了别人花不了的时间,是因为他看到别人看不到的事情。
- 【知识分享】不仅不会对你的阶层不利,反而可能巩固你的优势。 为什么? (废话,AI就是吃分享出来的……)
- 限制肉价不是“德政”,对消费者更不是。 为什么? (关键词:柠檬市场、国标、丛林法则)
- 关于拉斯维加斯的解构(我折叠掉的部分……)简直是神来之笔。
- 破产是确定性事件:震撼的 50 个赌徒 1 种结局。 胜率可明明有 48% ,数学为什么会欺骗数学?


这个大纲是我写给自己(备忘的),所以它的质量自然好。 如果dev写软件给别人看,恐怕可读性经常要把自己绕晕。
Forwarded from duangsuse::Echo
#冷知识: Rust 语言社区小鬼爱自嗨 “fearless concurrency”,结果一堆人说 Rustacean(Rust 开发者)是螃蟹(八条腿的 🦀 crab emoji )


现在 Peter 从 OpenClaw(爪 🦞)跳到 OpenAI,完美衔接成“甲壳类程序员终极进化”——写代码像蟹钳夹东西,精准、八条腿、带壳防护( MEMORY.md 安全)。
宇树科技(Unitree):三度上春晚,这次不扭秧歌了,改练武术《武BOT》,和河南塔沟武校合作,人形机器人秀高难度动作,力量+平衡拉满(去年秧歌太丝滑,今年直接硬核)。

松延动力(Noetix Robotics):搭档蔡明小品《奶奶的最爱》,机器人当“孙子”?奶奶的最爱可能是会干活的机器人吧。
魔法原子(MagicLab):参与歌曲《智造未来》,估计秀交互/表演。
其他还有银河通用等具身大模型机器人亮相。

科技感爆棚,但也有人吐槽“人味渐淡”“最不是人的一次春晚”。春晚用 AI/AR/XR 做舞美,手机竖屏直播也接入,妥妥的“AI+春晚”元年。
Forwarded from duangsuse::Echo
This media is not supported in your browser
VIEW IN TELEGRAM
#haha 春晚没有语言类节目了,足足4个机器人和豆包广告,但还有B站联名款…… 😄

假如历史人物参加联欢会

> 商鞅的刀马舞你能憋住吗?
> 恭喜发财的反义词是不是慈禧赔款?
bilibili.com/video/BV1nyZ7BbEG5
Please open Telegram to view this post
VIEW IN TELEGRAM