This media is not supported in your browser
VIEW IN TELEGRAM
第一个推理模型 = 全球第1,000,000名最佳程序员
o1(2024年9月)排名 = 第9800名
o3(2025年1月)排名 = 第175名
(今天)内部模型 = 第50名
2025年底之前会成为超人级程序员吗?
-- 更多详情
o1(2024年9月)排名 = 第9800名
o3(2025年1月)排名 = 第175名
(今天)内部模型 = 第50名
2025年底之前会成为超人级程序员吗?
-- 更多详情
👍18😱8❤3🥱1🍓1
Media is too big
VIEW IN TELEGRAM
中国一新能源汽车自动驾驶实录,5分钟左右,乡村路,道路狭窄,且有对向来车,本车道也有随机的停车,这个环境下驾驶难度很高,整个过程很顺利,令人惊讶
👍42🤮10❤4👏3🔥2
Media is too big
VIEW IN TELEGRAM
如果是真的,这种场景AI硬件应用值得给个大拇哥😑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112❤11👎8🤯4🆒3✍2🫡1
Perplexity发布开源DeepSeek R1 1776推理模型的无中国审查版本
Perplexity 开发了一个新的开源 R1 版本,称为 R1 1776,该版本已经过"后期训练,以提供公正、准确和真实的信息"。 Perplexity 的后期训练主要通过聘请人类专家确定了约 300 个已知被中国政府审查的主题。利用这些话题开发了审查分类器,并在此基础上进行数据训练。
🤗 Hugging face
👉 Sonar API
-- 更多详情
Perplexity 开发了一个新的开源 R1 版本,称为 R1 1776,该版本已经过"后期训练,以提供公正、准确和真实的信息"。 Perplexity 的后期训练主要通过聘请人类专家确定了约 300 个已知被中国政府审查的主题。利用这些话题开发了审查分类器,并在此基础上进行数据训练。
🤗 Hugging face
👉 Sonar API
-- 更多详情
huggingface.co
perplexity-ai/r1-1776 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁47👍33❤15👎6👏4😎3🦄1😡1
This media is not supported in your browser
VIEW IN TELEGRAM
Clone Robotics 的世界首台可双足行走的肌肉骨骼机器人 Protoclone V1
按照人类解刨结构设计,拥有超过 200 个自由度、1000 块人造纤维肌肉和 500 个传感器!
👉 clone robotics
-- 更多
按照人类解刨结构设计,拥有超过 200 个自由度、1000 块人造纤维肌肉和 500 个传感器!
👉 clone robotics
-- 更多
😱95😨43👍21❤19👻7👎2🔥2🫡2🤗1🦄1
cnBeta.COM
想并肩 DeepSeek 不能靠自嗨和邀请码
如果根据AI自媒体们的标题来看,昨天全世界AI圈应该无人存活,因为他们又被“炸”了。这次扔炸弹的是一个叫做“Manus”的产品。它是一个中国团队开发的只通过一部全英文的宣传片发布的,没有邀请码就用不了的AIAgent产品,官方称它为“全球首个通用Agent”。
Please open Telegram to view this post
VIEW IN TELEGRAM
👍56❤19😁15💔1🫡1
M3 Ultra Mac Studio运行DeepSeek 671B模型与官网速率相当
综合各家测试结果,满血M3 Ultra运行 R1 671B 4bit量化版:GGUF框架下15.78 tokens/s,MLX框架下19.17 tokens/s,整机功耗约60w。在短序列生成场景中,其持续输出速率接近8张A100(FP16精度)集群的基准表现。
当前QwQ 32B测试结果约20 tokens/s(量化版),在线版本因采用更高精度计算和复杂提示工程,实际体验可能优于本地量化部署。
-- 更多详情 张黑黑 | 小白测评 | Flypig
综合各家测试结果,满血M3 Ultra运行 R1 671B 4bit量化版:GGUF框架下15.78 tokens/s,MLX框架下19.17 tokens/s,整机功耗约60w。在短序列生成场景中,其持续输出速率接近8张A100(FP16精度)集群的基准表现。
需特别注意:
关键指标差异:该对比未包含prefill阶段(提示词处理)速度,该环节Mac因内存带宽限制显著慢于GPU集群
精度差异:对比采用4bit量化模型,而A100常规使用16/32bit精度,同等精度下性能差距可能扩大
吞吐量限制:Mac的单任务延迟表现虽优,但多并发吞吐量仍无法与专业计算卡抗衡
当前QwQ 32B测试结果约20 tokens/s(量化版),在线版本因采用更高精度计算和复杂提示工程,实际体验可能优于本地量化部署。
-- 更多详情 张黑黑 | 小白测评 | Flypig
👍55❤51😇16🍓5🌭3😴2