全部 AI 动态

查看 AIHOT 全量动态流,适合需要更完整视图时使用。

5 天前
X:SemiAnalysis (@SemiAnalysis_)AI 模型
vLLM 团队与 NVIDIA 合作,为 MiniMax M3 模型提供开箱即用的 day 0 体验,并集成 Inferact 的 EAGLE3 推测解码。当前工作包括:NVIDIA、Inferact 与 SemiAnalysis 推动拆分推理(PR 45879),Inferact 团队启用 FlashInfer M3 MoE 内核(PR 45723),落地后性能将显著提升。NVIDIA 表示 M3 已加入 DeepSeek V4 和 Kimi-K2.6 等前沿开放智能体模型行列。NVIDIA Blackwell Ultra 在 M3 上比 Hopper 实现最高 5 倍 AI 工厂吞吐量,并超过 300 TPS/user。未来通过优化内核、NVFP4 及 NVIDIA Dynamo 拆分推理等,性能有望进一步提升。
查看原文Great work to @vllm_project team and @NVIDIA on smooth, out-of-the-box day 0 @MiniMax_AI M3 experien…
5 天前
X:Nathan Lambert (@natolambert)行业动态
特朗普政府官员要求Anthropic若重新发布模型Fable 5,必须确保其安全护栏无法被绕过(即实现"零越狱")。安全专家则认为这在技术上不可行。主推文指出,这种对LLM的不切实际要求反映了双重用途技术面临的典型矛盾。
查看原文We need a word for this sort of impossible demand with llms. It's almost like we've never dealt with…
5 天前
X:Kim (@kimmonismus)AI 产品
Nitrosend 通过一次 MCP 安装,让邮件系统直接在 Codex、Claude 或 ChatGPT 内部运行,彻底摆脱传统仪表盘。其团队 Hartley 兄弟曾创立 SmartrMail,发送数十亿封邮件并于 2022 年出售。他们认为仪表盘曾是瓶颈,而非产品本身,Nitrosend 正是移除这一瓶颈的产物。
查看原文Email is one of the last martech layers still stuck in its own dashboard while the rest of the stack…
5 天前
X:Rohan Paul (@rohanpaul_ai)行业动态
Dario Amodei 在 G7 会议上提出,友好国家需要共享 AI 访问权限,而非各自为政的竞争系统。 Sam Altman 和 Demis Hassabis 支持这一总体思路,认为盟友需要共享网络防御工具、共享测试以及通用技术标准。 欧洲和印度领导人担心,如果美国能够"关掉开关",他们的经济和关键系统可能过度依赖美国的政治决策。
查看原文Dario Amodei used the G7 meeting to argue that friendly nations need shared AI access, not separate …
5 天前
X:Epoch AI (@EpochAIResearch)论文研究
AI 距离自动化 AI 研发还有多远?目前,经济学家用于追踪自动化的工具过于粗糙。 在本周的新闻通讯中,@datagenproc、@joemkwon 和 @ansonwhho 提出了一种更精细的工具:对前沿 AI 研究中 60 多项任务进行详细分类。🧵
查看原文How close is AI to automating AI R&D? Right now, the tools economists use to track automation ar…
5 天前
X:Viggle AI (@ViggleAI)技巧与观点
最后一舞。❤️ 从儿时的梦想,到站在足球最大的舞台上,每一刻都是荣耀。感谢我的队友、教练、家人,以及每一位一路相信我、支持我的球迷。 这将是我最后一届世界杯,但记忆将永远留在我心中。 感谢一切。 向我兄弟 @Cristiano 和 @neymarjr 致敬 #football #worldcup #wc2026 #viggleai
查看原文One last dance. ❤️ From dreaming as a kid to standing on the biggest stage in football, every momen…
5 天前
X:Rohan Paul (@rohanpaul_ai)AI 产品
Genspark发布AgentBase(预览版),可将电子邮件、文件、应用和数据库等现有数据转化为CRM、HR系统、项目追踪器、仪表盘等内部工具,几分钟即可搭建。兼容Salesforce、HubSpot等现有系统,通过一句话提示即可自定义仪表盘和工作流。配合Genspark Super Agent,还能完成起草邮件、研究、构建演示文稿、创建工作流等任务。目标是用一个平台替代30+ SaaS工具。
查看原文Genspark's newly launched AgentBase feels like a serious step toward the "build your own internal so…
5 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点
Wide Expert Parallelism增加了每个MoE部署可用的总内存带宽。这意味着模型将MoE专家权重分布到多个GPU上,因此每个GPU只需加载一小部分权重。这转化为每个GPU更高的吞吐量,提升了每美元性能和每瓦性能。
查看原文Wide Expert Parallelism increases the total memory bandwidth available per MoE deployment. This mean…
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点
金融科技公司 Block 自建内部 AI 系统 Builderbot,可跨整个代码库协调多个智能体。工程师在 Slack 中标记后,系统自动研究、规划并交付。当前日处理 20 万次操作,每周合并 1500 个 pull request,贡献了 Block 全部生产代码变更的 15%,将原需数月的流程缩短至数天。DAIR.AI 创始人 Elvis Saravia 强调,只有通过编排层协调多个智能体才能实现此类输出,建议团队自建编排层。
查看原文You can only truly get this level of output when using orchestrator agents that can coordinate multi…
5 天前
X:xAI (@xai)AI 产品
一键使用预装 Grok Build 的虚拟机
查看原文Use VMs with Grok Build preinstalled with one click
5 天前
X:AK (@_akhaliq)论文研究
LoopCoder-v2 仅循环一次实现高效测试时计算缩放
查看原文LoopCoder-v2 Only Loop Once for Efficient Test-Time Computation Scaling
5 天前
X:OpenAI (@OpenAI)论文研究
推出 LifeSciBench,一个用于衡量和改进 AI 如何支持现实世界生命科学研究的基准测试。 该基准测试与 173 位来自生物技术和制药研究的科学家共同开发,包含 750 项专家编写的任务,覆盖七个生物学研究工作流程。
查看原文Introducing LifeSciBench, a benchmark for measuring and improving how well AI supports real-world li…
5 天前
X:Kim (@kimmonismus)技巧与观点
多家主流媒体(Bloomberg、Fortune、CNBC)一致认为,Anthropic争议的最大赢家是开源。Bloomberg指出,开源模型可本地运行,无需担心被随意撤下。被切断访问的企业和国家联盟会寻求主权解决方案,而目前最强大的开源模型来自中国,这无意中利好中国。推文认为GLM 5.2发布恰逢其时,开源成为保障独立参与AI革命的关键。
查看原文All the major news outlets agree: The biggest winner in the Anthropic controversy is open source. A…
5 天前
X:Greg Brockman (@gdb)行业动态
GPT-5.4 用于改善药物化学中一个具有挑战性的反应。
查看原文GPT-5.4 for improving a challenging reaction in medicinal chemistry:
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点
GLM-5.2 在 Design Arena 上以 Elo 1360 跃居第一,超过已下架的 Claude Fable 5,排名提升 4 位、Elo 提高 27 分,且为开源权重。DAIR.AI 的 Elvis Saravia 实测认为其设计能力不错,虽未达专业设计师水平,但具备 Opus 级质量,擅长游戏、落地页、HTML artifacts 及 3D 世界等任务。
查看原文I was a bit suspicious of the claim, but GLM-5.2 is pretty good at designing stuff. Obviously not a…
5 天前
X:Testing Catalog (@testingcatalog)AI 产品
Anthropic 的 Claude Design 迎来更新,新增对更广泛设计系统的支持,附带画布编辑器(可直接拖拽、调整大小和对齐元素),并能与 Claude Code 实现双向同步协作。Claude Design 会在构建前使用真实组件检查输出是否符合设计系统。该功能目前处于 beta 阶段,面向所有付费计划用户,可在 Web 和桌面端使用。
查看原文ANTHROPIC 🔥: Claude Design has been updated with broader design system support, a canvas editor, an…
5 天前
X:Ethan Mollick (@emollick)技巧与观点
大型公司AI策略的一个大问题是,那些去年意识到AI重要性的公司(实际上只是很小一部分,大多数仍然行动缓慢),最多是在2025年底、智能体革命之前制定了他们的策略 自此,情况已变…
查看原文Big issue with AI strategies at big companies which realized the importance of AI last year (which i…
5 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 产品
Adam 是一个开源 AI CAD 工具,可将自然语言和图像输入转化为 3D 模型。它完全在浏览器中运行(基于 WebAssembly),提供参数化滑块调节和实时预览(Three.js),支持导出 .STL、.SCAD、.DXF 格式,内置 BOSL、BOSL2 和 MCAD 库。基准测试显示,从单一提示词即可生成全参数化 OpenSCAD 模型,包括 V8 发动机、9 缸径向航空发动机、高旁通比涡轮风扇发动机等复杂多部件机器,以及六角扭曲花瓶、M12 螺栓与螺母等参数化零件,每个模型附带可调节维度和颜色数量。
5 天前
TechCrunch:AI(RSS)行业动态
Snap 发布 AR 眼镜 Specs,零售价近 2200 美元。消息公布后股价下跌超 5%,从 $5.86 跌至 $4.83。CEO Evan Spiegel 称其定位为高可穿戴性的沉浸式计算设备,价格与高端笔记本相当。但核心用户青少年缺乏购买力,市场对其盈利前景存疑。
查看原文After unveiling ridiculously expensive AR glasses, Snap's stock takes a dive
5 天前
TechCrunch:AI(RSS)技巧与观点
年初硅谷掀起"tokenmaxxing"热潮,CEO鼓励员工最大化AI使用量,随后账单涌现:Uber数月内耗尽年度AI预算,部分公司削减组织内的Claude许可证,Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率,她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。
查看原文NEA's Tiffany Luck says enterprises are still figuring out their AI ROI