全部 AI 动态

查看 AIHOT 全量动态流，适合需要更完整视图时使用。

5 天前

X：SemiAnalysis (@SemiAnalysis_)AI 模型

vLLM 与 NVIDIA 为 MiniMax M3 提供开箱即用的 Day 0 体验

vLLM 团队与 NVIDIA 合作，为 MiniMax M3 模型提供开箱即用的 day 0 体验，并集成 Inferact 的 EAGLE3 推测解码。当前工作包括：NVIDIA、Inferact 与 SemiAnalysis 推动拆分推理（PR 45879），Inferact 团队启用 FlashInfer M3 MoE 内核（PR 45723），落地后性能将显著提升。NVIDIA 表示 M3 已加入 DeepSeek V4 和 Kimi-K2.6 等前沿开放智能体模型行列。NVIDIA Blackwell Ultra 在 M3 上比 Hopper 实现最高 5 倍 AI 工厂吞吐量，并超过 300 TPS/user。未来通过优化内核、NVFP4 及 NVIDIA Dynamo 拆分推理等，性能有望进一步提升。

查看原文Great work to @vllm_project team and @NVIDIA on smooth， out-of-the-box day 0 @MiniMax_AI M3 experien…

5 天前

X：Nathan Lambert (@natolambert)行业动态

Anthropic Fable 5 面临政府"零越狱"不可能要求

特朗普政府官员要求Anthropic若重新发布模型Fable 5，必须确保其安全护栏无法被绕过（即实现"零越狱"）。安全专家则认为这在技术上不可行。主推文指出，这种对LLM的不切实际要求反映了双重用途技术面临的典型矛盾。

查看原文We need a word for this sort of impossible demand with llms. It's almost like we've never dealt with…

5 天前

X：Kim (@kimmonismus)AI 产品

Nitrosend：MCP一键集成邮件层到AI智能体

Nitrosend 通过一次 MCP 安装，让邮件系统直接在 Codex、Claude 或 ChatGPT 内部运行，彻底摆脱传统仪表盘。其团队 Hartley 兄弟曾创立 SmartrMail，发送数十亿封邮件并于 2022 年出售。他们认为仪表盘曾是瓶颈，而非产品本身，Nitrosend 正是移除这一瓶颈的产物。

查看原文Email is one of the last martech layers still stuck in its own dashboard while the rest of the stack…

5 天前

X：Rohan Paul (@rohanpaul_ai)行业动态

Dario Amodei于G7呼吁盟友共享AI访问

Dario Amodei 在 G7 会议上提出，友好国家需要共享 AI 访问权限，而非各自为政的竞争系统。 Sam Altman 和 Demis Hassabis 支持这一总体思路，认为盟友需要共享网络防御工具、共享测试以及通用技术标准。欧洲和印度领导人担心，如果美国能够"关掉开关"，他们的经济和关键系统可能过度依赖美国的政治决策。

查看原文Dario Amodei used the G7 meeting to argue that friendly nations need shared AI access， not separate …

5 天前

X：Epoch AI (@EpochAIResearch)论文研究

Epoch AI 提出前沿AI研究60+任务分类法

AI 距离自动化 AI 研发还有多远？目前，经济学家用于追踪自动化的工具过于粗糙。在本周的新闻通讯中，@datagenproc、@joemkwon 和 @ansonwhho 提出了一种更精细的工具：对前沿 AI 研究中 60 多项任务进行详细分类。🧵

查看原文How close is AI to automating AI R&amp；D？ Right now， the tools economists use to track automation ar…

5 天前

X：Viggle AI (@ViggleAI)技巧与观点

Viggle AI 推文：最后一届世界杯的告别

最后一舞。❤️ 从儿时的梦想，到站在足球最大的舞台上，每一刻都是荣耀。感谢我的队友、教练、家人，以及每一位一路相信我、支持我的球迷。这将是我最后一届世界杯，但记忆将永远留在我心中。感谢一切。向我兄弟 @Cristiano 和 @neymarjr 致敬 #football #worldcup #wc2026 #viggleai

查看原文One last dance. ❤️ From dreaming as a kid to standing on the biggest stage in football， every momen…

5 天前

X：Rohan Paul (@rohanpaul_ai)AI 产品

Genspark推出AgentBase预览版：将数据转化为内部工具

Genspark发布AgentBase（预览版），可将电子邮件、文件、应用和数据库等现有数据转化为CRM、HR系统、项目追踪器、仪表盘等内部工具，几分钟即可搭建。兼容Salesforce、HubSpot等现有系统，通过一句话提示即可自定义仪表盘和工作流。配合Genspark Super Agent，还能完成起草邮件、研究、构建演示文稿、创建工作流等任务。目标是用一个平台替代30+ SaaS工具。

查看原文Genspark's newly launched AgentBase feels like a serious step toward the "build your own internal so…

5 天前

X：SemiAnalysis (@SemiAnalysis_)技巧与观点

Wide Expert Parallelism提升MoE吞吐与性价比

Wide Expert Parallelism增加了每个MoE部署可用的总内存带宽。这意味着模型将MoE专家权重分布到多个GPU上，因此每个GPU只需加载一小部分权重。这转化为每个GPU更高的吞吐量，提升了每美元性能和每瓦性能。

查看原文Wide Expert Parallelism increases the total memory bandwidth available per MoE deployment. This mean…

5 天前

X：Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点

Block 推出内部 AI 编排系统 Builderbot，协调多智能体实现高效交付

金融科技公司 Block 自建内部 AI 系统 Builderbot，可跨整个代码库协调多个智能体。工程师在 Slack 中标记后，系统自动研究、规划并交付。当前日处理 20 万次操作，每周合并 1500 个 pull request，贡献了 Block 全部生产代码变更的 15%，将原需数月的流程缩短至数天。DAIR.AI 创始人 Elvis Saravia 强调，只有通过编排层协调多个智能体才能实现此类输出，建议团队自建编排层。

查看原文You can only truly get this level of output when using orchestrator agents that can coordinate multi…

5 天前

X：xAI (@xai)AI 产品

一键使用预装 Grok Build 的虚拟机

查看原文Use VMs with Grok Build preinstalled with one click

5 天前

X：AK (@_akhaliq)论文研究

LoopCoder-v2：仅循环一次高效测试时计算缩放

LoopCoder-v2 仅循环一次实现高效测试时计算缩放

查看原文LoopCoder-v2 Only Loop Once for Efficient Test-Time Computation Scaling

5 天前

X：OpenAI (@OpenAI)论文研究

OpenAI 发布 LifeSciBench 生命科学基准测试

推出 LifeSciBench，一个用于衡量和改进 AI 如何支持现实世界生命科学研究的基准测试。该基准测试与 173 位来自生物技术和制药研究的科学家共同开发，包含 750 项专家编写的任务，覆盖七个生物学研究工作流程。

查看原文Introducing LifeSciBench， a benchmark for measuring and improving how well AI supports real-world li…

5 天前

X：Kim (@kimmonismus)技巧与观点

Anthropic风波最大赢家：开源，GLM 5.2发布正当时

多家主流媒体（Bloomberg、Fortune、CNBC）一致认为，Anthropic争议的最大赢家是开源。Bloomberg指出，开源模型可本地运行，无需担心被随意撤下。被切断访问的企业和国家联盟会寻求主权解决方案，而目前最强大的开源模型来自中国，这无意中利好中国。推文认为GLM 5.2发布恰逢其时，开源成为保障独立参与AI革命的关键。

查看原文All the major news outlets agree： The biggest winner in the Anthropic controversy is open source. A…

5 天前

X：Greg Brockman (@gdb)行业动态

GPT-5.4 改善药物化学挑战性反应

GPT-5.4 用于改善药物化学中一个具有挑战性的反应。

查看原文GPT-5.4 for improving a challenging reaction in medicinal chemistry：

5 天前

X：Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点

GLM-5.2 登顶 Design Arena，Elo 1360 超 Claude Fable 5

GLM-5.2 在 Design Arena 上以 Elo 1360 跃居第一，超过已下架的 Claude Fable 5，排名提升 4 位、Elo 提高 27 分，且为开源权重。DAIR.AI 的 Elvis Saravia 实测认为其设计能力不错，虽未达专业设计师水平，但具备 Opus 级质量，擅长游戏、落地页、HTML artifacts 及 3D 世界等任务。

查看原文I was a bit suspicious of the claim， but GLM-5.2 is pretty good at designing stuff. Obviously not a…

5 天前

X：Testing Catalog (@testingcatalog)AI 产品

Claude Design更新：更广设计系统、画布编辑器与Code同步

Anthropic 的 Claude Design 迎来更新，新增对更广泛设计系统的支持，附带画布编辑器（可直接拖拽、调整大小和对齐元素），并能与 Claude Code 实现双向同步协作。Claude Design 会在构建前使用真实组件检查输出是否符合设计系统。该功能目前处于 beta 阶段，面向所有付费计划用户，可在 Web 和桌面端使用。

查看原文ANTHROPIC 🔥： Claude Design has been updated with broader design system support， a canvas editor， an…

5 天前

X：Ethan Mollick (@emollick)技巧与观点

2025年底AI策略落后于智能体革命

大型公司AI策略的一个大问题是，那些去年意识到AI重要性的公司（实际上只是很小一部分，大多数仍然行动缓慢），最多是在2025年底、智能体革命之前制定了他们的策略自此，情况已变…

查看原文Big issue with AI strategies at big companies which realized the importance of AI last year （which i…

5 天前

Hacker News 热门（buzzing.cc 中文翻译）AI 产品

Launch HN： Adam（YC W25）--开源人工智能CAD

Adam 是一个开源 AI CAD 工具，可将自然语言和图像输入转化为 3D 模型。它完全在浏览器中运行（基于 WebAssembly），提供参数化滑块调节和实时预览（Three.js），支持导出 .STL、.SCAD、.DXF 格式，内置 BOSL、BOSL2 和 MCAD 库。基准测试显示，从单一提示词即可生成全参数化 OpenSCAD 模型，包括 V8 发动机、9 缸径向航空发动机、高旁通比涡轮风扇发动机等复杂多部件机器，以及六角扭曲花瓶、M12 螺栓与螺母等参数化零件，每个模型附带可调节维度和颜色数量。

查看原文

5 天前

TechCrunch：AI（RSS）行业动态

Snap 发布天价 AR 眼镜 Specs 后股价暴跌

Snap 发布 AR 眼镜 Specs，零售价近 2200 美元。消息公布后股价下跌超 5%，从 $5.86 跌至 $4.83。CEO Evan Spiegel 称其定位为高可穿戴性的沉浸式计算设备，价格与高端笔记本相当。但核心用户青少年缺乏购买力，市场对其盈利前景存疑。

查看原文After unveiling ridiculously expensive AR glasses， Snap's stock takes a dive

5 天前

TechCrunch：AI（RSS）技巧与观点

NEA合伙人Tiffany Luck：企业仍在摸索AI投资回报率

年初硅谷掀起"tokenmaxxing"热潮，CEO鼓励员工最大化AI使用量，随后账单涌现：Uber数月内耗尽年度AI预算，部分公司削减组织内的Claude许可证，Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率，她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。

查看原文NEA's Tiffany Luck says enterprises are still figuring out their AI ROI

加载更多