全部 AI 动态
查看 AIHOT 全量动态流,适合需要更完整视图时使用。
5 天前
X:SemiAnalysis (@SemiAnalysis_)AI 模型vLLM 团队与 NVIDIA 合作,为 MiniMax M3 模型提供开箱即用的 day 0 体验,并集成 Inferact 的 EAGLE3 推测解码。当前工作包括:NVIDIA、Inferact 与 SemiAnalysis 推动拆分推理(PR 45879),Inferact 团队启用 FlashInfer M3 MoE 内核(PR 45723),落地后性能将显著提升。NVIDIA 表示 M3 已加入 DeepSeek V4 和 Kimi-K2.6 等前沿开放智能体模型行列。NVIDIA Blackwell Ultra 在 M3 上比 Hopper 实现最高 5 倍 AI 工厂吞吐量,并超过 300 TPS/user。未来通过优化内核、NVFP4 及 NVIDIA Dynamo 拆分推理等,性能有望进一步提升。
查看原文Great work to @vllm_project team and @NVIDIA on smooth, out-of-the-box day 0 @MiniMax_AI M3 experien…
5 天前
X:Nathan Lambert (@natolambert)行业动态特朗普政府官员要求Anthropic若重新发布模型Fable 5,必须确保其安全护栏无法被绕过(即实现"零越狱")。安全专家则认为这在技术上不可行。主推文指出,这种对LLM的不切实际要求反映了双重用途技术面临的典型矛盾。
查看原文We need a word for this sort of impossible demand with llms. It's almost like we've never dealt with…
5 天前
X:Kim (@kimmonismus)AI 产品Nitrosend 通过一次 MCP 安装,让邮件系统直接在 Codex、Claude 或 ChatGPT 内部运行,彻底摆脱传统仪表盘。其团队 Hartley 兄弟曾创立 SmartrMail,发送数十亿封邮件并于 2022 年出售。他们认为仪表盘曾是瓶颈,而非产品本身,Nitrosend 正是移除这一瓶颈的产物。
查看原文Email is one of the last martech layers still stuck in its own dashboard while the rest of the stack…
5 天前
X:Rohan Paul (@rohanpaul_ai)行业动态Dario Amodei 在 G7 会议上提出,友好国家需要共享 AI 访问权限,而非各自为政的竞争系统。
Sam Altman 和 Demis Hassabis 支持这一总体思路,认为盟友需要共享网络防御工具、共享测试以及通用技术标准。
欧洲和印度领导人担心,如果美国能够"关掉开关",他们的经济和关键系统可能过度依赖美国的政治决策。
查看原文Dario Amodei used the G7 meeting to argue that friendly nations need shared AI access, not separate …
5 天前
X:Epoch AI (@EpochAIResearch)论文研究AI 距离自动化 AI 研发还有多远?目前,经济学家用于追踪自动化的工具过于粗糙。
在本周的新闻通讯中,@datagenproc、@joemkwon 和 @ansonwhho 提出了一种更精细的工具:对前沿 AI 研究中 60 多项任务进行详细分类。🧵
查看原文How close is AI to automating AI R&;D? Right now, the tools economists use to track automation ar…
5 天前
X:Viggle AI (@ViggleAI)技巧与观点最后一舞。❤️
从儿时的梦想,到站在足球最大的舞台上,每一刻都是荣耀。感谢我的队友、教练、家人,以及每一位一路相信我、支持我的球迷。
这将是我最后一届世界杯,但记忆将永远留在我心中。
感谢一切。
向我兄弟 @Cristiano 和 @neymarjr 致敬
#football #worldcup #wc2026 #viggleai
查看原文One last dance. ❤️ From dreaming as a kid to standing on the biggest stage in football, every momen…
5 天前
X:Rohan Paul (@rohanpaul_ai)AI 产品Genspark发布AgentBase(预览版),可将电子邮件、文件、应用和数据库等现有数据转化为CRM、HR系统、项目追踪器、仪表盘等内部工具,几分钟即可搭建。兼容Salesforce、HubSpot等现有系统,通过一句话提示即可自定义仪表盘和工作流。配合Genspark Super Agent,还能完成起草邮件、研究、构建演示文稿、创建工作流等任务。目标是用一个平台替代30+ SaaS工具。
查看原文Genspark's newly launched AgentBase feels like a serious step toward the "build your own internal so…
5 天前
X:SemiAnalysis (@SemiAnalysis_)技巧与观点Wide Expert Parallelism增加了每个MoE部署可用的总内存带宽。这意味着模型将MoE专家权重分布到多个GPU上,因此每个GPU只需加载一小部分权重。这转化为每个GPU更高的吞吐量,提升了每美元性能和每瓦性能。
查看原文Wide Expert Parallelism increases the total memory bandwidth available per MoE deployment. This mean…
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点金融科技公司 Block 自建内部 AI 系统 Builderbot,可跨整个代码库协调多个智能体。工程师在 Slack 中标记后,系统自动研究、规划并交付。当前日处理 20 万次操作,每周合并 1500 个 pull request,贡献了 Block 全部生产代码变更的 15%,将原需数月的流程缩短至数天。DAIR.AI 创始人 Elvis Saravia 强调,只有通过编排层协调多个智能体才能实现此类输出,建议团队自建编排层。
查看原文You can only truly get this level of output when using orchestrator agents that can coordinate multi…
查看原文Use VMs with Grok Build preinstalled with one click
查看原文LoopCoder-v2 Only Loop Once for Efficient Test-Time Computation Scaling
5 天前
X:OpenAI (@OpenAI)论文研究推出 LifeSciBench,一个用于衡量和改进 AI 如何支持现实世界生命科学研究的基准测试。
该基准测试与 173 位来自生物技术和制药研究的科学家共同开发,包含 750 项专家编写的任务,覆盖七个生物学研究工作流程。
查看原文Introducing LifeSciBench, a benchmark for measuring and improving how well AI supports real-world li…
5 天前
X:Kim (@kimmonismus)技巧与观点多家主流媒体(Bloomberg、Fortune、CNBC)一致认为,Anthropic争议的最大赢家是开源。Bloomberg指出,开源模型可本地运行,无需担心被随意撤下。被切断访问的企业和国家联盟会寻求主权解决方案,而目前最强大的开源模型来自中国,这无意中利好中国。推文认为GLM 5.2发布恰逢其时,开源成为保障独立参与AI革命的关键。
查看原文All the major news outlets agree: The biggest winner in the Anthropic controversy is open source. A…
查看原文GPT-5.4 for improving a challenging reaction in medicinal chemistry:
5 天前
X:Elvis Saravia (@omarsar0, DAIR.AI)技巧与观点GLM-5.2 在 Design Arena 上以 Elo 1360 跃居第一,超过已下架的 Claude Fable 5,排名提升 4 位、Elo 提高 27 分,且为开源权重。DAIR.AI 的 Elvis Saravia 实测认为其设计能力不错,虽未达专业设计师水平,但具备 Opus 级质量,擅长游戏、落地页、HTML artifacts 及 3D 世界等任务。
查看原文I was a bit suspicious of the claim, but GLM-5.2 is pretty good at designing stuff. Obviously not a…
5 天前
X:Testing Catalog (@testingcatalog)AI 产品Anthropic 的 Claude Design 迎来更新,新增对更广泛设计系统的支持,附带画布编辑器(可直接拖拽、调整大小和对齐元素),并能与 Claude Code 实现双向同步协作。Claude Design 会在构建前使用真实组件检查输出是否符合设计系统。该功能目前处于 beta 阶段,面向所有付费计划用户,可在 Web 和桌面端使用。
查看原文ANTHROPIC 🔥: Claude Design has been updated with broader design system support, a canvas editor, an…
5 天前
X:Ethan Mollick (@emollick)技巧与观点大型公司AI策略的一个大问题是,那些去年意识到AI重要性的公司(实际上只是很小一部分,大多数仍然行动缓慢),最多是在2025年底、智能体革命之前制定了他们的策略
自此,情况已变…
查看原文Big issue with AI strategies at big companies which realized the importance of AI last year (which i…
5 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 产品Adam 是一个开源 AI CAD 工具,可将自然语言和图像输入转化为 3D 模型。它完全在浏览器中运行(基于 WebAssembly),提供参数化滑块调节和实时预览(Three.js),支持导出 .STL、.SCAD、.DXF 格式,内置 BOSL、BOSL2 和 MCAD 库。基准测试显示,从单一提示词即可生成全参数化 OpenSCAD 模型,包括 V8 发动机、9 缸径向航空发动机、高旁通比涡轮风扇发动机等复杂多部件机器,以及六角扭曲花瓶、M12 螺栓与螺母等参数化零件,每个模型附带可调节维度和颜色数量。
5 天前
TechCrunch:AI(RSS)行业动态Snap 发布 AR 眼镜 Specs,零售价近 2200 美元。消息公布后股价下跌超 5%,从 $5.86 跌至 $4.83。CEO Evan Spiegel 称其定位为高可穿戴性的沉浸式计算设备,价格与高端笔记本相当。但核心用户青少年缺乏购买力,市场对其盈利前景存疑。
查看原文After unveiling ridiculously expensive AR glasses, Snap's stock takes a dive
5 天前
TechCrunch:AI(RSS)技巧与观点年初硅谷掀起"tokenmaxxing"热潮,CEO鼓励员工最大化AI使用量,随后账单涌现:Uber数月内耗尽年度AI预算,部分公司削减组织内的Claude许可证,Meta取消内部AI排行榜。NEA合伙人Tiffany Luck认为企业仍在摸索AI投资回报率,她在TechCrunch播客中谈到个人智能体前景、今年AI IPO以及帮助追踪AI支出的创业公司机遇。
查看原文NEA's Tiffany Luck says enterprises are still figuring out their AI ROI