精选 AI 资讯

默认展示 AIHOT 精选内容,更适合快速掌握当下 AI 圈重点。

4 天前
X:Yuchen Jin (@Yuchenj_UW)AI 产品
编程的未来不是单一智能体,而是一个完整的AI团队。 Omnigent让你在一个实时会话中运行一个智能体团队:Claude Code、Codex、Cursor、Pi,以及你自己的智能体。 它是一个面向AI智能体的元框架,基于我们内部的Databricks开发工具构建,现已开源给所有人。 由传奇人物@matei_zaharia和Databricks AI团队打造。没错,Matei仍然编写大量代码,包括Omnigent和我们产品的前端代码。
查看原文The future of coding is not one agent. It's a whole AI team. Omnigent lets you run a team of agents…
4 天前
Hugging Face:Blog(RSS)AI 模型
MolmoMotion基于Molmo 2骨干网络,输入视频帧、物体上的3D点标记及文字动作指令(如"移动并旋转桌上放水果的木碗"),预测未来数秒内这些点的3D轨迹。提供两个变体:自回归的MolmoMotion-AR逐步预测坐标,流匹配的MolmoMotion-FM通过连续空间变换处理多可能性运动。同时发布MolmoMotion-1M数据集(含116万视频的3D点轨迹及动作描述)和PointMotionBench基准测试(2700个人工验证视频片段)。模型权重、数据集和基准测试均已开源。
查看原文MolmoMotion: Language-guided 3D motion forecasting
4 天前
Google Blog:AI(RSS)论文研究
今日发表在《自然》杂志上的研究展示了 Google 的医学推理 AI 系统 AMIE(Articulate Medical Intelligence Explorer)从单次诊断对话演进到长期疾病管理的能力。AMIE 利用 Gemini 模型的长上下文能力,整合共情对话智能体和深度思考管理推理智能体,可交叉引用数百页临床指南。在盲测中,AMIE 与 21 名初级保健医生相比,在整体管理推理上匹配临床医生,在计划精确性和指南一致性上得分显著更高。
查看原文New research shows how AMIE, our medical AI, could help manage health conditions.
4 天前
Cloudflare BlogAI 产品
6月17日,Cloudflare 推出 Cloudflare One stack,一组可直接赋予 AI 智能体的技能文件,用于自动配置、部署和管理 Zero Trust 环境。工具集包含两个轻量级 skill:`cloudflare-one` 负责通用产品指导(VPN 替换、网络连接、安全策略等),`cloudflare-one-migration` 提供从 Zscaler、Palo Alto Networks 等厂商迁移的明确引导。技能内置决策树与结构化知识,智能体可自动执行云环境评估、网络拓扑生成及 Digital Experience Monitoring 排障。该 stack 基于 Cloudflare 员工数万小时客户经验提炼,降低学习与迁移门槛。
查看原文Introducing the Cloudflare One stack: agent-powered deployment
4 天前
IT之家(RSS)AI 产品
6月17日,阿里云发布开放式世界模型HappyOyster 1.0(快乐生蚝)。该产品基于原生多模态架构,支持多模态输入与音视频联合生成,可在生成过程中持续接收用户指令并实时响应画面。它深度学习物理世界状态转移规律,保持人物和环境长程一致性。官网开放"实时导演"与"世界探索"两种玩法:前者可随时叫停改写故事、与虚拟男友实时互动等;后者支持自由漫游、滑板冲刺、翼装滑翔、骑马奔驰、攻击打怪等交互。该产品已于今年4月16日开放内测,即日起至7月17日官网不定期掉落体验积分。
查看原文阿里发布世界模型 HappyOyster 快乐生蚝 1.0:一句话生成可实时交互的数字世界
4 天前
Hugging Face:Blog(RSS)AI 产品
AWS(Apache 2.0)开源的 Strands Robots SDK 将 LeRobot 栈封装为 AgentTools,构建统一智能体。默认用 MuJoCo 模拟(无需硬件),mode="real" 切换至真实机器人。可记录演示数据为 LeRobotDataset 并推送 Hugging Face Hub,运行 GR00T 或 LerobotLocal 策略推理,经 Zenoh mesh 广播命令到多台机器人。模拟与硬件代码完全一致,只需改一个关键字参数。示例可在笔记本(Python 3.12+,Linux/macOS)无硬件、无 GPU 运行。
查看原文From the Hugging Face Hub to robot hardware with Strands Agents and LeRobot
4 天前
公众号:火山引擎AI 产品
火山引擎一站式营销创作平台Kickart 3.0(原"创作Agent")正式上线,升级为对话式视频生成模式,用户可通过多轮对话调整商品图、故事板等,用自然语言生成营销视频。新增"爆款裂变"能力,上传视频链接后自动拆解爆款逻辑并重构至新商品视频,支持抖音电商内容合规与质量预审核。平台开放SaaS、API及Skill等多种交付方式,并已接入Seedance 2.0 mini,助力降低广告营销成本。
5 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 产品
在 Mathematica 诞生近 38 年后,Wolfram 语言与 Mathematica 发布 Version 15。每个笔记本内置 AI 助手,支持从 AI 环境中直接调用 Wolfram 技术。新增符号音乐系统、大规模时间序列与事件序列处理、分类数据计算、模型拟合超函数 ModelFit。笔记本支持千兆字节级大小与实时查找,首次引入侧边栏、视觉主题及弃用功能样式。强化了表格连接、多点可视化、图形刻度绘制与轨道运行计算等功能。DSolve 拐角处获得 AI 方法辅助,支持偏微分方程曲线坐标求解。扩充了矩阵分解、多元 zeta 函数与调和数、流线型部分分式分解。强化了 WebSocket 实时连接、Python 交互改进,支持 CUDA 内核作为外部函数,Wolfram Compute Services 新增 GPU 支持。
查看原文Wolfram 语言和 Mathematica 15 版、AI 助手、符号音乐等
5 天前
IT之家(RSS)行业动态
中国正加紧筹建世界人工智能合作组织,欢迎各方加入。2025年7月26日,中国政府倡议成立该组织,作为践行多边主义、推动共商共建共享全球治理的举措,旨在弥合数字和智能鸿沟、促进人工智能向善普惠发展。初步考虑总部设在上海。同日,2025世界人工智能大会发表《人工智能全球治理行动计划》,呼吁各方遵循向善为民、尊重主权、发展导向、安全可控、公平普惠、开放合作的原则,协力推进全球人工智能发展与治理。
查看原文中国正在加紧筹建世界人工智能合作组织
5 天前
X:宝玉 (@dotey)技巧与观点
baoyu-design(本地运行 Claude Design 的 Skill)新增动画视频导出功能。其声明式动画引擎基于 f(t) 设计:任意时间点 t 可绝对确定画面状态。导出采用无头 Chromium 逐帧截图 + ffmpeg 编码,每帧等待两帧 requestAnimationFrame 确保渲染完成。截图以 2 倍 DPR(3840×2160)再缩回 1080p,保证细节清晰。95 秒 30fps 动画需 2850 次截图循环,帧帧精确。项目已开源(MIT),获 1.2K star。此前 baoyu-design 已支持 PPT 本地生成和导出可编辑 PPTX。
查看原文baoyu-design skill 可以在本地生成动画视频,导出 mp4 格式,就像附件视频这个。 Claude Design 网页版可以用提示词创建动画视频,但你需要在网页上才能看到视频,无法下…
5 天前
HuggingFace Daily Papers(社区热门论文)AI 模型
Sumi(日语"墨")是一个完全开源的7B参数均匀扩散语言模型,从零开始在1.5T模型token上预训练。它在知识、推理和编程评测中与同等token预算的自回归模型表现相当,但在常识推理benchmark上略逊,教育密集型数据混合可能是原因之一。Sumi开放模型权重、检查点及完整训练配方(含公开语料数据混合说明),为社区提供首个大规模均匀扩散模型的基准参考。
查看原文Sumi: Open Uniform Diffusion Language Model from Scratch
5 天前
OpenAI:官网动态(RSS · 排除企业/客户案例)论文研究
2026 年 6 月,OpenAI 联合 173 位博士级生命科学家发布 LifeSciBench 评测基准,涵盖 750 个真实研究任务,覆盖证据处理、分析、设计优化等七个工作流及七个生物领域。每项任务配有约 25 条细化评分标准(共 19,020 条),评估模型的科学正确性与实用价值。79% 的任务需多步推理,53% 要求解读图表、PDF 等附件数据,旨在衡量 AI 在复杂、不确定的研究任务中的实际能力,而非仅回答结构化问题。
查看原文Introducing LifeSciBench
5 天前
xAI:News(网页)AI 模型
6 月 17 日,xAI 宣布 Grok 4.3 在 Amazon Bedrock 上全面可用。该模型在前沿模型中达成最低幻觉率,支持 100 万 token 上下文窗口,并提供可配置推理努力(none/low/medium/high)。在 Artificial Analysis Omniscience 基准排名第一,在 Tau2 Telecom 基准评估客服智能体真实工具调用性能排名第一,在 Vals AI Case Law 和 Corporate Finance 基准的复杂文档理解任务排名第一。定价为输入每百万 token 1.25 美元、输出每百万 token 2.50 美元,每美元智能度是其他前沿模型的 2-10 倍。
查看原文Grok on Amazon Bedrock Jun 17, 2026 # Grok on Amazon Bedrock Grok models are now available via Amazon Bedrock. Read More
5 天前
Hacker News 热门(buzzing.cc 中文翻译)技巧与观点
2026年Q1美国成人非虚构书籍销量同比下降9%,自助类下跌26.3%,仅手工艺/爱好/古董/游戏和宗教两个子类别增长。一位出版了多本《纽约时报》畅销书的作者透露,其五本书的印刷版年销量从2022年基准连续下滑:2023年-5%,2024年-13%,2025年-46%,2026年年化跌幅达-57% vs 2025年;若持续,2026年销量将比2022年减少约80%。所有格式在2025年下半年环比上半年下降约45%。作者认为,Claude、ChatGPT等大语言模型能提供更快、更便宜、更个性化的建议,正在系统性取代自助类书籍的"指令传递"价值。头部自助类品牌同期销量也下滑约40-60%,唯一显著变化是AI加速普及。作者判断整个指令传递型内容(包括YouTube教程、播客、在线课程、newsletter)都将面临替代。
5 天前
TechCrunch:AI(RSS)行业动态
Anthropic 5月企业AI订阅市场份额达41%,首次超越OpenAI(39.5%)。公司刚完成650亿美元融资、估值9650亿美元,并因首次盈利季度秘密提交IPO。特朗普政府以出口管制为由要求Anthropic禁止非美国人访问最新模型Mythos 5及Fable 5,导致两款模型下架。Ramp首席经济学家指出,类似争议(如3月被国防部列为供应链风险)反而推动Anthropic企业采用量创纪录。Ramp数据显示,企业支出主要流向Claude Opus模型(最新为Opus 4.8)。
查看原文Anthropic's latest feud with the Trump admin may actually help it, sales data suggests
5 天前
Gary Marcus:The Road to AI We Can Trust(RSS)技巧与观点
评论认为 OpenAI 正面临多重危机:缺乏护城河导致市场领先地位下滑;最大投资者微软持续疏远,近期甚至公开考虑将主要产品外包给中国;亏损速度远超预期,年亏损额以 8 倍增长。华盛顿方面可能打压 Anthropic,但也可能反而帮助其崛起,而 Elon Musk 成为另一个潜在的竞标者。
查看原文OpenAI's lead is dwindling fast
5 天前
X:Kim (@kimmonismus)行业动态
微软正考虑为 Copilot Cowork 提供微软托管的 DeepSeek V4 版本,作为更便宜的模型选项。Copilot Cowork 将放弃无限定价,转向按使用量计费,原因是成本过高(用户每周执行数百项任务导致费用激增)。若采用 DeepSeek,该模型将是可选的、经过微调与安全防护,并完全托管于 Azure。Axios 报道称微软已微调了一个可用模型,最终决定待定。
查看原文Axios reports that Microsoft is considering a Microsoft-hosted version of DeepSeek V4 as a cheaper m…
5 天前
OpenAI:Alignment 研究博客(RSS)论文研究
OpenAI利用WildChat公开数据集(2023年4月至2024年5月收集的100万条对话)模拟模型部署,预测GPT-5.1、GPT-5.2、GPT-5.4在真实生产环境中的不良行为率。与私有生产数据对比发现,WildChat模拟的平均预测误差约3倍;但对技术性和智能体型失调的预测精度下降。研究验证了公开数据集作为外部审计工具的可行性。
查看原文Can public chat data predict real-world AI misalignments?
5 天前
LMSYS:Blog(Chatbot Arena 团队)AI 产品
MOSS-TTS-Local-Transformer-v1.5 是一款开源 TTS 模型,支持 48 kHz 立体声、零样本声音克隆、最长 10 分钟长文本合成、时长控制及 31 种语言。其核心采用 Qwen3-4B 骨干与约 2B 参数的 MOSS-Audio-Tokenizer-v2 音频编解码器,通过 12 个 RVQ 码本运行。SGLang-Omni 以三阶段流水线部署该模型。在 Seed-TTS-Eval 上词错误率 5.10%、语音相似度 69.23%,CV3-Eval 上 WER 7.48%、SIM 61.59%,MiniMax Multilingual 上 WER 6.37%、SIM 75.31%,X Voice 上 WER 20.48%、SIM 63.00%。
查看原文Blog MOSS-TTS Local Transformer v1.5 on SGLang-Omni: Serving Native-Streaming 48 kHz Speech Today we are announcing end-to-end serving for MOSS-TTS-Local-Transformer-v1.5 on SGLang-Omni, together with MOSI and the OpenMOSS Team. MOSS-TTS-Local-Transformer-v1.5 is an open TTS model for 48 kH… MOSI, OpenMOSS Team & SGLang-Omni Team
5 天前
Google Developers Blog(RSS)技巧与观点
Google 分享了三种集成 A2UI 与 MCP Apps 的架构模式,旨在结合两者优势。A2UI 采用声明式框架,通过 JSON payload 定义 UI,由宿主原生渲染,确保一致性与安全性,但受限于预定义组件库。MCP Apps 在 iframe 中使用标准 Web 技术提供自定义界面,但存在设计碎片化、性能与安全挑战。三种模式包括:通过 MCP 服务器提供 A2UI,利用 MCP Resources 或 Tool 调用传递 JSON,实现"一次编写,原生渲染"的跨平台能力;以及静态与动态交付方案。Google 正考虑扩展 MCP 以原生支持 A2UI。
查看原文A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs