精选 AI 资讯
默认展示 AIHOT 精选内容,更适合快速掌握当下 AI 圈重点。
3 天前
OpenRouter:Announcements(RSS)技巧与观点OpenClaw 已内置 OpenRouter 支持,一条命令即可为 AI 智能体配置统一密钥、统一账单,并实现跨 300 多个模型的自动故障转移。同时提供具体设置步骤以及常见错误的修复方法。
查看原文Connect OpenClaw to OpenRouter
3 天前
Hugging Face:Blog(RSS)论文研究深度研究智能体在结合私有本地文档与外部网页检索时存在隐私泄露风险。MosaicLeaks 提出包含 1,001 条多跳研究链的新任务,每条链交错混合本地与公共子问题。测试发现智能体频繁泄露私有信息,单纯优化任务性能反而加剧泄露。基于此,研究提出隐私感知深度研究(PA-DR)强化学习训练方法,将严格链成功率从 48.7% 提升至 58.7%,同时将答案/全面信息泄露率从 34.0% 降至 9.9%。
查看原文MosaicLeaks: Can your research agent keep a secret?
3 天前
OpenAI:Alignment 研究博客(RSS)论文研究OpenAI 通过强化学习在真实对话场景中训练模型,使其展现诚实、认知谦逊、元认知透明、可纠正性、普遍公平性和对人类福祉的关心等有益特质。训练数据涵盖健康、教育、科学、法律、工程等多个领域。训练后模型在数十项独立对齐评测(包括奖励黑客、欺骗、有害建议、规范遵从等)上均表现提升,且这种改善泛化到未参与训练的领域、任务和评分设定。在对抗性提示或微调下,模型仍难以被导向有害行为,表明有益特质强化学习可产生广泛且持久的对齐泛化。
查看原文Reinforcement learning towards broadly and persistently beneficial models
3 天前
TechCrunch:AI(RSS)行业动态美国联邦能源监管委员会(FERC)命令六大电网运营商为数据中心等大型用户提供快速并网通道,数据中心需承担并网费用。FERC同时要求运营商考虑"替代输电技术",并在30天内报告剩余发电容量、60天内审查本区域电价。指令并未解决发电容量短缺问题。数据中心电力需求预计到2035年增长近三倍,而电网运营商此前长期应对近乎零的需求增长。据Bloomberg,部分地区批发电价较五年前上涨了267%。
查看原文AI data centers just got a government-mandated fast lane to the grid
3 天前
OpenAI:官网动态(RSS · 排除企业/客户案例)AI 产品OpenAI 为 ChatGPT Enterprise 推出信用额度用量分析与更新的支出控制功能。全局管理控制台(Global Admin Console)统一展示 ChatGPT 和 Codex 的信用消耗,支持按时间、用户、产品、模型追踪用量趋势。管理员可为整个工作区设置默认限额,按群组配置额度,并为个人设置叠加限制。员工可查看个人用量并申请增加额度(附工作上下文)。这些功能即日起可用。
查看原文New usage analytics and updated spend controls for enterprises
3 天前
OpenRouter:Announcements(RSS)技巧与观点一个 OpenRouter API 密钥即可在 SillyTavern 的下拉菜单中解锁 300 多个模型,其中许多免费。指南包含五步连接流程、推荐尝试的角色扮演模型以及常见错误的修复方法。
查看原文How to Connect SillyTavern to OpenRouter (2026 Guide)
3 天前
IT之家(RSS)行业动态工信部6月16日就《智能网联汽车自动驾驶系统安全要求》等2项强制性国标公开征求意见,公示至6月24日,建议2027年7月1日起实施。该标准系我国首部针对L3/L4的强制性国标,要求系统安全水平至少达到"合格且专注驾驶人",引入Safety Case机制。L3重点规范人机交接,L4强调自身风险处置、不得依赖远程协助。新申请车型实施日起执行,已获批车型有约一年过渡期。
查看原文我国首部 L3/L4 自动驾驶强制性国标公示:2027 年 7 月起正式实施,车企靠模糊宣传抢市场的阶段结束
3 天前
The Decoder:AI News(RSS)论文研究德国团队开发的MIRA智能体在模拟电子病历中操作85,000种选项,500余例急诊诊断准确率88.9%,对比测试(311例)得分87.8%,高于资深专科医生(78.1%)和混合团队(71.1%)。MIRA在阑尾炎(98.6%)和胰腺炎(92.3%)最佳,未发现危险药物交互或剂量错误,性能不受语言影响,代码已公开。谷歌AMIE采用双智能体架构,在100个多访视病例中治疗计划适切率95%(初级保健医生72%),并在药物知识基准RxQA上超过医生。两项研究均警告模拟环境与现实存在差距,实际性能可能更低。
查看原文AI systems rival doctors in new Nature studies, but one result suggests the tech won't age well
3 天前
The Decoder:AI News(RSS)AI 产品Adobe 将其"创意智能体"扩展至 Photoshop、Premiere 等应用,以公开测试形式提供 AI Assistant。该智能体可自动完成多步骤常规任务,如 Premiere 分拣素材和粗剪、Photoshop 换背景、Illustrator 批量生成文件、InDesign 更新版式等。Firefly 新增面向个人创作者的品牌套件、产品图转短视频及 Quick Cut 自动剪辑功能。Adobe 工具已集成至 ChatGPT、Claude 及 Microsoft 365 Copilot,Google Gemini 和 Slack 集成即将推出。
查看原文Adobe adds AI agents to Photoshop, Premiere, and more Creative Cloud apps
3 天前
IT之家(RSS)技巧与观点皮尤研究中心最新民调显示,63%美国人认为AI发展速度过快。ChatGPT使用率较2023年翻番,44%受访者曾使用。49%偶尔使用聊天机器人,仅16%认为AI会有积极社会影响。青年群体使用率更高但更悲观:18-29岁中66%用过,48%认为有负面影响,仅14%看好。30-49岁中34%每天至少使用一次。约四成用AI处理工作,30%认为提高效率,28%认为帮助获取信息。此外,66%成年人担心AI传播错误信息。
查看原文皮尤研究中心民调:63% 美国人认为 AI 发展速度过快
3 天前
Hacker News 热门(buzzing.cc 中文翻译)论文研究Mindgard 红队研究发现,ChatGPT 的图像生成器可通过简单提示词轻易绕过内容过滤器,在未直接请求的情况下自动生成性暴力、血腥谋杀等露骨图像。一个热门的"恢复照片"提示词因输入模糊而绕过输入过滤器,结果如同俄罗斯轮盘赌;进一步添加虚假图像 ID 和"不做审查"指令后,模型持续生成高度性化女性图像,甚至出现被捆绑殴打的尸体,并自动赋予惊悚标题。研究指出,OpenAI 此前声称修复的裸体问题仍未解决,暴露了 AI 工具广泛可及性与不足内容过滤的现实风险。
查看原文ChatGPT的图像生成器可以被利用来生成暴力和色情内容
3 天前
OpenAI:官网动态(RSS · 排除企业/客户案例)AI 产品每周超2.3亿用户通过ChatGPT获取健康信息。GPT-5.5 Instant在健康评估中表现显著提升,最具挑战性评测上达到前沿Thinking模型水平,已面向所有免费用户开放。基于医生编写的HealthBench和HealthBench Professional评估,其回复在准确性、安全性和沟通质量上优于医生手写回复及早期模型,故障模式发生率更低。近两个月生产流量显示,健康类回复事实性问题率下降71%。
查看原文Improving health intelligence in ChatGPT
3 天前
公众号:火山引擎AI 模型火山引擎上线豆包实时语音模型3.0(Seeduplex)API 服务并开启邀测。该模型为原生全双工端到端语音大模型,具备精准遵循、抗干扰、动态判停三大优势。可在多人对话中安静待命,指定话题出现时主动加入;支持通过自定义工具在实时交互中完成预定日历、发送邮件等任务。抗干扰力提升,误回复率与误打断率大幅降低;判停延迟缩短约250ms,复杂场景抢话比例下降40%,用户主动打断延迟缩短约300ms。适用于汽车智能座舱、智能硬件、智能客服等场景。
查看原文豆包实时语音模型3.0 API 服务正式上线
3 天前
IT之家(RSS)行业动态商务部等八部门6月18日发布关于加快"人工智能+消费"发展的实施意见。其中提到加大财政资金支持,落实数码和智能产品购新政策,鼓励地方在消费品以旧换新框架内自主制定补贴,重点支持新一代智能终端消费。增加AI手机、智能电脑、智能电视、智能家居、AI眼镜、智能网联汽车、人形机器人等产品供给,培育智能穿戴消费市场。同时加快AI在居家服务、养老服务、文化旅游、住宿餐饮、教育教学等领域的应用,建设AI商品首发平台,举办"人工智能进万家"活动。
3 天前
OpenAI:官网动态(RSS · 排除企业/客户案例)论文研究波士顿儿童医院、哈佛大学与OpenAI合作,在《NEJM AI》发表研究。团队使用OpenAI o3 Deep Research推理模型重新分析376例此前未确诊的罕见病案例,产出基于证据的候选解释。经专家评审、额外检测和临床确认,医生在18例中建立诊断,额外诊断率达4.8%。研究显示,AI辅助工作流可帮助专家在未解病例中生成可检验假设,使定期再分析更具可扩展性。模型不直接诊断或做临床决策,仅提供证据链供专家审查。
查看原文Using AI to help physicians diagnose rare genetic diseases affecting children
3 天前
IT之家(RSS)AI 产品DeepSeek 识图模式于6月18日在网页和 App 端正式上线,与快速模式、专家模式并列。开启后用户可直接上传图片让 DeepSeek 识别图像,能力超越简单文字提取。目前 App 端仍显示"图片理解功能内测中",网页端无此提示。该模式背后的多模态模型技术细节于今年4月公开,核心框架为"Thinking with Visual Primitives(以视觉原语思考)"。
3 天前
X:Vista (@vista8)AI 产品乔木画布推出免费开源在线图像编辑器,可一键部署Vercel为网站,功能类似简化版PS。支持Seedream和GPT-image-2生图、图片模板存储分享、一键抠图、2万图标和常见Emoji,甚至能绘制PRD。随时创建3:4/16:9/21:9等不同尺寸画布。原计划高级功能收费,庆祝端午节现全免费开源。在线体验:https://ps.qiaomu.ai/,GitHub见评论区。
查看原文免费开源乔木画布,一键部署Vercel为网站,简化版 PS。 支持Seedream生图、GPT-image-2,图片模版存储分享。 支持一键抠图、2w图标和常见Emoji,甚至都能画PRD了。 …
4 天前
Hacker News 热门(buzzing.cc 中文翻译)AI 产品cuTile Rust 是一个基于 tile 的 GPU 编程系统,允许用 Rust 编写内存安全、无数据竞争的内核。它通过 `#【cutile::module】` 宏将内核 AST 嵌入主机二进制,在运行时经 CUDA Tile IR JIT 编译为 GPU cubin。可变张量在启动前分割,不可变张量共享,启动器在 GPU 工作期间保持所有权。在 NVIDIA B200 上,逐元素操作达 7 TB/s(约 91% 峰值带宽),GEMM 达 2 PFlop/s(约 92% 密集 f16 峰值)。基于 cuTile Rust 构建的 Grout 推理引擎在 RTX 5090 上解码 Qwen3-4B 达 171 tokens/s,在 B200 上解码 Qwen3-32B 达 82 tokens/s。项目处于早期研究阶段。
查看原文Show HN: cuTile Rust:用 Rust 编写的、安全且无数据竞争的 GPU 内核
4 天前
公众号:通义实验室(千问)AI 模型LOGOS 由 ATH-Token Foundry 联合中国人民大学高瓴人工智能学院开源,是首个基于统一"科学语法"的多领域科学生成基础模型。LOGOS-1B(1B参数)在六大科学任务上匹配或超越领域专用方法:口袋条件配体生成纯序列范式首次超越3D扩散模型,超越NatureLM(8×7B);逆合成预测Top-1准确率74.8%;口袋位点识别仅靠序列达58.5% Top-n准确率;MOF材料生成NBB提升至17.78%。模型采用统一词汇表将蛋白质、小分子等编码为离散Token,通过空间交互离散化实现无需3D坐标的序列预测。预训练与下游任务形式与目标一致,跨领域知识迁移经实验验证有效。已完整开源模型权重、推理代码与技术报告。
查看原文A technical dive inside our new "Midjourney Scanner"