全部 AI 动态
查看 AIHOT 全量动态流,适合需要更完整视图时使用。
2 天前
X:SemiAnalysis (@SemiAnalysis_)行业动态Bessemer 合伙人 Adam Fisher 称,一些新云公司担心若未购买英伟达全套硬件,可能被"关进 Jensen 监狱"--即失去芯片配额。黄仁勋似乎在暗示,若不买全套就会削减配额。主推文称正在出售,有意者私信询价。
查看原文We are selling, DM for pricing
2 天前
X:Berry Xia (@berryxia)技巧与观点用户@justinleei分享从年初至今的智谱GLM使用体验:订阅GLM完成两个项目(1个商用上线),认为其多种文档格式解析综合能力优于竞品,与Claude Code体验无明显差距。期间算力紧缺时出现过降智,响应慢但结果可接受。近期使用的zcode比第三方agent更快。主推文@berryxia赞同此评价,认为智谱能力当前为国产模型第一档,甚至优于DeepSeek。
查看原文真的,同意刚哥的看法,不吹不黑。 当时很多人问我体感和实际体验吗,真的非常明显。 除了算力限速外,真的能力现在是国产模型中第一档了。 比DS都好使,就是这样。
2 天前
X:Rohan Paul (@rohanpaul_ai)行业动态白宫与Anthropic正合作制定正式技术评估框架,用于量化AI模型越狱攻击的严重性,并建立标准化评估方法论。框架将开发通用基准,评估防护被绕过程度、暴露的能力、攻击可重复性及实际运营后果。双方认识到完全免疫越狱并非可行目标。近期红队研究表明,强化后的前沿模型Fable 5比Opus 4.8更鲁棒,但在持续自动化攻击下仍产生有害输出。新框架每次以相同问题衡量风险,被视为更务实的监管路径。
查看原文The White House and Anthropic may have found the first serious path to restore Mythos and Fable acce…
2 天前
IT之家(RSS)论文研究麻省理工学院一项为期4周、67人参与的研究发现,过度依赖AI助手可能削弱批判性思维。实验使用基于GPT-4o并接入谷歌搜索的聊天机器人,参与者借助AI判断新闻标题和图片真伪时,正确概率提高21%,但在无AI帮助时独自识别错误信息的表现下降15.3%。研究指出,AI直接给出答案而非引导思考,短期内提升准确率,长期却削弱独立判断力,约四分之一参与者误以为能力提升,实际表现已变差。
查看原文When an agent says it's going to do something manually 👀
2 天前
X:Rohan Paul (@rohanpaul_ai)AI 产品OpenAI 将前沿健康 AI 能力从 premium 推理模型迁移至免费版 GPT-5.5 Instant,使其健康评估表现接近 Thinking 模型。每周超 2.3 亿用户通过 ChatGPT 咨询健康问题。OpenAI 采用知识蒸馏:由更强教师模型与 260+ 名医生(覆盖 60 国、49 种语言、26 专科)审查超 70 万条模型响应,训练学生模型学习临床回答模式。训练结合监督微调与偏好训练,重点提升"不确定性下的行为"(如主动询问年龄、症状等缺失信息)。真实健康流量中事实性问题减少 71%。GPT-5.5 Instant 已向全体免费用户开放。
查看原文This is really good. OpenAI just moved frontier-level health AI from premium reasoning models into …
2 天前
X:Berry Xia (@berryxia)技巧与观点Berry Xia 发现 @MengkePM 是 Apple Swift 移动应用创新大赛指导老师,随即关注学习,并认为其文章同样适合 MCN 机构和 AI 市场部的同学阅读参考。
查看原文居然是Apple Swift 移动应用创新大赛指导老师,果断关注学习。 MCN机构、AI市场部的同学们都可以学习,不错的文章。
查看原文What happens to the law when AI is the judge, jury &; executioner
2 天前
IT之家(RSS)行业动态中国自动驾驶公司 Momenta 估值已升至约 90 亿美元,正筹备赴港上市,计划通过 IPO 募资约 10 亿美元。中国证监会于 6 月 10 日发出通知,批准 Momenta 在港最多发行 4375 万股的备案申请。Momenta 定位为自动驾驶汽车的"大脑",向车企提供驾驶辅助解决方案。若成功上市,将成为继文远知行、小马智行后又一家赴港融资的中国自动驾驶初创企业。
查看原文消息称 Momenta 估值冲至 90 亿美元,赴港 IPO 剑指 10 亿美元募资
2 天前
X:Kim (@kimmonismus)行业动态某人在Reddit上搭建了一个WoW私服,包含1800个机器人,并通过DeepSeek API实现AI聊天。
死互联网理论,但可玩。
一个没有真实玩家的MMORPG,却不知何故仍然感觉像人类。
查看原文Someone on Reddit built a WoW private server with 1,800 bots and AI chat via the DeepSeek API. Dead…
2 天前
IT之家(RSS)技巧与观点6月17日,智谱开源新旗舰GLM-5.2,在FrontierSWE编程测试中得分74.4,超OpenAI GPT-5.5,仅落后Claude Opus 4.8约1个百分点。有网友提问中国大模型何时达到Anthropic Fable水平,马斯克回复可能2027年Q1。智谱联合创始人唐杰回应不需那么久。马斯克补充,跑分赶上相对容易,但以实用性衡量,2027年Q1达到已非常出色。Anthropic Fable 5于6月9日发布,可处理5000万行代码迁移等任务,发布数日后遭管制。
查看原文马斯克预测中国大模型 2027 年 Q1 追上 Anthropic Fable,智谱创始人唐杰回应"用不了那么久"
2 天前
MarkTechPost(RSS)AI 模型Liquid AI 本周发布两款 350M 参数检索模型:稠密双编码器 LFM2.5-Embedding-350M 和后期交互模型 LFM2.5-ColBERT-350M。二者基于 LFM2.5-350M-Base,通过将因果注意力改为双向注意力实现双向编码,支持阿拉伯语、德语、英语等 11 种语言的单语与跨语言搜索。在 NanoBEIR 多语言检索上,ColBERT 版 NDCG@10 为 0.605,Embedding 版为 0.577,均优于 Qwen3-Embedding-0.6B。在 MKQA-11 问答 Recall@20 上分别为 0.694 和 0.691。上下文窗口 32,768 tokens,文档调优至 512 tokens。提供 GGUF 格式,MacBook Pro M4 Max 上查询延迟低于 10 ms。模型以 LFM Open License v1.0 发布在 Hugging Face。
查看原文Liquid AI Introduces LFM2.5-Embedding-350M and LFM2.5-ColBERT-350M: Dense Bi-Encoder and Late-Interaction Models for Fast Multilingual Search Across 11 Languages
2 天前
X:Testing Catalog (@testingcatalog)AI 产品ClickUp 正在为 Brain 开发上下文压缩功能。该功能可在后台压缩整个工作空间(含文档、任务和历史),使 Brain 能像深度研究智能体一样推理多年材料,响应仍保持在秒级。例如,指向多年审计时,Brain 可自动追踪相关政策变更、提取支持文档并生成时间线,无需手动搜索存档。
查看原文ClickUp is working on context compression for Brain! > Brain will be able to condense a complete wo…
2 天前
X:MiniMax (@MiniMax_AI)行业动态MiniMax M3 已成为 B.AI 上最受欢迎的模型,目前免费使用。
感谢 @BAI_AGI 团队让 M3 从第一天起就可用。
查看原文Thanks to the @BAI_AGI team for making M3 available from day one.
2 天前
The Decoder:AI News(RSS)论文研究OpenAI用强化学习在真实对话中训练模型具备诚实、认知谦逊、可纠正性等特质。仅将少量该数据混入常规强化学习后训练流程,模型便在53个独立基准(衡量欺骗、谄媚、奖励黑客等)中的44个上获得改进。健康数据训练也提升非健康评估,反之亦然。模型对有害提示和有害微调更具抵抗力,同时保持有用可操控性,研究者称之为"选择性持久性"。该方法与Anthropic基于"Claude宪法"的宪制式对齐路径不同。
查看原文OpenAI researchers show small doses of "beneficial trait" training make AI models broadly safer and harder to manipulate
2 天前
Artificial Intelligence News(RSS)AI 产品e2e-assure 推出 Cumulo,该平台基于数字孪生技术,通过被动发现持续维护客户环境映射,支持安全攻击模拟与风险预判。零日 SOC 能力可将实时威胁情报直接应用为检测规则。客户专属本地大语言模型部署于主权环境,推理在客户控制基础设施内完成。平台采用分层 AI 架构,多个模型交叉校验每项调查并设置反幻觉层;SC 级安全团队保持"人在回路"决策,避免 AI 自主运行。
查看原文e2e-assure introduces Cumulo, the U.K.'s only sovereign, AI-driven, zero-day SOC platform to secure IT and OT environments
2 天前
The Decoder:AI News(RSS)行业动态Google宣布将对德国慕尼黑地区法院的一项裁决提出上诉。该法院于2026年5月底判决,AI Overviews属于独立内容而非单纯搜索结果,Google需对其直接承担责任。案中AI错误地将两家慕尼黑出版商与欺诈计划关联。柏林法院6月初在另一案中得出相反结论,认为AI Overviews只是另一种形式的搜索结果,Google仅承担间接责任。Google将在上诉中引用柏林裁决。
查看原文Google appeals ruling that made it directly liable for AI-generated search overview content
2 天前
公众号:卡尔的AI沃茨技巧与观点Humanize PPT v0.9 是一款专为演讲场景设计的PPT Skill,核心通过AST(Audience, State, Transfer)逻辑重新编排大纲,将页面渲染外包给下游Skill。渲染前先输出4张真实预览页,并将图片、视频素材的占位与生成prompt写入大纲。新增质检环节自动修复常见渲染问题,并支持演讲模式:按S键在独立窗口显示演讲稿备注,按ESC键打开全局索引快速跳页。项目已开源至github.com/LearnPrompt/humanize-ppt,由卡尔 & yc星辰开发。
查看原文开源一个为演讲而生的PPT Skill,再不用跟观众大眼瞪小眼了
2 天前
X:阿易 AI Notes (@AYi_AInotes)行业动态UCSD 黄碧薇教授将近 30 年 AI 分为四代:相关性小模型、因果小模型、相关性大模型(LLM)、因果大模型,认为我们正站在第四代门口。她深耕因果 AI 12 年,是 causal-learn 作者、Apple Scholar 入选者。其创立的 Aether AI 今日官宣完成首轮融资,被解读为资本开始为下一代 AI 范式(因果大模型)下注,而非继续堆参数、拼体量的"相扑式"竞争。
查看原文做美股的都应该知道这个网站,叫做Finviz。 完全免费,筛股功能比一堆收费软件还全。 你想找"放量突破 50 日均线、离新高一步之遥、内部人还在买的票",它几秒给你刷出来。 基本面、技术面、内…
2 天前
X:Gabriel (@gabriel1)行业动态Gabriel Petersson 已离开 OpenAI。他仍不解此人如何能在公告前一个月得知他离职的消息。
查看原文still have no idea how this guy knew that i left immediately, a month before announcement