Ilya 52页证词曝光硅谷“宫斗”:OpenAI曾险些与Anthropic合并
OpenAI罢免风波细节曝光。Ilya Sutskever长达52页的证词揭示,他与CTO Mira Murati策划近一年,指控奥特曼“撒谎并挑拨离间”。最重磅的爆料是,在奥特曼被解雇的周末,董事会收到了由Helen Toner带来的与Anthropic合并的提议,并与对方CEO进行了通话。
OpenAI罢免风波细节曝光。Ilya Sutskever长达52页的证词揭示,他与CTO Mira Murati策划近一年,指控奥特曼“撒谎并挑拨离间”。最重磅的爆料是,在奥特曼被解雇的周末,董事会收到了由Helen Toner带来的与Anthropic合并的提议,并与对方CEO进行了通话。
北京智源研究院(BAAI)发布340亿参数的Emu3.5,一个原生的多模态世界模型。该模型基于累计790年时长的互联网长视频数据,采用统一的“预测下一个状态”(Next-State Prediction)自回归架构。配合DiDA推理加速技术,其图像推理速度提升约20倍,在多项基准上表现卓越。
行业分析指出,AI发展的瓶颈正从芯片供应转向电力、数据中心空间和网络带宽。为解决高延迟和数据传输限制,端侧算力已成为必然趋势。英伟达与诺基亚合作开发AI-RAN,旨在将基站变为本地AI数据中心,推动高效小模型在边缘设备上的实时推理,打破“云独大”格局。
硅谷正涌现“OpenAI黑手党”趋势,前员工利用其背景和人脉圈进行创业和融资。前OpenAI产品经理Angela Jiang创办的Worktrace AI,产品尚未上线,仅凭理念就获千万美元融资,投资者包括前CTO Mira Murati等高层,显示“OpenAI血统”已成新的资本信任背书。
资深架构师访谈指出,AI工具正颠覆传统开发模式,架构师的角色正从关注技术选型和代码评估,转向更高层次的产品战略与公司战略。未来的架构师将更像“AI产品经理”或“智能平台设计师”,其核心价值在于组织协调、战略判断和连接业务的“语义管理”能力。
行业观察发现,GPT-4及后续模型普遍存在过度使用破折号(—)的现象,被称为“AI腔”。分析认为,这源于训练数据(大量19世纪末书籍及《纽约客》等文体)和功能便利性。破折号能安全地替代多种标点符号,模仿人类停顿,已成为分辨AI生成内容的重要线索。
美团发布LongCat-Flash-Omni,一款开源SOTA全模态大模型。该模型采用560B总参数与27B激活参数的MoE架构,实现了极低延迟的实时语音和视频交互。它在Omni-Bench等基准上超越Qwen3-Omni,性能媲美Gemini 2.5 Pro,并已上线LongCat APP。
斯坦福大学推出AgentFlow框架,采用模块化架构,使7B小模型在多项复杂推理任务上超越GPT-4o。其核心创新在于Flow-GRPO算法,允许智能体在推理“流”中进行实时在线强化学习(RL),从而根据环境反馈持续优化决策策略,实现自我进化。
Kimi Linear第一作者张宇分享了模型训练感想与架构细节。该模型为48B MoE规模,在5.7T Token上进行训练,核心设计是采用了KDA (Linear Attention) 与 MLA 的3:1混合架构。这一设计在长文任务上兼顾了高效率与强性能,验证了Hybrid Linear路线的可行性。
寒武纪(Cambricon)详细介绍了其统一基础软件平台Cambricon NeuWare,旨在构建CUDA之外的成熟AI生态。该平台实现了从芯片架构到编译优化的全栈协同,已全面兼容最新PyTorch版本和Triton语言,并已在大模型和搜广推等场景完成大规模验证。
快手与南大联合推出HiPO (Hybrid Policy Optimization) 框架,旨在解决LLM的“话痨”问题。HiPO通过混合强化学习,训练模型自主决策何时应启动详细推理(Think-on)或直接给出答案(Think-off),在多个基准上实现效率提升30%、准确率提升6.3%。
快手公布2025年AI深度应用战略,展示AI技术如何全面重塑业务。视频生成大模型可灵(Kling) 2.5 Turbo已投入AIGC短视频生产;自研的OneRec生成式推荐系统,已在电商商城等场景带来超3%的AB效果提升,标志着AI正驱动平台的全链路智能化升级。
百度文心APP(原文小言)推出“魔法漫画”功能,实现AI漫画创作的“拍立得”体验。用户仅需提供一句话或一张照片,AI即可在2分钟内自动生成包含分镜、排版和剧情的多页连载漫画。该功能还支持对已有漫画进行“续写”或“改编”,极大降低了内容创作门槛。
两位20岁的大学辍学生创办的AI笔记应用Turbo AI,在半年内用户从100万激增至500万,年收入超千万美元。该应用能将课堂录音、PDF、YouTube视频自动生成笔记、闪卡和测验题,精准切入学习场景,已获高盛、德勤等企业客户使用。
"规格驱动开发" (SDD) 成为AI编程新方法论,旨在解决AI代码工具的幻觉问题。该流程强制执行“规格说明 (Spec) -> 实施计划 (Plan) -> 可执行任务 (Task)”三步工作流,确保AI在拥有完整技术方案和步骤后再生成代码,极大提升了研发文档的编写效率。
CB Insights发布《AI Agent(智能体)圣经》终极指南报告。报告系统梳理了AI Agent的发展前景与未来趋势,提出了面向2026年的六大关键预测,并绘制了完整的生态版图,深入解析了市场格局、技术堆栈与企业级应用(如代码生产、客户服务)的重塑方式。
中国科学院、人民大学、武汉大学等机构联合小米发布首篇《LLM智能体幻觉综述》。报告指出,智能体幻觉是跨模块的“复合偏差”。综述首次厘清了5类幻觉、18大诱因与10种缓解方案,并开源了300+相关研究论文库。
OpenAI发布官方指南《A practical guide to building agents》,面向产品经理和工程师,介绍如何设计、实施和扩展能自主独立完成任务的AI智能体,为开发者提供了官方实践路径。