决战谷歌 Gemini 3
面对谷歌 Gemini 3 的强势反扑,OpenAI 内部进入“红色警报”状态,暂停次要项目全力优化 ChatGPT。代号 "Garlic" 的新模型(预计为 GPT-5.5)在预训练上取得重大突破,旨在从推理和体验双重维度夺回王座。
巨头激战,开源突围
数据来源:DeepSeek V3.2 技术报告,DeepSeek 展现极致性价比
面对谷歌 Gemini 3 的强势反扑,OpenAI 内部进入“红色警报”状态,暂停次要项目全力优化 ChatGPT。代号 "Garlic" 的新模型(预计为 GPT-5.5)在预训练上取得重大突破,旨在从推理和体验双重维度夺回王座。
DeepSeek V3.2 在智能体评测中登顶,标准版推理能力媲美 GPT-5,成本却仅为后者的 1/24。其技术报告证明了强化学习在长上下文下可持续扩展,宣告了高性能 AI 不再需要天价投入。
AWS CEO 在 10 分钟内发布了包括 Trainium4 芯片、Nova 2 系列模型在内的 25 款新品。值得关注的是,中国大模型 Kimi 和 MiniMax 首次被纳入 Amazon Bedrock 平台,开启全球化应用新篇章。
Anthropic 收购极速 JavaScript 运行时 Bun,旨在打造 AI 原生开发栈护城河。其 AI 编程工具 Claude Code 发布仅 6 个月,年化收入已突破 10 亿美元,展现出惊人的商业变现能力。
Mark Chen 透露 OpenAI 正专注于预训练突破以应对 Gemini 3,并确信“AGI 正处于生产过程中”。他强调了 AI for Science 的潜力,以及在激进的人才争夺战中保持开放文化的重要性。
主打工业场景的仙工智能再次递表港交所。尽管营收突破 3.39 亿元,但仍面临盈利挑战。其“控制器+机器人+软件”的一站式解决方案,展现了具身智能在工业领域的商业化探索。
数学圣殿 IPAM 获得 NSF 续命资金,但经费大幅缩水。陶哲轩呼吁社会关注基础科学资助体系的脆弱性,这一事件折射出美国当前科研预算削减对顶尖学术机构的冲击。
[新产品] AI 抗体设计模型 Chai-2 横空出世,能设计全长单克隆抗体,86% 的设计具备成药性。它攻克了 GPCR 等“不可成药”靶点,将抗体药物发现带入理性设计时代。
[工具] 通过引入 TDD 和计划审批机制,Superpowers 插件强迫 Claude Code 遵守高级软件工程规范。它将模糊需求拆解为可验证的微任务,解决 AI 编程“始乱终弃”的通病。
[应用] 腾讯广告算法大赛揭示了推荐系统的新方向:从“检索-排序”迈向“端到端全模态生成”。00 后团队利用 LLM 和 Muon 优化器夺冠,展示了学术界与工业界在生成式推荐上的技术融合。
在 AI 智能体系统中,速度与可靠性是核心。本报告详细拆解了从“并行工具使用”到“竞争性智能体集成”的 14 种并发模式。通过并行假设生成、分层团队协作和冗余执行等策略,解决 I/O 延迟和单点故障,为构建复杂、鲁棒的 AI 系统提供了系统性工程指南。