Ilya预言扩展终结 · 谷歌Gemini 3反击
OpenAI前首席科学家Ilya Sutskever在最新访谈中断言,预训练+Scaling的时代已遇瓶颈,AI正回归“科研时代”。他认为模型泛化能力远逊人类,单纯堆算力不再是通往AGI的唯一路径,未来应关注更高效的“价值函数”与安全对齐。
谷歌Gemini 3凭借原生多模态能力和TPU集群的深度优化,展现了惊人的推理与生成能力。其不依赖英伟达GPU的高效训练模式,不仅动摇了OpenAI的模型护城河,更直接挑战了英伟达的硬件垄断地位,AI算力战场迎来“三国杀”。
苏黎世联邦理工学院Yuansi Chen证明了困扰数学界30多年的塔拉格兰卷积猜想。这一成果不仅是概率论的重大突破,更为理解生成式AI(特别是扩散模型)处理离散数据提供了直接的数学工具和物理直觉,将深刻影响AI底层理论。
面对谷歌TPU抢夺Meta订单的传闻,英伟达回应称祝贺谷歌成功,但强调其GPU在通用性和性能上仍领先行业一代,不仅是硬件更是全生态平台。
Google Gemini推出File Search API,将分块、索引、检索全流程封装。开发者不再需要手搓RAG流程,工程复杂度被平台吸收,技术门槛归零。
谢赛宁与Jaakkola团队提出FreeFlow,完全无需外部数据,仅从先验分布采样即可实现Flow Map蒸馏,刷新ImageNet生成质量纪录,开启AI“向内挖掘”新范式。
DeepMind研究表明,像预测文本一样逐像素预测图像,在计算量上虽然巨大,但随着算力增长,未来五年内将成为可行的主流范式。
字节跳动推出AI编程IDE,主打“多维上下文管理”和“自动化规划”,从简单的代码补全进化到全流程接管。
全尺寸重型电驱人形机器人,凭借高爆发力电驱系统,在动态平衡与控制上超越液压方案,展示了国产机器人的硬核实力。
首个融合自动驾驶与具身智能的跨域模型,在29个榜单SOTA,打破了室外驾驶与室内操作的感知壁垒。
通用视频智能体框架,整合脚本、生成、编辑全流程。像“AI导演”一样统筹调用工具,实现从创意到成片的一站式自动化。
基于坐标和时间,AI能“凭空”重构历史现场影像。从911到诺曼底登陆,展现了惊人的时空逻辑统治力与创造力。
Artlist报告显示,AI已从实验性工具变为创意领域的利器,"AI创意总监"角色崛起,专注于愿景与品味。