AI科技日报

智谱SOTA / 谷歌新架构 / 大佬激辩

2025.12.24

Wednesday

数据透视

火山引擎市场份额

数据来源:Gartner & 火山引擎FORCE大会

头条新闻 Headlines

Top Pick

智谱GLM-4.7深夜炸场:编程能力刷新开源SOTA,剑指IPO

#国产大模型 #编程SOTA

2025倒计时之际,智谱AI发布GLM-4.7,在HLE、SWE-Bench等基准测试中超越GPT-5.1,刷新开源编程模型纪录。新模型引入“交错式思考”与“保留式思考”机制,大幅提升复杂推理与长程任务稳定性,不仅前端生成质量飞跃,更打通了从需求到落地的端到端闭环,为智谱IPO冲刺注入强心剂。

谷歌Gemini 3 Flash:看不懂的“黑魔法”架构,参数更小却更强

#模型架构 #Titans记忆

Gemini 3 Flash打破了“参数即正义”的铁律,以极低成本和百万级上下文能力碾压Pro级模型。背后的秘密武器疑似谷歌最新的Titans架构——一种结合Transformer与神经长时记忆(Neural Memory)的新形态。它像人脑一样在推理时实时“学习”并更新记忆,实现了无限上下文与线性复杂度的完美平衡。

火山引擎FORCE大会:AI从“聊大天”进化到“真干活”

#AgentKit #豆包1.8

火山引擎发布多模态模型豆包1.8及全套Agent开发工具,宣告AI进入高频生产态。推出的AgentKit解决了企业级Agent的权限、风控与稳定性难题,配合扣子(Coze)编程版与TRAE IDE,不仅降低了开发门槛,更通过“火山方舟”提供了强化学习自我进化的能力,致力于让AI成为靠谱的“数字员工”。

行业洞察 Insights

新产品 & 硬科技 Tech & Tools

StereoPilot:11秒将2D视频转3D大片

Computer Vision

快手可灵联合港科大(广州)推出单步推理方案,解决了传统方法无法处理镜面反射和格式不统一的难题。利用生成式先验,将转换速度提升至秒级,为VR/AR内容制作带来革命性突破。

单卡训练1亿高斯点:3DGS内存墙被打破

System Optimization

纽约大学推出CLM系统,通过CPU-GPU协同设计,仅用一张RTX 4090显卡配合大内存CPU,即可训练上亿规模的3D高斯模型,重建城市级大场景,打破了显存瓶颈。

阿里RTPurbo:Qwen3长文本推理5倍压缩

Model Compression

阿里RTP-LLM团队发现仅需15%的Attention Head即可保留全局信息。通过Headwise稀疏化和自蒸馏微调,在几乎无损效果的前提下,实现了长序列推理计算开销的5倍压缩

场景应用 Applications

新报告 Reports