下一代旗舰大模型 GLM-5 细节遭泄露。其采用与 DeepSeek-V3 相似的架构,集成 DSA(稀疏注意力) 与 MTP(多Token预测) 技术,总参数量高达 745B。这种架构不仅大幅提升长文本处理效率,更让模型在编程与逻辑推理能力上实现跨越式增长,预示着国产大模型正加速进入万亿参数新纪元。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867980&idx=1&sn=e8ef314ff6da5561d0f677e7ad31b2fc...何恺明团队提出全新 「漂移模型(Drifting Model)」,彻底摒弃扩散模型中复杂的微分方程迭代。通过训练推送分布演化,该模型天然支持 单步推理(1-NFE),在 ImageNet 256x256 测试中 FID 达到 1.54,刷新单步生成纪录。这一范式解决了质量与效率的权衡难题,为实时生成应用开辟了新路径。
来源:http://mp.weixin.qq.com/s?__biz=MzU3Mzg5ODgxMg==&mid=2247496425&idx=1&sn=1c0ebe3d358f116ee15183328eb10972...华为诺亚实验室推出业界首个扩散语言模型 Agent DLLM Agent。与传统自回归模型相比,其展现出“全局视角”的规划能力,任务执行速度平均提升 30%,在特定复杂场景下效率甚至提升 8 倍。该模型能并行提取关键信息并逐步细化,减少了冗余的推理回溯,让 Agent 真正具备了“想得深、跑得快”的特质。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867895&idx=2&sn=d001f0276a2b658171ecc06d47328e85...OpenAI 宣布开始在全美免费版中测试广告功能。广告将以 “赞助内容” 标签区分,且不影响模型回答质量。OpenAI 称此举是为了支撑 8 亿免费用户的算力成本,并推动向更 Agentic(智能体化) 的交互模式进化。这一决策引发了隐私与体验的巨大争议,也预示着 AI 流量变现时代正式到来。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867980&idx=3&sn=7b281c4857c8c0570baa8e2b5a3c0a27...AI Agent 正在经历从“被动响应”到“主动角色”的转变。以 Clawdbot 为代表的新一代智能体,不再等待每一步指令,而是根据环境状态自主触发。通过与 IM 深度集成和本地优先计算,Agent 正从简单的工具演变为具备长期目标意识的数字分身,重塑人类对“需求”与“供给”的认知循环。
来源:http://mp.weixin.qq.com/s?__biz=MzkwMDE2ODgwMA==&mid=2247487951&idx=1&sn=104f4560081904220459bdefdb8664c2...达摩院开源 RynnBrain 具身大脑基模,其 MoE 架构仅需 3B 激活参数 性能即超越 72B 规模模型。核心突破在于赋予机器人“时空记忆”,使其能记住身后物体及历史轨迹,解决“转身就忘”的痛点。该模型支持 20 项具身基准,为分层架构提供了可直接落地的“大脑层”实现。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867794&idx=1&sn=fd45e25630fe4bd806f55bc995797e4d...腾讯混元推出 HY-1.8B-2Bit 模型,内存占用仅 600MB,实际模型体积压缩至 300MB。通过创新的“弹性拉伸量化”策略,在大幅减重的条件下保留了全思考能力。该模型支持思维链(CoT),在移动端生成速度提升 2-3 倍,标志着端侧模型正式进入极小化时代。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867794&idx=2&sn=85bf8513208a77a4ff58432912815580...由前百川智能联创陈炜鹏打造的 Loopit 迅速走红。其内容全由 AI Coding 生成,与手机硬件(陀螺仪、麦克风等)深度融合,实现“吹气吹散蒲公英”等魔性交互。它将创作门槛降至一句话,让用户从“看视频”转向“玩内容”,开启了 AI Native 互动内容平台的新范式。
来源:http://mp.weixin.qq.com/s?__biz=MzIwMTU5OTQ1Nw==&mid=2653724662&idx=1&sn=8afca47365b57a5d68da8d0c587728d4...百度正式揭秘 ERNIE 5.0。其采用 Ultra-Sparse MoE 架构,总参数高达万亿级别,但推理时 激活参数不足 3%。报告详述了其四模态原生自回归统一架构及“弹性预训练”范式,仅需一次训练即可抽取多个子模型,实现了效能与泛化能力的六边形平衡。
来源:http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247867895&idx=3&sn=765f912cd303a19a1c56c4fd7c97493e...白皮书深度拆解了人形机器人的技术收敛路径。报告指出,产业正从“数字大脑”向“钢铁身躯”深度融合,新能源车企的跨界正带来零部件供应链的 “降维打击”。报告预判了从封闭工业场景到家庭服务的“阶梯式落地”路径,为产业链的突破与博弈绘制了详尽地图。
来源:http://mp.weixin.qq.com/s?__biz=MzkwMTYzNzA1Mw==&mid=2247496164&idx=1&sn=9bc7f954aed8a40c2c88b4128312c14c...