DeepSeek 近日低调更新模型(疑似 V4 Preview),将上下文长度从 128K 提升至 1M Token,知识库同步更新至 2025 年 5 月。实测显示其前端逻辑推理与语言风格显著进化,虽然暂不支持多模态,但超长文本处理能力已跻身全球顶尖梯队。
马斯克旗下的 xAI 遭遇人才流失,24 小时内两名联合创始人离职,单月内已损失三位华人核心成员。初创 12 人“梦之队”目前仅剩半数,引发业界对该公司大模型研发进展及团队稳定性的高度关注。
蚂蚁技术研究院开源 LLaDA 2.1 扩散语言模型,通过“可纠错编辑”机制在 100B 规模下实现 892 tokens/s 的峰值速度。该模型成功打破了自回归模型逐字生成的瓶颈,首次在超大规模扩散模型上跑通强化学习,兼顾了生成质量与极致效率。
北京大学彭宇新教授团队推出的 Fine-R1 模型,通过思维链推理增强细粒度视觉识别能力。在每类仅需 4 张图像 训练的条件下,其识别准确率全面超越 OpenAI 的 CLIP 和谷歌的 SigLIP,证明了生成式大模型在判别式任务上的巨大潜力。
本月 AI 产品榜单新星云集:OpenAI 发布了号称最强 Agent 编程模型的 GPT-5.3-Codex;Anthropic 的 Claude Opus 4.6 上下文提升至 100 万并具备自适应思考力;字节 Seedance 2.0 则以一张图生音频多镜头视频惊艳影视圈。
可灵 AI 3.0 正式发布,实现多模态输入输出一体化。新增智能分镜功能,可自动调度景别与机位,大幅提升视频叙事的专业度,图片生成支持深度叙事与组图批量创作,进一步降低了高质量 AIGC 的门槛。
通过 Skywork 部署的 SkyBot(基于 OpenClaw)实现了 AI 从“聊天框”到“数字员工”的进化。它集成了 70+ 种实用工具,能自动打开浏览器、读取网页数据并生成报告,真正实现了 24 小时全天候的自动化办公流程。
该白皮书系统梳理了语言智能从 1950s 至今的五个演进阶段,探讨了其作为独立交叉学科的建制化进程。报告重点勾勒了智能教育、跨语言服务、社会治理及多模态融合四大蓝图,为把握 AGI 未来脉搏提供了权威指南。