作者 |陈成制作 |网易科技 还没等老王切蛋糕,新王就已经手里拿着刀到门口了。 ChatGPT 刚刚满 3 岁,我们迫不及待地想举办一个安静的生日庆祝活动。 Google Gemini 3 强势回归,让奥特曼大喊“准备过冬吧!” Antropic不遵循武术道德,交出了克劳德的4.5工作,重新获得了“代码之神”的称号。就连卖刀片的Nvidia也不稳定。随着 Google TPUv7 的到来,OpenAI 现在可以充满信心地进行谈判。从模型大战到秘密芯片大战,这周的信息实在是太多了,需要氧气。不用担心。这些“瓜”都是我们自己切的。 1、周末热门话题:OpenAI王座动摇,Nvidia垄断不复存在。 1、Gemini 3超越GPT-5,谷歌市值逼近4万亿美元。 ChatGPT 推出三年后,这家价值 5000 亿美元的独角兽正面临自成立以来最大的危机e 它的成立。英国《金融时报》报道称,随着谷歌Gemini 3的强势推出,业界普遍认为该模型在训练技术上实现了对OpenAI GPT-5的飞跃,OpenAI曾经“遥遥领先”的护城河正在被填补。 Hugging Face 联合创始人直言“世界已经改变”,OpenAI 首席执行官 Sam Altman 也向员工发出不同寻常的警告,为“艰难时期”做好准备。相比之下,谷歌的全面技术整合不仅帮助Gemini应用程序达到了6.5亿月活跃用户,还使其母公司的市值增加到近4万亿美元。连Salesforce的CEO Marc Benioff在测试Gemini 3后都感叹“没有回头路”。AI王座之争正式进入了激烈竞争的新阶段。 2、NVIDIA打破垄断:谷歌TPUv7“大杀四方”,OpenAI趁机降价30%。的f软件层的激烈争夺,与硬件格局的重塑密不可分。谷歌的 TPU 正在突破 Nvidia 的铁幕。由于两个主要的SOTA模型Gemini 3和Claude 4.5 Opus都是在TPU上训练的,谷歌已经开始积极向Anthropic等外部客户销售其最新的TPUv7 Ironwood算力,订单有时超过1GW。半导体行业知名研究和资讯公司SemiAnalysis发布的TPUv7与Nvidia的最新竞争分析受到业界广泛关注。事实证明,卓越的盈利能力 TPU 广告 (TCO) 是领先公司的讨价还价筹码。尽管 OpenAI 尚未正式采用 TPU,但他们能够与 Nvidia 协商,通过实施这一有竞争力的选项,将其计算团队的总成本降低约 30%。 Google 用行动证明,克服 CUDA 护城河的最佳方法是为客户提供真正的“TPU买得越多越好”的体验。 2、本周重磅消息:Claude Opus 4.5 重夺“代码之神”称号。本周最有趣的功能是 Anthropic 发布的 Claude Opus 4.5。在被 GPT-5.1 和 Gemini 3 Pro 取代最大模型的宝座几周后,克劳德终于亮出了自己的王牌,承诺夺回“世界上最强大的 AI”的桂冠。 · 代码熟练度评级:在SWE-bench Verified基准测试中,Opus 4.5取得了令人印象深刻的分数d80.9%,击败了GPT-5.1(77.9%)和Gemini 3 Pro(76.2%)。 · 代理功能,例如 SOTA:Terminal-bench 2.0 和 OSWorld(计算机操作)。在我们的复杂代理基准测试中,Opus 取得了 80.9% 的骄人成绩。它击败了 GPT-5.1 (77.9%) 和 Gemini 3 Pro (76.2%),所有这些都达到了下一代水平 (SOTA)。 · 知名开发者Gene Dai评论:大错误也可以通过一条消息解决。 “价格和市场:当前价格为每百万美元 5 美元代币用于输入,每百万代币 25 美元用于输出。比上一代 Opus 便宜三分之二,但与 Gemini 3 Pro 相比仍然昂贵。 Opus 4.5上线后,各界人士纷纷前来尝试并发表个人感受。著名网络博主@peakcooper周末对Opus 4.5进行全面评测后表示,“这是世界上最好的音调”。“编程史上无错误的逻辑、优雅的代码、独立的调试、严格的指令执行和长上下文中的完美表现,效率提升了25%到35%,堪比2025年的Sonnet 3.5。沃顿商学院人工智能教授Ethan Mollick也公布了AI诗歌挑战赛的结果周末表示,从ChatGPT-3.5到Claude Opus 4.5,AI诗歌挑战赛随着Claude的更新而演变。世界上最好的三个人工智能模型在过去两周内完成了迭代。知名博主 McKay 此前曾开发过操作了一个工作流程,使他能够同时比较三个巨人的表现。从图像到视频,从闭源到开源,开发者有了更多的选择。 · Flux.2:Black Forest Labs 宣布推出备受期待的 FLUX.2 套件(包括 Pro、Flex 和 Dev 版本)。 ·卓越的功能:支持“多参考图像生成”。用户可以上传10张参考图像,生成的AI角色保持一致的绘画风格和面部特征,使其完全适应您的漫画和设计需求。·技术细节:以Mistral-3 24B视觉语言模型(VLM)为核心,支持400万像素原生输出。·性价比:质量与Nano Banana Pro相同,但成本仅Nano Banana Pro的1/3 · 腾讯混元:腾讯发布的混元视频1.5是消费类显卡的福音 · 友好的配置:运行普通消费级GPU,参数加起来只有83亿。有一个庞大的变压器架构。 · 强大的功能:支持720p(可升级至1080p)、10秒视频生成,具有出色的物理和动作一致性。 Weights 是 codeigo 在 Hugging Face 上开放的。 · 阿里巴巴Z-Image Turbo:阿里巴巴统一实验室推出Vincentian Z-Image Turbo图形模型。在武术的世界里,速度是唯一永远不会输的东西。这个 6B 参数 Vincent 图模型专注于极限速度。在 H800 上生成图像只需不到一秒的时间,并且可以轻松安装在具有 16 GB 视频内存的显卡上,同时保持照片级真实感。 4.认真的科学研究和新模型 · INTELLECT-3(106B MoE):Prime Intellect 发布的新开源模型。虽然总参数很大,但激活参数只有12B。它在数学和代码方面表现非常出色(AIME 2024/2025 准确率约为 90%),是目前同类规模中功能最强大的模型。 · Fara-7B:微软发布新设备基于Qwen 2.5调整的代理模型已经发布。可以预测本地设备上的鼠标和键盘操作(订票、网页浏览等)。 WebVoyager得分为73.5%,注重隐私保护。 · DeepSeek Math V2:DeepSeek 专为数学推理而设计的全新开源大规模模型。其主要突破在于引入了自我验证机制,在多项国际数学竞赛中达到了金牌级别,成为第一个开源的奥数金牌级别模型。 · NVIDIA Nemotron-Elastic-12B:NVIDIA 正在研究“弹性推理”架构。通过嵌套模型提取,该模型可以无损转换为较小的6B或9B版本,无需重新训练,大大提高了部署灵活性。 · 混源OCR(1B参数):腾讯推出混源OCR(1B参数),在文档分析和视频字幕提取方面超越Qwen3-V。大型模型如L-72B。 5、行业动态:你唱歌,我出现。除了上面提到的重大公告之外,本周还有一些值得注意的进展: – 硬件: · 阿里巴巴推出了 Quark 人工智能眼镜,并配备了大统壹模型。价格1899元,与Meta Ray-Ban对比。 ——App:Character.AI推出了“故事”功能,用户可以与自己喜欢的AI角色一起创作互动冒险故事。 · LTX Studio 将启动“恢复”功能。这允许用户精确修改视频中的特定镜头或台词,而无需重新生成整个电影。 ・谷歌在美国推出代理呼叫功能。 AI 可以代表您直接致电卖家以检查价格和库存情况。 ——市场:·Anthropic预测人工智能的广泛应用将使美国劳动生产率在未来十年翻倍增长报告已发布。 · 过多的需求迫使 Google 和 OpenAI 限制目前 Sora a 等高算力模型的流量nd Nano Banana Pro ・国家发改委相关负责人提醒,仿人机器人投资力度加大,需警惕产业泡沫。 · Suno 与华纳音乐集团合作,使用真实且经过认证的音乐库开发人工智能音乐工具。 6. 福利:ChatGPT 三周年历史时刻 最后,我们要回顾三年了。本周是 ChatGPT 推出三周年。展望2022年11月,一个简单的聊天框开启了人类历史上最史诗般的技术革命。三年的时间,我们见证了从单纯聊天的聊天机器人,到具有记忆、图像读取、代码创建和推理能力的多功能助手(o1/o3 系列),到现在的 GPT-5.1。正如本文提到的,AI 圈已经是玩家云集,但 ChatGPT 仍然是推倒第一张多米诺骨牌的传奇。历史的车轮继续前进,我们生活在最好的时代梅斯。