隐私至上理念遭遇AI算力瓶颈
苹果始终将用户隐私保护当作核心卖点, Siri 的设计亦是依照此原则, 往昔, 全部语音指令皆优先于 iPhone 本地予以处理, 唯有较为复杂的任务才会上传至苹果自身的私有云, 然而生成式 AI 出现之后, 情形发生了变化, 2025 年苹果内部评估表明, 自建私有云的算力连万亿参数大模型一半负载都无法运行。
这表明, 要是苹果始终坚持仅仅采用自家服务器的话, 那么Siri有好些全新功能压根儿就没办法上线。诸如多模态问答以及长文本总结这类的, 这些呈现出高算力需求的任务必然离不开更为强大的数据中心。如此一来, 苹果因而才迫不得已做出妥协状态, 从而寻觅外部合作。
谷歌与英伟达成Siri新后台

最终苹果选定要与谷歌展开合作, 具而言之, 某些复杂的AI查询不再由苹果的服务器去处理, 而是借助云端接入谷歌所授权的大模型, 那些模型运行于谷歌部署的英伟达B200高端GPU集群之上, B200乃是英伟达在2024年推出的新一代数据中心GPU, 是专门针对超大参数模型训练以及推理而设计的。
根据芯片行业所呈现出的数据来讲, 相比于前一代的H100, B200的AI算力有了大约30%的提升幅度, 它能够以高效的状态去承受肩负万亿级参数模型的实时运算任务。谷歌于全球范围开展运营工作, 所涉及的超过90个数据中心处在运行当中, 在这些数据中心里的部分节点部位, 已经布置安排了数量达到数万块的B200芯片。此次展开的合作情形, 就如同苹果借助借用谷歌所拥有的算力基础设施, 以此来运行Siri一样的情况。
硬件级加密保护用户数据安全
苹果必须解决数据出境所带来的隐私风险这一问题, 为此, 苹果同步采用了英伟达的机密计算技术, 这套能在B200芯片处理用户数据全程实现硬件加密的安全机制, 从数据进入芯片开始, 直至计算完成, 加密层始终生效。
英伟达官方所出技术文档作出说明, 机密计算能够防止云服务商窥探芯片内的数据, 机密计算能够防止网络攻击者窥探芯片内的数据, 机密计算能够防止系统管理员窥探芯片内的数据。也就是说, 即便数据运行于谷歌的服务器之上,苹果的技术可确保用户信息不会被第三方看到, 英伟达的技术也可确保用户信息不会被第三方看到。这等同于给敏感数据添加了一道硬件锁。
本地任务与云端任务重新划分
实施新方案之际, Siri的任务分配会愈发趋向精细化, 基础语音指令像“设置闹钟”以及“打开蓝牙”依旧留在iPhone本地进而予以处理, 是由端侧小模型去完成的, 这些轻量化任务并不牵涉数据上传, 用户隐私得以获得全然保护, 苹果于2024年发布的白皮书表明, 此类本地任务在Siri总请求量里所占比例超过70%。

然而, 长文本总结、多模态问答等具备高算力要求的任务, 将会被分流至谷歌云端。举例来说, 倘若用户要求Siri对一份10页的PDF进行总结, 又或者识别一张图片里的文字并加以翻译, 诸如此类请求便会经由新的云端通道。苹果有着利用AI判定任务复杂度, 进而自动决定是否上传的计划。
功能上线时间与用户预期
如今这套跨越企业的算力合作方案仍处在落地前的筹备环节, 苹果方面的内部消息表明, 完整的Siri AI功能预估会随着iOS 27正式版本的推送而上线, iOS 27系统计划于2026年9月予以推出, 到时用户进行更新后便能够体验新的能力, 初期或许只会覆盖部分国家以及地区, 其中涵盖美国以及欧洲的主要市场。
对于用户最为关心的延迟问题, 苹果以及谷歌正在开展压力测试, 初步工程数据表明, 云端推理响应时间被控制在1秒以内, 几近与本地处理不存在差异, 然而在网络条件欠佳之时, 延迟便有可能增加至2到3秒, 苹果向用户提议保持Wi-fi连接从而获取最佳体验。
苹果与合作方的商业考量
这一回的合作, 之于苹果而言, 属于一次战略层面的妥协, 在过往的十年时间里, 苹果始终都在规避把用户数据交予第三方, 然而大模型所处变革时代, 算力所需成本实在过高, 自行构建百万张GPU卡的集群, 所需投入达到数百亿美金, 作出选择谷歌以及英伟达的决定, 苹果能够省下这笔数额巨大的投资, 与此同时, 能够迅速弥补Siri在人工智能方面存在的短板。
对谷歌来讲, 能够接入苹果那拥有十亿级用户的设备, 这表明其大模型技术得到了最大规模的商用验证。英伟达借助此次合作, 将B200芯片售卖进了苹果生态。三方各自有着自身需求, 然而隐私保护能不能让用户接受, 这还得瞧瞧iOS 27上线之后的实际表现。
你认为此次苹果同谷歌、英伟达的携手合作, 会致使你针对Siri隐私保护的观点发生改变吗, 欢迎于评论区留下言语来进行讨论交流, 点赞以及分享能让更多的人目睹科技巨头隐私方面全新的棋局布局。



