
WWDC26で発表された新しいSiri AIをめぐって、「結局、AppleはGoogleのGeminiを使うことにしたのではないか」という見方が一部で広がっている。
たしかに、今回のApple IntelligenceにはGoogleが関わっている。だが、「Siri AIがGeminiそのもので動いている」と理解するのは正確ではない。
新しいSiri AIとApple Intelligenceの中心にあるのは、Appleが構築した第3世代の「Apple Foundation Models(AFM)」だ。AppleはWWDC26にあわせて、このモデル群の技術的な詳細を公開している。GoogleのGeminiファミリーの技術を活用しながらも、自社の製品体験、オンデバイス処理、Private Cloud Compute、プライバシー要件に合わせて、これを自社のAI基盤として構築したものだ。
つまり今回の関係は、「AppleがGeminiになった」のではなく、「AppleがGoogleの技術とクラウド基盤を取り込み、自社のAI基盤として再構成した」と見るのが近い。
Apple Foundation Modelsとは

Apple Foundation Modelsは、文章の生成や要約、画像理解、音声、アプリ操作など、Apple Intelligenceのさまざまな機能の裏側で動く。いわば、Apple Intelligenceの頭脳だ。
今回発表された第3世代Apple Foundation Modelsは、用途や動作環境に応じて5つのモデルに分かれている。大きく分けると、iPhoneやMacなどの端末内で動くオンデバイスモデルと、AppleのPrivate Cloud Compute上で動くクラウドモデルがある。
簡単な処理や個人情報に近い処理は端末内で行い、より重い処理はクラウド側で引き受ける。この役割分担によって、AppleはAIの性能とプライバシーの両立を図ろうとしている。
5つのモデル。オンデバイス2つ、クラウド3つ
第3世代Apple Foundation Modelsは、用途とハードウェアに合わせて5つに分かれている。
オンデバイスで動くのは、以下の2モデルだ。
AFM 3 Coreは、30億パラメータの基本モデルである。前世代モデルから品質が向上しており、端末内でのApple Intelligenceの基礎を担う。
AFM 3 Core Advancedは、より高性能なオンデバイスモデルだ。200億パラメータ規模のモデルのうち、リクエストに応じて10億から40億パラメータ程度だけを動かすスパースな構造を採る。マルチモーダルに対応し、より表現力のある音声や、高精度な音声入力などを実現する。高性能なApple Silicon向けに最適化されたモデルだ。
Private Cloud Compute上で動くのは、以下の3モデルである。
AFM 3 Cloudは、サーバー側の主力モデルだ。速度と効率を重視し、オンデバイスでは難しい処理を担う。
ADM 3 Cloudは、画像の生成・編集向けモデルである。AFMファミリーの中で画像処理を担当し、写真アプリの編集機能や新しいImage Playgroundを支える。
AFM 3 Cloud Proは、最も高度なサーバーモデルだ。複雑な推論や、複数の手順を伴うツール操作など、要求の高い処理を担当する。

このうちAFM 3 Cloud Pro以外の4モデルは、Apple Silicon向けに作られている。一方、AFM 3 Cloud ProはApple Siliconではなく、Google Cloud上のNVIDIA GPUで動作する。
Googleが関わるのはどこか
ひとつは、モデル構築の段階だ。Appleは第3世代Apple Foundation Modelsについて、GoogleのGeminiファミリーの技術を活用して構築したと説明している。
ただし、これは「完成品としてのGeminiがSiriの裏側でそのまま動いている」という意味ではない。Appleの説明から読み取れるのは、Geminiファミリーの技術を取り込みながら、Appleが自社の製品体験やプライバシー要件に合わせてApple Foundation Modelsとして構築した、という関係だ。
もうひとつは、実行基盤である。最も高度なクラウドモデルであるAFM 3 Cloud Proは、Google Cloud上のNVIDIA GPUで動く。AppleはGoogleおよびNVIDIAと協力し、Private Cloud ComputeをGoogle Cloud上のNVIDIA GPUへ拡張したとしている。
ただし、Google Cloud上で動く場合でも、AppleはPrivate Cloud Computeのプライバシー保証を維持するという。リクエストの処理中、ユーザーの個人データはAppleを含め誰にも保存もアクセスもされず、その仕組みは外部の専門家が検証できるとしている。
整理すると、Siri AIの中心で動くのはApple Foundation Modelsであり、その構築にはGeminiファミリーの技術が活用されている。そして、最も重い処理を担うモデルの実行基盤として、Google Cloud上のNVIDIA GPUが使われる。今回のポイントは、この2つにある。
対応デバイスには差がある
第3世代Apple Foundation Modelsのすべてが、すべてのAppleデバイスで同じように動くわけではない。
特に、最も高性能なオンデバイスモデルであるAFM 3 Core Advancedを動かせるデバイスは限られる。Appleの説明では、iPhone Air、iPhone 17 Pro、iPhone 17 Pro Max、12GB以上のユニファイドメモリを搭載したM4以降のiPad、12GB以上のユニファイドメモリを搭載したM3以降のMac、そしてM5を搭載したApple Vision Proが対象になる。

端末内で大きなAIモデルを動かすには、相応のメモリと処理能力が必要になる。正直、意外と多くの機種が外れたな、というのが第一印象だ。
Apple IntelligenceやSiri AIそのものは、iPhone 15 Proや16シリーズ以降、M1以降のiPad・Macなどで使える。だが、この最上位のオンデバイスモデルとなると、対象は12GB級のメモリを積んだ最新機にぐっと絞られる。
たとえばiPhone 16 Proや、M3以前のiPad、M2以前のMacは、Apple Intelligence自体は動いても、この上位モデルの恩恵までは受けられない。ここは次の買い替えの判断にも効いてくるところだ。Apple Intelligenceが高度化するほど、対応デバイスごとの差はより見えやすくなりそうだ。
Appleが握るのは、体験の設計
今回の発表で重要なのは、モデルそのものだけではない。Apple Intelligenceでは、どの処理を端末内で行い、どの処理をクラウドへ送るかを判断する仕組みも重要になる。

つまり、AIの処理をどこで行うか、どのアプリのどの情報を使うか、どのタイミングでユーザーに結果を返すかといった体験設計は、Apple側が握る。ここに、Appleらしさがある。
AIモデルを単体のチャットボットとして見せるのではなく、iPhone、iPad、Mac、Apple Watch、Apple Vision Proの中に深く組み込み、日常の操作そのものを変えていく。Appleが狙っているのは、OS全体の体験としてAIを機能させることだ。
「Geminiで動く」でも「完全自前」でもない
第3世代Apple Foundation Modelsを理解するうえで大事なのは、極端な見方を避けることだ。
「Siri AIはGeminiで動いている」という見方は正確ではない。Siri AIとApple Intelligenceの中心にあるのは、Appleが構築したApple Foundation Modelsである。一方で、「Googleはほとんど関係ない」と見るのも正しくない。モデル構築にはGeminiファミリーの技術が活用され、最上位モデルの実行基盤にはGoogle Cloud上のNVIDIA GPUが使われている。
つまり今回の変化は、AppleがGeminiをそのまま採用したという話ではない。Googleの技術とクラウド基盤を取り込みながら、自社のプライバシー設計とOS統合の中にAIを組み込んだ、という話だ。
第3世代Apple Foundation Modelsは、その土台にあたる。モデルの名前を競うのではなく、OSに溶け込ませ、あくまでApple Intelligenceとして見せる。派手さはないが、AppleのAIがこれからどこへ向かうのかは、ここに表れている気がする。
