引用元HP:Google Cloud Platform公式HP(https://cloud.google.com/)
本記事では、Googleが提供するクラウドGPU「Google Cloud Platform(GCP)」の特徴をまとめています。 GPUの導入を検討している方はぜひ参考にしてください。
GCPのGPUは、その利用目的によってプロダクトと設定方法が異なりますので注意しましょう。まずプロジェクトと課金の確認ですが、GCPコンソールへログイン→ 「IAM と管理」→「クォータ」の順に操作を行います。
次にサービス(プロダクト)の選択についてです。サービス(プロダクト)を選択するにあたっては、機械学習ならGCE、3DCGや画像動画処理ならCompute Engine などといったように、目的に応じて選択するようにしましょう。
次にGPUが必要な理由について記載しましょう。なお、名前とメールアドレスは入力されていると思いますので、「リクエストを送信」をクリックして送信しましょう。電話番号については空欄でも問題ありません。
上記の作業や操作・処理が一通り完了すると、その段階でメールが届きます。届いたメールについては内容をしっかりと確認しましょう。また、メールについてはきちんと保存しておけば後から見返すことも可能です。
Google Compute Engine(GCE)は、Google Cloud Platformのサービスとしてのインフラストラクチャコンポーネントです。Googleの検索エンジンやGmail、YouTube、その他サービスなどを実行するグローバルインフラストラクチャ上に構築されています。
Vertex AI WorkbenchはJupyterノートブックをベースにした開発環境です。データ サイエンスワークフロー全体に対応しており、Vertex AI Workbench インスタンスの Jupyterノートブックから Vertex AIをはじめその他のGoogle Cloud サービスを操作することができます。
GCEとはGoogle Compute Engineの略であり、Google Cloud で提供されている仮想マシンを指します。(VM)Google が用意したインフラストラクチャ上にLinuxやWindows ベースの仮想マシンを立ち上げることができるサービスであり、IaaSに分類されます。
GCPでのGPUを使用したCustom Trainingは通常、Vertex AI を使用して実行されます。これによりユーザーは強力な GPU リソースを活用して機械学習モデルのトレーニングを高速化することが可能です。
Google Cloud Platformは、Google社が利用するインフラを活用できるサービスです。クラウドGPUを備えており、仮想マシンによる機械学習などの処理速度を上げるのに役立ちます。GPUと関連メモリは仮想マシンで直接制御でき、コンピューティングワークロード用とグラフィックワークロード用の2パターンを提供中です。
1年間コミットメントする場合の実質的時間単価は$0.220~1.562(税不明)で、提供モデルによって価格差があります。スポット料金は空きを利用して活用するため、中断する可能性はありますが、1年間のコミットメント価格と比べて最大2分の1の価格で利用することが可能です。
コンピューティングワークロード用のNVIDIA GPUとして、L4・A100・T4・P4・V100・P100・K80を提供しています。グラフィックワークロード用のGPUとしては、NVIDIA RTX 仮想ワークステーションを使用して、L4・T4・P100・P4の仮想ワークステーションを作成できます。
使用するメモリを少なくする混合精度FP16/FP32に関しては、A100が312 TFLOPS、L4が121 TFLOPS、T4が65 TFLOPS、V100が125 TFLOPSです。L4に関しては構造スペースがサポートされているため、パフォーマンス値が2倍に向上します。
Google Cloud Platformには4つのサポートパッケージが用意されており、ブロンズ・シルバー・ゴールド・プラチナとランク別のサポートが受けられます。ブロンズは全てのユーザーが利用できる標準的なドキュメント・コミュニティフォーラム・課金についてのサポートです。
シルバーは一般的な質問とサービスエラーのサポートが受けられ、ゴールドは24時間365日いつでもサポートが受けられるパッケージです。プラチナは最も手厚いサポートが受けられ、テクニカルアカウントマネージャーチームへの問い合わせにも対応しています。
Google Cloud Platform(GCP)のポイント
Google Cloud Platformは、提供しているクラウドGPUが豊富で、任意のスペックを選べることが特徴です。一部モデルでは仮想ワークステーションの作成サポートもあります。また、サポートパッケージの種類がたくさんあるので、初心者や複雑なプロジェクトを実行する場合は手厚いサポートのパッケージを選ぶことも可能です。
▼横にスクロールできます
GPUモデル | NVIDIA T4 | NVIDIA P4 | NVIDIA V100 | NVIDIA P100 |
---|---|---|---|---|
時間課金の場合 | GPUあたり $0.37 |
- | - | - |
月額料金の場合 | - | - | - | - |
GPUメモリ | 16GB | 8GB | 16GB | 16GB |
※2025年7月29日時点での情報です。
それでは次にGCPにおけるGPUの導入事例を紹介します。Compute EngineはGPUを追加することができ、A3 VMなどを使っている場合は自動的にGPUも付いてきます。ぜひ参考にしてください。
Google Cloud のフルマネージド環境を採用して、導入から運用管理までの作業負荷を大幅に軽減することに成功した事例です。はじめは小さな構成からスタートしていますが、必要に応じてオートスケールすることで急なアクセス増加が発生しても安定して稼働できています。ドキュメントやサポートが充実していて、約10か月の短期間、エンジニア3名のリソースで、ゲーム開発環境・運用インフラを構築ができています。
参照:Google Cloud(https://cloud.google.com/customers/preferrednetworks?hl=ja)
かつて使っていたワークステーションはかなり古いもので、ディープラーニングを本格的に研究するためには力不足でした。Google Cloudの導入で、それぞれのエンジニアがリソースを考えることなくAI開発を行えるようになり、スピードが大幅に向上しています。Google Cloud のプロダクトを駆使することでこれまでは丸一日以上もかかっていたような処理が 30 分で完了し、また、新規採用したエンジニアのための開発環境をスピーディーに用意できるようになるなど、人材活用の効率も大幅にアップすることができています。
参照:Google Cloud(https://cloud.google.com/customers/subaru?hl=ja)
コスパ
シェア
ラインナップ