AIインフラストラクチャ

生成AI、コンピュータ・ビジョン、予測分析など、最も要求の厳しいAIワークロードを分散クラウドのあらゆる場所でより迅速に実行します。最新のGPUコンピュートをご利用いただければ、32,768 GPU Oracle Cloud Infrastructure(OCI) Superclusterまでスケールアップが可能です。

Suno AIとOCIで誰もが美しい音楽を生成可能に(2:06)

OCI AIインフラストラクチャで実行する理由

最高水準のAIパフォーマンスと価値

OCI AIインフラストラクチャは、推論、トレーニング、AIアシスタントを含むすべてのAIワークロードに、最高水準のパフォーマンスと価値を提供します。

最大32,768 GPUまでスケールアップ

1兆パラメータを超えるAIモデルのトレーニングを高速化できるよう、ベアメタル・コンピュートで業界をリードするスケールを提供できるのは、唯一 OCI Superclusterのみです。

ソブリンAIを実現

オラクルの分散クラウドでは、AIインフラストラクチャをどこにでも導入可能になるため、パフォーマンス、セキュリティ、AI主権の要件を満たせるよう支援します。

AIイノベーターは、OCIを活用して次世代AIモデルをホスト、トレーニング、推論します。

大規模AIトレーニングのためのOCIクラスタの詳細

概要

OCI Superclusterは、1クラスタあたり業界をリードする最大32,768 GPUを導入でき、RDMAクラスタ・ネットワークとローカル・ストレージを活用して、大規模なAIモデルの迅速なトレーニングと推論を実現します。

OCI Superclusterの図は、NVIDIA GPUによるベアメタル・コンピュート、ストレージ・オプション(ブロック、オブジェクト、ファイル・ストレージなど)、およびマイクロ秒のレイテンシと1.6 Gbpsの帯域幅を提供するConverged Ethernet上のRDMAで構成されるクラスタ・ネットワーキングを示しています。

Supercluster向けストレージ

お客様はOCI Superclusterを介して、Exascaleコンピューティング向けのローカル・ブロック・オブジェクト・ファイルストレージにアクセスが可能です。主要なクラウド・プロバイダーの中で、OCIは最高容量の高いパフォーマンス・ローカルNVMeストレージを提供しており、トレーニング実行中のチェックポイントをより頻繁に行うことで、障害からの復旧をより迅速に行うことができます。

BeeGFS、GlusterFS、Lustre、WEKAを含むHPCファイルシステムは、パフォーマンスを損なうことなく大規模なAIトレーニングに利用できます。

スーパークラスタ向けネットワーキング

RDMA over Converged Ethernet v2を実装したMellanoxのConnectX-5 100 Gb/secネットワーク・インターフェイス・カードによる高速RDMAクラスタ・ネットワーキングにより、オンプレミスと同じ超低レイテンシ・ネットワーキングとアプリケーションのスケーラビリティを備えたGPUインスタンスの大規模クラスタを作成できます。

RDMA機能、ブロック・ストレージ、ネットワーク帯域幅に追加料金を支払う必要はなく、最初の10TBのイグレスは無料です。

スーパークラスタ向けネットワーキング
拡大+
この図は、合計1.6 Tb/秒のノード間帯域幅を持つ全二重ネットワーク・ファブリックを介して連携されたノードあたり8個のNVIDIA A100 GPUを持つスーパークラスターRDMAネットワークを示しています。

スーパークラスタ向けコンピュート

NVIDIA H100およびA100 GPUを実装したOCIベアメタル・インスタンスにより、顧客はディープラーニング、対話型AI、生成AIなどの大規模AIモデルを実行できます。Superclusterでは、顧客はクラスタあたり最大32,768個のA100 GPUまでスケールアップが可能です。

図は、NVIDIA A100 GPUを実装したGPUクラスタ・ノードと、レイテンシ2マイクロ秒以下のネットワーキングを示しています。

OCI Superclusterの仕組み

チーフ・テクニカル・アーキテクトのPradeep Vincentが、OCI Superclusterが機械学習モデルのトレーニングと推論を強化し、何万ものNVIDIA GPUにスケールする方法を説明します。

一般的なAIインフラストラクチャのユースケース

GPU、RDMAクラスタ・ネットワーク、OCI Data Scienceを実装したOCIベアメタル・インスタンスでAIモデルをトレーニングします。


ディープラーニング・トレーニングと推論の図および説明
GPU、RDMAクラスタ・ネットワーク、OCI Data Scienceを実装したOCIベアメタル・インスタンスでAIモデルをトレーニングします。

毎日行われる何十億という金融取引を保護するためには、大量の履歴顧客データを分析できる強化されたAIツールが必要となります。NVIDIA GPUを実装したOCI Compute上で実行されるAIモデルは、OCI Data Scienceやその他のオープン・ソース・モデルなどのモデル管理ツールとともに、金融機関による不正行為の軽減を支援します。


AIで強化された不正検出の図および説明
NVIDIA GPUを実装したOCI Compute上で実行されるAIモデルは、OCI Data Scienceやその他のオープン・ソース・モデルなどのモデル管理ツールとともに、金融機関による不正行為の軽減を支援します。

AIは、病院内のさまざまな種類の医療画像(X線やMRIなど)の解析によく利用されています。トレーニングしたモデルを使用することで、放射線科医による早急なレビューが必要な症例の優先度設定を支援でき、その他の症例については決定的な結果を報告することができます。


AIによる医用画像解析の図および説明
GPUを実装したOCI Computeで実行されるトレーニングされたモデルは、医療画像の解析を支援でき、即座に決定的な結果の提供や、さらなるレビューのための画像の優先度設定を行います。

創薬には長い年月と数百万ドルの費用がかかる、時間のかかる高コストなプロセスです。AIインフラストラクチャと分析を活用することで、研究者は創薬を加速することができます。さらに、NVIDIA GPUを実装したOCI ComputeとBioNeMoなどのAIワークフロー管理ツールにより、お客様はデータのキュレーションと前処理を行うことができます。


AIを活用した創薬の加速に関する説明
AIインフラストラクチャと分析を活用することで、研究者は創薬を加速し、データのキュレーションと前処理を行うことができます。

AI infrastructureのお客様事例

他のお客様事例を見る

OCI AIインフラストラクチャの利用開始

Oracle AIを30日間試してみる

オラクルでは、ほとんどのAIサービスで無料価格帯を提供しています。また、無料トライアル・アカウントに提供されるUS$300のクレジットを使って、追加のクラウド・サービスをお試しいただけます。AIサービスとは、開発者がアプリケーションや業務にAIを簡単に適用できるようにする、デフォルトの機械学習モデルを備えた生成AIなどを含む一連のサービスです。

  • Oracle AIおよびMLサービスのうち、無料価格帯を提供しているもの

    • OCI Speech
    • OCI Language
    • OCI Vision
    • OCI Document Understanding
    • Machine Learning in Oracle Database
    • OCI Data Labeling

    また、OCI Data Scienceではコンピュートとストレージの使用料のみ。

その他のリソース

RDMAクラスタ・ネットワーキング、GPUインスタンス、ベアメタル・サーバーなどの詳細をご覧ください。

OCIでのコスト削減を試算してみましょう

Oracle Cloudの価格は、わかりやすく、世界中で一貫性のある低価格であり、さまざまなお客様事例をサポートしています。コストを見積もるには、コスト見積ツールをチェックし、ニーズに応じて、サービスを設定します。

違いを体験してください

  • 1/4のアウトバウンド帯域幅コスト
  • コンピューティングのコストパフォーマンスが3倍向上
  • すべてのリージョンで同じ低価格
  • 長期のコミットメントなしの低価格

AI分野のエキスパートへのアクセス

次のAIソリューションの構築や、OCI AIインフラストラクチャへのワークロードの導入に関する支援をご利用ください。

  • 次のような質問に回答できます。

    • Oracle Cloudを使い始めるには、どうすればよいですか?
    • OCIで実行可能なAIワークロードを教えてください。
    • OCIで提供されているAIサービスを教えてください。