Udemy講師クーポン配布中。詳しくはこちら(AIP問題集追加しました)

【無料】AWS AIP-C01練習問題10問|図解解説付き|Udemy講師作成

AWS AIP無料問題集です。正解と解説を確認する際は右側のボタンを押下してください。

問題集の完全版は以下Udemyにて発売しているためお買い求めください。問題集への質問はUdemyのQA機能もしくはUdemyのメッセージにて承ります。Udemyの問題1から10問抜粋しております。

多くの方にご好評いただき、講師評価 4.5/5.0 を獲得できております。ありがとうございます。

特別価格: 通常2,600円1,500円

講師クーポン適用で42%OFF

講師クーポンAWS認定Generative AI Developer – Professional (AIP-C01)模擬試験問題集

AWS認定Generative AI Developer - Professional (AIP-C01)模擬試験問題集

問題文:
ある医療機器メーカーは、複数のAIワークロードをサポートするために基盤モデル(FM)を使用するソリューションを設計しています。一部のFMは診断支援のためにオンデマンドでリアルタイムに呼び出す必要があります。他のFMは過去の診療記録のバッチ処理のために一貫した高スループットアクセスを必要とします。 このソリューションは、ハイブリッドデプロイパターンをサポートし、患者データのレジデンシーとコンプライアンス要件に準拠するために、クラウドインフラストラクチャと病院内オンプレミスインフラストラクチャの両方でワークロードを実行する必要があります。 これらの要件を満たすステップの組み合わせはどれですか。(2つ選択)

選択肢:
A. AWS Lambdaを使用して、Amazon SageMaker AI非同期エンドポイントでホストされたFMを呼び出すことで、低レイテンシのFM推論をオーケストレーションします。
B. Amazon Bedrockでプロビジョンドスループットを設定して、大量ワークロードに対する一貫したパフォーマンスを確保します。
C. Amazon SageMaker Neoを使用してエッジデプロイをサポートするAmazon SageMaker AIエンドポイントにFMをデプロイします。AWS Lambdaを使用してFMをオーケストレーションし、ハイブリッドデプロイをサポートします。
D. オートスケーリング機能を備えたAmazon Bedrockを使用して、予測困難なトラフィック急増に対応します。
E. Amazon SageMaker JumpStartを使用して、FMをホストおよび呼び出します。

正解:B、C

A. AWS Lambdaを使用して、Amazon SageMaker AI非同期エンドポイントでホストされたFMを呼び出すことで、低レイテンシのFM推論をオーケストレーションします。

不正解 SageMaker AI非同期エンドポイントは、大規模な入力データや処理時間が長いワークロード向けに設計されています。推論結果はAmazon S3に非同期で返されるため、リアルタイムの低レイテンシ推論には適していません。低レイテンシが求められる場合はSageMaker AIリアルタイムエンドポイントを使用する必要があります。

B. Amazon Bedrockでプロビジョンドスループットを設定して、大量ワークロードに対する一貫したパフォーマンスを確保します。

正解 Amazon Bedrockのプロビジョンドスループットは、モデルユニット(MU)を購入することで特定のモデルに対して一定のスループットを確保する機能です。各MUは1分あたりに処理可能な入力トークン数と生成可能な出力トークン数という形でスループットレベルを提供し、バッチ処理のように安定した高スループットが必要なワークロードに対して一貫したパフォーマンスを提供します。なお、MUあたりの具体的なTPM(tokens-per-minute)値はモデルごとに異なり、詳細な値や上限引き上げの申請はAWSアカウントマネージャーへ問い合わせる必要があります。

C. Amazon SageMaker Neoを使用してエッジデプロイをサポートするAmazon SageMaker AIエンドポイントにFMをデプロイします。AWS Lambdaを使用してFMをオーケストレーションし、ハイブリッドデプロイをサポートします。

正解 SageMaker Neoはモデルを一度トレーニングすればクラウドとエッジの両方で実行できる機能を提供します。Neoコンパイラがモデルをターゲットハードウェア向けに最適化したバイナリを生成し、AWS IoT Greengrass V2を介して病院内オンプレミスのエッジデバイスにデプロイできます。Lambdaでオーケストレーションすることで、クラウドとオンプレミスの両環境でのワークロード管理を統合的に実現します。なお、SageMaker Edge Managerは2024年4月26日にEOL(サポート終了)となっており、現行でのエッジ向けモデルデプロイはNeoでコンパイルしたモデルまたはONNX形式のモデルを、AWS IoT Greengrass V2経由でエッジデバイスへ配布・実行する構成が推奨されます。

D. オートスケーリング機能を備えたAmazon Bedrockを使用して、予測困難なトラフィック急増に対応します。

不正解 Amazon Bedrockのオンデマンド推論はAWSが内部的にスケーリングを管理するフルマネージドサービスですが、ユーザーが設定する「オートスケーリング」機能は提供していません。また、この選択肢はクラウドのみの対応であり、病院内オンプレミスインフラストラクチャでのワークロード実行というハイブリッドデプロイ要件を満たしません。

E. Amazon SageMaker JumpStartを使用して、FMをホストおよび呼び出します。

不正解 SageMaker JumpStartは事前トレーニング済みモデルの検索・デプロイを簡易化するサービスですが、エッジデプロイやハイブリッドデプロイをネイティブにサポートする機能を持っていません。モデルのデプロイを容易にする点では有用ですが、病院内オンプレミスインフラストラクチャでのワークロード実行という患者データレジデンシー要件には対応できません。

全体的な説明

問われている要件

  • 一部のFMを診断支援のためオンデマンドかつリアルタイムで呼び出す能力
  • 過去診療記録のバッチ処理用の一貫した高スループットアクセスの確保
  • クラウドと病院内オンプレミスにまたがるハイブリッドデプロイパターンのサポート
  • 患者データのレジデンシーとコンプライアンス要件への準拠

前提知識 Amazon Bedrockのプロビジョンドスループットについて

  • プロビジョンドスループットは、特定のモデルに対してモデルユニット(MU)を購入することで一定のスループットを確保する機能です。
  • 各MUは1分あたりに処理可能な入力トークン数と生成可能な出力トークン数というかたちでスループットレベルを提供します。MUあたりのTPM値はモデルごとに異なり、具体的な値・MU単価・上限引き上げについてはAWSアカウントマネージャーへ問い合わせる必要があります。
  • コミットメント期間は「No commitment(なし)」「1か月」「6か月」から選択でき、長期コミットメントほど時間単価が割引されます。ただし一部のモデル(例: Titan Image Generator G1 V1/V2のベースモデル)は「No commitment」での購入に対応しておらず、No commitmentで購入可能なモデルは公式ドキュメントの対応モデル表で確認する必要があります。AWS GovCloud (US-West)ではカスタムモデル+No commitmentのみがサポートされます。
  • カスタムモデル(ファインチューニング済みモデル)を本番で使用する場合は、プロビジョンドスループットの購入が必須です。

Amazon SageMaker Neoによるモデル最適化とエッジデプロイについて

  • SageMaker Neoは「一度トレーニングすればどこでも実行できる」をコンセプトとした機能です。
  • Neoコンパイラは各フレームワーク固有の演算を「framework-agnostic(フレームワーク非依存)な中間表現」に変換した上で最適化を行い、ターゲットハードウェア向けに最適化されたバイナリを生成します(内部的にはApache TVMやTreelite等のオープンソースコンパイラが利用されています)。対応フレームワークにはPyTorch、TensorFlow、MXNet、ONNXなどがあります。
  • エッジデプロイはDLR(Deep Learning Runtime)またはAWS IoT Greengrass V2を介して実行でき、ARM、Intel、NVIDIAなど多様なプロセッサアーキテクチャに対応します。
  • クラウドインスタンス(Inferentiaを含む)とエッジデバイスの両方へのデプロイをサポートします。
  • 旧サービスの SageMaker Edge Manager は 2024年4月26日にEOL となっており、現行の推奨エッジ運用は「SageMaker Neo または ONNX でコンパイル/変換したモデル」を AWS IoT Greengrass V2 で配布・実行する構成です。

SageMaker AIエンドポイントの種類について

  • リアルタイムエンドポイントは、数ミリ秒〜数秒の低レイテンシで推論結果を返します。オンデマンドのリアルタイム推論に適しています。
  • 非同期エンドポイントは、大規模入力や処理時間が長いワークロード向けで、結果をS3に返します。リアルタイム推論には不適切です。
  • バッチ変換はエンドポイントとは異なるジョブベースの大量データ一括処理方式です。

ハイブリッドデプロイとデータレジデンシーについて

  • データレジデンシー要件では、特定の地域のデータがその地域内で処理される必要があります。オンプレミスデプロイはこの要件を満たす有効な手段です。
  • AWS IoT Greengrassを使用すると、クラウドで管理しながらエッジデバイスでMLモデルを実行できます。

解くための考え方

この問題では、FMの推論ワークロードにおける2つの異なるアクセスパターン(リアルタイムとバッチ)に加え、ハイブリッドデプロイという3つの要件を同時に満たす構成を問われています。 まず、バッチ処理の一貫した高スループットという要件に着目します。Amazon Bedrockのプロビジョンドスループットはモデルユニットを事前に確保することで予測可能な一定のスループットを保証でき、大量のバッチ処理を安定して実行する要件に最適です。 次に、ハイブリッドデプロイとデータレジデンシー要件に着目します。Amazon Bedrockはフルマネージドのクラウドサービスであり、オンプレミスデプロイには対応していません。SageMaker Neoはモデルをコンパイル・最適化し、AWS IoT Greengrass V2を介してエッジデバイスやオンプレミス環境にデプロイできます(SageMaker Edge Managerは2024年4月26日にEOL済のため、現行ではNeo/ONNX + Greengrass V2 の経路を用います)。SageMaker AIのリアルタイムエンドポイントでクラウド側の推論を処理し、Neoでコンパイルされたモデルをオンプレミスに配置することで、ハイブリッドパターンを実現します。 非同期エンドポイントはレスポンスがS3経由で返されるため低レイテンシのリアルタイム推論には不適切です。Bedrockの「オートスケーリング」はユーザー設定可能な機能として提供されておらず、ハイブリッド要件も満たしません。SageMaker JumpStartはモデルの発見とデプロイの簡易化に特化しており、エッジデプロイ機能を持ちません。各サービスの推論エンドポイントタイプの特性と、ハイブリッドアーキテクチャの設計パターンを正確に理解することが求められます。 参考資料

目次

スポンサーリンク

以下スポンサーリンクです。

この記事がお役に立ちましたら、コーヒー1杯分(300円)の応援をいただけると嬉しいです。いただいた支援は、より良い記事作成のための時間確保や情報収集に活用させていただきます。

目次