【速報】AWS re:Invent2023 アップデート情報(2023/11/29)by Dr. Swami Sivasubramanian

    【速報】AWS re:Invent2023 アップデート情報(2023/11/29)by Dr. Swami Sivasubramanian

    目次

      はじめに

      クラウドインテグレーション部の宮島です。11/27からAWS re:Inventに参加しています。
      今回は、AWS re:Invent 2023のキーノート3日目(Dr. Swami Sivasubramanian Keynote)の発表にフォーカスを当てて、執筆します。

      202312_reinvent3_01

      Amazon BedRock

      Dr.Swamiのキーノートは、AI/MLにフォーカスが当たる内容が盛りだくさんでした。その中で今回最初のトピックで選ばれたのは、Bedrockです。

      202312_reinvent3_02

      新たに、以下二つの外部モデルの対応が発表されました。

      • Claude2.1
        • 既存のClaudeは2.0でした。これにより、2.0と比較して二倍速くなると発表しています。
      • LLama2 70B
        • こちらも同じく、既存のLLama2のモデルである13Bは使用できていました。今回それが70Bのより大規模なモデルとして利用可能になっています。

      delivering key capabilities for enterprises such as an industry-leading 200,000 token context window (2x the context of Claude 2.0), reduced rates of hallucination, improved accuracy over long documents, system prompts, and a beta tool use feature for function calling and workflow orchestration.

      Amazon Bedrock now provides access to Anthropic’s latest model, Claude 2.1

      早速試してみましょう。リージョンはus-east-1です。

      202312_reinvent3_03

      LLama2 70Bが使えるようになっていますね。一旦こちらで検証してみましょう。申請後リロードすると、数分と待たずに有効化されました。
      適当に質問をぶつけてみます。

      70B

      202312_reinvent3_04

      13B

      202312_reinvent3_05

      ・・・正直なところ一見しただけではあまり違いが分かりませんでした。執筆後プロンプトを変えて再チャレンジしてみようと思います。

      Amazon Titan

      今回Amazon Bedrockでアップデートのあったモデルには、当然AmazonTitanも含まれます。

      • Amazon Titan Text Lite
      • Amazon Titan Text Express
      • Titan Multimodal Embeddings G1
      • Amazon Titan Image Generator(プレビュー版)

      せっかくなのでImage Generatorを使って画像を生成してみましょう。
      以下の三枚の画像を見て元のプロンプトがなんだったか分かりますでしょうか?
      実はあまりうまくいっていないのですが、答えとその原因は最後に記載しておきます。

      202312_reinvent3_06202312_reinvent3_07202312_reinvent3_08

      Amazon Bedrockに関連するアップデートとしては、Vector databasesなるものが追加されるようです。執筆時点で詳細が不明なので、情報を得次第また記事にしようと思います。
      Bedrock関連アップデートは以上です。

      Amazon SageMaker HyperPod

      Amazon SageMakerは、機械学習に関連する様々なタスクと、それに必要な機能を包括的に備えたサービスです。
      今回提供されたHyperPodは、これまで対応しきれていなかった学習時の分散処理へのアプローチをするサービスとなります。
      今まで機械学習の分散処理はクラウドの得意領域であるとは言われていましたが、環境を構築するエンジニアのスキルに依存する部分が大きいエリアでした。
      今回、分散処理のオーケストレーションなどをSageMakerに任せることで、分散処理をより気軽に実施することが出来るようになりそうです。

      Announcing Amazon SageMaker HyperPod, a purpose-built infrastructure for distributed training at scale

      Vector search/engine

      Vector searchとは、主にAmazon BedrockやQなど、大規模言語モデル(LLM)を使った開発を行う際に必要となる機能で、顧客データやドキュメントなど、その企業独自のデータを取り扱う際にどんな属性を持つのかで検索が出来る機能です。
      LLMはその特性上ドキュメントをモデルに取り込んでFine-tuningすることが難しいため、DBを検索するような仕組みで都度データを取得、反映する設計にすることが多いです。その検索時に利用されやすいのがVector searchとなります。
      今回はこのVector searchに新たに対応したサービスがアップデートとして発表されました。

      • Amazon OpenSearch Serverless
      • Amazon DocumentDB
      • Amazon DynamoDB
      • MemoryDB for Redis(プレビュー版)

      ゼロETL

      本日もゼロETLをサポートするサービスが新たに公開されました。

      • Amazon OpenSearch with S3(プレビュー)

      202312_reinvent3_09

      Amazon OpenSearchの全文検索対象としてS3を指定できると、データの追加や削除がかなり容易になるのではないかと思います。

      You can now analyze infrequently queried data in cloud object stores and simultaneously use the operational analytics and visualization capabilities of OpenSearch Service.

      Announcing Amazon OpenSearch Service zero-ETL integration with Amazon S3 (preview)

      Amazon Q

      先日発表のあった、生成系AIによるアシスタントサービスです。
      三日目にも新たな発表があったので記載しておきます。

      • Amazon RedShiftにて、自然言語でRedShiftのSQLを生成する機能
      • 近日中にGlueのパイプラインとQが統合
        • 執筆時点でまだcoming soonとなっているため詳細は不明ですが、データ統合パイプラインを自然言語で書けるようになるそうです。

      最後に

      Titan Image Generatorで生成した画像のプロンプトは、「海賊旗を掲げるエンジニア」でした!
      1mmもあってないのはなんでだろう?と思って再度、「Engineer raise pirate's flag」で実行したところ、以下のようなこちらの期待した内容に近い結果になりました。
      皆さんも初歩的なミスには気を付けましょう。

      202312_reinvent3_10