AQ Tech Blog

2024年版・主流AIGCサービスの紹介と比較【どんなサービスがあるの?】

作成者: musheng.chen|2024年10月04日

はじめに

この記事では、最近注目を集めている AIGC(人工知能生成コンテンツ) サービスの紹介と、それぞれのツールがどのように使われているかを解説します。
AI技術を活用することで、テキスト生成、画像生成、対話型キャラクター作成など、私たちの仕事や日常生活が一段と便利になってきました。
今回は、代表的なサービスやツールをカテゴリ別に紹介し、使い方や利便性、今後の発展について比較します。

記事の目的と狙い

  • AIGCサービスの概要を初心者にも分かりやすく紹介
  • 各サービスの特徴や使用例をシェア
  • AIサービスの今後の発展とその利用シーンを説明

AIGCのトレンド

AIGC(生成AI)はここ1年で急速に普及し、私たちの生活や仕事に大きな変化をもたらしています。
特に、ChatGPTが登場してから、動画生成やワークフローツール、クリエイティブ作業支援ツールなど、さまざまな分野でAIが使われるようになりました。

2024年3月のThe Top 100 Gen AI Appsの報告によると、生成AIを使った製品が数多く登場し、その人気が急速に高まっています。
特に、以下の点が注目されています。

  • AIツールが業務効率を大幅に向上
  • 新しいワークフローの創出
    • AIは従来の業務フローを改善し、より効率的なワークフローを構築するために活用されています。
      たとえば、AIがデータを解析し、改善点を自動的に提案・実行するシステムが広がっています。
  • プロダクティビティツールの進化
    • 多くの生成AIアプリはGoogle Chrome拡張機能を介して利用されており、ユーザーが既存の作業フロー内で直接AIを活用できるように設計されています。

このような流れを受けて、これからもAIGCサービスはさらに進化し、より多くの分野での活用が期待されています。

AIGCサービスのリポートと比較

2024年3月の時点で、トップ50のAIGCサービスのランキングは以下となっております。

AIアシスタント

  ChatGPT Claude
背景 OpenAIが開発した会話型AIで、高度な自然言語処理技術を用いて、文章生成、会話、質問応答が得意 Anthropicが開発したAIアシスタントで、倫理的なAI利用に重点を置いている
利便性 作業の効率化や、複雑な問題解決の手助けとして活用でき、多くの業務が自動化される 業務を効率化しつつ、特に倫理的な判断が求められるシーンでの信頼性が高い
使用例 企業ではカスタマーサポートやデータ分析、記事作成などに幅広く利用されて、プログラミングのサポートツールとしても人気 企業内のデータ分析やレポート作成、リスク評価などで使われて、特に、安全性が求められる場面でのAI応答が特徴

2024年8月のThe Top 100 Gen AI Appsの報告によると、AIアシスタントの競争がますます激化しています。
ChatGPTは引き続き、ウェブとモバイルで第1位の人気を誇っていますが、新たな競争相手も登場しています。

特に注目すべきは、AI検索エンジンであるPerplexityです。
リアルタイムで正確な情報を提供し、出典も明示するため、ユーザーから高く評価されています。
Perplexityは、訪問時間の平均が7分を超え、ユーザーの深い関与を示しています。

また、Claude(Anthropic社開発)は、ChatGPTの強力なライバルとして台頭し、ウェブランキングで第4位にランクインしました。
これに加え、Anthropic社は新たにArtifactsを導入し、ChatGPTのGPTs機能に直接対抗しています。
これらの動向から、今後さらにAIアシスタント市場の競争が激化することが予想されます。

画像生成

  MidJourney Leonardo AI
背景 テキストからアートや画像を生成するAIツールで、クリエイティブなコンテンツ作成に強い プロフェッショナルやクリエイター向けの画像生成ツールで、クリエイティブなプロジェクトに特化している
利便性 アーティストやデザイナーが使いやすいインターフェースで、素早く高品質な画像を生成可能 クリエイティブなプロジェクトにおいて、短期間で高品質なビジュアルを生成でき、プロジェクトのスピードアップに貢献する
使用例 デジタルアートや広告、ゲームデザインなどのビジュアルコンテンツを効率よく作成できる デザイン業務やマーケティングに活用され、特にゲームや映画制作などで使われている

ちなみに、Stable Diffusionは、オープンソースのAI画像生成モデルで、コミュニティによって常に改善されています。
広告やデジタルアート、ゲーム業界での画像生成に使用されています。
多様なシーンで活用され、クリエイターが自分のスタイルに合わせたカスタマイズが可能です。

また、ChatGPT Plusプランのユーザーが画像生成機能にアクセスできるようになりました。
Plusプランに登録して、画像生成機能を使用し、DALL·Eの最新モデルを利用することが可能です。
以下はChatGPT 4oで生成した画像となっております。

AIモデルプラットフォーム

AIモデル とは、膨大な学習データをもとにして、特定の用途に合わせて訓練されたプログラムです。
このAIモデルを使うことで、画像生成や自然言語処理、音声認識など、さまざまなタスクを効率的に処理できます。
以下では、AIモデルを利用できるプラットフォームを紹介します。

  Civitai Hugging Face
背景 AIモデルを簡単に共有できるプラットフォームで、特にStable Diffusionモデルの拡張が得意 さまざまなAIモデルを提供する大手プラットフォームで、自然言語処理や画像生成モデルを中心に取り扱っている
利便性 オープンソースのAIモデルを気軽に利用でき、クリエイティブなプロジェクトに迅速に取り組むことができる 豊富なオープンソースモデルが揃っており、プロジェクトに必要なモデルを簡単に導入できる
使用例 クリエイターがAIモデルを収集し、独自のプロジェクトに利用している 企業や研究機関がNLPモデルを使ってアプリケーションを開発している

AI対話キャラクター

  • Character.AI
    Character.AIは、ユーザーがカスタマイズした対話型キャラクターと会話できるプラットフォームで、感情豊かなAIとの対話が可能です。
    個人の対話エンターテインメントや教育、さらには感情支援の場面で使われています。
    エンターテインメントや教育の場で深いエンゲージメントが可能で、特に若者に人気があります。

The Top 100 Gen AI Appsの報告によると、Character.AIはユーザー1人あたり高い使用率を誇っています。
これらのデータから、AIアシスタントは「恋人」や「友達」としての役割を超え、友情やメンターシップ、さらにはエンターテインメントや医療分野にも広がりつつあることがわかります。

Stable Diffusionの説明と使い方

背景・コミュニティ現状

Stable Diffusionは、特にオープンソースの画像生成モデルとして、クリエイターの間で高い人気を誇ります。
GitHub上で活発に開発が進められており、コミュニティによる貢献が大きな特徴です。
多くのクリエイターや研究者が関わっており、さまざまな拡張機能やカスタマイズが可能です。

使用シーン

  • txt2img

    • テキストから直接画像を生成します
    • 例:beautiful landscapeと入力することで美しい風景画像が生成されます
  • img2img

    • 既存の画像を基に新しい画像を生成します
    • 例:既存の風景写真を加工し、スタイルを変更した新しい画像を生成します
  • upscale

    • 画像の解像度を向上させます
    • 例:低解像度の画像を高解像度に変換し、ディテールを鮮明にします


Base ModelとLoRAの違い

  • Base Model

    • 標準的な画像生成モデルで、さまざまな用途に使用できます
  • LoRA(Low-Rank Adaptation)

    • 特定のスタイルやタスクに特化した小規模モデルで、カスタマイズ性が高いです

参考記事:【Stable Diffusion Web UI】追加学習モデルLoRAの使い方

Stable Diffusionのインストールと使用例

New install:

  1. If Homebrew is not installed, follow the instructions at https://brew.sh to install it. Keep the terminal window open and follow the instructions under "Next steps" to add Homebrew to your PATH.
  2. Open a new terminal window and run brew install cmake protobuf rust python@3.10 git wget
  3. Clone the web UI repository by running git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
  4. Place Stable Diffusion models/checkpoints you want to use into stable-diffusion-webui/models/Stable-diffusion. If you don't have any, see Downloading Stable Diffusion Models below.
  5. cd stable-diffusion-webui and then ./webui.sh to run the web UI. A Python virtual environment will be created and activated using venv and any remaining missing dependencies will be automatically downloaded and installed.
  6. To relaunch the web UI process later, run ./webui.sh again. Note that it doesn't auto update the web UI; to update, run git pull before running ./webui.sh.
  • txt2imgの使用例
  1. Base Modelをダウンロードして、プロジェクト「stable-diffusion-webui」のフォルダーmodels/Stable-diffusionに配置します。
    ※今回使用したモデル: Stable DIffusion 1.4 (sd-v1-4.ckpt)

  2. ターミナルで./webui.shコマンドを実行し、「http://127.0.0.1:7860」Webページを開きます。

  3. Stable DiffusionのWebページで、様々な画像を生成します。

プロンプトやその他の関連パラメーターを継続的に調整したり、モデルを最適化したりすることで、生成されたイメージの品質を継続的に向上させることができます。


ChatGPTとStable Diffusionの連携

Stable Diffusionを使って画像を生成する際には、ユーザーが入力する様々な言語や表現を正確に反映することが重要です。
そこで、ChatGPTと組み合わせて、ユーザーの画像生成リクエストを最適化されたStable Diffusionのプロンプトに変換する手法が、実際のAIGCプロジェクト開発でよく使われています。

たとえば、ユーザーが入力した各言語のリクエストをChatGPTで精密に解析し、より具体的で質の高いプロンプトに変換することで、生成される画像の質が向上します。

連携例

  1. ChatGPTで新しいチャットを作成して、以下のメッセージを送信する。
You will now act as a prompt generator for a generative AI called "Stable Diffusion." Stable Diffusion AI generates images based on given prompts. I will provide a concept, and you will provide the prompt for Stable Diffusion AI. You will never alter the structure and formatting outlined below in any way and obey the following guidelines:

You will not write the word “description” or use ":" in any form.
The prompt should be detailed and descriptive, using clear imagery and specifying styles, lighting, and other aspects.
You will write each prompt in one line without using return.
The prompts you provide will be in English.
  1. 生成したい画像をテキストで書く、ChatGPTに送信する。
地面から芽吹く若い緑の苗、泥と土と草に囲まれた様子を、鮮明でリアルな質感と奥行きのある高品質な写真で捉えたもの。

  1. ChatGPTで生成されたプロンプトをStable Diffusionに入力し、画像を生成します。

実際のプロジェクト開発では、ChatGPTとStable DiffusionをAPI経由で連携させることで、ユーザーのリクエストをリアルタイムで処理し、最適な画像生成を自動化しています。
Stable Diffusion API Wiki

まとめ

AIGCサービスは今後も進化を続け、私たちの生活や仕事をさらに便利にしてくれるでしょう。
今回紹介したツールを使えば、クリエイティブなアイデアを簡単に形にできるようになります。
これからの未来、AIを活用して、あなたのプロジェクトもより楽しく、効率的に進めてみましょう!

参考・引用

The Top100 Gen AI Consumer Apps - 2024.03
ChatGPT
Claude
MidJourney
Leonardo AI
Civitai
Hugging Face