生成AIツールの種類
「生成AIとは」の章で、生成AIが「ゼロから何かを生み出す」画期的な能力を持つことをご理解いただけたかと思います。しかし、一口に「生成AI」といっても、その種類は多岐にわたり、それぞれ得意なことや使える場面が異なります。
ここでは、現在市場に出回っている主要な生成AIツールを、その「種類」ごとに分類し、具体的な代表ツールを多数ご紹介します。ご自身の業務フローで洗い出した「生成AIに任せたいタスク」と照らし合わせながら、最適な「相棒」を見つける参考にしてください。
昨今の生成AIツールはマルチモーダル化(様々な種類に対応した生成AI)が進んでいますが、ここでは主な種類として紹介します。(例:テキスト生成AIですが、画像生成も可能 など)
1. テキスト生成AI
最も身近で、公務での活用可能性も非常に高いのがテキスト生成AIです。
人間が使う自然な言葉を理解し、文章を生成することに特化しています。
1-1. 全般的なテキスト生成・対話型AI
あらゆる種類のテキスト生成、情報要約、質問応答、ブレインストーミングなどに利用できる汎用性の高いモデルです。
ChatGPT (OpenAI)
特徴: 生成AIブームの火付け役となった、最も有名で利用者の多いツールの一つ。人間のような自然な会話ができ、幅広いトピックに対応。文章の生成、要約、翻訳、プログラミングコードの生成など多岐にわたる。無料版と有料版(ChatGPT Plus, Team, Enterprise)があり、有料版はより高性能なモデルが利用でき、機能も豊富。
公務での活用例: 議事録の要約、広報文案の下書き、企画書のアイデア出し、調査レポートの骨子作成、研修資料の作成支援、メール文面作成。
Gemini (Google)
特徴: Googleが開発した最先端のAIモデルを搭載。テキスト、画像、音声、動画など複数の情報を同時に処理できる「マルチモーダル」能力が強み。Googleの豊富な情報源と連携しやすく、リアルタイムの情報検索も可能。無料版と有料版(Gemini Advanced)がある。
公務での活用例: ChatGPTと同様のテキスト生成に加え、Google検索との連携による情報収集、Google Workspace(Google ドキュメント、スプレッドシートなど)との連携による資料作成。
Claude (Anthropic)
特徴: 「憲章AI」を掲げ、安全性と倫理性を重視して開発されたモデル。長文の処理能力が高く、特に長い文書の要約や分析、膨大な情報の中から必要な部分を抽出するのに優れている。ビジネス利用に適した設計。無料版と有料版(Claude Pro, Team)がある。
公務での活用例: 長大な条例や報告書の要約、契約書や規約のレビュー、市民からの詳細な意見書の分析、専門性の高い文献調査。
Copilot (Microsoft)
特徴: Microsoftが提供する、同社のOffice製品(Word, Excel, PowerPoint, Outlookなど)やWindows、Edgeブラウザと連携するAIアシスタント。日々の業務にAIを組み込むことを目指している。Microsoft 365の契約が必要となる場合が多い。
公務での活用例: Wordでの文書作成支援、Excelでのデータ分析補助、PowerPointでのスライド作成、Outlookでのメール作成・要約、Teamsでの会議要約など、日常業務の効率化。
Perplexity AI (Perplexity AI)
特徴: 対話形式の検索エンジン。質問に対する回答を生成するだけでなく、その情報源(ウェブサイトや論文など)を明示してくれる点が大きな特徴。正確な情報収集やファクトチェックに役立つ。
公務での活用例: 政策立案のための情報収集、特定の統計データや法令の根拠確認、最新の先行事例調査、市民からの質問への正確な情報提供のためのリサーチ。
1-2. コード生成・開発支援AI
プログラミングコードの生成やデバッグ、開発作業の支援に特化したAIツールです。
公務でも、簡単なスクリプト作成やシステム連携の効率化に役立つ場合があります。
GitHub Copilot (GitHub / Microsoft)
特徴: プログラマー向けのAIペアプログラマー。コードエディタ内で、コメントや既存のコードから次に書くべきコードを予測・提案してくれる。様々なプログラミング言語に対応。
公務での活用例: VBAマクロの自動生成、データ処理のためのPythonスクリプト作成支援、Webサイトの簡単な改修のためのHTML/CSS/JavaScriptコード生成、システム間のデータ連携スクリプト作成支援。
Amazon CodeWhisperer (Amazon)
特徴: GitHub Copilotと同様に、コードの自動補完や生成、脆弱性チェックなどを行う。Amazon Web Services (AWS) 環境での開発に強み。
公務での活用例: クラウド環境でのシステム開発・運用におけるコード生成支援。
2. 画像生成AI
テキストの指示(プロンプト)から、リアルな写真のような画像や、多様なスタイルのイラストを生成できるツールです。
2-1. 高品質な画像・アート生成A
プロンプトの解釈能力が高く、写実的あるいは芸術性の高い画像を生成できます。
Midjourney (Midjourney)
特徴: 非常に高品質で芸術的な画像を生成することで有名。風景画、キャラクター、抽象画など幅広いスタイルに対応し、特に写真のようなリアルな画像生成に強み。Discord上で操作するのが特徴。
公務での活用例: 広報誌やウェブサイトのメインビジュアル、イベント告知ポスターのデザイン案、観光プロモーション用のイメージ画像、地域紹介パンフレットの挿絵。
DALL-E (OpenAI)
特徴: OpenAIが開発。テキストからの画像生成に加え、既存の画像を元にバリエーションを生成したり、画像の一部を修正したりする機能も持つ。ChatGPTと連携して利用できる場合も。
公務での活用例: Midjourneyと同様の用途に加え、既存の広報素材のバリエーション作成、地図や図のアイコン作成、資料内のイメージ画像の追加。
Stable Diffusion (Stability AI)
特徴: オープンソースで提供されており、個人でも比較的容易に利用できる。カスタマイズ性が高く、様々なモデルや追加学習データを組み合わせて、特定のスタイルや内容に特化した画像を生成できる。ローカル環境での実行も可能。
公務での活用例: 内部資料の図解、研修資料のイメージ画像、Webサイトのブログ記事用アイキャッチ画像、職員向け広報物の作成。独自のモデルを学習させることで、特定の地域の風景やキャラクターを生成することも可能。
Adobe Firefly (Adobe)
特徴: Adobe製品(Photoshop, Illustratorなど)との連携が強く、著作権に配慮した学習データ(Adobe Stockなど)で訓練されている点が大きな特徴。商用利用しやすい。
公務での活用例: 既存の広報デザインへの組み込み、Adobe製品を活用したデザイン業務の効率化、著作権リスクを低減したい広報物作成。
2-2. スケッチ・ワイヤーフレームからの画像生成AI
簡単な手描きスケッチやワイヤーフレームから、より詳細な画像を生成するAIです。
Scribble Diffusion (Replicate / Stability AI)
特徴: 手書きの落書きや簡単なスケッチを元に、高品質な画像を生成できる。
公務での活用例: 職員が手描きした企画書のラフスケッチを清書する、イベント会場の簡単な見取り図からパースを描く、新しい施設の間取り図からイメージ画像を生成する。
3. 音声・音楽生成AI
テキストから音声を生成したり、指示に基づいて音楽を作曲したりするAIツールです。
3-1. 音声生成AI(テキスト読み上げ:TTS)
テキストを入力すると、自然な音声で読み上げてくれます。
ElevenLabs (ElevenLabs)
特徴: 非常に自然で感情豊かな音声を生成できることで有名。多言語対応。
公務での活用例: 市民向けのアナウンス音声(防災放送、イベント告知)、ウェブサイトの音声ガイド、視覚障がい者向けの広報資料の音声化、研修動画のナレーション。
Google Cloud Text-to-Speech (Google)
特徴: Googleの技術を使った高品質な音声生成。様々な声の種類や言語に対応。
公務での活用例: 多言語対応が必要な観光案内音声、公共施設の案内音声。
Azure AI Speech (Microsoft)
特徴: Microsoftの技術を使った音声生成サービス。カスタム音声の作成も可能。
公務での活用例: 庁内システムの音声ガイダンス、高齢者向け情報提供の音声化。
3-2. 音楽生成AI
指示や簡単なメロディから、オリジナルの楽曲を生成します。
AIVA (AIVA)
特徴: 映画音楽やゲーム音楽のような、プロフェッショナルな品質の楽曲を生成できる。特定のスタイルや感情を指定可能。
公務での活用例: 市の広報動画のBGM、イベントのテーマソング、地域PR動画のオリジナル音楽、庁内放送のジングル。
Soundraw (Soundraw)
特徴: ジャンル、ムード、楽器、長さなどを指定して簡単に楽曲を生成できる。ロイヤリティフリーで利用しやすい。
公務での活用例: ウェブサイトの背景音楽、SNS投稿のBGM、庁内プレゼンテーションのBGM。
4. 動画生成AI
テキストや画像、短いクリップから、動画コンテンツを生成するツールです。
RunwayML (Runway)
特徴: テキストから動画を生成する「Gen-1」「Gen-2」機能で注目されている。既存の動画をスタイル変換したり、画像から動画を作成したりもできる。
公務での活用例: 短いニュースクリップ、イベント告知のSNS動画、ウェブサイトの動的な背景、政策説明のアニメーション素材。
Pika Labs (Pika Labs)
特徴: テキストや画像から短い動画を生成できるAI。動きやスタイルを指定できる。
公務での活用例: SNSでの情報発信、災害時の注意喚起の短い動画、観光地の魅力紹介。
HeyGen (HeyGen)
特徴: テキストを入力するだけで、AIアバターが話す動画を生成できる。多様なアバターと音声、言語に対応。
公務での活用例: 市長や広報担当者のAIアバターによるメッセージ動画、多言語での情報提供、研修動画の講師役。
5. その他の生成AIツール
上記以外にも、特定の用途に特化した様々な生成AIが登場しています。
3Dモデル生成AI: テキストや2D画像から3Dモデルを生成。
代表例: Luma AI, CSM.ai
公務での活用例: 都市開発のシミュレーション用3Dモデル、公共施設のバーチャル見学、歴史的建造物のデジタルアーカイブ化。
プレゼンテーション生成AI: プロンプトからプレゼンテーションのスライドを自動生成。
代表例: Tome, Gamma
公務での活用例: 議会への説明資料のたたき台、市民向け説明会のスライド作成、内部研修資料の自動生成。
データ分析・可視化AI: テキスト指示でデータ分析やグラフ作成。
代表例: Microsoft Copilot in Excel (上記Copilotの一部), Tableau Copilot (Tableau)
公務での活用例: 予算データの分析、アンケート結果の可視化、人口統計データの傾向分析、市民からの意見の傾向分析。
【資料】主要な生成AIツール一覧
主要な生成AIツール一覧について資料にまとめているので、参照ください。
【資料】生成AIの種類と動向
生成AIの種類と動向について資料にまとめているので、参照ください。