データ分析・処理
公務の現場には、市民アンケート、統計データ、事業実績、地域特性データなど、日々膨大な量のデータが蓄積されています。これらのデータは、適切な分析と処理を行うことで、現状の課題を把握し、効果的な政策立案や市民サービス改善のための貴重な「宝」となります。しかし、データの量が増えるほど、その分析・処理には専門知識と時間が必要となり、多くの職員にとって負担となっています。生成AIは、このデータ分析・処理のプロセスを強力に支援し、「データに基づいた行政運営(データドリブン行政)」を加速させる可能性を秘めています。AIを「賢いデータアナリスト」として活用することで、私たちは迅速にデータから知見を得て、より根拠のある意思決定を下せるようになります。
①大量データの要約と傾向分析
膨大なテキストデータや数値データの中から、主要な傾向や重要なポイントを瞬時に抽出し、分かりやすく要約することは、AIの得意分野です。
プロンプト例
市民アンケートの自由記述要約
あなたは〇〇区の広聴担当者です。以下に提供する令和7年度市民アンケートの自由記述回答を読み、特に『区政への要望』に関する意見を抽出し、主要な要望事項をカテゴリ別に分類して、それぞれの意見の傾向と頻出キーワードを要約してください。[ここに市民アンケートの自由記述回答テキストを大量に貼り付け]
地域課題に関する住民意見の傾向分析
あなたは〇〇区地域振興課の職員です。以下の『地域課題に関する住民懇談会』の議事録(発言録)を分析し、住民が最も懸念している地域課題のトップ3を挙げ、それぞれの課題について具体的な発言内容の要点をまとめてください。また、それらの課題に対する住民からの提案があれば、それも抽出してください。[ここに住民懇談会の議事録テキストを貼り付け]
業務日報のサマリー作成
あなたは〇〇区の管理職です。以下の部署メンバーの日報を読み込み、今週の部署全体の主要な進捗、発生した課題、および特筆すべき事項を簡潔にまとめてください。[ここに複数の職員の日報テキストをまとめて貼り付け]
②データ形式の変換・整形
異なる形式のデータを統一したり、分析しやすい形に整形したりする作業は、手作業で行うとミスが生じやすく、時間もかかります。AIは、この作業を正確かつ迅速に支援します。
プロンプト例
非定型データから表形式データへの変換
あなたは〇〇区のデータ担当者です。以下のテキストデータは、区内のボランティア団体活動報告ですが、フォーマットが不統一です。これを、『団体名』『活動内容(簡潔に)』『活動頻度(月何回など)』『参加人数(概算)』『主要活動地域』の列を持つCSV形式のデータに変換してください。ヘッダー行も追加してください。[ここに非定型なボランティア活動報告のテキストを貼り付け]
住所データの整形と標準化
あなたは〇〇区の住民情報担当者です。以下の住民リストの住所データには表記ゆれや誤りがあります。これらの住所を、『東京都〇〇区〇〇町〇丁目〇番〇号』という標準的な形式に整形してください。不可能な場合は『不明』としてください。[ここに整形前の住所リストを貼り付け]
特定情報の抽出とリスト化
「あなたは〇〇区の契約担当者です。以下の契約書リストから、『契約番号』『契約相手企業名』『契約金額』『契約締結日』『契約期間(開始日~終了日)』の5項目を抽出し、箇条書きでリストアップしてください。[ここに契約書概要のテキストを大量に貼り付け]
③データに基づいた簡易レポート作成
特定のデータセットから、主要な指標や傾向を抽出し、簡易的なレポートとしてまとめる作業をAIに任せることで、迅速な状況把握が可能になります。
プロンプト例
公共施設利用状況の簡易分析レポート
あなたは〇〇区の施設管理担当者です。以下の『令和7年度〇〇市民会館利用状況データ』(CSV形式)を分析し、利用件数の多い上位5つの施設カテゴリ、曜日別の利用傾向、および時間帯別のピークを示す簡易レポートを作成してください。各項目をグラフ化することを想定し、数値データと要約を併記してください。[ここに〇〇市民会館利用状況のCSVデータを貼り付け]
防災備蓄品の在庫状況レポート
あなたは〇〇区の防災担当者です。以下の防災備蓄品リスト(Excelデータ抜粋)を元に、各品目の『現在の在庫量』が『推奨備蓄量』を下回っているものを抽出し、品目名と不足量を記述した緊急補充リストを作成してください。[ここに防災備蓄品の品目、現在の在庫量、推奨備蓄量などのデータを貼り付け]
ウェブサイトアクセス解析の傾向レポート
あなたは〇〇区広報課のウェブ担当者です。以下の〇〇区公式ウェブサイトのアクセス解析データ(月間レポート抜粋)を分析し、今月のアクセス数が多かった上位3ページ、特に流入経路が多かったページ、および直帰率が高かったページについて、その傾向と可能な限り理由を推測したレポートを作成してください。[ここにアクセス解析の主要な数値データ(ページビュー、ユニークユーザー、直帰率、流入経路など)を貼り付け]
④データの可視化補助(指示出し)
直接グラフを作成する機能は限定的ですが、AIは、データからグラフを作成するための指示や、適切なグラフの種類を提案することができます。
プロンプト例
グラフ作成指示の生成
あなたは〇〇区の統計分析担当者です。以下の〇〇区人口推移データ(時系列データ)を用いて、最も効果的に人口の増減傾向を可視化するためのExcelグラフ作成手順を指示してください。具体的に選択すべきグラフの種類、X軸とY軸の設定、凡例の表示、タイトル案を含めてください。[ここに人口推移データ(年、男性人口、女性人口、総人口など)を貼り付け]
適切なグラフ種類の提案
あなたは〇〇区のデータ分析官です。以下の『令和7年度区民健康診断項目別受診率データ』があります。このデータから、各受診項目の割合を比較するのに最適なグラフの種類を複数提案し、それぞれのグラフが伝える情報の特性を簡潔に説明してください。[ここに健康診断項目と受診率のデータを貼り付け]
データ分析・処理における安全な活用のポイント
- 個人情報・機密情報の厳重な匿名化・仮名化: データ分析で最も注意すべきは個人情報の漏洩です。氏名、生年月日、住所など、個人が特定できる情報はAIに入力する前に必ず匿名化または仮名化してください。データの特性を理解し、「再識別化のリスクがないか」を常に考慮しましょう。
- セキュアなAI環境の利用: 分析対象データに機密情報が含まれる場合は、必ずAzure OpenAI ServiceやVertex AIなど、入力データが学習に利用されず、高いセキュリティが保証されたAIサービスを利用してください。無料の一般向けAIツールに機密データを入力することは絶対に行わないでください。
- AI分析結果の二重チェック: AIはデータからパターンを見つけ出すことは得意ですが、その解釈や、データの誤り(ノイズ)の影響を受ける可能性があります。AIが生成した分析結果やレポートは、必ず人間の専門家が最終的にチェックし、その妥当性を判断してください。特に、政策決定の根拠とする場合は、複数人でのレビューが望ましいです。
- データの誤解釈リスクの理解: AIは統計的な関連性を見つけますが、それが因果関係を意味するとは限りません。AIの分析結果を鵜呑みにせず、なぜそのような結果になったのか、データの背景や文脈を人間が深く理解することが重要です。
【資料】生成AI×Excelでデータ処理が劇的進化
問題
問題1 市民アンケートのカテゴリ分け
あなたは△△市市民協働課の職員です。令和7年度に実施した市民アンケート(自由記述回答含む)では、「市への提案・改善希望」の自由記述が1万件以上寄せられました。これを用いて、次回のまちづくり計画策定の参考にする必要があります。市の上層部は、主な改善要望を分野別に整理した要約資料を求めています。
この分析を生成AIに依頼するためのプロンプト文を設計してください。以下の条件をすべて満たすように書いてください。
・「市への提案・改善希望」の自由記述が大量にある前提
・回答の中から重要な要望・頻出意見を抽出し、カテゴリ別に分類すること
・各カテゴリについて、意見の傾向やキーワードを要約するよう依頼すること
・公務員らしい言葉遣いで明確に記述すること
[令和7年度市民アンケートの「市への提案・改善希望」自由記述(抜粋)]
・駅前の駐輪場が常に満車で困っている。もっと増やしてほしいです。
・子どもが遊べる公園が少ない。安全に遊べる広い場所が必要。
・窓口対応がとても丁寧だった。今後も続けてほしい。
・バスの本数が少なく、夜は特に不便。もう少し増やしてもらえると助かる。
・地域の高齢者向けの集まりが少ない気がする。孤立しないような支援をお願いしたい。
・道路の舗装が一部でかなり傷んでいて、車椅子やベビーカーでの移動が大変。
・スマホで行政手続きがもっとできるようになってほしい。
・ごみの分別ルールが地域によって微妙に違って分かりにくい。
・毎年の健康診断が受けにくい。予約が取りづらい。
・夜間の防犯パトロールを強化してほしい。最近、不審者情報が多い。
解答プロンプト例
あなたは△△市市民協働課の広聴担当者です。以下に提供する『令和7年度市民アンケート』自由記述欄のうち、「市への提案・改善希望」に関する意見を分析してください。
- 意見を内容に応じてカテゴリ別(例:子育て、交通、福祉、まちづくり、行政サービスなど)に分類してください。
- 各カテゴリごとに、代表的な意見や主な要望の傾向、頻出キーワードを簡潔にまとめてください。
- 特に件数の多かったカテゴリには注釈を添えてください。
※必要に応じて、カテゴリ名称は柔軟に判断して構いません。
[令和7年度市民アンケートの「市への提案・改善希望」自由記述(抜粋)]
・駅前の駐輪場が常に満車で困っている。もっと増やしてほしいです。
・子どもが遊べる公園が少ない。安全に遊べる広い場所が必要。
・窓口対応がとても丁寧だった。今後も続けてほしい。
・バスの本数が少なく、夜は特に不便。もう少し増やしてもらえると助かる。
・地域の高齢者向けの集まりが少ない気がする。孤立しないような支援をお願いしたい。
・道路の舗装が一部でかなり傷んでいて、車椅子やベビーカーでの移動が大変。
・スマホで行政手続きがもっとできるようになってほしい。
・ごみの分別ルールが地域によって微妙に違って分かりにくい。
・毎年の健康診断が受けにくい。予約が取りづらい。
・夜間の防犯パトロールを強化してほしい。最近、不審者情報が多い。
生成AIの回答例
以下に、『令和7年度市民アンケート』自由記述(「市への提案・改善希望」)をカテゴリ別に分類・分析した結果をご提供します。
分類・分析結果
1. 交通・インフラ
件数:2件(※比較的多め)
代表的意見:
・駅前駐輪場が常に満車。増設の要望
・バスの本数が少なく、特に夜間が不便
要望傾向:
公共交通の利便性向上や、日常利用インフラの整備に関する要望が目立つ
頻出キーワード:
「満車」「バス」「本数」「夜」「増やして」
2. 子育て・公園整備
件数:1件
代表的意見:
・子どもが安心して遊べる広い公園が不足
要望傾向:
子育て世帯が安全に利用できる公共空間の整備を求める声
頻出キーワード:
「子ども」「遊べる」「公園」「安全」「広い」
3. 高齢者福祉・地域支援
件数:1件
代表的意見:
・高齢者の集まりが少ない。孤立を防ぐ施策を求む
要望傾向:
高齢者の居場所づくりや地域での見守り体制に対する期待
頻出キーワード:
「高齢者」「孤立」「支援」「集まり」
4. 道路・バリアフリー
件数:1件
代表的意見:
・道路の舗装が傷んでおり、車椅子やベビーカーでの移動が困難
要望傾向:
誰もが安全に通行できるインフラ環境の整備
頻出キーワード:
「舗装」「傷んで」「車椅子」「ベビーカー」「移動」
5. 行政サービス(デジタル化含む)
件数:2件(※比較的多め)
代表的意見:
・窓口対応が丁寧で好印象
・スマホでの行政手続きの拡充希望
要望傾向:
対面サービスの質は評価しつつ、さらなる利便性向上のためのデジタル対応が求められている
頻出キーワード:
「丁寧」「続けて」「スマホ」「手続き」
6. 環境・ごみ分別
件数:1件
代表的意見:
・ごみ分別ルールが地域ごとに異なり分かりづらい
要望傾向:
ルールの統一・明確化を望む声
頻出キーワード:
「分別」「地域」「違う」「わかりにくい」
7. 健康・医療
件数:1件
代表的意見:
・健康診断の予約が取りづらい
要望傾向:
市民が健康維持のために必要なサービスを、より利用しやすくする環境整備への要望
頻出キーワード:
「健康診断」「受けにくい」「予約」
8. 防犯・安全
件数:1件
代表的意見:
・夜間の防犯パトロール強化を希望。不審者情報が増えている
要望傾向:
地域の安全確保と不安解消を図る対策が求められている
頻出キーワード:
「夜間」「防犯」「パトロール」「不審者」
問題2 活動報告書のフォーマット整形
あなたは○○区地域振興課のボランティア支援担当です。区内のボランティア団体から提出された活動報告が、メール本文・Word文書・手書き記録のOCRなど、バラバラな形式で届いており、表形式データに整える必要があります。特に、活動の傾向を把握するために、以下の項目が必要です:団体名、活動内容(要約)、活動頻度、参加人数、主な活動地域。
生成AIに対して、上記のような非定型データを構造化データ(CSV)に変換させるプロンプトを設計してください。以下の要素を含めてください。
・入力データがフォーマットばらばらな自由記述であること
・指定した5項目に対応する情報を抽出・整理すること
・CSVのヘッダー行を出力させること
・情報が欠けている場合の対処も促すこと
[自由記述形式の活動報告]
A会:月に3回、公園での清掃活動をしています。参加者はおおむね15名程度。活動範囲は中央1丁目~3丁目。
「若葉の会」では、主に高齢者宅を訪問し話し相手になるボランティアを行っています。月2回程度、毎回5人前後で対応しています。拠点は東町地区。
ボラ友クラブ:児童館での絵本の読み聞かせ(毎週)。参加者数は毎回10名ほど。場所は南町児童館。
清掃チーム花水木:不定期(月1~2回)で駅周辺の花壇整備とゴミ拾いをしています。地域住民含めて20人前後が参加。
「スマイルふれあい」:市内全域のイベント支援(例:マラソン大会、福祉フェアなど)を行っており、参加人数は都度異なる(平均30人程度)。
解答プロンプト例
あなたは○○区地域振興課のデータ整備担当です。以下のボランティア団体による活動報告は、フォーマットが統一されていない自由記述形式です。
このデータを以下の5項目に整理し、CSV形式で出力してください。
・団体名
・活動内容(簡潔に)
・活動頻度(例:「月2回」など)
・参加人数(概算)
・主要活動地域
ヘッダー行を含めて出力してください。各項目が明記されていない場合は「不明」と記入してください。
[自由記述形式の活動報告]
A会:月に3回、公園での清掃活動をしています。参加者はおおむね15名程度。活動範囲は中央1丁目~3丁目。
「若葉の会」では、主に高齢者宅を訪問し話し相手になるボランティアを行っています。月2回程度、毎回5人前後で対応しています。拠点は東町地区。
ボラ友クラブ:児童館での絵本の読み聞かせ(毎週)。参加者数は毎回10名ほど。場所は南町児童館。
清掃チーム花水木:不定期(月1~2回)で駅周辺の花壇整備とゴミ拾いをしています。地域住民含めて20人前後が参加。
「スマイルふれあい」:市内全域のイベント支援(例:マラソン大会、福祉フェアなど)を行っており、参加人数は都度異なる(平均30人程度)。
生成AIの回答例
団体名,活動内容(簡潔に),活動頻度,参加人数(概算),主要活動地域
A会,公園での清掃活動,月3回,15,中央1丁目~3丁目
若葉の会,高齢者宅への訪問と話し相手,月2回,5,東町地区
ボラ友クラブ,児童館での絵本読み聞かせ,週1回,10,南町児童館
清掃チーム花水木,駅周辺の花壇整備とゴミ拾い,月1~2回,20,駅周辺
スマイルふれあい,市内イベントの支援(マラソン大会・福祉フェア等),不定期(平均月1回程度),30,市内全域