QuickSight講座

この講座では、AWSのフルマネージドBI(ビジネスインテリジェンス)サービスであるAmazon QuickSightについて学びます。

  • Amazon QuickSightの概要と特徴
  • QuickSightの主要コンポーネント(データソース・データセット・分析・ダッシュボード)
  • グラフの種類と選び方
  • SPICEエンジン
  • ユーザ管理とアクセス制御
  • 主なユースケース
  • 設計のポイント

1. QuickSightの概要

1.1 Amazon QuickSightとは

Amazon QuickSightは、データの可視化とビジネスインテリジェンス(BI)を提供するフルマネージドのクラウドサービスです。データをグラフやチャートで視覚的に表現し、ダッシュボードとして組織内のユーザに共有できます。

📝 BIサービスとは
BI(ビジネスインテリジェンス)サービスとは、企業のデータを集約・分析・可視化し、ビジネス上の意思決定を支援するためのソフトウェアです。大量のデータから売上の傾向、顧客の行動パターン、業務のボトルネックなどをダッシュボードやレポートとして可視化できます。経営層やビジネス部門が「データに基づいた意思決定」を行うための基盤となります。

QuickSightにはいくつかの大きな特徴があります。

まず、QuickSightはフルマネージドのサービスです。サーバの構築や管理は一切不要で、ブラウザからすぐに利用を開始できます。

また、SPICEエンジンと呼ばれる超高速なインメモリ計算エンジンを搭載しており、大量のデータでも高速にグラフを表示できます。

データソースについては、Athena、S3、RDS、Redshiftなど、AWSの各種サービスや外部データソースに幅広く接続できます。

さらに、作成したダッシュボードをURLで組織内のユーザに共有できるため、分析結果をチーム全体で活用できます。

💡 ポイント
QuickSightは、AWSのデータ分析基盤の「出口」に位置するサービスです。Glueでデータを加工し、Athenaで分析した結果を、QuickSightで可視化して意思決定者に届けるという流れが、データ分析基盤の典型的なパイプラインです。

2. QuickSightの構成要素

続いて、QuickSightを構成する要素をいくつかみていきたいと思います。

QuickSightの4つの構成要素の関係を以下に示します。

flowchart LR
  DS[データソース] --> DST[データセット]
  DST --> AN[分析]
  AN --> DB[ダッシュボード]

2.1 データソース

データソースは、QuickSightが接続するデータの提供元です。以下のような接続先をサポートしています。

カテゴリ 接続先の例
AWSサービス Athena, S3, RDS, Aurora, Redshift など
データベース MySQL, PostgreSQL, SQL Server, Oracle など
SaaS Salesforce, Jira, GitHub など
ファイル CSV, Excel, JSON(ローカルアップロード) など

2.2 データセット

データセットは、データソースから取得したデータに対して、フィルタリング、カラムの選択、計算フィールドの追加などの加工を行った「分析用のデータ」です。

データセットの作成時には、さまざまな加工を行えます。たとえば、分析に不要なカラムを除外したり、カラムのデータ型を変更したりできます。また、既存のカラムを使った計算フィールドを追加することも可能です。これは「単価 × 数量 = 売上金額」のように、既存のカラムから新しい計算列を作成する機能です。さらに、フィルタを適用して特定の条件に合致するデータのみを抽出したり、複数テーブルの結合(JOIN)を行ってデータを統合したりすることもできます。

2.3 分析

分析は、データセットを使ってグラフやチャートを作成する作業スペースです。1つの分析の中に、たとえば売上推移の折れ線グラフ、地域別の円グラフ、明細データのテーブルといった複数のグラフをまとめて配置できます。分析は作成者が編集・試行錯誤を行うための場で、組織内の他のユーザには直接共有されません。

💡 ポイント
「分析」を主語にすると違和感があるかもしれませんが、QuickSightの画面上でもこの名称で表示されています。QuickSightでは「分析」がグラフを作成・編集する作業スペースの正式な項目名です。

2.4 ダッシュボード

ダッシュボードは、分析を公開(パブリッシュ)したものです。ダッシュボードは読み取り専用で、組織内の指定したユーザやグループに共有できます。閲覧者はダッシュボード上でフィルタの変更やドリルダウンなどのインタラクティブな操作が可能ですが、グラフの構成を変更することはできません。

📝 コンポーネントの関係
データソース → データセット → 分析 → ダッシュボード、という流れでデータが加工・可視化されていきます。データソースが「生の接続先」、データセットが「加工済みデータ」、分析が「作業スペース」、ダッシュボードが「公開された成果物」と覚えると理解しやすいでしょう。

3. グラフの種類

QuickSightでは、データの特性や伝えたい内容に応じて、さまざまな種類のグラフやチャートを選択できます。

グラフの種類 用途
棒グラフ カテゴリ別の比較 商品別の売上比較
折れ線グラフ 時系列データの推移 月別の売上推移
円グラフ 構成比率の表示 地域別の売上構成比
KPI 単一指標の表示 月間売上目標の達成率
テーブル 詳細データの一覧表示 売上明細の一覧
ピボットテーブル 多次元データの集計 商品×地域のクロス集計
ヒートマップ 値の大小を色で表現 時間帯別・曜日別のアクセス数
ファンネル プロセスの段階的な変化 購入プロセスの離脱率

4. SPICEエンジン

4.1 SPICEとは

SPICESuper-fast, Parallel, In-memory Calculation Engine)は、QuickSightに搭載された超高速なインメモリ計算エンジンです。

データソースから取得したデータをSPICEにインポートすることで、ダッシュボードの表示速度が大幅に向上します。SPICEにインポートされたデータは、元のデータソースに直接クエリを発行することなく、SPICE内で高速に処理されます。

📝 インメモリ処理とは
インメモリ処理とは、データをハードディスクではなくメモリ(RAM)上に展開して処理する方式です。メモリはディスクに比べてデータの読み書きが非常に高速なため、大量のデータに対する集計やフィルタリングを短時間で実行できます。SPICEはこのインメモリ処理を活用することで、ダッシュボードのグラフを高速に表示しています。

4.2 SPICEを使うメリット

SPICEを使う最大のメリットは表示の高速化です。インメモリ処理によりダッシュボードのグラフが高速に表示されます。また、SPICEにインポートしたデータを参照するため、元のデータベースやAthenaに対するクエリが発生せず、データソースの負荷を軽減できます。さらに、Athenaをデータソースとする場合、SPICEにインポートすればAthenaのスキャン量課金を毎回発生させずに済むため、コスト削減にもつながります。

4.3 直接クエリモード

SPICEにデータをインポートせず、クエリ実行時にデータソースに直接アクセスする「直接クエリモード」も利用できます。常に最新のデータを表示したい場合に適していますが、データソースへの負荷やクエリの応答時間に注意が必要です。

💡 ポイント
一般的にはSPICEモードの利用が推奨されます。データの更新頻度に合わせてSPICEの更新スケジュール(例: 1日1回)を設定することで、高速な表示と適度なデータ鮮度を両立できます。ただし、SPICEにはデータ容量に応じた追加コスト($0.38/GB/月、作成者1人あたり10GBの無料枠あり)が発生します。一方、直接クエリモードではSPICEの費用はかかりませんが、Athenaなどのデータソースに対するクエリ課金が都度発生します。データ量やクエリ頻度を考慮して選択してください。

5. ユーザ管理とアクセス制御

5.1 ユーザの種類

QuickSightでは、ユーザの役割に応じて3つの役割が用意されています。

管理者Admin)は、QuickSightの全設定を管理できる役割です。主にQuickSightの管理者が担当します。

作成者Author)は、データセット・分析・ダッシュボードの作成が可能な役割で、データアナリストやレポート作成者が該当します。

閲覧者Reader)は、ダッシュボードの閲覧のみが可能な役割で、経営層やビジネス部門のユーザが対象です。

5.2 課金モデル

QuickSightの料金は、ユーザの種類と人数に応じて課金されます。

作成者Author)はユーザ単位の月額課金、閲覧者Reader)はセッション単位の従量課金(月額上限あり)です。閲覧者はセッション単位の課金のため、たまにしかダッシュボードを見ないユーザにとっては、固定月額よりも低コストで利用できます。

💡 ポイント
QuickSightのコストは利用ユーザ数に比例します。組織全体に展開する場合は、事前にユーザ数と利用頻度を見積もり、コストを把握してから展開することを推奨します。

6. 主なユースケース

6.1 経営ダッシュボード

売上データをKPIグラフで月間目標の達成率として表示し、月別の売上推移を折れ線グラフで並べることで、ビジネスの成長傾向や季節変動を把握できます。さらに、商品カテゴリ別の売上を棒グラフで比較すれば、どの商品が収益に貢献しているかが一目でわかります。経営層がこれらのデータをダッシュボード上で確認することで、データに基づいた迅速な意思決定が可能になります。

📝 KPIグラフとは
KPIグラフは、売上高や達成率などの重要な指標(KPI: Key Performance Indicator)を大きな数値で目立つように表示するグラフです。折れ線グラフや棒グラフのように複数のデータを並べるのではなく、「今月の売上: 1,200万円」「目標達成率: 85%」のように単一の指標をひと目で把握できるように設計されています。前期比や目標との差異を矢印や色で示す機能もあり、ダッシュボードの冒頭に配置して全体の状況をすばやく伝える用途でよく使われます。

6.2 運用監視ダッシュボード

AWSのコストデータをサービス別の棒グラフで表示し、どのサービスにコストがかかっているかを把握できます。また、API応答時間やエラー発生数を折れ線グラフで時系列に並べることで、パフォーマンスの劣化や障害の兆候をいち早く検知できます。時間帯別・曜日別のエラー発生状況をヒートマップで表示すれば、問題が集中する時間帯のパターンも視覚的に把握でき、運用チームの迅速な対応につながります。

📝 ヒートマップとは
ヒートマップは、2つの軸(例: 曜日と時間帯)の交差するセルを値の大小に応じて色分けするグラフです。数値が大きいセルほど濃い色で表示されるため、データの偏りやパターンをひと目で把握できます。たとえば、エラー発生数を曜日×時間帯で表示すれば「金曜の夕方にエラーが集中している」といった傾向を視覚的に発見できます。

6.3 マーケティング分析

広告チャネル別のクリック数やコンバージョン数を棒グラフで比較し、どのチャネルが最も効果的かを分析できます。また、「広告表示→クリック→会員登録→購入」といった購入プロセスの各段階をファンネルグラフで表示すれば、どの段階でユーザが離脱しているかが明確になります。顧客の年齢層や地域別の売上構成を円グラフで可視化することで、ターゲット層に合わせた施策の検討にも活用できます。

📝 ファンネルグラフとは
ファンネルグラフは、プロセスの各段階における数量の変化を、上から下へ段階的に狭まる漏斗(ファンネル)の形で表現するグラフです。たとえば「広告表示: 10,000 → クリック: 2,000 → 会員登録: 500 → 購入: 100」のように、各段階でどれだけのユーザが残り、どこで離脱しているかを視覚的に把握できます。コンバージョン率の改善ポイントを特定する際に有効です。

7. 設計のポイント

QuickSightを設計する際の主要な検討項目を以下にまとめます。

設計項目 検討内容 推奨・注意事項
データソース 接続先の選択 Athena経由でS3のデータに接続するパターンが一般的
SPICEの利用 SPICEモードと直接クエリモードの選択 基本的にSPICEモードを推奨。更新スケジュールを適切に設定
ユーザ管理 役割の割り当て 最小権限の原則に従い、適切な役割を割り当てる
コスト ユーザ数とSPICE容量 ユーザ数の増加とSPICE容量の消費を監視
ダッシュボード設計 グラフの選択と配置 伝えたい情報に適したグラフを選択し、1画面に情報を詰め込みすぎない
データ更新 SPICEの更新頻度 データの鮮度要件に合わせてスケジュールを設定

8. まとめ

この講座では、AWSのBIサービスであるAmazon QuickSightについて学びました。

  • Amazon QuickSightはデータの可視化とダッシュボード作成を行うフルマネージドBIサービス
  • データソース→データセット→分析→ダッシュボードという4つのコンポーネントでデータを可視化する
  • SPICEエンジンにより、大量データでも高速なダッシュボード表示が可能
  • AthenaやS3と連携し、データ分析基盤の可視化レイヤーとして機能する
  • ユーザは管理者・作成者・閲覧者の3つの役割に分かれ、役割に応じた課金モデルが適用される
  • ダッシュボード設計では、伝えたい情報に適したグラフの選択と、情報の詰め込みすぎに注意する