

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
集計関数・とは?
集計関数とは、データの集合からひとつの値を取り出して合計・平均・件数などを計算する機能の総称です。データを集めて一つの数値にする役割があり、データ分析の基本ツールとして広く使われています。ここでは初心者のあなたにも分かるように、身近な例とともに丁寧に解説します。
1. 集計関数の考え方
日常のデータにも、何かを「まとめて」結果を出したい場面が多くあります。たとえば学校の出席データを集計して累計人数を知りたいとき、売上データを月ごとに合計したいときなどです。集計関数はこのような「集計作業」を自動で行う道具となります。これを使うと、手計算のミスを減らせ、作業を短くすることができます。
2. 代表的な集計関数の例
Excel・Google Sheets の場合、代表的な集計関数には次のようなものがあります。SUMは範囲の合計を出します。AVERAGEは平均を、COUNTはデータの件数を、MAXは最大値を、MINは最小値を返します。使い方の基本は次のとおりです。
例: SUM(A1:A10) は A1 から A10 の合計を出します。別の例として平均は AVERAGE(B1:B20) です。これらの関数はセルの範囲を指定するだけで、複雑な計算を簡単に行えます。
3. SQL での集計関数
データベースを使うときにも集計関数は活躍します。SQL では SUM、AVG、COUNT、MAX、MIN が基本セットです。例として「sales テーブルの総売上金額を知る」には次のように書きます。 SELECT SUM(price) FROM sales; このように条件をつけて集計することも可能です。
4. 集計関数の使い方のコツと注意点
注意点としては、セル範囲が正しく選ばれているか、データに欠損値がある場合の扱い、集計の単位や期間の揃え方が挙げられます。欠損値があると結果が変わる場合があるので、空白をどう扱うかを知っておくと安心です。
複数の条件を使って集計したいときには、SUMIF や COUNTIF、あるいは SQL の GROUP BY 句を活用します。
5. 表を使って整理する
| 関数名 | 用途 | |
|---|---|---|
| Excel/Sheets | SUM | 合計を出す |
| Excel/Sheets | AVERAGE | 平均を出す |
| SQL | SUM | 総計を出す |
| SQL | COUNT | 件数を出す |
6. まとめ
集計関数は、データを「一つの数値」にまとめて結果を知るための基本機能です。日常的なデータ整理から高度なデータ分析まで、さまざまな場面で役立ちます。最初は身近な Excel の使い方から始め、徐々に SQL など他の場面にも広げていくと理解が深まります。
集計関数の同意語
- アグリゲーション関数
- データセットの値を1つの要約値に集約して返す関数の総称。代表例には SUM、AVG、MAX、MIN、COUNT などが挙げられ、複数行のデータを要約する目的で使われます。
- アグリゲート関数
- Aggregation Function のカタカナ表記。データを集約して要約値を返す、集計処理の中心となる関数の総称です。
- 集約関数
- データを集約して要約値を返す関数の総称。データベースや BI の文脈で最も正式に使われる用語の一つです。
- 集計関数
- データを集計して1つの値にまとめる機能を指す言葉。SQL やExcel などで用いられる日常的な同義語です。
- 合計関数
- 値を合計して1つの値を返す関数の総称。特に SUM の機能を指すことが多いですが、広義には集計全般を指すこともあります。
- 要約関数
- データを要約して代表値を返す機能の総称。平均、最大・最小、件数など複数の統計量を含む場合があります。
- サマリ関数
- Summary の意味をカタカナ表記した表現。データを要約して値を返す関数のことを指す語として使われることがあります。
- サマリー関数
- サマリー(要約)を作る関数の別称。データを要約して1つの値を返す機能を指します。
- 総計関数
- データの総計を求める機能を指す表現。一般に SUM の機能を指す場面で使われます。
- 統計関数
- データの統計量を算出する関数の総称。平均・中央値・分散・標準偏差などを含み、集計の一部として扱われることが多いです。
- 集計機能
- データを集約して要約する機能全般を指す表現。関数だけでなく集計処理全体を指す場合にも使われます。
集計関数の対義語・反対語
- 非集計関数
- 集計を行わず、個々の値をそのまま扱う関数群。文字列操作や日付処理など、1つの集合値を返さない関数が該当します。
- 行レベル計算
- 各行ごとに独立して計算・表示する方法。集計関数はデータ全体を1つの値にまとめますが、行レベル計算は行ごとに結果を返します。
- 個別値の算出
- データセット全体をまとめず、各データ点の値を個別に算出・表示する考え方。
- 詳細値表示
- 元データの詳細な値をそのまま表示・出力すること。集計の逆で、要約せず細部を残します。
- ウィンドウ関数を用いた計算
- OVER句で分布やパーティションを指定して、各行ごとに値を返す計算。集計関数と異なり、全体を1つの値にせず行ごとに結果を持ちます。
集計関数の共起語
- 合計
- データの総和を求める指標。ExcelのSUM、SQLのSUMなどで使われる代表的な集計関数の一つ。
- 総和
- 全データの値を足し合わせた結果。集計の基本となる指標の一つ。
- 平均
- データの算術平均値。複数データの代表値として用いられる。
- 平均値
- データの値を全データ数で割って得られる中心値。
- 個数
- データの要素数を数える指標。空白や欠損をどう扱うかは関数仕様による。
- 件数
- データの総件数。COUNT系関数の対象になることが多い。
- 最大値
- データの中で最も大きい値。
- 最小値
- データの中で最も小さい値。
- 最大
- 最大値のこと。
- 最小
- 最小値のこと。
- 中央値
- データを小さい順に並べたとき中央に位置する値。
- 中位数
- 中央値の別称。
- 分散
- データのばらつきを表す指標。母集団分散と標本分散がある。
- 標準偏差
- データのばらつきを示す指標。分散の平方根。
- 標準偏差(母集団)
- 母集団全体のばらつきを表す指標。
- 標準偏差(標本)
- 標本データのばらつきを表す指標。
- 分散(母集団)
- 母集団全体の分散。
- 分散(標本)
- 標本データの分散。
- 四分位数
- データを4等分する際の区切りの値。Q1, Q2, Q3 など。
- 第一四分位数
- データの下位25%の境界点(Q1)。
- 第三四分位数
- データの上位75%の境界点(Q3)。
- パーセンタイル
- データを百分位に分ける値。例: 90パーセンタイルは上位10%の境界。
- パーセンタイル値
- 特定の百分位に対応するデータの値。
- 条件付き集計
- 条件を満たすデータだけを集計する手法。SUMIF/COUNTIFなど。
- SUMIF
- 条件を満たすデータの合計を求める関数。
- AVERAGEIF
- 条件を満たすデータの平均を求める関数。
- COUNTIF
- 条件を満たすデータの個数を数える関数。
- SUMIFS
- 複数条件で合計を求める関数。
- AVERAGEIFS
- 複数条件で平均を求める関数。
- COUNTIFS
- 複数条件で個数を数える関数。
- GROUP BY
- SQLでデータをグループ化して集計する考え方。
- ピボットテーブル
- データを集計して要約する表。ExcelやSheetsの機能。
- ウィンドウ関数
- 行ごとに集計を行い、結果を返す関数群。特定の環境で使われる。
- データ範囲
- 集計の対象となるデータの範囲。
集計関数の関連用語
- 集計関数
- データを一つの値にまとめて返す関数の総称。SQL・Excel・BIツールなどで広く使われ、合計・平均・件数などの集約を行います。
- SUM
- 指定範囲の数値をすべて足し合わせる集計関数。NULLは通常無視されることが多いです。
- AVG / AVERAGE
- 指定範囲の数値の平均を求める関数。データの中心傾向を知るときに便利です。
- COUNT
- 指定条件に合う行の件数を数える関数。COUNT(*は全行、COUNT(列)はNULLを除く値の個数を数えます。
- COUNT(DISTINCT)
- 重複を除いた値の件数を数えます。ユニークな要素の数を知りたいときに使います。
- MIN
- 指定範囲の最小値を返します。
- MAX
- 指定範囲の最大値を返します。
- MEDIAN
- データの中央値を求めます。極端な値の影響を受けにくい指標です。
- MODE
- データの最頻値を求めます。データセットで最もよく現れる値を知るときに使います。
- VAR.S
- 標本分散。データが母集団の一部であると仮定した分散を求めます。
- VAR.P
- 母集団分散。全体データの分散を求めます。
- STDEV.S
- 標本標準偏差。データのばらつきを測る指標の一つ。
- STDEV.P
- 母集団標準偏差。全体のばらつきを測る指標。
- SUMIF
- 条件を満たすデータだけを合計します。
- COUNTIF
- 条件を満たすデータの件数を数えます。
- AVERAGEIF
- 条件を満たすデータの平均を求めます。
- SUMIFS
- 複数条件を満たすデータの合計を求めます。
- COUNTIFS
- 複数条件を満たすデータの件数を数えます。
- AVERAGEIFS
- 複数条件を満たすデータの平均を求めます。
- GROUP BY
- データを指定した列でグルーピングし、グループごとに集計します。
- HAVING
- GROUP BY後にグループを絞り込む条件を指定します。
- WHERE
- 集計前にデータを絞り込む条件を指定します。
- DISTINCT
- 重複を排除して一意の値だけを扱います。
- ウィンドウ関数
- 行ごとに集計を適用し、結果を同じ行に表示できる機能。
- OVER
- ウィンドウ関数で集計の範囲や分割を指定する句。
- PARTITION BY
- ウィンドウをグループ分けする基準を指定します。
- ORDER BY
- ウィンドウ内での順序付けを指定します。
- ROWS BETWEEN
- ウィンドウフレームの範囲を定義します。
- ピボットテーブル
- データを行と列の軸に集約して要約する表。
- クロス集計
- 行と列を組み合わせてデータを要約する表示形式。
- GROUPING SETS
- 複数のグルーピングの組み合わせを一度に出力します。
- ROLLUP
- 階層的な集計をまとめて出力するグルーピング手法。
- CUBE
- 多次元のグルーピングを作成する方法。
- SUBTOTAL
- 範囲内での小計を返すExcel独自の関数。フィルタ時の挙動が特徴です。
- AGGREGATE
- 複数の集計関数を一つの関数で実行するExcelの機能。エラー処理なども可能。
- pandasのgroupby
- Pythonのpandasでデータをグループ化して集計する操作。
- groupby
- データをカテゴリ別に集約する操作の名称。
- agg
- 複数の集計処理を一度に適用するpandasの手法(聚合)。
- Excel特有の集計機能
- Excelに特化した集計機能群の総称。



















