

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
countuniqueとは?
データ分析をしていると、データの中に同じ値が何回も現れることがあります。そんなとき "重複を除いた値の種類数を知りたい" というニーズが生まれます。countunique(英語表記では COUNTUNIQUE と表される関数)は、データの中から重複を除き、一意な値の数を返してくれる機能です。特にGoogleスプレッドシートなどの表計算ソフトでよく使われ、データの要素がいくつあるのかを素早く把握したいときに役立ちます。
基本の使い方
最もよく使われるのは Googleスプレッドシートの COUNTUNIQUE 関数です。基本形は次のとおりです。=COUNTUNIQUE(A1:A10)。この式を入力すると、セル範囲 A1 から A10 の中で異なる値の個数が返ってきます。空白セルは通常カウントされませんが、データの環境によっては扱いが変わる場合があるため、前後のデータに注意してください。
Excel との違いと代替手段
現時点での実状として、Excelには標準の COUNTUNIQUE 関数は存在しません。代わりに UNIQUE 関数と COUNTA、SUM、FREQUENCY などを組み合わせて同様の結果を得ることが多いです。例えば =ROWS(UNIQUE(A1:A10)) のように使う方法がありますが、Excel のバージョンや言語設定で挙動が異なることがあるので自分の環境で動作を確かめてください。
実践的な使い方と注意点
以下のポイントを押さえておくと、 countunique の活用度が高まります。
- データの種類を意識する
- 文字列、数字、日付など、データの型に応じて結果が変わることがあります。統一したデータ形式で入力しましょう。
- 空白とnullの扱い
- 空白セルがあると結果が変わることがあります。集計前に空白を除外するか、特定の条件下でのみカウントする設定をしておくと安心です。
- 複数列の範囲を扱う場合
- COUNTUNIQUE は複数列の範囲でも使えますが、想定している「一意の値」が横方向にも現れることを理解しておきましょう。
実践例
データの例として、セル A1:A4 に以下の値が入っているとします。
| データ例 | 結果の説明 |
|---|---|
| A1:A4 = りんご、みかん、りんご、ぶどう | COUNTUNIQUE(A1:A4) は 3 を返します。重複を除いた3種類の値があるためです。 |
| B列に数値 1, 2, 2, 3 | COUNTUNIQUE(B1:B4) は 3 を返します。 |
| 空白セルを含む場合 | 空白を含む列では、空白は通常カウントされません(データ設定次第で挙動が変わることがあります)。 |
まとめ
countunique は、データの中にある「異なる値の種類数」を手早く知るための強力なツールです。 Googleスプレッドシートでの基本的な使い方は =COUNTUNIQUE(range)、Excel では代替手段を組み合わせて同様の結果を得るのが一般的です。データの性質と環境に合わせて、適切な方法を選びましょう。
countuniqueの同意語
- ユニーク数
- データセット内で重複を除いた一意の値の総数を表す指標です。重複している値は1つとして数えず、異なる値の個数を示します。
- ユニーク値の数
- データ中に現れる異なる値の個数。重複をまとめて1つとしてカウントします。
- 重複を除いた件数
- データ内の重複を取り除いた後の件数を表します。
- 重複なしの件数
- 重複が排除された後、残っている値の件数です。
- 異なる値の件数
- データ内で異なる値の総数を指します。
- 一意値の件数
- 他と重ならない一意の値の個数を示します。
- ユニークカウント
- ユニークな値の個数を数える指標・操作名です。
- distinct count
- 英語の表現で、重複を排除した値の個数を表します。
- count distinct
- 別名の表現。重複を取り除いた値の数を数える操作を指します。
- COUNTUNIQUE
- Google Sheets などの関数名。重複を排除してユニークな値の個数を返します。
- ユニーク値のカウント
- データ中の一意な値の個数を数えることを意味します。
- 唯一値の数
- データ中の重複のない値の個数を示します。
countuniqueの対義語・反対語
- 全件カウント
- コレクション内のすべての要素を、重複を区別せずに数えること。すべての出現回数を合計するイメージです。
- 重複を含む総数
- データ内の要素を、同じ値の重複も区別せずに全て数え上げた総数です。Distinctを使わず、全出現をカウントします。
- 長さ(Length)
- 配列やリストなどの要素数そのもの。重複を含む全件数を直感的に表します。
- 総要素数
- データ集合の要素の総数。重複の有無に関係なく、全体の件数を示す表現です。
- 非一意カウント
- 要素の一意性を無視して、出現回数をすべてカウントする考え方。
- 全件合計
- データセット内の全要素の合計件数を指します。重複を含めた全体量を表す表現です。
- 全体件数
- データ集合全体の個数。重複を含めた全体量を示す、一般的な言い方です。
countuniqueの共起語
- distinct
- 重複を取り除いた値の集合を指す概念。データ分析で“一意の値”を表すときに使われます。
- distinct count
- 一意の値の個数を数えること。countuniqueの基本的な目的です。
- ユニーク値
- データの中で他の値と重ならない“唯一の値”。
- ユニーク数
- データセットに含まれるユニーク値の総数。
- 重複排除
- 重複した値を取り除く処理。
- 重複
- 同じ値が複数回出現する状態。
- データの整合性
- データ内の重複や欠損を抑え、正確性を保つ性質。
- データ前処理
- 分析前にデータを整える作業の一部。
- 集計
- データを要約して全体像を掴む計算。
- Excel
- Microsoftの表計算ソフト。COUNTUNIQUEに近い機能は別の関数で実現します。
- Google Sheets
- Googleが提供するスプレッドシート。countuniqueが直接使える環境です。
- SQL
- リレーショナルデータベースの問い合わせ言語。DISTINCTで重複を除いた集計を行います。
- COUNT(DISTINCT ...)
- SQLで一意値の個数を数える標準表現。
- BigQuery
- Google Cloudのデータウェアハウス。大量データの一意値集計にも適しています。
- Power BI
- MicrosoftのBIツール。DAXのDISTINCTCOUNT関数でユニーク数を算出します。
- DAX
- Power BIなどで使われる式言語。DISTINCTCOUNTでユニーク数を計算します。
- pandas
- Pythonのデータ分析ライブラリ。nunique()で一意の値の個数を返します。
- nunique
- pandasの関数名。範囲の重複を除いた値の個数を返します。
- R
- 統計解析のプログラミング言語。length(unique(x))のように一意値を数えます。
- n_distinct
- dplyr/ dbplyr などで使われる、一意な値の個数を返す関数名。
- データベース
- 大量データを格納・集計する基盤。
- 一意性
- データの中で他と重複しない性質。
- DISTINCT
- SQLで使われるキーワード。重複を排除した結果を返します。
- UNIQUE
- データの設計や制約、または一意の値を表す英語表現。
- データ品質
- 重複の有無や一意性はデータ品質を左右します。
- 条件付き distinct
- 条件を付けて一意値を数える手法。
- フィルタ
- 特定条件でデータを絞り込み、ユニーク値を数える場面で使います。
countuniqueの関連用語
- COUNTUNIQUE
- Google Sheets の関数。指定範囲の値から重複を除いて一意な値の個数を返します。複数列にも対応可能です。例: =COUNTUNIQUE(A1:A100)
- UNIQUE
- 範囲の重複を取り除き、一意な値だけを抽出する関数。結果は新しい範囲として返され、別の集計と組み合わせて使われます。
- DISTINCT
- SQL やデータベースで“重複を除いた値のみ”を表す概念。SELECT DISTINCT で一意な値を取得します。
- COUNT_DISTINCT
- SQL で特定の列の異なる値の個数を数える集計操作。
- CARDINALITY
- データ集合の基数。含まれる一意値の総数を表す指標で、低基数/高基数と区別します。
- DUPLICATES
- データの中で同じ値が複数回現れる状態。データ品質の観点から除去対象になることが多いです。
- DEDUPLICATION
- 重複したデータを取り除く処理。データの一意性を確保します。
- GROUP_BY
- SQL の句で、共通の値を持つ行をまとめて集計します。
- FREQUENCY
- 値の出現回数を数える指標・関数。頻度分布を作る際に使います。
- HASH_SET
- ハッシュテーブルを使ったデータ構造で、要素の重複を自動的に排除し、存在確認を高速に行えます。
- SET
- 重複を許さない集合データ構造。データのユニーク性を保証します。
- COUNTA
- 空でないセルの個数を数える関数。数える対象が文字列・数字など多様な場合に使われます。
- ARRAYFORMULA
- Google Sheets などで配列全体に対して一度に計算を適用できる機能。
- LOW_CARDINALITY
- 基数が低い、すなわち種類が少ないデータ列の特徴。分析や最適化の観点で扱います。
- HIGH_CARDINALITY
- 基数が高い、すなわち多くの一意値が含まれるデータ列の特徴。パフォーマンスや集計設計に影響します。
- UNIQUE_VALUES
- データ中の一意な値の集合。重複が除かれた値のこと。
- DATA_CLEANING
- 欠損・誤値・重複などを修正・除去してデータ品質を高める作業。
- NORMALIZATION
- データを統一した形式・スケールに揃える手法。重複の削減や比較を容易にします。
- DISTINCT_COUNT
- 一意な値の個数を表す表現。COUNT(DISTINCT x) の別名として使われることがあります。



















