countuniqueとは?初心者向けガイド: 基本の使い方と活用例共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
countuniqueとは?初心者向けガイド: 基本の使い方と活用例共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


countuniqueとは?

データ分析をしていると、データの中に同じ値が何回も現れることがあります。そんなとき "重複を除いた値の種類数を知りたい" というニーズが生まれます。countunique(英語表記では COUNTUNIQUE と表される関数)は、データの中から重複を除き、一意な値の数を返してくれる機能です。特にGoogleスプレッドシートなどの表計算ソフトでよく使われ、データの要素がいくつあるのかを素早く把握したいときに役立ちます。

基本の使い方

最もよく使われるのは Googleスプレッドシートの COUNTUNIQUE 関数です。基本形は次のとおりです。=COUNTUNIQUE(A1:A10)。この式を入力すると、セル範囲 A1 から A10 の中で異なる値の個数が返ってきます。空白セルは通常カウントされませんが、データの環境によっては扱いが変わる場合があるため、前後のデータに注意してください。

Excel との違いと代替手段

現時点での実状として、Excelには標準の COUNTUNIQUE 関数は存在しません。代わりに UNIQUE 関数と COUNTASUMFREQUENCY などを組み合わせて同様の結果を得ることが多いです。例えば =ROWS(UNIQUE(A1:A10)) のように使う方法がありますが、Excel のバージョンや言語設定で挙動が異なることがあるので自分の環境で動作を確かめてください。

実践的な使い方と注意点

以下のポイントを押さえておくと、 countunique の活用度が高まります。

データの種類を意識する
文字列、数字、日付など、データの型に応じて結果が変わることがあります。統一したデータ形式で入力しましょう。
空白とnullの扱い
空白セルがあると結果が変わることがあります。集計前に空白を除外するか、特定の条件下でのみカウントする設定をしておくと安心です。
複数列の範囲を扱う場合
COUNTUNIQUE は複数列の範囲でも使えますが、想定している「一意の値」が横方向にも現れることを理解しておきましょう。

実践例

データの例として、セル A1:A4 に以下の値が入っているとします。

データ例結果の説明
A1:A4 = りんご、みかん、りんご、ぶどうCOUNTUNIQUE(A1:A4) は 3 を返します。重複を除いた3種類の値があるためです。
B列に数値 1, 2, 2, 3COUNTUNIQUE(B1:B4) は 3 を返します。
空白セルを含む場合空白を含む列では、空白は通常カウントされません(データ設定次第で挙動が変わることがあります)。

まとめ

countunique は、データの中にある「異なる値の種類数」を手早く知るための強力なツールです。 Googleスプレッドシートでの基本的な使い方は =COUNTUNIQUE(range)、Excel では代替手段を組み合わせて同様の結果を得るのが一般的です。データの性質と環境に合わせて、適切な方法を選びましょう。


countuniqueの同意語

ユニーク数
データセット内で重複を除いた一意の値の総数を表す指標です。重複している値は1つとして数えず、異なる値の個数を示します。
ユニーク値の数
データ中に現れる異なる値の個数。重複をまとめて1つとしてカウントします。
重複を除いた件数
データ内の重複を取り除いた後の件数を表します。
重複なしの件数
重複が排除された後、残っている値の件数です。
異なる値の件数
データ内で異なる値の総数を指します。
一意値の件数
他と重ならない一意の値の個数を示します。
ユニークカウント
ユニークな値の個数を数える指標・操作名です。
distinct count
英語の表現で、重複を排除した値の個数を表します。
count distinct
別名の表現。重複を取り除いた値の数を数える操作を指します。
COUNTUNIQUE
Google Sheets などの関数名。重複を排除してユニークな値の個数を返します。
ユニーク値のカウント
データ中の一意な値の個数を数えることを意味します。
唯一値の数
データ中の重複のない値の個数を示します。

countuniqueの対義語・反対語

全件カウント
コレクション内のすべての要素を、重複を区別せずに数えること。すべての出現回数を合計するイメージです。
重複を含む総数
データ内の要素を、同じ値の重複も区別せずに全て数え上げた総数です。Distinctを使わず、全出現をカウントします。
長さ(Length)
配列やリストなどの要素数そのもの。重複を含む全件数を直感的に表します。
総要素数
データ集合の要素の総数。重複の有無に関係なく、全体の件数を示す表現です。
非一意カウント
要素の一意性を無視して、出現回数をすべてカウントする考え方。
全件合計
データセット内の全要素の合計件数を指します。重複を含めた全体量を表す表現です。
全体件数
データ集合全体の個数。重複を含めた全体量を示す、一般的な言い方です。

countuniqueの共起語

distinct
重複を取り除いた値の集合を指す概念。データ分析で“一意の値”を表すときに使われます。
distinct count
一意の値の個数を数えること。countuniqueの基本的な目的です。
ユニーク値
データの中で他の値と重ならない“唯一の値”。
ユニーク数
データセットに含まれるユニーク値の総数。
重複排除
重複した値を取り除く処理。
重複
同じ値が複数回出現する状態。
データの整合性
データ内の重複や欠損を抑え、正確性を保つ性質。
データ前処理
分析前にデータを整える作業の一部。
集計
データを要約して全体像を掴む計算。
Excel
Microsoftの表計算ソフト。COUNTUNIQUEに近い機能は別の関数で実現します。
Google Sheets
Googleが提供するスプレッドシート。countuniqueが直接使える環境です。
SQL
リレーショナルデータベースの問い合わせ言語。DISTINCTで重複を除いた集計を行います。
COUNT(DISTINCT ...)
SQLで一意値の個数を数える標準表現。
BigQuery
Google Cloudのデータウェアハウス。大量データの一意値集計にも適しています。
Power BI
MicrosoftのBIツール。DAXのDISTINCTCOUNT関数でユニーク数を算出します。
DAX
Power BIなどで使われる式言語。DISTINCTCOUNTでユニーク数を計算します。
pandas
Pythonのデータ分析ライブラリ。nunique()で一意の値の個数を返します。
nunique
pandasの関数名。範囲の重複を除いた値の個数を返します。
R
統計解析のプログラミング言語。length(unique(x))のように一意値を数えます。
n_distinct
dplyr/ dbplyr などで使われる、一意な値の個数を返す関数名。
データベース
大量データを格納・集計する基盤。
一意性
データの中で他と重複しない性質。
DISTINCT
SQLで使われるキーワード。重複を排除した結果を返します。
UNIQUE
データの設計や制約、または一意の値を表す英語表現。
データ品質
重複の有無や一意性はデータ品質を左右します。
条件付き distinct
条件を付けて一意値を数える手法。
フィルタ
特定条件でデータを絞り込み、ユニーク値を数える場面で使います。

countuniqueの関連用語

COUNTUNIQUE
Google Sheets の関数。指定範囲の値から重複を除いて一意な値の個数を返します。複数列にも対応可能です。例: =COUNTUNIQUE(A1:A100)
UNIQUE
範囲の重複を取り除き、一意な値だけを抽出する関数。結果は新しい範囲として返され、別の集計と組み合わせて使われます。
DISTINCT
SQL やデータベースで“重複を除いた値のみ”を表す概念。SELECT DISTINCT で一意な値を取得します。
COUNT_DISTINCT
SQL で特定の列の異なる値の個数を数える集計操作。
CARDINALITY
データ集合の基数。含まれる一意値の総数を表す指標で、低基数/高基数と区別します。
DUPLICATES
データの中で同じ値が複数回現れる状態。データ品質の観点から除去対象になることが多いです。
DEDUPLICATION
重複したデータを取り除く処理。データの一意性を確保します。
GROUP_BY
SQL の句で、共通の値を持つ行をまとめて集計します。
FREQUENCY
値の出現回数を数える指標・関数。頻度分布を作る際に使います。
HASH_SET
ハッシュテーブルを使ったデータ構造で、要素の重複を自動的に排除し、存在確認を高速に行えます。
SET
重複を許さない集合データ構造。データのユニーク性を保証します。
COUNTA
空でないセルの個数を数える関数。数える対象が文字列・数字など多様な場合に使われます。
ARRAYFORMULA
Google Sheets などで配列全体に対して一度に計算を適用できる機能。
LOW_CARDINALITY
基数が低い、すなわち種類が少ないデータ列の特徴。分析や最適化の観点で扱います。
HIGH_CARDINALITY
基数が高い、すなわち多くの一意値が含まれるデータ列の特徴。パフォーマンスや集計設計に影響します。
UNIQUE_VALUES
データ中の一意な値の集合。重複が除かれた値のこと。
DATA_CLEANING
欠損・誤値・重複などを修正・除去してデータ品質を高める作業。
NORMALIZATION
データを統一した形式・スケールに揃える手法。重複の削減や比較を容易にします。
DISTINCT_COUNT
一意な値の個数を表す表現。COUNT(DISTINCT x) の別名として使われることがあります。

インターネット・コンピュータの人気記事

awstatsとは?初心者でもわかる使い方と基本解説共起語・同意語・対義語も併せて解説!
14083viws
bing・とは?初心者のための基本ガイド:検索エンジンの仕組みと使い方共起語・同意語・対義語も併せて解説!
1945viws
着信転送とは?初心者向けガイドで分かる使い方と設定のコツ共起語・同意語・対義語も併せて解説!
841viws
リマインドメールとは?初心者にもわかる基本ガイドと使い方のコツ共起語・同意語・対義語も併せて解説!
582viws
com端子・とは?初心者にも分かる基礎ガイド|シリアルポートの使い方と歴史を解説共起語・同意語・対義語も併せて解説!
568viws
充電アダプターとは何かを徹底解説|初心者でも分かる基本と選び方のコツ共起語・同意語・対義語も併せて解説!
535viws
pinロックとは?初心者が知っておくべき基本と使い方ガイド共起語・同意語・対義語も併せて解説!
528viws
asp・とは?初心者向けに徹底解説する基本と使い方ガイド共起語・同意語・対義語も併せて解説!
458viws
16進数カラーコード・とは?初心者でもつまずかない基礎と使い方ガイド共起語・同意語・対義語も併せて解説!
442viws
ローカルポート・とは?初心者にも分かる基本と使い方ガイド共起語・同意語・対義語も併せて解説!
423viws
7zファイル・とは?初心者でもわかる使い方と特徴を解説共起語・同意語・対義語も併せて解説!
368viws
全角文字とは?初心者向け解説|全角と半角の違いをやさしく学ぶ共起語・同意語・対義語も併せて解説!
346viws
差し込み印刷・とは?初心者でもすぐわかる使い方と仕組みガイド共起語・同意語・対義語も併せて解説!
340viws
ワンタイムコード・とは?初心者でも分かる基本と使い方ガイド共起語・同意語・対義語も併せて解説!
319viws
select句・とは?初心者でも分かるSQLの基本と使い方共起語・同意語・対義語も併せて解説!
301viws
ダイレクトチャットとは?初心者向けガイドで使い方と注意点を徹底解説共起語・同意語・対義語も併せて解説!
295viws
none とは?初心者にもやさしく解説する意味と使い方ガイド共起語・同意語・対義語も併せて解説!
295viws
csvダウンロードとは?初心者が今すぐ使える基本ガイド共起語・同意語・対義語も併せて解説!
294viws
解像度スケールとは?初心者でも分かる解像度スケールの基礎と使い方共起語・同意語・対義語も併せて解説!
275viws
sha256とは?初心者が知るべき暗号ハッシュの基礎と使い道共起語・同意語・対義語も併せて解説!
234viws

新着記事

インターネット・コンピュータの関連記事