rfc3986とは?初心者が今すぐ理解できるURL規格の基本講座共起語・同意語・対義語も併せて解説!

  • このエントリーをはてなブックマークに追加
rfc3986とは?初心者が今すぐ理解できるURL規格の基本講座共起語・同意語・対義語も併せて解説!
この記事を書いた人

高岡智則

年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)


rfc3986とは何か

このガイドでは rfc3986 という文書がどんなものかを、初心者にも分かるように丁寧に解説します。rfc3986 はインターネットが使う住所のような文字列を決めるルールのことです。URL とは何か など基本から順に整理します。

まず知っておきたいのは URI の意味です。URI は Uniform Resource Identifier の略で、資源を一意に特定する文字列のことです。URL は URI の中の一種であり、資源がどこにありどうやって取りに行くかまで教えてくれるものです。URN は資源を名前だけで表す形式であり場所を示さないことが多いのが特徴です。

RFC 3986 は URI の「文法」を決めています。つまりどういう順番で文字を並べれば URI として正しいのかを決めています。基本的な形は次のとおりです。スキーム という部分のあとに コロン hier-part が続きます。続くのは クエリフラグメント であることもあります。

例として次の URL を見てみましょう。 https://example.com/path?query=value#fragment この例ではスキームは http や https で始まり、権限情報やホストパスクエリフラグメント という部分に分かれています。

この規格のポイントを押さえておくと、Web サイトを設計する人や検索エンジンの仕組みを理解するのに役立ちます。特に SEO の現場では URL の正しい形を保つことが大切です。例えば同じ内容のページでも URL が異なると検索エンジンが混乱してしまい、評価が分散することがあります。RFC 3986 のルールに沿って URL を作ると巡回がスムーズになり、リンクの意味も伝わりやすくなります。

部品説明
スキームURI の先頭部分で資源の種類を示す。例: http, https
hier-part権限情報とパスの集合。権限情報にはユーザー名やパスワードが含まれることがある
ホスト資源の実在する場所の住所。ドメイン名や IP アドレスが使われる
パス資源までの道筋を表す部分。階層を示す
クエリ追加の情報を URL に渡す部分。検索条件など
フラグメントページ内の特定の場所へ飛ぶための情報

また RFC 3986 にはエンコーディングのルールも含まれています。URL に使えない文字を パーセントエンコーディング という形で表現します。たとえばスペースは %20 のように変換されます。これにより世界中の文字を正しく URI に入れることができます。

実務での活用としては 正規化正規URLの扱いクロールの最適化 などがあります。検索エンジンは URL の正規形を理解することで、同一ページの複数URLを避けるのが難しい場合があります。そこで canonical URL の設定が重要です。サーバー側の設定や CMS の機能で 1 つの URL を「公式な」URLとして指し示すことができます。

最後に学習のコツとして、身の回りのサイトの URL を観察してみましょう。よくある形は https の後に :// で続くホスト名とパスです。自分の作成するページの URL がどう作られているかを確認し、文字のエンコーディングや大文字小文字の統一を意識すると理解が深まります。

要点のまとめ は以下のとおりです。URL の構造を分解して理解すること、パーセントエンコーディングの使い方を覚えること、そして実務では SEO の観点から URL の正規化を心がけることです。


rfc3986の同意語

Uniform Resource Identifier
URIの正式名称。ウェブ上の資源を一意に識別する文字列の総称で、URLやURNを含む広い概念。
URI
Uniform Resource Identifierの略称。資源識別子の総称を指す英語表現。
URL
Uniform Resource Locator。資源の場所を指し示すURIの一種で、ウェブページなどの所在地を表す文字列。
Uniform Resource Locator
URLの正式名称。資源の所在を示すURIの一部。
URN
Uniform Resource Name。資源の名前を指すURIの一種。場所依存しない識別子として用いられる。
Uniform Resource Name
URNの正式名称。資源の名前で識別するURIの一種。
IRI
Internationalized Resource Identifier。非ASCII文字を含むリソース識別子の拡張概念。URIの一部拡張として用いられることがある。
RFC 3986
RFC 3986 — Uniform Resource Identifier (URI): Generic Syntax(URIのジェネリック構文を規定する標準文書)
URIのジェネリック構文
URIの基本文法・構造を定義する考え方。RFC 3986で述べられているジェネリック構文のこと。
資源識別子
Resource Identifierの日本語訳。URIの広義の表現として使われることがある。

rfc3986の対義語・反対語

非RFC3986準拠
RFC 3986の規格に従っていない、あるいは適合していない状態。URIの文法・構造がこの規格の定義を満たしていないことを指す対義語的表現。
非標準仕様
公的な標準として承認・公開されていない仕様。公式の標準規格(例: RFC 3986など)に対する対義語として使われることが多い。
独自仕様
特定の組織やプロジェクトが内部的に定義した仕様。公開標準ではなく、互換性が低いことが多い。
互換性なし
他の実装と互換性が保たれていない状態。RFC 3986準拠の規定と整合しない設計・挙動のことを指す。
ローカル仕様
組織内や特定の環境・用途でのみ有効な仕様。普遍的・国際標準性が欠如している点が対義語的要素。
実装依存
仕様が明確に定義されず、挙動や解釈が実装に依存している状態。標準化された挙動と反対の概念。
旧来の仕様
現在のRFC規格より古い、時代遅れと見なされる仕様。新しい標準(例: RFC 3986)と対比される。
非URI規格
URI自体の公式規格ではなく、別のフォーマットや規格のこと。RFC 3986と対照的なカテゴリとして捉えられることがある。

rfc3986の共起語

URI
Uniform Resource Identifier。ウェブ上の資源を一意に識別する文字列で、RFC 3986 でその構文が規定されています。
URL
Uniform Resource Locator。資源の位置を表す URI の一種。日常では“ウェブアドレス”と呼ばれますが、RFC 3986 では URI の一部として扱われます。
URN
Uniform Resource Name。資源を名前で識別する URI の別形式。
IETF
Internet Engineering Task Force。インターネットの標準規格を策定する団体。
ABNF
Augmented Backus–Naur Form。RFC で構文を表すために用いられる記法。
percent-encoding
パーセントエンコーディング。非 ASCII 文字や予約文字を URI 内で表現する方法。
percent-encoded
パーセントエンコードされた状態を指す語。例として %20 など。
unreserved
未予約文字の集合。ALPHA / DIGIT / '-' / '.' / '_' / '~' から成ります。
reserved
予約文字。URI の構文上、特別な意味を持つ文字の集合。
gen-delims
一般区切り文字。':' / '/' / '?' / '#' / '[' / ']' / '@'。
sub-delims
サブ区切り文字。 '!' / '$' / '&' / ''' / '(' / ')' / '*' / '+' / ',' / ';' / '=' など。
scheme
URI の先頭部分。例: http, https, ftp など。
authority
ユーザー情報・ホスト・ポートを含む、リソースへアクセスする際の権限情報の部分。
user-info
ユーザー名とパスワードなど、認証情報を含む部。
host
資源を提供するホスト名。ドメイン名または IP アドレスが入ります。
port
資源へアクセスする際の通信ポート番号。
path
資源の場所を表す部分。セグメントで構成されます。
query
資源に追加情報を渡すパラメータの集合。クエリ文字列とも呼ばれます。
fragment
資源内の特定の位置を指す参照。
IP-literal
URI 内で IP アドレスを表す表現。主に IPv6 アドレスを角括弧で囲んで表記します。
IPv6
128ビットのアドレス体系。IPv4 に代わる新しい IP 形式。
IPv4
32ビットのアドレス体系。現在一般的に使われる IP 形式。
IPvFuture
IPvFuture。今後の IP アドレスの表現形式を意味する概念。
IRI
Internationalized Resource Identifier。非 ASCII 文字を含む URI の拡張概念(RFC 3986 との併用で利用されます)。
IANA
Internet Assigned Numbers Authority。URI のスキーム登録などを管理する機関。
canonicalization
正規化。URI を一意な形に揃える作業。
normalization
正規化の別名。大文字小文字の扱い、パーセントエンコーディングの解釈などを統一します。
relative-URI
スキームを持たず、現在のリファレンス点から相対的に参照する形式。
absolute-URI
スキームを含む完全な URI の形式。
URI-reference
URI または相対 URI のいずれかを指す表現。
path-abempty
パスが空でもよく、先頭がスラッシュで始まる形式。
path-absolute
先頭にスラッシュがあり、最初のセグメントが必須の形式。
path-rootless
先頭にスラッシュがなく、相対パスとして解釈される形式。
path-empty
パスが空の形式。

rfc3986の関連用語

URI
Uniform Resource Identifier の略。資源を一意に識別する文字列で、スキーム・オーソリティ・パス・クエリ・フラグメントなどの要素から成り立ちます。RFC 3986 で基本概念として定義されています。
URL
Uniform Resource Locator の略。資源の場所情報を含む URI の一種で、実務的には最もよく使われる形式です。RFC 3986 では URL は URI のサブセットとして扱われます。
URN
Uniform Resource Name の略。資源の場所に依存しない名前で識別する方式で、長期的な識別性を重視します。
スキーム
URI の先頭部分で、アクセス方法や識別の仕組みを示します。例: http、https、ftp。スキーム名は通常 case-insensitive です。
オーソリティ
ユーザー情報、ホスト、ポートを含む URI の中核部分で、// の後に続く資源の位置情報をまとめたセクションです。
ユーザー情報
ホストへアクセスする際の認証情報を含む部分で、ユーザー名とパスワードを user:password の形で表し、@ の前に配置します。
ホスト
資源の所在を示す部分。ドメイン名、IPv4 アドレス、IPv6 アドレス(IPリテラルは [IPv6] の形で表現します)などを含みます。
IPリテラル
ホストとして IP アドレスを表す形式です。IPv6 の場合は [IPv6アドレス] の形でブラケットで囲まれます。
IPv4アドレス
4つの10進数オクテットをドットで区切った表現です。例: 192.0.2.1。
IPv6アドレス
8つの16進数セグメントをコロンで区切って表すアドレスで、省略表記が可能です。例: 2001:db8::1。
IPvFuture
IPvFuture は将来の IP アドレス表現を指す拡張形式で、IPリテラルの一部として扱われます。
ポート
接続先の番号。省略可能で、デフォルトポートが使われることがあります。
パス
資源の場所を表す文字列。階層的なパスとそうでないパスを区別します。
パスの形式
パスには path-abempty、path-absolute、path-rootless、path-empty の4つの形式が定義されています。
クエリ
リクエストの追加情報を渡す文字列で、'?' の後に続き、各パラメータはスキームごとに解釈されます。
フラグメント
リソース内の特定の位置を指す参照。 '#' の後に続く文字列はサーバへ送信されません。
相対URI
基準 URI から相対的に参照する形式で、スキームを省略することが多いです。
絶対URI
スキームを含む完全な URI。資源を一意に識別します。
URI参照
URI または相対参照のいずれかを指します。
reg-name
ホスト名として登録名を指す文字列。通常はドメイン名の形式で用いられます。
パーセントエンコード
特定の文字を % に続く2桁の16進数で表現する文字列形式のこと。
pct-encoded
ABNF 定義上の用語で、% で始まる2桁の16進数のエンコード文字列を指します。
unreserved
そのまま使える文字集合。アルファベット・数字・'-'・'.'・'_'・'~' が該当します。
reserved
予約された意を持つ文字の集合で、URI の構文上特別な意味を持つ文字が含まれます。
gen-delims
一般デリミタ。 ':' / '/' / '?' / '#' / '[' / ']' / '@' が含まれます。
sub-delims
サブデリミタ。 '!' / '$' / '&' / ''' / '(' / ')' / '*' / '+' / ',' / ';' / '=' が含まれます。
正規化
URI の正規化処理。スキーム・ホストの小文字化、デフォルトポートの省略、パスの dot-segments の除去、% 記法の大文字小文字統一などを含みます。
デフォルトポート
スキームごとに定義される省略時のポート番号。例: http の場合 80、https の場合 443 など。
階層URI
階層構造を持つ URI。パスが階層的に解釈されるタイプの URI。
ABNF
Augmented Backus-Naur Form の略。RFC 3986 で URI の構文を規定する記法として使用されます。
IRI
Internationalized Resource Identifier の略。Unicode 文字を含む URI の拡張で、RFC 3987 により定義されています。

インターネット・コンピュータの人気記事

awstatsとは?初心者でもわかる使い方と基本解説共起語・同意語・対義語も併せて解説!
14588viws
bing・とは?初心者のための基本ガイド:検索エンジンの仕組みと使い方共起語・同意語・対義語も併せて解説!
2434viws
着信転送とは?初心者向けガイドで分かる使い方と設定のコツ共起語・同意語・対義語も併せて解説!
1083viws
差し込み印刷・とは?初心者でもすぐわかる使い方と仕組みガイド共起語・同意語・対義語も併せて解説!
1064viws
com端子・とは?初心者にも分かる基礎ガイド|シリアルポートの使い方と歴史を解説共起語・同意語・対義語も併せて解説!
948viws
充電アダプターとは何かを徹底解説|初心者でも分かる基本と選び方のコツ共起語・同意語・対義語も併せて解説!
916viws
全角文字とは?初心者向け解説|全角と半角の違いをやさしく学ぶ共起語・同意語・対義語も併せて解説!
858viws
7zファイル・とは?初心者でもわかる使い方と特徴を解説共起語・同意語・対義語も併せて解説!
858viws
pinロックとは?初心者が知っておくべき基本と使い方ガイド共起語・同意語・対義語も併せて解説!
803viws
リマインドメールとは?初心者にもわかる基本ガイドと使い方のコツ共起語・同意語・対義語も併せて解説!
796viws
none とは?初心者にもやさしく解説する意味と使い方ガイド共起語・同意語・対義語も併せて解説!
732viws
16進数カラーコード・とは?初心者でもつまずかない基礎と使い方ガイド共起語・同意語・対義語も併せて解説!
717viws
xlsmとは?初心者でも分かるExcelのマクロ付きファイルの基本共起語・同意語・対義語も併せて解説!
612viws
asp・とは?初心者向けに徹底解説する基本と使い方ガイド共起語・同意語・対義語も併せて解説!
602viws
ローカルポート・とは?初心者にも分かる基本と使い方ガイド共起語・同意語・対義語も併せて解説!
595viws
countifとは?初心者でもすぐ使える基本と応用ガイド共起語・同意語・対義語も併せて解説!
556viws
ワンタイムコード・とは?初心者でも分かる基本と使い方ガイド共起語・同意語・対義語も併せて解説!
533viws
csvダウンロードとは?初心者が今すぐ使える基本ガイド共起語・同意語・対義語も併せて解説!
515viws
sha256とは?初心者が知るべき暗号ハッシュの基礎と使い道共起語・同意語・対義語も併せて解説!
493viws
googleドキュメントとは?初心者が今日から使いこなす基本ガイド共起語・同意語・対義語も併せて解説!
483viws

新着記事

インターネット・コンピュータの関連記事