

高岡智則
年齢:33歳 性別:男性 職業:Webディレクター(兼ライティング・SNS運用担当) 居住地:東京都杉並区・永福町の1LDKマンション 出身地:神奈川県川崎市 身長:176cm 体系:細身〜普通(最近ちょっとお腹が気になる) 血液型:A型 誕生日:1992年11月20日 最終学歴:明治大学・情報コミュニケーション学部卒 通勤:京王井の頭線で渋谷まで(通勤20分) 家族構成:一人暮らし、実家には両親と2歳下の妹 恋愛事情:独身。彼女は2年いない(本人は「忙しいだけ」と言い張る)
rfc3986とは何か
このガイドでは rfc3986 という文書がどんなものかを、初心者にも分かるように丁寧に解説します。rfc3986 はインターネットが使う住所のような文字列を決めるルールのことです。URL とは何か など基本から順に整理します。
まず知っておきたいのは URI の意味です。URI は Uniform Resource Identifier の略で、資源を一意に特定する文字列のことです。URL は URI の中の一種であり、資源がどこにありどうやって取りに行くかまで教えてくれるものです。URN は資源を名前だけで表す形式であり場所を示さないことが多いのが特徴です。
RFC 3986 は URI の「文法」を決めています。つまりどういう順番で文字を並べれば URI として正しいのかを決めています。基本的な形は次のとおりです。スキーム という部分のあとに コロン と hier-part が続きます。続くのは クエリ と フラグメント であることもあります。
例として次の URL を見てみましょう。 https://example.com/path?query=value#fragment この例ではスキームは http や https で始まり、権限情報やホスト名、パス、クエリ、フラグメント という部分に分かれています。
この規格のポイントを押さえておくと、Web サイトを設計する人や検索エンジンの仕組みを理解するのに役立ちます。特に SEO の現場では URL の正しい形を保つことが大切です。例えば同じ内容のページでも URL が異なると検索エンジンが混乱してしまい、評価が分散することがあります。RFC 3986 のルールに沿って URL を作ると巡回がスムーズになり、リンクの意味も伝わりやすくなります。
| 部品 | 説明 |
|---|---|
| スキーム | URI の先頭部分で資源の種類を示す。例: http, https |
| hier-part | 権限情報とパスの集合。権限情報にはユーザー名やパスワードが含まれることがある |
| ホスト | 資源の実在する場所の住所。ドメイン名や IP アドレスが使われる |
| パス | 資源までの道筋を表す部分。階層を示す |
| クエリ | 追加の情報を URL に渡す部分。検索条件など |
| フラグメント | ページ内の特定の場所へ飛ぶための情報 |
また RFC 3986 にはエンコーディングのルールも含まれています。URL に使えない文字を パーセントエンコーディング という形で表現します。たとえばスペースは %20 のように変換されます。これにより世界中の文字を正しく URI に入れることができます。
実務での活用としては 正規化 や 正規URLの扱い、クロールの最適化 などがあります。検索エンジンは URL の正規形を理解することで、同一ページの複数URLを避けるのが難しい場合があります。そこで canonical URL の設定が重要です。サーバー側の設定や CMS の機能で 1 つの URL を「公式な」URLとして指し示すことができます。
最後に学習のコツとして、身の回りのサイトの URL を観察してみましょう。よくある形は https の後に :// で続くホスト名とパスです。自分の作成するページの URL がどう作られているかを確認し、文字のエンコーディングや大文字小文字の統一を意識すると理解が深まります。
要点のまとめ は以下のとおりです。URL の構造を分解して理解すること、パーセントエンコーディングの使い方を覚えること、そして実務では SEO の観点から URL の正規化を心がけることです。
rfc3986の同意語
- Uniform Resource Identifier
- URIの正式名称。ウェブ上の資源を一意に識別する文字列の総称で、URLやURNを含む広い概念。
- URI
- Uniform Resource Identifierの略称。資源識別子の総称を指す英語表現。
- URL
- Uniform Resource Locator。資源の場所を指し示すURIの一種で、ウェブページなどの所在地を表す文字列。
- Uniform Resource Locator
- URLの正式名称。資源の所在を示すURIの一部。
- URN
- Uniform Resource Name。資源の名前を指すURIの一種。場所依存しない識別子として用いられる。
- Uniform Resource Name
- URNの正式名称。資源の名前で識別するURIの一種。
- IRI
- Internationalized Resource Identifier。非ASCII文字を含むリソース識別子の拡張概念。URIの一部拡張として用いられることがある。
- RFC 3986
- RFC 3986 — Uniform Resource Identifier (URI): Generic Syntax(URIのジェネリック構文を規定する標準文書)
- URIのジェネリック構文
- URIの基本文法・構造を定義する考え方。RFC 3986で述べられているジェネリック構文のこと。
- 資源識別子
- Resource Identifierの日本語訳。URIの広義の表現として使われることがある。
rfc3986の対義語・反対語
- 非RFC3986準拠
- RFC 3986の規格に従っていない、あるいは適合していない状態。URIの文法・構造がこの規格の定義を満たしていないことを指す対義語的表現。
- 非標準仕様
- 公的な標準として承認・公開されていない仕様。公式の標準規格(例: RFC 3986など)に対する対義語として使われることが多い。
- 独自仕様
- 特定の組織やプロジェクトが内部的に定義した仕様。公開標準ではなく、互換性が低いことが多い。
- 互換性なし
- 他の実装と互換性が保たれていない状態。RFC 3986準拠の規定と整合しない設計・挙動のことを指す。
- ローカル仕様
- 組織内や特定の環境・用途でのみ有効な仕様。普遍的・国際標準性が欠如している点が対義語的要素。
- 実装依存
- 仕様が明確に定義されず、挙動や解釈が実装に依存している状態。標準化された挙動と反対の概念。
- 旧来の仕様
- 現在のRFC規格より古い、時代遅れと見なされる仕様。新しい標準(例: RFC 3986)と対比される。
- 非URI規格
- URI自体の公式規格ではなく、別のフォーマットや規格のこと。RFC 3986と対照的なカテゴリとして捉えられることがある。
rfc3986の共起語
- URI
- Uniform Resource Identifier。ウェブ上の資源を一意に識別する文字列で、RFC 3986 でその構文が規定されています。
- URL
- Uniform Resource Locator。資源の位置を表す URI の一種。日常では“ウェブアドレス”と呼ばれますが、RFC 3986 では URI の一部として扱われます。
- URN
- Uniform Resource Name。資源を名前で識別する URI の別形式。
- IETF
- Internet Engineering Task Force。インターネットの標準規格を策定する団体。
- ABNF
- Augmented Backus–Naur Form。RFC で構文を表すために用いられる記法。
- percent-encoding
- パーセントエンコーディング。非 ASCII 文字や予約文字を URI 内で表現する方法。
- percent-encoded
- パーセントエンコードされた状態を指す語。例として %20 など。
- unreserved
- 未予約文字の集合。ALPHA / DIGIT / '-' / '.' / '_' / '~' から成ります。
- reserved
- 予約文字。URI の構文上、特別な意味を持つ文字の集合。
- gen-delims
- 一般区切り文字。':' / '/' / '?' / '#' / '[' / ']' / '@'。
- sub-delims
- サブ区切り文字。 '!' / '$' / '&' / ''' / '(' / ')' / '*' / '+' / ',' / ';' / '=' など。
- scheme
- URI の先頭部分。例: http, https, ftp など。
- authority
- ユーザー情報・ホスト・ポートを含む、リソースへアクセスする際の権限情報の部分。
- user-info
- ユーザー名とパスワードなど、認証情報を含む部。
- host
- 資源を提供するホスト名。ドメイン名または IP アドレスが入ります。
- port
- 資源へアクセスする際の通信ポート番号。
- path
- 資源の場所を表す部分。セグメントで構成されます。
- query
- 資源に追加情報を渡すパラメータの集合。クエリ文字列とも呼ばれます。
- fragment
- 資源内の特定の位置を指す参照。
- IP-literal
- URI 内で IP アドレスを表す表現。主に IPv6 アドレスを角括弧で囲んで表記します。
- IPv6
- 128ビットのアドレス体系。IPv4 に代わる新しい IP 形式。
- IPv4
- 32ビットのアドレス体系。現在一般的に使われる IP 形式。
- IPvFuture
- IPvFuture。今後の IP アドレスの表現形式を意味する概念。
- IRI
- Internationalized Resource Identifier。非 ASCII 文字を含む URI の拡張概念(RFC 3986 との併用で利用されます)。
- IANA
- Internet Assigned Numbers Authority。URI のスキーム登録などを管理する機関。
- canonicalization
- 正規化。URI を一意な形に揃える作業。
- normalization
- 正規化の別名。大文字小文字の扱い、パーセントエンコーディングの解釈などを統一します。
- relative-URI
- スキームを持たず、現在のリファレンス点から相対的に参照する形式。
- absolute-URI
- スキームを含む完全な URI の形式。
- URI-reference
- URI または相対 URI のいずれかを指す表現。
- path-abempty
- パスが空でもよく、先頭がスラッシュで始まる形式。
- path-absolute
- 先頭にスラッシュがあり、最初のセグメントが必須の形式。
- path-rootless
- 先頭にスラッシュがなく、相対パスとして解釈される形式。
- path-empty
- パスが空の形式。
rfc3986の関連用語
- URI
- Uniform Resource Identifier の略。資源を一意に識別する文字列で、スキーム・オーソリティ・パス・クエリ・フラグメントなどの要素から成り立ちます。RFC 3986 で基本概念として定義されています。
- URL
- Uniform Resource Locator の略。資源の場所情報を含む URI の一種で、実務的には最もよく使われる形式です。RFC 3986 では URL は URI のサブセットとして扱われます。
- URN
- Uniform Resource Name の略。資源の場所に依存しない名前で識別する方式で、長期的な識別性を重視します。
- スキーム
- URI の先頭部分で、アクセス方法や識別の仕組みを示します。例: http、https、ftp。スキーム名は通常 case-insensitive です。
- オーソリティ
- ユーザー情報、ホスト、ポートを含む URI の中核部分で、// の後に続く資源の位置情報をまとめたセクションです。
- ユーザー情報
- ホストへアクセスする際の認証情報を含む部分で、ユーザー名とパスワードを user:password の形で表し、@ の前に配置します。
- ホスト
- 資源の所在を示す部分。ドメイン名、IPv4 アドレス、IPv6 アドレス(IPリテラルは [IPv6] の形で表現します)などを含みます。
- IPリテラル
- ホストとして IP アドレスを表す形式です。IPv6 の場合は [IPv6アドレス] の形でブラケットで囲まれます。
- IPv4アドレス
- 4つの10進数オクテットをドットで区切った表現です。例: 192.0.2.1。
- IPv6アドレス
- 8つの16進数セグメントをコロンで区切って表すアドレスで、省略表記が可能です。例: 2001:db8::1。
- IPvFuture
- IPvFuture は将来の IP アドレス表現を指す拡張形式で、IPリテラルの一部として扱われます。
- ポート
- 接続先の番号。省略可能で、デフォルトポートが使われることがあります。
- パス
- 資源の場所を表す文字列。階層的なパスとそうでないパスを区別します。
- パスの形式
- パスには path-abempty、path-absolute、path-rootless、path-empty の4つの形式が定義されています。
- クエリ
- リクエストの追加情報を渡す文字列で、'?' の後に続き、各パラメータはスキームごとに解釈されます。
- フラグメント
- リソース内の特定の位置を指す参照。 '#' の後に続く文字列はサーバへ送信されません。
- 相対URI
- 基準 URI から相対的に参照する形式で、スキームを省略することが多いです。
- 絶対URI
- スキームを含む完全な URI。資源を一意に識別します。
- URI参照
- URI または相対参照のいずれかを指します。
- reg-name
- ホスト名として登録名を指す文字列。通常はドメイン名の形式で用いられます。
- パーセントエンコード
- 特定の文字を % に続く2桁の16進数で表現する文字列形式のこと。
- pct-encoded
- ABNF 定義上の用語で、% で始まる2桁の16進数のエンコード文字列を指します。
- unreserved
- そのまま使える文字集合。アルファベット・数字・'-'・'.'・'_'・'~' が該当します。
- reserved
- 予約された意味を持つ文字の集合で、URI の構文上特別な意味を持つ文字が含まれます。
- gen-delims
- 一般デリミタ。 ':' / '/' / '?' / '#' / '[' / ']' / '@' が含まれます。
- sub-delims
- サブデリミタ。 '!' / '$' / '&' / ''' / '(' / ')' / '*' / '+' / ',' / ';' / '=' が含まれます。
- 正規化
- URI の正規化処理。スキーム・ホストの小文字化、デフォルトポートの省略、パスの dot-segments の除去、% 記法の大文字小文字統一などを含みます。
- デフォルトポート
- スキームごとに定義される省略時のポート番号。例: http の場合 80、https の場合 443 など。
- 階層URI
- 階層構造を持つ URI。パスが階層的に解釈されるタイプの URI。
- ABNF
- Augmented Backus-Naur Form の略。RFC 3986 で URI の構文を規定する記法として使用されます。
- IRI
- Internationalized Resource Identifier の略。Unicode 文字を含む URI の拡張で、RFC 3987 により定義されています。



















