長い間検討されてきた、多国語を使えるリソース識別子であるIRI (Internationalized Resource Identifier) が、ようやくRFC3987となりました。合わせて、URIの一般構文を定義するRFC2396の改訂版もRFC3986として公開されています。 IRIは、Unicode(ISO 10646)の文字レパートリを使えるようにしたリソース識別子。URIはASCIIのサブセットしか使えないために、検索のクエリやWiki nameに日本語を与えると '%E7%A5%9E%E5%B4%8E' のようにエスケープ(URLエンコード)されてしまうわけですが、IRIならこれを '神崎' とできることになります。さらに、IRIでは右から左に向かって文字を書く言語のことも考慮したBidiに関する規定も用意しています。 IRIが使える場面としては、たとえばXMLスキーマのan