~/devtools / unicode
tool::unicode
Unicode
Converter
テキストと\uXXXX形式のUnicodeエスケープシーケンスを双方向変換。Java .propertiesのnative2ascii形式に対応。
// Unicodeエスケープ
\uXXXX形式はUnicodeコードポイントを4桁の16進数で表します。Java .propertiesファイルは非ASCII文字をこの形式で保存します。
テキスト
0文字
Unicodeエスケープ
0文字
ad · 300×250
// about this tool
Unicode Converterとは?
Unicodeはすべての言語のすべての文字に固有のコードポイントを割り当てる普遍的な文字エンコード標準です。各文字は4桁の16進数を使った\uXXXXエスケープシーケンスで表現できます。
Javaの.propertiesファイルは非ASCII文字を直接保存できません。native2asciiツールは日本語や中国語などの文字を\uXXXX形式に変換します。このツールはその変換をブラウザ上で即座に再現します。
3つのモードをサポートしています:「すべてエンコード」はすべての文字を\u形式に変換、「非ASCIIのみ」はASCI範囲外の文字(127以上)を変換、「Java Properties」モードはnative2asciiと同じ動作を再現します。
主な使用例
- ▸Java .propertiesファイルの日本語メッセージをnative2ascii形式に変換
- ▸ソースコード内の\uXXXXエスケープシーケンスを解釈・デバッグ
- ▸絵文字や特殊文字のUnicodeコードポイントを調べる
- ▸Javaアプリケーション用i18nリソースファイルの準備・検証
- ▸正規表現内のUnicodeエスケープシーケンスを理解する
よくある質問
Q. \uとU+の違いは何ですか?
U+XXXXはコードポイントのUnicode標準表記です。\uXXXXはJava・JavaScript・C#などのプログラミング言語でソースコード中にUnicode文字を表すためのエスケープ構文です。
Q. 一部の絵文字が単一の\uXXXXで表現できないのはなぜですか?
ほとんどの絵文字は補助多言語面(U+FFFFより上)にあります。UTF-16ではこれらはサロゲートペア(\uD800〜\uDFFFの範囲の2つの\uエスケープ)が必要です。4桁の単一\uでは表現できません。
Q. Java PropertiesモードとNon-ASCIIモードの違いは何ですか?
Non-ASCIIモードはコードポイント127より大きいすべての文字を変換します。Java PropertiesモードはLatin-1範囲(コードポイント256)以上の文字を\uXXXXに変換するnative2asciiの動作と完全に一致します。
// related tools