~/devtools / unicode
tool::unicode

Unicode
Converter

テキストと\uXXXX形式のUnicodeエスケープシーケンスを双方向変換。Java .propertiesのnative2ascii形式に対応。

ad · 728×90
// Unicodeエスケープ
\uXXXX形式はUnicodeコードポイントを4桁の16進数で表します。Java .propertiesファイルは非ASCII文字をこの形式で保存します。
テキスト
0文字
Unicodeエスケープ
0文字
ad · 300×250
// about this tool

Unicode Converterとは?

Unicodeはすべての言語のすべての文字に固有のコードポイントを割り当てる普遍的な文字エンコード標準です。各文字は4桁の16進数を使った\uXXXXエスケープシーケンスで表現できます。

Javaの.propertiesファイルは非ASCII文字を直接保存できません。native2asciiツールは日本語や中国語などの文字を\uXXXX形式に変換します。このツールはその変換をブラウザ上で即座に再現します。

3つのモードをサポートしています:「すべてエンコード」はすべての文字を\u形式に変換、「非ASCIIのみ」はASCI範囲外の文字(127以上)を変換、「Java Properties」モードはnative2asciiと同じ動作を再現します。

主な使用例
  • Java .propertiesファイルの日本語メッセージをnative2ascii形式に変換
  • ソースコード内の\uXXXXエスケープシーケンスを解釈・デバッグ
  • 絵文字や特殊文字のUnicodeコードポイントを調べる
  • Javaアプリケーション用i18nリソースファイルの準備・検証
  • 正規表現内のUnicodeエスケープシーケンスを理解する
よくある質問
Q. \uとU+の違いは何ですか?
U+XXXXはコードポイントのUnicode標準表記です。\uXXXXはJava・JavaScript・C#などのプログラミング言語でソースコード中にUnicode文字を表すためのエスケープ構文です。
Q. 一部の絵文字が単一の\uXXXXで表現できないのはなぜですか?
ほとんどの絵文字は補助多言語面(U+FFFFより上)にあります。UTF-16ではこれらはサロゲートペア(\uD800〜\uDFFFの範囲の2つの\uエスケープ)が必要です。4桁の単一\uでは表現できません。
Q. Java PropertiesモードとNon-ASCIIモードの違いは何ですか?
Non-ASCIIモードはコードポイント127より大きいすべての文字を変換します。Java PropertiesモードはLatin-1範囲(コードポイント256)以上の文字を\uXXXXに変換するnative2asciiの動作と完全に一致します。
// related tools
b64
Base64 Encoder
テキストをBase64にエンコード、またはデコード。テキスト・URL・バイナリデータに対応。
%
URL Encoder
encodeURIComponentまたはencodeURIでURL文字列をエンコード・デコード。
<
HTMLエンティティエンコーダー
HTML特殊文字をエンティティにエンコード/デコード。& → & など双方向。
{}
JSON Formatter
JSONのフォーマット、バリデーション、圧縮に対応。ネスト構造や差分比較もサポート。