~/devtools / unicode
tool::unicode

Unicode
Converter

Bidirektionale Konvertierung zwischen Text und \uXXXX-Unicode-Escape-Sequenzen. Unterstützt Java .properties native2ascii-Format.

ad · 728×90
// Unicode-Escapes
Das \uXXXX-Format stellt einen Unicode-Codepunkt als 4 hexadezimale Stellen dar. Java .properties-Dateien speichern Nicht-ASCII-Zeichen in diesem Format.
Text
0 Zeichen
Unicode-Escapes
0 Zeichen
ad · 300×250
// about this tool

Was ist ein Unicode Converter?

Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen in jeder Sprache einen eindeutigen Codepunkt zuweist. Jedes Zeichen kann als \uXXXX-Escape-Sequenz mit vier hexadezimalen Stellen dargestellt werden.

Javas .properties-Dateien können Nicht-ASCII-Zeichen nicht direkt speichern. Das native2ascii-Tool konvertiert Zeichen wie Koreanisch oder Chinesisch in \uXXXX-Escape-Sequenzen. Dieses Tool repliziert diese Konvertierung sofort im Browser.

Drei Modi werden unterstützt: „Alles kodieren" wandelt jedes Zeichen in das \u-Format um, „Nur Nicht-ASCII" konvertiert Zeichen außerhalb des ASCII-Bereichs (über 127), und der „Java Properties"-Modus entspricht dem genauen Verhalten von native2ascii.

Anwendungsfälle
  • Koreanische Meldungen in Java .properties-Dateien in native2ascii-Format konvertieren
  • \uXXXX-Escape-Sequenzen im Quellcode interpretieren und debuggen
  • Unicode-Codepunkte von Emoji oder Sonderzeichen nachschlagen
  • i18n-Ressourcendateien für Java-Anwendungen vorbereiten oder prüfen
  • Unicode-Escape-Sequenzen in regulären Ausdrücken verstehen
Häufige Fragen
Q. Was ist der Unterschied zwischen \u und U+?
U+XXXX ist die Unicode-Standardnotation für einen Codepunkt. \uXXXX ist die Escape-Syntax in Programmiersprachen wie Java, JavaScript und C# zur Darstellung eines Unicode-Zeichens im Quellcode.
Q. Warum können manche Emoji nicht mit einem einzigen \uXXXX dargestellt werden?
Die meisten Emoji befinden sich in den Supplementary Planes (oberhalb U+FFFF). In UTF-16 benötigen diese ein Surrogatpaar — zwei \u-Escapes im Bereich \uD800–\uDFFF. Ein einzelnes 4-stelliges \u kann sie nicht darstellen.
Q. Was ist der Unterschied zwischen Java Properties-Modus und Non-ASCII-Modus?
Der Non-ASCII-Modus konvertiert alle Zeichen über Codepunkt 127. Der Java Properties-Modus entspricht exakt dem Verhalten von native2ascii und konvertiert Zeichen oberhalb des Latin-1-Bereichs (Codepunkt 256 und höher) in \uXXXX.
// related tools
b64
Base64 Encoder
Text in Base64 kodieren oder dekodieren. Unterstützt Text, URLs und Binärdaten.
%
URL Encoder
URL-Strings mit encodeURIComponent oder encodeURI kodieren oder dekodieren.
<
HTML-Entitäten-Kodierer
HTML-Sonderzeichen in Entitäten kodieren oder dekodieren. & → & u.v.m.
{}
JSON Formatter
JSON formatieren, validieren und minimieren. Unterstützt verschachtelte Strukturen und Diff-Vergleiche.