~/devtools / unicode

tool::unicode

Unicode
Converter

Bidirektionale Konvertierung zwischen Text und \uXXXX-Unicode-Escape-Sequenzen. Unterstützt Java .properties native2ascii-Format.

// Unicode-Escapes

Das \uXXXX-Format stellt einen Unicode-Codepunkt als 4 hexadezimale Stellen dar. Java .properties-Dateien speichern Nicht-ASCII-Zeichen in diesem Format.

Text

0 Zeichen

Unicode-Escapes

0 Zeichen

// about this tool

Was ist ein Unicode Converter?

Unicode ist ein universeller Zeichenkodierungsstandard, der jedem Zeichen in jeder Sprache einen eindeutigen Codepunkt zuweist. Jedes Zeichen kann als \uXXXX-Escape-Sequenz mit vier hexadezimalen Stellen dargestellt werden.

Javas .properties-Dateien können Nicht-ASCII-Zeichen nicht direkt speichern. Das native2ascii-Tool konvertiert Zeichen wie Koreanisch oder Chinesisch in \uXXXX-Escape-Sequenzen. Dieses Tool repliziert diese Konvertierung sofort im Browser.

Drei Modi werden unterstützt: „Alles kodieren" wandelt jedes Zeichen in das \u-Format um, „Nur Nicht-ASCII" konvertiert Zeichen außerhalb des ASCII-Bereichs (über 127), und der „Java Properties"-Modus entspricht dem genauen Verhalten von native2ascii.

Anwendungsfälle

▸Koreanische Meldungen in Java .properties-Dateien in native2ascii-Format konvertieren
▸\uXXXX-Escape-Sequenzen im Quellcode interpretieren und debuggen
▸Unicode-Codepunkte von Emoji oder Sonderzeichen nachschlagen
▸i18n-Ressourcendateien für Java-Anwendungen vorbereiten oder prüfen
▸Unicode-Escape-Sequenzen in regulären Ausdrücken verstehen

Häufige Fragen

Q. Was ist der Unterschied zwischen \u und U+?

U+XXXX ist die Unicode-Standardnotation für einen Codepunkt. \uXXXX ist die Escape-Syntax in Programmiersprachen wie Java, JavaScript und C# zur Darstellung eines Unicode-Zeichens im Quellcode.

Q. Warum können manche Emoji nicht mit einem einzigen \uXXXX dargestellt werden?

Die meisten Emoji befinden sich in den Supplementary Planes (oberhalb U+FFFF). In UTF-16 benötigen diese ein Surrogatpaar — zwei \u-Escapes im Bereich \uD800–\uDFFF. Ein einzelnes 4-stelliges \u kann sie nicht darstellen.

Q. Was ist der Unterschied zwischen Java Properties-Modus und Non-ASCII-Modus?

Der Non-ASCII-Modus konvertiert alle Zeichen über Codepunkt 127. Der Java Properties-Modus entspricht exakt dem Verhalten von native2ascii und konvertiert Zeichen oberhalb des Latin-1-Bereichs (Codepunkt 256 und höher) in \uXXXX.

// related tools

Text in Base64 kodieren oder dekodieren. Unterstützt Text, URLs und Binärdaten.

URL-Strings mit encodeURIComponent oder encodeURI kodieren oder dekodieren.

HTML-Entitäten-Kodierer

HTML-Sonderzeichen in Entitäten kodieren oder dekodieren. & → & u.v.m.

JSON formatieren, validieren und minimieren. Unterstützt verschachtelte Strukturen und Diff-Vergleiche.