~/devtools / unicode
tool::unicode
유니코드
변환기
텍스트와 \uXXXX 유니코드 이스케이프를 양방향으로 변환합니다. Java .properties 파일의 native2ascii 형식도 지원합니다.
// 유니코드 이스케이프
\uXXXX 형식은 4자리 16진수로 유니코드 코드포인트를 표현합니다. Java .properties 파일은 비ASCII 문자를 이 형식으로 저장합니다.
텍스트
0자
유니코드 이스케이프
0자
ad · 300×250
// about this tool
유니코드 변환기란?
유니코드(Unicode)는 전 세계 모든 문자를 하나의 표준으로 통합한 문자 인코딩 시스템입니다. 각 문자는 고유한 코드포인트(U+XXXX)를 가지며, \uXXXX 형식의 이스케이프 시퀀스로 표현할 수 있습니다.
Java의 .properties 파일은 한글, 중국어 등 비ASCII 문자를 직접 저장하지 않고 native2ascii 도구로 \uXXXX 형식으로 변환해 저장합니다. 이 도구는 그 변환 과정을 브라우저에서 즉시 처리합니다.
세 가지 모드를 지원합니다. '전체 인코딩'은 모든 문자를 \u 형식으로, '비ASCII만'은 ASCII 범위(0~127)를 벗어나는 문자만 변환하며, 'Java Properties' 모드는 실제 native2ascii와 동일하게 동작합니다.
주요 사용 사례
- ▸Java .properties 파일의 한글 메시지를 native2ascii 형식으로 변환
- ▸소스 코드 내 유니코드 이스케이프 시퀀스 해석 및 디버깅
- ▸정규식 패턴에서 유니코드 문자 코드포인트 확인
- ▸이모지나 특수문자의 유니코드 코드포인트 조회
- ▸국제화(i18n) 리소스 파일 작성 및 검증
자주 묻는 질문
Q. \u와 U+의 차이는 무엇인가요?
U+XXXX는 유니코드 표준에서 코드포인트를 표기하는 방식입니다. \uXXXX는 Java, JavaScript, C# 등 프로그래밍 언어에서 소스 코드 내 유니코드 문자를 이스케이프하는 문법입니다.
Q. 이모지는 왜 \u 하나로 표현이 안 될 때가 있나요?
대부분의 이모지는 U+10000 이상의 보조 평면(Supplementary Plane) 문자입니다. 이런 문자는 UTF-16에서 서로게이트 쌍(\uD800~\uDFFF 두 개)으로 표현되며, 4자리 \u로는 표기할 수 없습니다.
Q. Java Properties 모드와 비ASCII 모드의 차이는?
비ASCII 모드는 코드포인트 128 이상의 모든 문자를 변환합니다. Java Properties 모드는 실제 native2ascii 동작과 동일하게 Latin-1 범위(코드포인트 256 이상)의 문자를 \uXXXX로 변환합니다.