이글루스 | 로그인  



[유니코드] 한글과 한자 영역

한글

현대한글은 초성(19개), 중성(21개), 종성(28개)로 총 11,172자가 조합되어 나올 수 있으며, 유니코드의 AC00 - D7AF 영역에 모든 조합가능한 문자가 완성되어 배열되어 있다.
하지만, 옛한글을 포함한다면 초성(90개), 중성(66개), 종성(82자), 채움(2자)로 대략 50만자가 조합되어 나올 수 있는데 말이 50만자이지 50만자를 유니코드에 포함시킨다는 것은 사실상 불가능에 가깝다. 그래서 1100 - 11FF 영역에는 조합이 가능한 자모 240개만이 배열되어 있다.
결국, 유니코드는 한글 표현을 위해 완성형(유니완성형)과 조합형(유니조합형) 두 가지 모두 처리할 수 있도록 지원하고 있는 셈이다.

좀 더 자세한 정보는, 한글 및 한국어 정보 처리 코드 (backup.zip)에서 얻을 수 있다.
완성형에서 유니코드까지의 한글코드 변천과정및 문제점등 전반적인 내용을 확인해 볼 수 있는 곳이다.

이 밖에, 3130 - 318F 영역에 또다른 한글자모를 볼 수 있는데 이곳은 기존 한글완성형 코드에 있던 자모와의 호환을 위해 배치된 것이다.


한자

정확한 총 개수는 알 수 없으나, 실제로 사용되는 것은 3,000자 내외라고 한다.
유니코드의 기본언어판에는 약 2만여자가 포함되어 있으며, 4E00 - 9FFF 영역에 배열되어 있다. (유니코드 3.1 이후에는 약 4만여자가 보충언어판에 더 추가되었다.)

◆편해(篇海): 금(金)왕조시대의 자전 54,000자 수록
◆해편(海篇): 명(明)왕조 시대의 자전 54,000자 수록
◆강희자전(康熙字典): 청(淸)왕조 시대의 자전 47,000 자 수록
◆대한화사전(大漢和辭典): 현대 일본 사전 50,000자 수록
한어대자전(漢語大字典): 현대 중국 사전 56,000자 수록
◆중화자해(中華字海): 현대 중국 자전 85,000자 수록
◆금석문자경(今昔文字鏡): 현대 중국 자전 85,000자 수록

by 空想 | 2006/04/03 12:07 | ▶프로그래밍 | 트랙백 | 덧글(1)

트랙백 주소 : http://pallas.egloos.com/tb/1300305
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
Commented by F176 at 2008/02/05 04:16
현대한글 영역은 좀 더 정확하게는 AC00 부터 D7A3 가지입니다.
D7AF까지의 뒷부분의 몇글자는 한글 영역은 아니더군요...

:         :

:

비공개 덧글

◀ 이전 페이지          다음 페이지 ▶