2006년 04월 03일
[유니코드] 한글과 한자 영역
한글
현대한글은 초성(19개), 중성(21개), 종성(28개)로 총 11,172자가 조합되어 나올 수 있으며, 유니코드의 AC00 - D7AF 영역에 모든 조합가능한 문자가 완성되어 배열되어 있다.
하지만, 옛한글을 포함한다면 초성(90개), 중성(66개), 종성(82자), 채움(2자)로 대략 50만자가 조합되어 나올 수 있는데 말이 50만자이지 50만자를 유니코드에 포함시킨다는 것은 사실상 불가능에 가깝다. 그래서 1100 - 11FF 영역에는 조합이 가능한 자모 240개만이 배열되어 있다.
결국, 유니코드는 한글 표현을 위해 완성형(유니완성형)과 조합형(유니조합형) 두 가지 모두 처리할 수 있도록 지원하고 있는 셈이다.
좀 더 자세한 정보는, 한글 및 한국어 정보 처리 코드 (backup.zip)에서 얻을 수 있다.
완성형에서 유니코드까지의 한글코드 변천과정및 문제점등 전반적인 내용을 확인해 볼 수 있는 곳이다.
이 밖에, 3130 - 318F 영역에 또다른 한글자모를 볼 수 있는데 이곳은 기존 한글완성형 코드에 있던 자모와의 호환을 위해 배치된 것이다.
한자
정확한 총 개수는 알 수 없으나, 실제로 사용되는 것은 3,000자 내외라고 한다.
유니코드의 기본언어판에는 약 2만여자가 포함되어 있으며, 4E00 - 9FFF 영역에 배열되어 있다. (유니코드 3.1 이후에는 약 4만여자가 보충언어판에 더 추가되었다.)
◆편해(篇海): 금(金)왕조시대의 자전 54,000자 수록
◆해편(海篇): 명(明)왕조 시대의 자전 54,000자 수록
◆강희자전(康熙字典): 청(淸)왕조 시대의 자전 47,000 자 수록
◆대한화사전(大漢和辭典): 현대 일본 사전 50,000자 수록
◆한어대자전(漢語大字典): 현대 중국 사전 56,000자 수록
◆중화자해(中華字海): 현대 중국 자전 85,000자 수록
◆금석문자경(今昔文字鏡): 현대 중국 자전 85,000자 수록
현대한글은 초성(19개), 중성(21개), 종성(28개)로 총 11,172자가 조합되어 나올 수 있으며, 유니코드의 AC00 - D7AF 영역에 모든 조합가능한 문자가 완성되어 배열되어 있다.
하지만, 옛한글을 포함한다면 초성(90개), 중성(66개), 종성(82자), 채움(2자)로 대략 50만자가 조합되어 나올 수 있는데 말이 50만자이지 50만자를 유니코드에 포함시킨다는 것은 사실상 불가능에 가깝다. 그래서 1100 - 11FF 영역에는 조합이 가능한 자모 240개만이 배열되어 있다.
결국, 유니코드는 한글 표현을 위해 완성형(유니완성형)과 조합형(유니조합형) 두 가지 모두 처리할 수 있도록 지원하고 있는 셈이다.
좀 더 자세한 정보는, 한글 및 한국어 정보 처리 코드 (backup.zip)에서 얻을 수 있다.
완성형에서 유니코드까지의 한글코드 변천과정및 문제점등 전반적인 내용을 확인해 볼 수 있는 곳이다.
이 밖에, 3130 - 318F 영역에 또다른 한글자모를 볼 수 있는데 이곳은 기존 한글완성형 코드에 있던 자모와의 호환을 위해 배치된 것이다.
한자
정확한 총 개수는 알 수 없으나, 실제로 사용되는 것은 3,000자 내외라고 한다.
유니코드의 기본언어판에는 약 2만여자가 포함되어 있으며, 4E00 - 9FFF 영역에 배열되어 있다. (유니코드 3.1 이후에는 약 4만여자가 보충언어판에 더 추가되었다.)
◆편해(篇海): 금(金)왕조시대의 자전 54,000자 수록
◆해편(海篇): 명(明)왕조 시대의 자전 54,000자 수록
◆강희자전(康熙字典): 청(淸)왕조 시대의 자전 47,000 자 수록
◆대한화사전(大漢和辭典): 현대 일본 사전 50,000자 수록
◆한어대자전(漢語大字典): 현대 중국 사전 56,000자 수록
◆중화자해(中華字海): 현대 중국 자전 85,000자 수록
◆금석문자경(今昔文字鏡): 현대 중국 자전 85,000자 수록
# by | 2006/04/03 12:07 | ▶프로그래밍 | 트랙백 | 덧글(1)










☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]
D7AF까지의 뒷부분의 몇글자는 한글 영역은 아니더군요...