티스토리 뷰

전체/잡생각

utf8-ko 라니?

Coolen 2008. 12. 6. 01:34
http://www.zdnet.co.kr/news/network/broadcast/0,39031043,39175972,00.htm
남북간 '인터넷 연결' 성사되나

기사를 보니 도대체 이해가 가지 않는 구석이 있다.
머지않아 남북간 인터넷 연결이 현실화될 전망이다. 한국방송통신학회는 북한과 인터넷 상호연동을 위해 양쪽의 언어코드를 일치화하는 기술적인 해결방안을 모색하고 있다고 밝혔다.
"인터넷 연결이 현실화 된다"는 것은 물리적인 연결 혹은 보안정책상 라우팅 금지된 것을 해제하는 얘기같은데, "언어코드를 일치화하는 기술적인 해결방안"이 바로 뒤이어 나오는 것은 마치 문자 집합(character set)을 일치시키자는 사뭇 논지가 어딘지 모르겠다.

그리고 뒤이어 "지역식별자 특임회의"라는 말이 나온다. 로캘 설정을 말하는 것 같은데, 언어_지역으로 표현되는 지역식별자는 "ko_KR", "ko_KP", "ko_CN" 등을 적절하게 조합해서 각각, 남한, 북한, 연변 정도로 나누어 사용하면되지 않나?

만약 지역 식별자에 문자집합을 넣어야한다면, 지금도 "ko_KR.euc-kr", "ko_KR.utf8" 을 쓰고 있는 마당에 "ko_KP.utf8" "ko_KP.kps9566" 같은 것으로 표현하면 되지 않을까?
지금까지는 남북간 지역식별자의 불일치로 상호 교신이 불가능했다. 인터넷 연동을 위한 지역식별자에는 117개의 상황이 존재하지만, 이중 '국적과 언어부호'가 핵심이다. 이것이 일치해야 상호 교신(유통)이 가능하다. 북한에서는 국적기호로 kp를 사용하고 한국은 kr을 사용한다. 이것은 이미 ISO에 등재된 사항으로 남북간 교신에 전혀 문제가 없었지만 '언어코드'가 달라서 교신이 불가능했다.
정말이란 말입니까? 글쎄요... 내가 알고 있는 교신과 저 기사의 교신은 좀 다른 것인가 봅니다. 전, 전기적인 흐름이나 패킷 정도에서 불가능했다라고 생각이 되는데, 전달받은 데이터가 암호 해독수준으로 복잡한 코드 해석을해야하는 것 처럼 씌어 있군요.
이번 회의에서는 언어코드를 '정음 3벌식 로마자 호환 아스키 부호'를 utf-8에 새롭게 반영하여 'utf-8_KO'로 써보자는 절충안이 포함돼 있다.

로마자 호환아스키란 정음 28+17=45자를 로마자 대소 52자에 대응하며 아주 쉽게 구성하는 것이다. 이렇게 되면 한국, 북한, 중국 어디를 가든 어떤 코드를 사용하던 간에 utf8_KO을 매개로 하여 서로 교신할 수 있으며, 세계 어디에 있어도 로마자가 통하면 상호 교신이 가능하게 된다.

이렇게 쉬운 일이 그 동안 불가능했던 것은 utf-8_KO가 국제표준으로 인정되지 않았기 때문이다. 한국방송통신학회는 이번 회의서는...
그동안 불가능했다는 것은 상당히 논의가 많이 돼왔다는 얘기 같습니다. 그런데 왜 공개적으로 의견을 수렴하거나  초안을 발표한 흔적이 검색이 안되는 것일까요? 구글에서 utf-8-ko로 검색하면 달랑 저 회의 관련된 기사 세 개만 나옵니다. 회의를 하시는 분들이 한국방송통신학회라고 검색해서 혹시 홈페이지에 뭔가 있을까 찾아보려했는데, 다음에서의 검색 결과는 "한국인터넷방송통신TV학회", "한국방송학회" 는 나와도 "한국방송통신학회"는 나오지 않습니다. 제 검색 능력이 떨어져서 그런 것일지 모르겠지만, 저 단어를 넣어 한 번에 안나온다는 것은 뭔가 이상하지 않습니까??

저 기사... 뭔가 이상합니다.





반응형
댓글
댓글쓰기 폼