2006-02-17

아스키 코드, 유니코드 ?

ASCII (American Standard Code for Information Interchange) ; 아스키
아스키는 컴퓨터나 인터넷상에서 텍스트 파일을 위한 가장 일반적인 포맷이다.
아스키 파일에서는 각각의 알파벳이나 숫자 그리고 특수문자들이 7 비트의 2 진수(7개의 0 또는 1의 조합으로 이루어진 스트링)로 표현되며, 총 128개의 문자가 정의되어 있다.
유닉스나 도스 기반의 운영체계(윈도우 NT는 제외)는 텍스트 파일을 표현하는데 있어 아스키를 사용한다.
윈도우 NT의 경우에는 유니코드라고 하는 새로운 코드를 사용하며, IBM의 System 390 서버들은 엡시딕이라고 부르는 자신들만의 고유한 8 비트 코드체계를 사용한다.
따라서 서로 다른 운영체계 간에 어떤 파일을 교환하기 위해서는 코드 변환 프로그램이 필요하게 된다. 아스키는 미국규격협회인 ANSI (American National Standards Institute)에 의해 개발되었다.
영문자, 숫자, 기호를 7비트로 표시하는 미국 표준 코드. ASCII 코드로 표현할 수 있는 문자의 종류는 27=128가지이고, 오류 검사용 패리티 비트 하나를 추가하여 8비트로 2진 코드화함으로써 바이트 단위의 전송이 가능하다.
10여 년 전, 그러니까 16비트 컴퓨터가 보급되기 시작한 시기에 컴퓨터를 처음 배운 사람이라면 ‘아스키’ 코드라는 그리운 단어가 기억에도 생생할 것이다. 아스키(ASCII)는 원래 미국 정보교환 표준 코드(American Standard Code for Information Interchange)로 컴퓨터를 사용하는데 필요한 문자 규약을 말한다. 컴퓨터 환경이 열악하던 그 시절, 흑백 모니터를 들여다보며 자판을 두드리다 지친 사람들은 종종 문자와 기호를 이용해 멋진 그림을 만들어내곤 했다. 따지고 보면 ; ) :-) 8-( T_T 등과 같은 현재의 인터넷 스마일리도 간단하기는 하나 예전에 애용되던 ‘아스키 코드를 이용한 그래픽 표현’과 마찬가지다

유니코드란?
다양한 나라가 서로 동일한 혹은 비슷한 의미의 문자를 저마다 다른 인코딩 방식을 사용함으로써, 자료 및 프로그램의 호환성 및 확장성에 문제를 일으키는 관계로 이를 하나의 문자 세트인 유니코드로 통합시켜 표현함으로써 해결하자는 뜻에서 `유니코드`는 전세계 주요 컴퓨터회사들이 업계표준으로 규정한 만국공통 문자코드로 우리나라에서도 지난 96년 2월16일 서울 롯데호텔에서 설명회를 열었고 우리나라에서도 다양한 서체가 개발되고 있다.
즉 Unicode는 세계 각국의 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 코드 규약의 이름을 말한다.
미국에서 개발되어진 컴퓨터는 그 구조가 영어를 바탕으로 정의되어 있기에 26자의 영문 알파벳트와 몇 가지 특수 문자를 표현하기에는 1바이트로 충분하였기 때문에 모든 정보가 1바이트를 단위로 표현되고 있었으나 동양3국의 언어 표현인 한글, 한자 또는 일어 등과 같은 문자는 그 구조가 영어와 달라서 1 바이트로는 표현이 불가능하기에 2바이트로 조합하여 하나의 문자를 표현하는 컴퓨터의 구조적 문제점을 바탕으로 만들어 졌다.
기본적으로 유니코드에서는 16비트를 사용하여 하나의 문자를 표현하고 있다.

댓글 없음: