정보공유와 파일포맷

정보공유와 파일포맷

김 명 철 (성공회대 교수, 컴퓨터과학)

앞에서 정보공유운동과 정보공유를 위한 라이선스를 다루었으나, 여기서는 좀 다른 시각인 기술적인 검토로서 정보공유를 위한 파일포맷을 다루어 본다. 파일 포맷은 정보 공유의 인프라로서 공유 라이선스와 함께 중요한 결정사항이 된다. 그러나, 정보공유 파일 포맷에 대한 체계적인 연구나 확산 운동은 거의 전무한 실정이다.
파일 포맷이 정보공유에 있어서 얼마나 중요한가를 나타내주는 대표적인 예로 현재 웹문서 표준인 html 과 음악파일 표준인 mp3를 들어본다. html은 1989년 스위스 제네바에 있는 유럽 원자핵 공동 연구소(CERN)의 Tim Berners-Lee가 제안한 것으로, 문자 정보가 대부분이었던 그때까지의 통신에 의한 정보 전달 방법과는 달리 문자, 화상, 음성까지 다양한 표현 방법이 가능하였기 때문에 누구나 쉽게 저작하고 공유할 수 있는 환경을 제공하였던 것이다. [네이버 사전]. 이로 인하여 인류는 지금까지의 제한적인 정보공유를 넘어서서 월드와이드웹이라는 거대한 정보공유의 장을 경험하게 된 것이다.
또 다른 예로 최근 저작권시비가 첨예하게 대립되고 있는 음악 파일 포맷인 mp3를 들 수 있다. mp3는 Moving Picture Experts Group, Audio Layer III 의 약자로 독일의 "Fraunhofer Institut" 에서 Erlangen 대학의 Dieter Seitzer 교수가 음질은 좋으면서 낮은 비트 레이트(bit-rate)를 차지하는 오디오 코딩 방식을 연구하던 중, 1989년 독일에서 mp3 의 특허를 취득하게 되고 몇 년 뒤 International Standards Organization(ISO) 가 MPEG-1 스펙에 통합시켰다 [Web&Biz]. mp3의 음질이 CD 음질에 버금가고 크기는 10분의 1정도로 줄일 수 있었기 때문에 현재와 같이 대중적인 인기를 끌게 되었으며, 이는 냅스터, 소리바다와 같은 공유 사이트가 등장하는 등, 음악 정보 공유의 기폭제가 되었던 것이다.
이와 같이 한 파일 포맷의 등장과 사용이 라이선스와 관련 없이 현실적인 정보공유의 기본 틀을 제공하므로 다양한 파일포맷을 살펴볼 필요가 있으며, 가장 바람직한 정보공유 파일 포맷에 대한 연구와 확산 운동이 필요한 이유이기도 하다.

1. 파일포맷 현황
홍성태 교수의 발표문에서 정보를 크게 소프트웨어와 컨텐츠로 나누었는데, 여기서는 컨텐츠, 그 중에서도 일반 사용자가 가장 많이 쓰는 윈도우상의 디지털 컨텐츠로 한정지어 살펴본다. 디지털 컨텐츠는 문서, 음악, 이미지, 동영상으로 나누어볼 수 있으며, 문서도 워드나 글 파일과 같은 텍스트위주의 문서, 표계산용 문서, 발표용 문서, 웹문서, 이동문서 등이 있다. 이런 디지털 컨텐츠의 기술적인 정보공유란 특정 기계나 소프트웨어에 의존하지 않는 파일포맷을 말한다. 이들 디지털 컨텐츠에 대한 표준은 국제적인 기구나 단체(ISO, W3C), 국가기관(정부, KS)에서 주도를 하고 있으나, 급변하는 새로운 기술에 대한 표준은 시장을 선점하거나 독과점한 소수 영리기업에 의해 사실적인 표준(Standard de facto)으로 자리잡고 있다. 현재의 각 디지털 컨텐츠에 대한 실용적인 파일 포맷을 표로 나타내면 다음과 같다.

<현재의 파일 포맷>

종류
표준
비표준
국제/국가
De Facto
문서
텍스트 문서
txt
(KS/Unicode)
doc(MS Word)
hwp(글)
gul(삼성 훈민정음, hwp/ doc 호환)
Open Office, Star Suite
(doc 호환)
표계산용 문서

xls(MS Excel)
Open Office, 넥셀,
Star Suite (xls 호환)
발표용 문서

ppt
(MS Powerpoint)
한컴 슬라이드 2004, Open Office , Star Suite (ppt호환)
웹 문서
html (W3C)
xml (W3C)
Java script
(SUN)
VB script (MS)
글 2004, MS Word 2003 (html/xml 호환)
이동 문서

pdf (Adobe) – 모든 문서와 출력호환

음악
mp3 (ISO)
wav
음악 스티리밍
(ra/ram-RealNetworks, asf-Intel, wma-MS)
midi
au (Unix)

이미지
jpeg (ISO)
bmp, gif (컴퓨서브), tiff, pcx,
wmf (MS)

동영상
mpeg(ISO)
mpeg2(DVD)
avi(MS)
mov/qt (Apple)

 
  2. 정보공유를 위한 파일 배포 제안

앞의 표에서 정리한 정보를 보거나 듣기 위해서는 각각의 뷰어/플레이어 소프트웨어가 필요하다. 국제나 국가 표준 파일포맷들은 대부분의 소프트웨어들이 지원하고 있으니, 어떤 형태로든 배포를 하게 되면 각각의 라이선스에 따라 공유가 가능할 것이다. 또, 사실상의 표준인 (De Facto) 파일들도 각각의 회사들이 제공하는 무료의 뷰어/플레이어를 이용하면 불편하기는 하지만 보거나 듣는데는 지장이 없으므로, 이를 읽기 수준의 공유 ROS (Read Only Sharing)라고 하자. 반면에, 이런 정보를 이용해 2차 저작을 원하는 경우, 해당 업체 또는 호환가능 업체의 유료 저작 소프트웨어를 구입해야 하므로 이를 쓰기 수준의 공유RWS (Read & Write Sharing) 라고 할 수 있을 것이다. 사용자 입장에서 쉽게 재가공이 가능한 RWS 수준의 공유를 원하겠지만, ROS 만으로도 다시 입력하는 수고만 한다면, 얼마든지 정보 공유가 가능하다. 이와 같이 공유 수준에 따라 재분류하면 다음 표와 같다.

<공유 수준에 따른 파일 포맷>

종류
읽기쓰기 수준의 공유(RWS)
읽기 수준 공유(ROS)
공유 불가
문서
텍스트 문서
txt
(KS/Unicode)
xml
doc(MS Word)
hwp(글)

pdf (Adobe)

표계산용 문서

xls(MS Excel)
발표용 문서

ppt
(MS Powerpoint)

웹 문서
html(W3C)
xml (W3C)

이동 문서

pdf (Adobe) – 모든 문서와 출력호환

음악
mp3 (ISO)
wav
음악 스티리밍
(ra/ram-RealNetworks, asf-Intel,
wma-MS)
midi
au (Unix)

이미지
jpeg (ISO)
bmp, gif (컴퓨서브), tiff, pcx,
wmf (MS)

동영상
mpeg(ISO)
mpeg2(DVD)
avi(MS)
mov/qt (Apple)

 
이와 같이, 공유를 위해서 정보를 배포할 경우, 음악, 이미지, 동영상 정보는 mp3/jpeg/mpeg 파일 포맷으로 하는 것이 읽기쓰기 수준의 공유를 만족한다. 다만, 문서의 경우, 현 수준에서는 읽기 수준의 공유(ROS) 파일 포맷 (비록 한회사의 제품이기는 하지만, pdf 배포가 가장 효율적임)으로 배포하고, 궁극적으로는 xml 파일 배포를 통한 읽기쓰기 수준의 공유(RWS) 로 나아가는 것이 바람직해 보인다.
  정보공유 단계로는 공공기관의 문서부터 파일 포맷을 통일하고 정보 공유에 찬성하는 민간으로 확산시킬 필요가 있다. 또, 여기서 다룬 파일 포맷들이 윈도우상에서 가능한 것들로만 살펴보았는데, 다른 운영체제 (리눅스나 맥킨토시) 플랫폼에 대해서도 고려해 볼 필요가 있다.첨부 파일http://www.ipleft.or.kr/bbs/data/ipleft_5/10/정보공유와파일포맷.pdf과거 URLhttp://www.ipleft.or.kr/bbs/view.php?board=ipleft_5&id=441

댓글 남기기