본문 바로가기
웹지능화서비스

프랑스 `파리`와 곤충 `파리` 척척 구분…똑똑한 인터넷

by 누피짱 2008. 4. 25.
장면1. 프랑스 파리 여행을 준비하는 A씨는 인터넷 포털사이트 검색창에 `파리'를 입력했다. 그런데 나타난 결과는 파리 해충 박멸, 연막분무 파리 살충제, 파리바게뜨, 파리넬리, 사파리 등 원하는 정보와 관계없는 것만 잔뜩나와 당황한다.

장면2. 조정래씨의 장편소설 태백산맥을 재미있게 읽었던 B씨는 갑자기 이야기를 나누다가 등장인물인 외서댁의 남편 이름(강동식)을 생각나지 않아 검색을 해봤다. 그런데 같은 이름을 가진 기자의 기사 정보만 검색된다.

장면3. 인공지능 분야의 연구자인 C씨는 연구기획에 필요한 참고자료를 찾기 위해 `인공지능'을 검색어로 입력한 뒤 엄청난 양의 불필요한 정보 사이를 헤매다 결국 포기한다.

우리 생활의 일부로(일부 사람에게는 전부로) 자리를 잡은 인터넷을 사용하면서 수시로 느끼게 되는 아쉬움이자, 현재의 인터넷이 안고 있는 한계다.

◇WWW의 대안, 시맨틱웹=팀 버너스리가 지난 1989년 제안한 WWW(World Wide Web)는 많은 사람이 자신의 생각이나 연구의 결과를 웹에 올려놓고, 공유하는데 많은 이바지를 했다. 그러나 정보량이 급증하면서 원하는 정보를 찾는 일이 매우 어려워지는 문제가 드러났다.

이같은 인터넷의 한계를 먼저 느낀 사람 역시 팀 버너스리. 그는 1999년 다른 전문가들과 함께 시맨틱웹(semantic web)을 대안으로 제시했다. 시맨틱웹은 한마디로 컴퓨터가 정보의 의미(semantic)를 똑똑하게 이해할 수 있도록 하는 기술이다. 지금까지 컴퓨터는 정보를 문법적(syntax)으로만 이해해 `프랑스 파리'와 `곤충 파리'를 구분할 수 없고, 기온과 날짜 모두 같은 숫자로 인식할 뿐이었다.

시맨틱웹은 어떤 숫자가 기온인지 컴퓨터도 알 수 있도록 정보에 기온을 표시하는 코드(메타데이터)를 넣어 이를 구분한다. 또 컴퓨터가 여러 웹 페이지에 있는 정보를 수집해 그 의미를 추론, 사람이 원하는 최적의 정보를 제공하게 하는 것이다. 이 방식이 발전하면 휴가계획을 짤 때 직접 웹에 있는 여행정보를 일일이 찾아 예약하지 않아도 컴퓨터가 필요한 정보를 해독해 여행일정을 추천하고, 예약까지 자동으로 처리할 수 있다.


◇시맨틱웹, 어디까지 왔나=시맨틱웹을 현실세계에서 적용하는 것은 만만한 일이 아니다. 컴퓨터가 정보의 의미를 이해하고 처리하려면 모든 정보에 코드를 넣어줘야 하고, 주제와 관련된 단어간 관계를 계층적으로 정의하고 표현하는 사전(온톨로지)을 만들어야 하기 때문이다. 이 때문에 개념이 소개된 지 8년이 지났지만, 일반인들에게는 먼 이야기로만 받아들여지고 있다.

하지만, 연구분야 등 특정 영역을 대상으로 한 시도는 이미 시작돼 주목받고 있다.

대표적인 사례가 한국과학기술정보연구원(KISTI)이 최근 개발한 연구개발 서비스 플랫폼(온투프레임-K)이다. 지금까지 자기 분야의 공동연구자를 찾는 일은 주로 인맥에 의존했다. 하지만, 온투프레임-K는 정보 간의 연관관계를 입체적으로 제시해 연구개발 동향분석과 연구기획, 협업연구자 선정을 쉽게 지원한다.

KISTI의 성원경 박사는 "연구자들이 연구기획, 협업연구자 선정, 연구방향 설정 등에 할애하는 시간이 전체 연구개발 시간의 40~50%를 차지한다"며 "온투프레임-K가 본격적으로 적용되면 이같은 문제를 상당부분 해결할 것"이라고 말했다. KISTI는 향후 온투프레임-K를 다른 분야에도 활용할 수 있는 툴킷을 만들어 보급한다는 계획이다.

이밖에 한국교육학술정보원이 다양한 학술콘텐츠를, 한국문화콘텐츠진흥원이 문화콘텐츠를 시맨틱웹을 활용해 제공하는 사업을 추진하고 있으며, 일부 통신사업자들도 관련 기술을 자사 서비스에 적용하기 위해 연구하고 있다. 관련 기업인 프로토마는 일일이 여러 사이트를 뒤지지 않아도 필요한 민원내용과 연관 정보를 한 번에 얻을 수 있는 통합행정민원안내시스템의 시험판을 개발, 보급을 추진하고 있다.

전문가들은 이처럼 특정 영역에서 시작된 시맨틱웹 적용이 장기적으로는 현재의 인터넷 체계를 대체할 것으로 전망하고 있다.

프로토마의 정은환 기술이사는 "시맨틱웹을 확산하려면 키워드 정의나 온톨로지를 만들어야 하는데 단시간에는 어렵다"며 "우선 각 영역(분야)별로 온톨로지를 만들고 나중에 이를 통합하는 방식으로 진행될 것"이라고 말했다.

성원경 박사는 "포털 등에 시맨틱웹 적용을 위한 툴 키트를 보급한 뒤 다양한 적용사례를 묶으면 국가의 지식정보가 통합될 수 있을 것"이라고 말했다.

시맨틱웹 솔루션 기업인 솔트룩스 천우영 차장은 "시맨틱웹은 학술정보 뿐만 아니라 기업의 지식관리, 제조기업의 시뮬레이션, 서비스 사업자의 푸시 서비스 등 다양하게 적용할 수 있다"며 "이를 위해서는 기술 발전은 물론 일반인들이 쉽게 접할 수 있는 다양한 서비스 모델을 만드는 것이 더 중요하다"고 말했다.

댓글