본문 바로가기
웹지능화서비스

현실적인 상품정보 온톨로지 데이터베이스 구축

by 누피짱 2008. 4. 25.

심준호: 공학박사, 숙명여자대학교 정보과학부 부교수

 

근래에 IT 기술의 패러다임에 대해 논할 때 빼놓을 수 없는 키워드 중에 하나는 시멘틱웹이다. 이러한 시멘틱웹 분야의 핵심기술로 온톨로지를 꼽을 수 있으며, 온톨로지 관련 이슈들은 학계와 IT 산업계로 빠르게 회자되고 보급 되어지는 추세이다. 국내외적으로 온톨로지 연구를 이끌어가는 학계의 주류는 아무래도 논리와 추론, 지식 표현 등을 다루는 이른바 인공지능 백그라운드를 가진 부류라고 할 수 있다. 온톨로지에 대해 식견이 있는 IT 업계 종사자들이 온톨로지라는 단어로 떠올릴 수 있는 대표적 키워드는 W3C OWL (Web Ontology Language) Stanford 대학의 Protege 시스템 등이 있고, 이들은 모두 인공지능 분야 종사자들이 만들어낸 결과물들이다. 전문가가 아닌 IT 종사자에게 온톨로지라는 새로운 키워드의 의미와 사업적 응용이 요구될 경우, 참조할 수 있는 대부분의 논문이나 서적들은 인공지능 학계의 배경 지식을 바탕으로 기술되었기 때문에, 어떤 산업분야에서 온톨로지를 구축하고자 하였을 때, 그 방법론은 자연스럽게 OWL 언어로 해당 도메인의 지식을 표현하고 지식베이스를 구축하며 OWL 엔진을 사용하여 프로세싱하는 방법론을 떠올리는 것은 자연스러운 것일 수도 있다. 더 나아가 이와 다른 방법론으로 온톨로지를 구축 사용하는 것에 대해 온톨로지라는 용어를 쓰기조차 어색할 만큼 두려울 수도 있다.

 

하지만 현실적으로 볼 때 온톨로지라는 기술의 패러다임이 성숙하여 그 결과가 IT 산업 더 나아가 사회 전반에 파급 효과를 내기 위해서는, 현재 인공지능 분야에서 주도하는 언어와 추론엔진 등의 온톨로지 기반기술 발전과 더불어, 특정 도메인에 특화된 온톨로지 컨텐츠 생성 및 운용 또한 매우 중요하다. 의료, 생명과학 분야에서 온톨로지 프로젝트가 제일 활성화 되어 있는 까닭은 분야 특성상 개념과 개념들 사이에 대한 관계 정보 컨텐츠가 제일 많이 누적되어져 왔고, 이러한 온톨로지적 컨텐츠의 활용 효과가 상대적으로 가시적이기 때문일 것이다.

 

의료 생명분야에 이어 최근에 온톨로지 프로젝트중 주목을 받는 영역 중 하나는 e-비즈니스관련 상품정보(product information)라고 보여진다. 작년(2004) 1차 구축된 조달청 상품정보 온톨로지 DB구축 프로젝트는 국내 프로젝트의 대표적인 사례라 할 수 있고, 국제적으로는 유럽 표준 기구인 CEN/ISSS eCat 워킹그룹에서 시도하고 있는 상품 온톨로지 관련 프로젝트를 예로 들 수 있다.

 

상품정보 온톨로지 구축에 있어 제일 중요한 고려 사항은 구축된 상품정보 DB가 실제로 성능(performance/scalability), 가용성(availability), 그리고 대용량 데이터 처리 등에 무리 없이 서비스 운용되어져야 한다는 점이다. 왜냐하면 상품정보를 운용하는 시스템은 학계에서 연구하는 것이 아닌 e-마켓플레이스, SCM, CRM등을 실제 운용하는 사업체가 대부분이기 때문이다.

 

상품정보 온톨로지 데이터베이스 구축 방법은 여러 가지가 있겠지만, 이상에서 언급된 사항을 고려해 다소 단적으로 살펴보면 1) OWL등의 온톨로지 언어를 사용한 지식베이스 구축 기법과  2) Oracle이나 SQL Server 와 같은 관계형 DBMS상에 구축하는 방법으로 살펴볼 수 있고, 이들 방법에 대한 간략한 특징은 아래 테이블과 같다.

온톨로지 언어 기반

지식베이스

관계형 데이터베이스상의

온톨로지 데이타베이스

n         Semantic Web

n         OWL, DAML+OIL, Topic Maps, Description Logics, FOL, Logics, .

n         이론 중심, 이상적

Ø        다양한 온톨로지 정보의 표현

Ø        Reasoning Tool에 의존

Ø        실험적 연구실 수준

n         표현된 knowledgebase를 운용할 reasoning tool의 부재

Ø        실험적 연구실 수준

Ø        Robust 한 시스템 부재

 

n         Relational DBMS

n         EER, Table, SQL, Relational Algebra & Calculus, ..

n         동작 중심, 현실적

Ø        온톨로지 정보의 표현과 기능의 시스템적 한계

Ø        상용 데이타베이스 & 응용 프로그래밍

Ø        상용화 가능

n         관계형 DB로의 온톨로지화에 따른 문제 해결 데이타베이스

Ø        제한된 온톨로지 표현

Ø        온톨로지 추론의 지원

< 1 : 상품정보 온톨로지 데이타베이스 구축 방법론 비교>

 

그런데 성능, 가용성, 그리고 대용량 데이터 처리 측면에서 살펴보면, OWL 지식베이스 방법론으로 상품온톨로지 DB를 실제 서비스 운용한다는 것은 현실성과 거리가 멀다. 왜냐하면 아직까지 실제로 서비스 운용할 만큼 대용량을 처리하는 OWL 엔진이 없기 때문이다.

 

그렇다면 상용 DBMS상에 구축하는 방법만이 현실적인 유일한 방법일 수 밖에 없는데, 위 테이블에서 언급하였듯이, 문제는 구축되는 관계형 데이터베이스가 과연 얼만큼 온톨로지적으로 모델화 될 수 있고, 실제로 온톨로지를 활용한 서비스로 제공될 수 있도록 구현될 것인가 이다.

 

이 문제는 상품정보의 온톨로지적 모델링으로부터 관계형 DB로의 변환까지 모든 과정에서, 모델링 기법의 정확성뿐 아니라 상품정보 도메인 자체에 대한 전문 지식 또한 필요로 하게 한다. 즉 앞서 말한 의료 생명과학 분야에서와 마찬가지로 데이터베이스 모델링과 구축을 담당하는 팀은 온톨로지 기술과 상품정보 컨텐츠 양쪽에 대한 전문가 집단일 필요가 있다. 이는 상품정보 DB의 구축 및 활용이 기 구축된 제품이나 솔루션을 가지고 이루어지는 경우에 있어도 마찬가지이다.

 

또한 관계형 DB를 사용하는 이유가 현재로선 다분히 현실적인 것이지만, 장래의 온톨로지 엔진기술의 발전도 고려하고 싶고 또한 대외적으로 구축한 온톨로지가 온톨로지 관련 IT 전문가들에게도 매력적으로 다가가고 싶을 수도 있겠다. 이때 필요한 과정은 일종의 역공학(reverse-engineering)적인 것으로서 상품정보의 온톨로지적 모델링으로부터 관계형 DB로의 변환 원리를 역으로 적용하여, 상용 DBMS상에 저장 관리되는 테이블 내용과 메타데이타로부터 상품정보의 온톨로지 정보를 OWL과 같은 언어로 표현할 수 있게 한다. 관계형 상품정보 온톨로지 DB로부터 필요한 정보를 OWL 지식베이스로 export 하는 것이다. 이론적으로만 생각하면, 반대로 OWL RDF로 표현된 상품정보 역시 관계형 DB import될 수 있을 것이다. 물론 이러한 과정에는 상품정보의 OWL 표현의 의미적/구문적 타당성이 뒷받침 되어야 하며, 표준화는 그 방법론이 될 수 있다. 관계형 상품정보 온톨로지 DB XML과의 import/export를 지원하는 기술이 적용된 상품정보 솔루션은 궁극적으로 이러한 모습으로 발전하기에 용이한 구조를 가지고 있다고 볼 수 있다.

 

결론적으로 상품정보 온톨로지 구축 방법론은 현실에 기반을 두지만 상품정보 데이터베이스와 온톨로지 지식베이스의 상호연동도 염두에 두는 구축 방법론이 이상적인 구축 방법론이라 할 수 있으며, 이러한 방법론은 비단 상품정보 온톨로지에 국한하지 않고 성능, 가용성, 그리고 대용량 온톨로지 데이터베이스의 현실적 서비스가 요구되는 다른 환경에서도 적용될 수 있을 것이다.

댓글