“컴퓨터의 이해력을 높여라”
차세대 웹 환경으로 시맨틱 웹이 부상한 가운데, 시맨틱 웹(seman tic web)을 위한 핵심기술로 ‘온톨로지(ontology)’가 떠오르고 있다.
온톨로지는 주제와 관련된 단어들의 관계를 계층적으로 정의한 일종의 사전으로, 인공지능 및 자연언어처리 분야에서 오랫동안 연구돼 왔던 기술이다.
서로의 관계를 통해 컴퓨터가 정보를 이해할 수 있도록 만들면, 이를 기반으로 웹상의 무수한 정보 중 필요한 정보만을 추론해 낼 수 있을 것으로 기대되고 있다.
반면 그러나 일각에서는 온톨로지 구현의 어려움을 들어 현실의 웹에는 적용하기 힘들다는 비판을 하기도 한다.
◆온톨로지란 무엇인가 = 온톨로지란 철학의 한 영역으로 ‘존재론’을 의미한다. 존재론은 “있다는 것은 무엇인가”를 탐구하는 학문이다.
반면 전산학 말하는 온톨로지는 컴퓨터가 사물의 존재를 이해하도록 돕는 기반이다.
특히 사물과 사물 사이의 관계를 규정, 이를 통해 컴퓨터가 사물의 존재를 이해할 수 있로록 한 것이 온톨로지다.
가장 간단한 온톨로지라면 사물과 사물의 관계를 컴퓨터가 이해할 수 있도록 규정한 일종의 어휘집이 될 수 있다.
남자와 여자라는 단어는 인간이라는 단어 안에 포함된다. 총각이나 유부남이라는 단어는 남자라는 범주 안에 들어간다.
스타크래프트는 프로토스, 저그, 테란과 관계가 있다. 그 관계는 게임속 종족이라는 것이다.
이런 관계의 체계를 컴퓨터가 처리할 수 있도록 구조성과 구체성을 갖춰 구축하면 온톨로지가 된다.
또 사물의 속성이나 메타데이타(데이터를 설명하는 참조자료)도 온톨로지에 표현된다. 책은 저자, 출판일, 출판사, 가격, 분량, 종이질 등의 하부 속성을 가지고 있다.
◆ 온톨로지, 왜 필요한가 = 온톨로지를 통해 활용할 수 있는 대표적 분야는 정보검색이다.
예를 들어 일제시대 독립운동가를 알고 싶어 네이버나 구글에 '독립운동가'라는 검색어를 넣는다면 어떤 결과가 나올까. 독립운동가라는 단어가 포함된 문서들이 검색될 것이다.
그러나 독립운동관련 온톨로지가 구축돼 있다면, 독립운동가라는 단어가 없는 문서라도 '유관순'이나 '안중근'이라는 단어만 포함돼 있어도 검색될 수 있다.
인터넷 쇼핑몰에서 PC를 검색했을 때 노트북이 검색되는 것도 낮은 수준의 온톨로지라고 볼 수 있다.
온톨로지를 기반으로 한 검색 서비스 개발은 현재도 한창 진행중이다.
국 가기록원은 온톨로지를 기반으로 한 대용량 통합검색 서비스를 개발 중이다. 이 사업을 수주한 솔트룩스에 따르면, 국가기록원은 이번 프로젝트를 통해 각 기록물의 필수 메타데이터 요소를 추출하고, 요소간의 의미기반 검색이 가능하도록 의미관계성 온톨로지 구축할 계획이다.
◆ 온톨로지 구축, 멀고도 험한 길 = 그러나 온톨로지를 구축하는 것은 생각보다 어렵고 지난한 작업이다. 세상의 사물에 대한 관계를 정립한다는 것은 어쩌면 불가능한 꿈일 수도 있다.
때 문에 일각에서는 온톨로지를 통합 시맨틱 웹 접급에 대해 "비현실적 기술"이라거나 "상용화 불가능한 기술"이라는 비판을 가하기도 한다. 이들은 "온톨로지 같은 거창한 기술보다 현실에서 쉽게 응용할 수 있는 기술에 전념해야 한다"고 주장한다.
ETRI 의 전종홍 선임연구원은 지난 2006년 자신이 운영하는 블로그에서 "거창하고 복잡하고 어려운 온톨로지에 대한 이야기들보다, RSS(Really Simple Syndication)가 엄청나게 세상을 바꾸고 있고, 많은 사람들에게 웹의 미래에 대한 희망을 갖게 하고 있다"고 비판했다.
다음커뮤니케이션 DNA랩 윤석찬 팀장도 블로그를 통해 "기술적 난이도와 완성도도 중요하지만 더욱 중요한 것은 얼마나 많은 사람이 어떻게 어디에 쓸 수 있는가"라면서 "시맨틱 웹 연구자들이 웹이 아닌 시맨틱에만 관심을 기울이면 결국 현실과 괴리될 수 밖에 없다"고 지적했다.
이같은 비판은 현실에서 이용할 수 있는 기술에 대한 중요성을 강조하고 있다. 연구자들만을 위한 온톨로지가 아니라 실제 상용화되거나, 이용가능한 서비스가 등장할 수 있어야 한다는 것이다.
이을 위해 전문분야별 지식을 온톨로지라는 형태로 구축하는 작업이 활발히 이루어지고 있다. 모든 분야에 대한 온톨로지가 불가능하다면, 특수한 영역에 한정지어 시작하자는 것이다.
한 예로 한국과학기술원(KISTI)도 온톨로지를 적용해 '온투프레임-K'라는 연구개발 서비스 플랫폼을 개발했다. 온투프레임-K는 'IT'라는 한정되 영역과 '논문'이라는 특수 문서만을 대상으로 온톨로지를 구축했다.
이를 통해 연구개발에 필요한 논문이나 연구자를 손쉽게 찾을 수 있도록 지원하는 시스템을 개발했다.
이 시스템은 연구자들이 연구개발 동향을 분석할 때나 연구 기획, 협업 연구자 선정 등에 활용할 수 있다.