검색 자동분류 등 새로운 기술 상용화
최근 시맨틱 웹 기술을 이용한 서비스들이 속속 선보이고 있다.
물론 이상적인 시맨틱 웹이 현실화 되기 위해서는 아직 기술의 진보가 더 필요한 상황. 하지만 초보적 시맨틱 웹 기술을 이용한 상용서비스는 지금 이 순간에도 만나볼 수 있다.
대표적인 것이 검색의 자동분류(클러스터링) 기능이다. 자동분류는 검색어가 포함된 문서를 일렬로 보여주는 것이 아니라 분야별로 나눠 보여주는 기술이다.
예를 들어 일반 검색엔진에 '빅뱅'이라는 검색어를 입력하면 대부분 가수 빅뱅과 관련된 문서만 검색된다. 대부분의 검색엔진이 인기있는 문서를 먼저 보여주기 때문에 우주의 빅뱅 관련 문서를 찾기가 쉽지 않다.
그 러나 자동분류 기술이 적용되면 이런 불편함은 사라진다. 연예, 우주, 금융, 노동 등으로 관련분야별 결과를 보여준다. 우주의 빅뱅 관련 문서를 찾기 위해 가수 빅뱅과 금융권 대 빅뱅, 노동계 빅뱅 등의 문서 속에서 헤맬 필요가 없는 것이다.
이를 위해서는 컴퓨터가 스스로 문서의 분야를 분류할 수 있어야 한다. 수 억건의 웹 문서를 사람이 분류해 놓는 것은 불가능하기 때문에 컴퓨터가 사람처럼 문서의 의미를 이해해 분류하는 기술이 필수적이다.
이런 수준의 기술은 이미 상용화 단계에 와 있다.
올초 시맨틱 기술 전문기업인 시맨틱스는 새로운 검색 서비스인 큐로보(www.qrobo.com)을 선보였다. 큐로보는 자동분류 기술을 웹 검색에 적용한 최초의 사례다.
회사측은 큐로보를 출시하며 “지금까지의 검색엔진은 검색창에 써 넣은 검색 키워드에 맞춰 검색 결과를 보여 주는 형태였지만, 큐로보는 검색 사용자 의도까지 파악해 검색 결과를 보여준다”고 강조했다.
코리아와이즈넛, 코난테크놀로지, 다이퀘스트, 솔트룩스 등 기업용 검색엔진 업체들도 이 자동분류 기술을 보유한 상태다.
유의어 검색 등도 넓게 보면 시맨틱 웹의 한 분야다.
온 라인쇼핑몰에서 'PC'를 검색했을 때 PC라는 단어가 들어간 상품뿐 아니라 컴퓨터와 노트북까지 보여준다. 이도 낮은 수준의 시맨틱 웹이라고 볼 수 있다. PC와 컴퓨터, 노트북이 서로 연관이 있는 단어라는 것을 컴퓨터가 인식하고 있기 때문에 가능한 것이다.
웹2.0의 대표적 도구인 RSS도 시맨틱 웹 기술에서 파생됐다. RSSS는 RDF Site Summary의 약자다. RDF(Resource Description Framework)는 특정 자원에 대한 메타데이터를 설명하는 XML기반의 프레임워크로, 시맨틱 웹 구현을 위한 기술이다.
이처럼 시맨틱 웹은 생각보다 매우 가까이에 있다. 앞으로 이같은 현상은 더욱 가속화 될 전망이다.
국 내에 처음 대중적으로 시맨틱 웹을 소개한 책 '웹2.0 시대의 기회 시맨틱 웹'의 저자 김중태씨는 책의 서문에서 "한국에는 시맨틱 웹이라는 말조차 들어본 적이 없는 사람이 대부분일 정도로 차세대 웹에 대한 관심이 적다"고 지적하면서 "시맨틱 웹은 향후 5년 동안 인터넷에 큰 변화를 가져올는 혁명적인 신기술이 될 것"고 말했다.