Skip to Content
Ontology

Ontology

온톨로지(Ontology)는 어떤 영역(domain)에서 개념과 그 개념들 간의 관계를 명확하게 정의한 지식 구조입니다. 철학에서 존재와 개념의 본질을 다루는 학문에서 시작되었으며, 컴퓨터 과학에서는 지식을 체계적으로 표현하고 공유하기 위한 형식적 모델로 활용됩니다.

왜 온톨로지를 빌딩하는가?

COS가 온톨로지를 빌딩하는 궁극적인 목적은 도메인에 전문화·특화된 Agent Builder에 있습니다. Agent가 특정 비즈니스 도메인에서 전문적인 추론과 의사결정을 수행하려면, 해당 도메인의 개념·관계·규칙이 체계적으로 구조화된 **도메인 지식(Domain Knowledge)과 메모리(Memory)**가 필요합니다. 온톨로지는 바로 이 지식과 메모리를 구축하는 기반입니다.

많은 사람들이 온톨로지를 Graph DB, Graph RAG와 같은 연결성 데이터 추론 방법으로 한정합니다. 하지만 COS의 온톨로지는 존재론의 본질에 집중합니다 — 맥락과 의미, 존재에 대한 정의를 효과적으로 분해하고 구성하여, Agent가 도메인을 깊이 이해할 수 있는 지식 체계를 만드는 것이 핵심입니다.

설계 사상

COS 온톨로지는 세 가지 검증된 사상에 뿌리를 두고 있습니다.

사상영감
Data Warehousing (Medallion Architecture)원본 데이터를 단계적으로 정제하며 의미를 부여하는 데이터 처리 방식
Ontology현실 세계의 객체를 데이터에 직접 매핑하고 관계를 정의하여 데이터를 바라보는 관점
도메인 중심 설계 (Domain-Driven Design)도메인 규칙을 중심으로 Agent를 구성하고 이벤트를 처리하는 방식

이를 바탕으로 COS는 Semantic Layer를 실제 DB와 분리하여 데이터 간의 관계를 사전에 정의하고, 맥락 기반으로 연결합니다. 대규모 집계의 강점은 유지하면서도 연결된 데이터들의 관계를 효과적으로 분석할 수 있으며, Agent는 이 구조화된 지식을 기반으로 단순한 데이터 검색을 넘어 도메인 맥락에 맞는 전문적인 응답을 생성할 수 있습니다.


왜 Graph가 아닌가?

GraphDB 기반 온톨로지와 COS 온톨로지는 데이터를 바라보는 관점과 해결하려는 문제의 핵심이 다릅니다.

두 접근 방식 비교

비교 항목GraphDB 기반 (Neo4j 등)COS 온톨로지
데이터 모델노드(Node)와 엣지(Edge)의 네트워크 구조행(Row)과 열(Column) + 분리된 Semantic Layer
강점복잡한 관계 추적, 경로 탐색, 다단계 연결 분석대규모 집계 + 사전 정의된 맥락 기반 관계 탐색
쿼리 언어Cypher, SPARQL (관계 중심)SQL, NoSQL Query (값 중심)
확장성수평적 확장(Sharding)이 상대적으로 어려움수평적 확장이 용이하며 멀티테넌시 구현이 쉬움
관계 처리런타임에 그래프 순회로 관계 탐색Semantic Layer에서 사전 정의된 관계로 효율적 탐색

GraphDB 기반 온톨로지

데이터 간의 ‘관계’ 자체가 핵심 정보일 때 적합합니다.

  • 장점: “A유저와 연관된 B상품을 구매한 다른 유저들이 좋아하는 카테고리는?”과 같은 다단계 조인(Multi-hop) 쿼리에서 효과적
  • 단점: 수십 GB 이상의 데이터 로드/인덱싱 비용이 높고, “올해 전체 매출 합계”와 같은 집계 작업에서는 관계형 테이블보다 느림

COS 온톨로지

기존 테이블 구조 위에 Ontology Layer를 분리하여 구성하는 방식입니다.

  • 대규모 집계: Medallion Architecture처럼 데이터는 원래 있던 곳에 두고, 단계적으로 의미를 정의한 메타데이터 중심으로 관리합니다. 데이터 이동 없이 현업 데이터를 바로 활용
  • 관계 분석: Ontology Layer에서 Object 간 관계를 사전에 정의하고 맥락 기반으로 연결하여, 복잡한 Join 연산 없이도 데이터의 관계 탐색하여 최적의 성능으로 추론하고 탐색 가능
  • 다단계 추론: 사용자 질문에 대해 데이터 연결과 맥락을 기반으로 구조를 이해하여 다단계 분석과 다방면 분석을 효과적으로 수행

COS가 이 방식을 선택한 이유

요구사항COS의 대응
대용량 데이터GB 단위 데이터를 GraphDB로 이동하는 오버헤드 없이 기존 소스 활용
집계/정산 쿼리”올해 매출 정리”와 같은 질문은 경로 탐색보다 Aggregation 능력이 중요
관계 분석Ontology Layer 분리를 통해 맥락 기반 관계를 사전 정의, 복잡한 Join 없이 연결 데이터 탐색
멀티테넌시테넌트별 데이터 격리가 용이하여 관리 측면에서 유리
Agent 도메인 지식구조화된 온톨로지가 곧 Agent의 도메인 메모리로 작동하여, 고객사별 맞춤 전문 Agent 구축 가능

COS는 Ontology Layer를 실제 DB와 분리하여 대규모 집계와 관계 분석을 모두 효과적으로 수행합니다. 사전에 정의된 맥락 기반 관계를 통해 Agent가 데이터의 의미와 연결 구조를 이해하고, 복잡한 비즈니스 질문에도 정확하게 응답할 수 있습니다.


일반적인 온톨로지 구성 요소

구성 요소설명예시
개념 (Concept, Class)해당 영역에서 다루는 대상의 종류나 범주”사람”, “도시”, “자동차”
속성 (Property, Attribute)개념의 특성이나 성질”사람” → 이름, 나이
관계 (Relation)개념 간의 연관성”사람” 거주한다 “도시”
개체 (Instance)개념에 속하는 실제 사례”사람” → 김철수, 이영희
공리 (Axiom)개념과 관계에 대한 규칙이나 제약 조건”모든 사람은 반드시 하나의 출생지를 가진다”

COS 온톨로지 구조

COS는 일반적인 온톨로지 개념을 비즈니스 데이터에 최적화된 형태로 재구성했습니다. 각 요소는 Agent가 도메인을 이해하고 추론하기 위한 지식 단위로 작동합니다.

COS 요소일반 온톨로지 대응역할
ObjectConcept, Class대상의 종류/범주에 대한 이름, 정의, 설명을 담은 추상화 대상
Object PropertyProperty, AttributeObject를 구성하는 개념의 특성과 성질
Object SourceInstance실제 Object의 사례, 정형화된 데이터
LinkRelationObject ↔ Object, Property ↔ Property 간의 연결 관계
KnowledgeAxiom개념과 관계에 대한 규칙, 제약조건, 동의어, 지식 리스트

각 요소의 역할

Object

Object는 데이터를 의미 단위로 추상화한 개념입니다.

  • 정의: 비즈니스에서 다루는 대상(상품, 주문, 고객 등)을 표현합니다. 도메인 중심 설계에서 하나의 비즈니스 개념을 정의·속성·데이터까지 한 묶음으로 다루듯, Object도 관련된 모든 정보를 하나의 의미 단위로 모아 관리합니다.
  • 구성: Object Property(속성)와 Object Source(실제 데이터)를 포함
  • 활용: Agent가 “상품이란 무엇인가”, “주문은 어떤 속성을 가지는가”를 이해하는 기본 단위이며, Chat과 View Generation의 기반 데이터 구조

Link는 Object 간, Property 간의 관계를 사전에 정의합니다. Ontology Layer에서 관계를 미리 구성해두기 때문에, 실제 쿼리 시점에 복잡한 Join 연산 없이도 연결된 데이터를 탐색할 수 있습니다.

  • Object 간 관계: 상품 ↔ 주문, 고객 ↔ 리뷰
  • Property 간 관계: 주문금액 ↔ 정산금액
  • 맥락 기반 연결: Ontology가 현실 세계의 관계를 데이터 위에 그대로 옮겨놓듯, COS도 비즈니스 맥락을 기반으로 관계를 정의하여 단순 키 연결을 넘어선 유연한 관계 탐색이 가능합니다.

Link를 통해 Agent는 “상품과 주문이 어떻게 연결되는지”, “주문금액과 정산금액이 어떤 관계인지”를 사전에 학습된 메모리처럼 즉시 파악할 수 있습니다.

Knowledge

Knowledge는 비즈니스 규칙과 제약조건을 담습니다. 도메인 중심 설계에서 업무 규칙을 데이터나 로직과 분리하여 별도로 관리하듯, COS도 도메인 지식을 독립된 객체로 정의하여 Agent가 추론 시 이를 참조할 수 있도록 합니다.

  • 동의어: “매출” = “판매액” = “Revenue”
  • 공리: “블랙셀러 기준: 월 매출 1억 이상”
  • 제약: “플랫폼별 정산 금액 계산 규칙”

Knowledge는 Agent의 도메인 메모리에서 가장 핵심적인 역할을 합니다. 같은 데이터를 보더라도 “블랙셀러 기준이 월 매출 1억 이상”이라는 규칙을 알고 있는 Agent와 모르는 Agent의 응답 품질은 완전히 다릅니다. Knowledge를 통해 Agent는 각 고객사의 비즈니스 맥락에 맞는 전문적인 판단을 내릴 수 있습니다.


데이터 온톨로지화 프로세스

고객사의 데이터를 COS 온톨로지로 변환하는 과정입니다. 이 과정은 곧 Agent가 해당 도메인을 이해하기 위한 지식과 메모리를 구축하는 과정이기도 합니다.

Structured Data

정형 데이터(DB, CSV 등)의 온톨로지화입니다. Medallion Architecture에서 원본 데이터를 단계적으로 정제하며 비즈니스 의미를 부여하는 것처럼, COS도 데이터를 거치며 점진적으로 의미를 쌓아갑니다.

  1. 정규화: 데이터를 각 속성에 맞춰 Object로 분해
  2. Property/Source 구성: 분해 과정에서 속성과 실제 데이터 매핑
  3. Link 생성: Object, Source, Property 간 관계 정의

Unstructured Data

비정형 데이터(문서, 이미지 등)의 온톨로지화:

  1. Agent 기반 분해: Ontology Agent가 도메인 규칙을 기준으로 데이터를 Object와 지식으로 분해합니다. 도메인 중심 설계에서 업무 흐름에 따라 처리 단위를 나누듯, 각 Agent는 도메인 맥락에 맞게 분해 방식을 결정합니다.
  2. 정형화: 생성된 Object 기반으로 구조화
  3. Link 생성: Object 간 관계 정의
  4. Knowledge 추출: 데이터에 포함된 규칙, 유의어, 정의 등을 지식으로 축적

온톨로지 활용

온톨로지로 구축된 도메인 지식과 메모리는 Agent가 다양한 기능을 수행하는 데 직접 활용됩니다.

기능현재향후
ChatObject, Source, Property 기반 질문 응답Link 기반 관계 추론 응답
View GenerationObject 기반 대시보드 생성파생 관계 기반 확장된 데이터 시각화
의사결정 지원단일 Object 분석Knowledge 기반 고객사 맞춤 인사이트
Agent Builder도메인별 전문 Agent 생성고객사별 도메인 지식이 내재된 맞춤형 Agent 자동 구성

온톨로지는 Agent의 도메인 지식이자 메모리입니다. Object로 “무엇이 있는지”를, Link로 “어떻게 연결되는지”를, Knowledge로 “어떤 규칙으로 판단해야 하는지”를 Agent에게 알려줍니다. 이를 기반으로 각 고객사의 비즈니스 도메인에 특화된 전문 Agent를 빌딩할 수 있습니다.


다음 단계

  • Object 정의 가이드: Object와 Property 설계 방법
  • Link 설정 가이드: 관계 정의 및 매핑 방법
  • Knowledge 관리: 비즈니스 규칙 등록 및 활용
Last updated on