제도와 인사의 관계성 온톨로지와 데이터 모델링

김바로 온톨로지 위키(ddokbaro's Ontology WIKI
이동: 둘러보기, 검색

기존 자료 분석

온톨로지 설계의 방향성을 결정하기 위한 선행 단계로 수집된 자료의 역사적 맥락을 파악하고, 구한말 관공립학교의 제도와 교원의 인사 기록 관련 선행 연구 성과를 종합한다. 이를 바탕으로 법제, 학교, 직위, 직급에 대한 명칭과 변화를 살펴보고, 인사 운영의 용어·용례를 정리한다.

본 논문의 대상 범위에서 실제적인 학교 명칭과 그 변화 양상은 크게 관립학교와 공립학교로 분류하였다. 그 중에서 공립학교는 4가지 기준으로 구분하였다. 법률에 의거하여 소학교에서 보통학교로 개편된 “법적승계”, 법률로는 승계되지 않았지만 동일 지역에서 교원의 전임을 통해서 실질적으로 승계된 “교원승계”, 법률적으로도 승계되지 않았고, 교원의 전임을 통한 승계도 없지만 동일한 지역에서 교육의 직무를 승계한 “지역승계”, 마지막으로 법률, 교원이동과 지역적인 어떠한 연관성도 발견되지 않은 “단독학교”가 바로 이에 해당한다. 본 논문의 대상 범위의 직급, 직위, 직봉에 대한 고증 작업을 수행하여, 구한말 관공립학교와 인사제도의 변화 양상에 대해서 파악하였다. 또한 대상 범위의 인사 용어에 대한 고증 작업을 수행하여, 구한말 관공립학교와 인사제도의 변화 양상에 대해서 파악하고자 한다.


온톨로지 설계

제도와 인사에 관련된 종이 매체와 디지털 매체의 자료 및 데이터의 모델을 살펴본다. 이를 통해서 도출된 선행 모델과 구한말 관공립학교 제도와 교원의 인사 기록 구조 분석 결과를 바탕으로 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 구축한다. 온톨로지의 설계는 크게 인문학 기본 온톨로지, 관공립학교 제도 온톨로지, 인사 기록 온톨로지로 분리하여 설계한 이후에 이를 종합하고 검증한다.


온톨로지 학술.png


인문학 연구의 특질을 반영하여 인문학 정보의 온톨로지 구축을 하기 위한 필수 요소를 제시하였다. 다양한 연구자들의 동일한 대상에 대한 서로 다른 판단의 결과를 데이터의 형태로 구축 가능하게 하였다.


온톨로지 추정.png


또한 기존 인문학에서 소략되었던 “추정”의 개념을 강조하여, 설령 완벽하게 대상을 파악하지 못하더라도 근사치를 제공하여 지속적인 연구를 위한 토대를 제공할 수 있도록 하였다.


온톨로지 사건.png


인문학 정보의 “사건”에 대한 온톨로지 모형을 제시하였다. 인문학에서 등장하는 복합적인 지식 정보인 “사건”을 특정 시점을 기준으로 한 선후 변화 개념으로 디지털에 최대한 모사하였다.


온톨로지 시스템.png



데이터 모델링

RDF 데이터 모델링

RDF 모델 설계의 중점은 RDF와 RDF를 통한 LOD 서비스를 통하여 무한한 연결을 지원하는 것에 두었다. 이를 위하여 데이터 속성의 설정을 최대한 지양하였다. 가부 판단의 ‘boolean’, 경위도값의 ‘float’, 직위수량이나 직봉 등의 일반숫자값을 나타내는 ‘int’, 날짜와 시간에 쓰이는 ‘dateTime’과 같은 숫자값, 그리고 출처 표기(전통형 출처표기, URL표기)와 지명정보에 사용되는 문자값 정도만을 데이터 속성으로 정의하였다.

온톨로지 전체.png

전체적인 RDF 모델의 구조는 크게 공통 영역, 제도 영역, 인사운용 영역으로 구분된다. 공통 영역에는 집필자, 집필일자, 근거(전통형 출처표기, URL표기)를 중심으로 하는 학술 모델, 그리고 100% 확정적이지는 않지만 다양한 근거를 통하여 특정한 대상에 대해서 미루어 짐작할 수 있는 사항을 기록하는 추정 모델이 있다. 제도 영역은 제도의 세부 내용을 기술하는 곳으로 제도 모델이 사용되었다. 인사운용 영역은 실제적인 임명, 해임 등의 인사 사건과 제도의 변화를 기술하는 곳으로 사건 모델이 사용되었다. 마지막으로 전체적으로 다양한 이칭의 처리를 위하여 이칭 모델을 사용하였다.


XML 데이터 모델링

XML은 RDB에 비하여 비정형데이터를 효율적으로 다룰 수 있다. 이에 따라서 현재 인문학 아카이브의 데이터는 기본적으로 XML 형태로 구축되고 있다. 그러나 해당 XML은 원문에 대한 마크업만을 수행하고 있으며, 원문에서 추출된 인문학 지식 요소에 대한 추가적인 처리는 수행하고 있지 않다. 물론 디지털 백과사전의 편찬자가 각각의 아카이브에서 인문학의 지식요소를 처리하고 연결할 수도 있다. 하지만 원문에 대해서 가장 완전히 파악하고 있는 아카이브 구축자가 직접 해당 아카이브의 내용에서 지식 요소를 추출해야 보다 완전한 인문학 데이터를 구축할 수 있다.

온톨로지 XML.PNG


가장 좋은 것은 RDF 방식으로 지식 자원을 구성하여 언제든지 다른 자원과 연결할 수 있는 LOD 서비스를 구현하는 것이다. 그러나 현실적으로 RDF의 구현은 대량의 자원이 투입되어서 전체적인 온톨로지 및 유관 시스템을 구축한 이후에나 가능하다. 따라서 아카이브를 구축하는 작업자들이 조금씩이나마 현재의 시스템을 기반으로 RDF를 구현할 수 있도록 최대한 단순한 형태의 인사 기록에 대한 XML 설계를 진행한다. 제도는 개별 인문학 자료에서 다루는 것보다는 전문적이고 포괄적인 연구를 통한 온톨로지를 구축하여 관리할 필요가 있다. 따라서 본 장에서는 인물의 임명, 해임, 승진, 처벌 등의 인사 기록에 대한 설계만을 진행한다.

또한 XML 설계는 전통적인 주석에 대한 새로운 발전 방향을 모색한다는 목적도 포함하고 있다. 기존의 주석은 “낱말이나 문장의 뜻을 쉽게 풀이하는 글”로 정의된다. 실제의 주석에서는 인문학 자료에 등장하는 주요 단어에 대해서 풀이하거나, 간략한 관련 부가 정보를 제공하는 수준으로 작업을 진행하였다. 그런데 이러한 작업은 인간을 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위이다. 디지털 시대에는 인간이 아닌 기계를 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위가 필요하다. 따라서 인문학 자료의 원문을 재구성하여 기계가독형 데이터로 만드는 작업의 수행이 필요하다.