"김바로 온톨로지"의 두 판 사이의 차이
(→제도-조직 SPARQL 활용 예시) |
(→제도-조직 SPARQL 활용 예시) |
||
276번째 줄: | 276번째 줄: | ||
select * | select * | ||
where { | where { | ||
− | ? | + | ?schooltemp rdf:type schoolsys:Group . |
− | ? | + | ?schooltemp rdfs:label ?schoolname |
} | } | ||
</source> | </source> | ||
298번째 줄: | 298번째 줄: | ||
select * | select * | ||
where { | where { | ||
− | ? | + | ?schooltemp rdf:type schoolsys:Group . |
− | ? | + | ?schooltemp rdfs:label ?schoolname |
FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) | FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) | ||
} | } | ||
320번째 줄: | 320번째 줄: | ||
select * | select * | ||
where { | where { | ||
− | ? | + | ?schooltemp rdf:type schoolsys:Group . |
− | ? | + | ?schooltemp rdfs:label ?schoolname |
FILTER(LANGMATCHES(LANG(?p), "ko-hanza")) | FILTER(LANGMATCHES(LANG(?p), "ko-hanza")) | ||
} | } | ||
342번째 줄: | 342번째 줄: | ||
select * | select * | ||
where { | where { | ||
− | ? | + | ?schooltemp rdf:type schoolsys:Group . |
− | ? | + | ?schooltemp rdfs:label ?schoolname |
FILTER regex( str(?p),"영암" ) | FILTER regex( str(?p),"영암" ) | ||
FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) | FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) | ||
} | } | ||
− | |||
</source> | </source> | ||
2017년 5월 4일 (목) 23:31 판
목차
개괄
조직-인사 아카이브는 김바로에 의해 만들어진 조직-인사 온톨로지를 기반으로 1895년부터 1910년 근대 학교 제도 및 인사 자료를 RDF로 기술하였다.
본 데이터는 저작자표시 4.0 국제 (CC BY 4.0)의 조건을 따르고 있다.
데이터 포맷은 RDF(Resource Description Framework)이며, 조직-인사 온톨로지에 따라 구조화 하였다.
데이터 모델의 상세 스펙은 OWL DOC, Google Docs 등을 통하여 살펴볼 수 있다.
본 데이터의 검색은 온라인에서는 SPARQL Endpoint, 오프라인에서는 rdf-syntax-convert을 통하여 수행한다.
SPARQL Endpoint: 바로가기
SPARQL Endpoint 활용 예시 :
// 조직(학교) 이름을 모두 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?s rdf:type schoolsys:Group . ?s rdfs:label ?p }
- 그 외의 다양한 활용 예시는 "#제도-조직 SPARQL 활용 예시"에서 확인할 수 있다.
데이터셋 통계 :
제목 | 내용 |
---|---|
Last Update | 2017-04-23 |
Number of Statements | 1,312,187 |
Number Of Entities | 15,084 |
데이터셋 다운로드 :
제목 | 내용 |
---|---|
OWL 파일 다운로드 | 다운로드 |
전체 데이터 파일 다운로드 | 다운로드 |
연구 개괄
연구 목적과 대상
본 연구는 제도와 인사의 관계성 데이터 아카이브 구축 및 활용 방법론을 제시하는 데 목적이 있다. 기존의 종이 매체상에서의 인문학 정보 서술과 활용의 한계를 극복하기 위하여, 이를 대체할 디지털을 바탕으로 하는 새로운 인문학 정보 서술과 활용 방안에 대한 모색이 필요하다. 특히 기존 종이 매체의 구조와 형식을 그대로 디지털에 모사하는 일차적인 디지털화를 탈피하여, 컴퓨터 연산이 가능한 기계가독형 데이터를 생산함으로써 새로운 방식으로 수행되는 인문학 연구가 이루어져야 한다.
디지털인문학[1]은 정보기술(Information Technology)의 도움을 받아 새로운 방식으로 수행하는 인문학 연구와 교육, 그리고 이와 관계된 창조적인 저작 활동을 일컫는 말이다. 디지털인문학은 전통적인 인문학의 주제를 계승하면서 연구 방법의 측면에서 디지털 기술을 활용하는 연구, 그리고 예전에는 가능하지 않았지만 컴퓨터를 사용함으로써 시도할 수 있게 된 새로운 성격의 인문학 연구를 포함한다. 단순히 인문학의 연구 대상이 되는 자료를 디지털화하거나, 연구 결과물을 디지털의 형태로 간행하는 것은 아니다. 그것보다는 정보 기술의 환경에서 더욱 창조적인 인문학 활동을 전개하는 것, 그리고 그것을 디지털 매체를 통해 소통시킴으로써 보다 혁신적으로 인문 지식의 재생산을 촉진하는 노력을 하는 학문이 바로 디지털인문학이다.[2]
디지털인문학의 연구 영역은 설계, 구축, 분석, 해석, 시각화로 크게 분류할 수 있다. 설계는 대상 인문학 정보를 디지털에서 구현하기 위하여 대상의 구조와 내용을 연구하는 영역이다.[3] 분석은 구축된 데이터를 네트워크 분석, 지리정보 분석 등의 디지털 분석 방법뿐만이 아니라, 전통적인 인문학 연구 방법론을 통하여 구체적인 수치를 도출하는 영역이다.[4] 해석은 분석을 통하여 도출된 수치에 인간의 다양한 관점과 사유를 통한 의미를 부여하는 영역이다. 시각화는 컴퓨터에 최적화되어 있는 설계, 구축, 분석 및 인간에 의한 해석을 인간을 위하여 출력하는 영역이다.[5]
디지털 백과사전은 디지털 기술을 바탕으로 기존 종이매체보다 발전된 양태로 구축된 학문, 기술, 예술 등 자연과 인간의 모든 활동에 관한 다방면의 지식을 수집하여 체계적으로 정리한 내용 혹은 이를 위한 전반적인 시스템을 지칭한다. 아날로그 시대에 백과사전은 대중들이 분야별 전문지식의 세계로 들어가는 관문의 역할을 담당하였다. 그러나 디지털 시대에는 이미 무한한 디지털 공간에서의 “검색”이 종래의 백과사전의 역할을 대신하게 되었다. 이미 수많은 지식들이 인터넷에 있기에 간단한 검색으로도 원하는 정보를 취득할 수 있게 되었기 때문이다. 하지만 인터넷에 있는 정보는 아직 그 정보의 정확도를 따로 검증해야 할 필요가 있다. 또한, 무엇보다 정보가 서로 분산이 되어 사용자가 다양한 정보를 스스로 취합해야 된다. 따라서 디지털 백과사전은 다양한 분야와 층위의 전문적인 지식 내용을 구축하고, 서로 다른 영역의 지식 정보들을 상호 연계하는 시스템이어야 한다.
디지털 아카이브는 오프라인 실물 자원의 디지털화 방법 혹은 태생적으로 디지털인 자원의 수집과 보존 및 활용을 위한 보관 장소 혹은 이를 위한 전반적인 시스템을 지칭한다. 디지털 시대에도 기록관이나 박물관 등에서의 의미 있는 실물 자원의 수집과 보존은 지속되어야 한다. 다만 실물 자료의 활용성 증대, 그리고 태생적 디지털 자원의 수집과 보존에 대한 새로운 모색이 필요하다.
디지털 아카이브에 구축된 역사 기록을 이해하기 위해서는 역사 기록에 등장하는 인물과 공간에 대한 정보는 물론, 다양한 용어들을 알아야 한다. 기존 종이 매체에서는 이러한 용어에 대해 주석의 형식으로 개설적인 소개를 하는 데 그쳤다. 그런데 주석에 소개된 개설적인 내용은 해당 주석을 기술한 편찬자의 관심과 지식에 따라 한정되기 때문에 사용자의 요구가 충족되지 않을 수 있다. 또한 이용자가 해당 용어에 대한 추가적인 정보를 알고 싶을 때, 관련 저술에 대한 복잡한 탐색 작업을 수행하여야만 하였다. 그러나 디지털 세계에서는 다양한 분야와 층위의 전문적인 지식을 다방면의 전문가들이 각기 서술하고 이를 통합적으로 사용자에게 제공할 수 있다.
이를 위하여 출현한 개념이 디지털 통합정보 아카이브이다. 다시 말해서 디지털 통합정보 아카이브는 문헌, 문서, 사진 등 역사기록의 원천자원을 제공하는 디지털 아카이브와 특정 내용에 대한 전문적인 지식을 제공하는 디지털 백과사전을 상호 연계하는 개념이다.
본 논문에서는 전통 인문학 지식의 총아인 공구서를 디지털로 이식하고자 한다. 그 대상으로 인문학 연구의 기반인 인물 관련 공구서와 제도 관련 공구서 그리고 양자의 상호 관계에 집중하고자 한다. 다만 개인이 행하는 연구의 본질적인 한계로 인하여 연구의 범위를 제한한다. 연속성이 보장되면서도 현존 사료가 풍부하고 국가 권력 혼란기의 변화 양상을 볼 수 있는 1895년 한성사범학교부터 1910년 조선총독부 직원록까지의 사범학교와 소학교(보통학교), 교원을 연구 대상으로 한다. 세부적으로 기관은 1895년부터 1910년까지의 소학교, 보통학교, 사범학교 274개를 대상으로 한다. 인물은 구한말 관보에 등장하는 공식적인 학교 관련 인물 4,256명을 핵심 대상으로 한다. 인물 및 인사운용 정보는 구한말 관보에 공식적으로 거론된 기록 7,960건, 직원록 795건, 근현대인물데이터베이스 578건을 주요 대상으로 한다.
연구 방법
본 연구에서는 다음의 A~F와 같은 절차를 수행한다.
A. 구한말 관공립학교 제도와 교원의 인사 기록 수집
구한말 관공립학교 제도와 교원의 인사 기록을 수집하기 위하여 정부 3.0 및 “공공데이터 제공 및 이용 활성화에 관한 법률”[6] 에 의거하여 수집 가능한 공공데이터인 국사편찬위원회의 한국근현대인물자료 데이터[7]와 직원록 데이터[8]를 확보한다.
공공데이터로서의 수집이 제한되는 서울대학교 규장각한국학연구원 소장자료를 디지털화한 규장각한국학연구원본 《구한말 관보》[9]와 1899년 5월 25일 아세아문화사의 『구한국관보』를 토대로 하는 국립중앙도서관본 《구한말 관보》[10] 및 한국언론진흥재단의 “고신문 데이터”[11] 등의 데이터는 온라인 서비스를 통하여 접근한다.
B. 구한말 관공립학교 제도와 교원의 인사 기록 구조 분석
온톨로지 설계의 방향성을 결정하기 위한 선행 단계로 A에서 수집된 자료의 역사적 맥락을 파악하고, 구한말 관공립학교 제도와 교원의 인사 기록 관련 선행 연구 성과를 종합한다. 이를 바탕으로 법제, 학교, 직위, 직급에 대한 명칭과 변화를 살펴보고, 인사 운영의 용어·용례를 정리한다.
C. 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지 구축
효율적인 온톨로지 설계를 위하여 제도와 인사에 관련된 종이 매체와 디지털 매체의 자료 및 데이터의 모델을 살펴본다. 선행 모델과 B에서 분석된 내용을 바탕으로 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 구축한다. 온톨로지의 설계는 크게 인문학 기본 온톨로지, 관공립학교 제도 온톨로지, 인사 기록 온톨로지로 분리하여 설계한 이후에 이를 종합하고 검증한다.
D. 구한말 관공립학교 제도와 교원의 인사기록 데이터 처리
C에서 구축된 온톨로지를 바탕으로 A에서 수집된 PLAIN TEXT, RDB, XML 형식의 데이터를 정규표현식, RDB 데이터 운용, XML 데이터 운용의 방법을 통해 기계가독형 데이터로 전환하는 과정을 수행한다.
E. 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 바탕으로 하는 데이터 모델링
C에서 구축된 온톨로지를 바탕으로 D에서 처리한 데이터를 시맨틱웹으로 구현할 수 있는 RDF 모델과 기존 디지털 아카이브에 사전 정보를 추가할 수 있도록 설계된 XML 모델, 실무적인 활용성을 목적으로 한 RDB 모델, 인문학 연구자들의 디지털 접근의 입문단계에서 사용 가능한 WIKI 모델을 각기 모델링한다.
F. 구한말 관공립학교 제도와 교원의 아카이브를 바탕으로 하는 시각화
효율적인 시각화 모델 제시를 위하여 유관 시각화 선행 모델을 살펴본다. 이를 바탕으로 E에서 구축한 아카이브를 효율적으로 활용하기 위한 시각화 방법을 모색한다. 시각화는 크게 인간가독형 시각화 모델과 데이터 접근성 향상을 위한 시각화 모델로 분리하여 서술한다. 인간가독형 시각화 모델은 인간의 다양한 관점에 따른 요구를 수용하기 위한 각각의 관점에 대한 시각화 모델을 제시한다. 데이터 접근성 향상을 위한 시각화 모델에서는 간단하지만 제한적인 접근만이 가능한 키워드 검색 방법과 복잡하지만 다양한 접근이 가능한 데이터 질의 언어 사이의 간극을 해소할 수 있는 블록조합형 질의언어 시각화 방법론을 제시한다. 마지막으로 제시한 시각화 모델과 디지털인문학 분석 방법론을 활용하여 구축된 아카이브를 토대로 인문학 연구를 위한 활용 모델을 제시한다.
연구 과정에서 사용되는 소프트웨어는 다음과 같다.
데이터 설계를 위해서 protégé(프로테제)와 Altova XMLSpy(알토바 엑스엠엘스파이)를 사용하였다. 지리 정보 수집을 위하여 남한 지역은 Daum 지도와 네이버 지도를 사용하였고, 북한 지역은 Google 지도와 Google Earth를 사용하였다. 데이터의 처리를 위하여 EmEditor(엠에디터), Microsoft Excel(마이크로소프트 엑셀), RDFConvert를 사용하였다. 데이터의 분석을 위하여 Gephi(게파이), GNU R(지엔유 알)을 사용하였다. 데이터 검색을 위하여 Twinkle(트윙클)을 사용하였다. 데이터 운용을 위하여 Virtuoso Universal Server(벌투오소 유니버샬 서버를 사용하였다. 이미지 처리를 위해서 Photoshop(포토샵)과 Illustrator(일러스트레이터)를 사용하였다. 마지막으로 논문 집필을 위하여 문서편집기로 Google Docs(구글 문서), Microsoft PowerPoint(마이크로소프트 파워포인트), 한컴오피스 한글을 사용하였다.
데이터 설계
기존 자료 분석
온톨로지 설계의 방향성을 결정하기 위한 선행 단계로 수집된 자료의 역사적 맥락을 파악하고, 구한말 관공립학교의 제도와 교원의 인사 기록 관련 선행 연구 성과를 종합한다. 이를 바탕으로 법제, 학교, 직위, 직급에 대한 명칭과 변화를 살펴보고, 인사 운영의 용어·용례를 정리한다.
본 논문의 대상 범위에서 실제적인 학교 명칭과 그 변화 양상은 크게 관립학교와 공립학교로 분류하였다. 그 중에서 공립학교는 4가지 기준으로 구분하였다. 법률에 의거하여 소학교에서 보통학교로 개편된 “법적승계”, 법률로는 승계되지 않았지만 동일 지역에서 교원의 전임을 통해서 실질적으로 승계된 “교원승계”, 법률적으로도 승계되지 않았고, 교원의 전임을 통한 승계도 없지만 동일한 지역에서 교육의 직무를 승계한 “지역승계”, 마지막으로 법률, 교원이동과 지역적인 어떠한 연관성도 발견되지 않은 “단독학교”가 바로 이에 해당한다. 본 논문의 대상 범위의 직급, 직위, 직봉에 대한 고증 작업을 수행하여, 구한말 관공립학교와 인사제도의 변화 양상에 대해서 파악하였다. 또한 대상 범위의 인사 용어에 대한 고증 작업을 수행하여, 구한말 관공립학교와 인사제도의 변화 양상에 대해서 파악하고자 한다.
온톨로지 설계
제도와 인사에 관련된 종이 매체와 디지털 매체의 자료 및 데이터의 모델을 살펴본다. 이를 통해서 도출된 선행 모델과 구한말 관공립학교 제도와 교원의 인사 기록 구조 분석 결과를 바탕으로 구한말 관공립학교 제도와 교원의 인사 기록 온톨로지를 구축한다. 온톨로지의 설계는 크게 인문학 기본 온톨로지, 관공립학교 제도 온톨로지, 인사 기록 온톨로지로 분리하여 설계한 이후에 이를 종합하고 검증한다.
인문학 연구의 특질을 반영하여 인문학 정보의 온톨로지 구축을 하기 위한 필수 요소를 제시하였다. 다양한 연구자들의 동일한 대상에 대한 서로 다른 판단의 결과를 데이터의 형태로 구축 가능하게 하였다.
또한 기존 인문학에서 소략되었던 “추정”의 개념을 강조하여, 설령 완벽하게 대상을 파악하지 못하더라도 근사치를 제공하여 지속적인 연구를 위한 토대를 제공할 수 있도록 하였다.
인문학 정보의 “사건”에 대한 온톨로지 모형을 제시하였다. 인문학에서 등장하는 복합적인 지식 정보인 “사건”을 특정 시점을 기준으로 한 선후 변화 개념으로 디지털에 최대한 모사하였다.
데이터 모델링
RDF 데이터 모델링
RDF 모델 설계의 중점은 RDF와 RDF를 통한 LOD 서비스를 통하여 무한한 연결을 지원하는 것에 두었다. 이를 위하여 데이터 속성의 설정을 최대한 지양하였다. 가부 판단의 ‘boolean’, 경위도값의 ‘float’, 직위수량이나 직봉 등의 일반숫자값을 나타내는 ‘int’, 날짜와 시간에 쓰이는 ‘dateTime’과 같은 숫자값, 그리고 출처 표기(전통형 출처표기, URL표기)와 지명정보에 사용되는 문자값 정도만을 데이터 속성으로 정의하였다.
전체적인 RDF 모델의 구조는 크게 공통 영역, 제도 영역, 인사운용 영역으로 구분된다. 공통 영역에는 집필자, 집필일자, 근거(전통형 출처표기, URL표기)를 중심으로 하는 학술 모델, 그리고 100% 확정적이지는 않지만 다양한 근거를 통하여 특정한 대상에 대해서 미루어 짐작할 수 있는 사항을 기록하는 추정 모델이 있다. 제도 영역은 제도의 세부 내용을 기술하는 곳으로 제도 모델이 사용되었다. 인사운용 영역은 실제적인 임명, 해임 등의 인사 사건과 제도의 변화를 기술하는 곳으로 사건 모델이 사용되었다. 마지막으로 전체적으로 다양한 이칭의 처리를 위하여 이칭 모델을 사용하였다.
XML 데이터 모델링
XML은 RDB에 비하여 비정형데이터를 효율적으로 다룰 수 있다. 이에 따라서 현재 인문학 아카이브의 데이터는 기본적으로 XML 형태로 구축되고 있다. 그러나 해당 XML은 원문에 대한 마크업만을 수행하고 있으며, 원문에서 추출된 인문학 지식 요소에 대한 추가적인 처리는 수행하고 있지 않다. 물론 디지털 백과사전의 편찬자가 각각의 아카이브에서 인문학의 지식요소를 처리하고 연결할 수도 있다. 하지만 원문에 대해서 가장 완전히 파악하고 있는 아카이브 구축자가 직접 해당 아카이브의 내용에서 지식 요소를 추출해야 보다 완전한 인문학 데이터를 구축할 수 있다.
가장 좋은 것은 RDF 방식으로 지식 자원을 구성하여 언제든지 다른 자원과 연결할 수 있는 LOD 서비스를 구현하는 것이다. 그러나 현실적으로 RDF의 구현은 대량의 자원이 투입되어서 전체적인 온톨로지 및 유관 시스템을 구축한 이후에나 가능하다. 따라서 아카이브를 구축하는 작업자들이 조금씩이나마 현재의 시스템을 기반으로 RDF를 구현할 수 있도록 최대한 단순한 형태의 인사 기록에 대한 XML 설계를 진행한다. 제도는 개별 인문학 자료에서 다루는 것보다는 전문적이고 포괄적인 연구를 통한 온톨로지를 구축하여 관리할 필요가 있다. 따라서 본 장에서는 인물의 임명, 해임, 승진, 처벌 등의 인사 기록에 대한 설계만을 진행한다.
또한 XML 설계는 전통적인 주석에 대한 새로운 발전 방향을 모색한다는 목적도 포함하고 있다. 기존의 주석은 “낱말이나 문장의 뜻을 쉽게 풀이하는 글”로 정의된다. 실제의 주석에서는 인문학 자료에 등장하는 주요 단어에 대해서 풀이하거나, 간략한 관련 부가 정보를 제공하는 수준으로 작업을 진행하였다. 그런데 이러한 작업은 인간을 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위이다. 디지털 시대에는 인간이 아닌 기계를 위하여 “낱말이나 문장의 뜻을 쉽게 풀이하는” 행위가 필요하다. 따라서 인문학 자료의 원문을 재구성하여 기계가독형 데이터로 만드는 작업의 수행이 필요하다.
활용 모델
구한말 관공립학교의 제도와 교원의 인사 기록 온톨로지를 바탕으로 하는 데이터 모델링으로 구축된 아카이브를 효율적으로 활용하기 위한 시각화 방법을 모색한다. 시각화는 크게 인간가독형 시각화 모델과 데이터 접근성 향상을 위한 시각화 모델로 분리하여 서술한다. 인간가독형 시각화 모델에서는 인간의 다양한 관점에 따른 요구를 수용하기 위해 각각의 관점에 대한 시각화 모델을 제시한다. 데이터 접근성 향상을 위한 시각화 모델에서는 간단하지만 제한적인 접근만이 가능한 키워드 검색 방법과 복잡하지만 다양한 접근이 가능한 블록조합형 질의언어에 의한 시각화 방법론을 제시한다. 마지막으로 제시한 시각화 모델과 디지털인문학 분석 방법론을 활용하여 구축된 아카이브를 토대로 인문학 연구를 위한 활용 모델을 제시한다.
제도-조직 SPARQL 활용 예시
// 조직(학교) 이름을 모두 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname }
// 한글로 된 조직(학교) 이름을 모두 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) }
// 한자로 된 조직(학교) 이름을 모두 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname FILTER(LANGMATCHES(LANG(?p), "ko-hanza")) }
// 한글로 된 "영암"이 포함된 조직 이름을 모두 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname FILTER regex( str(?p),"영암" ) FILTER(LANGMATCHES(LANG(?p), "ko-hangul")) }
// 분류가 보통학교인 학교의 한글 이름을 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select ?schoolname ?subjectname where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname . FILTER(LANGMATCHES(LANG(?schoolname), "ko-hangul")) ?schooltemp rdf:subject ?subjecttemp . ?subjecttemp rdfs:label ?subjectname . FILTER regex( str(?subjectname),"보통학교" ) }
// 학교의 한글이름과 한자이름을 합쳐서 "한글이름(한자이름)"의 형식으로 출력하라.
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select ?schoolname where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolnamehan . FILTER(LANGMATCHES(LANG(?schoolnamehan ), "ko-hangul")) ?schooltemp rdfs:label ?schoolnamehanza . FILTER(LANGMATCHES(LANG(?schoolnamehanza ), "ko-hanza")) BIND (CONCAT(?schoolnamehan , "(", ?schoolnamehanza, ")" ) AS ?schoolname) }
// 기관 분류별 개수 통계 출력
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select (count(distinct *) AS ?CNT) ?subjectname where { ?schooltemp rdf:type schoolsys:Group . ?schooltemp rdfs:label ?schoolname . FILTER(LANGMATCHES(LANG(?schoolname), "ko-hangul")) ?schooltemp rdf:subject ?subjecttemp . ?subjecttemp rdfs:label ?subjectname . } group by ?subjectname
// 보직이동에 관하여 "이전조직", "이후조직", "시간정보"를 출력하라
PREFIX schoolsys: <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#> PREFIX historygokr: <http://dh.aks.ac.kr/ontologies/personnelmatters/historygokr#> PREFIX kyujanggak: <http://dh.aks.ac.kr/ontologies/personnelmatters/kyujanggak#> PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX xsd: <http://www.w3.org/2001/XMLSchema#> PREFIX xml: <http://www.w3.org/XML/1998/namespace> PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> select * where { ?eventtemp rdf:type kyujanggak:Event. ?eventtemp schoolsys:hasEventPreObject ?preobjecttemp . ?preobjecttemp rdf:type schoolsys:Group . ?preobjecttemp rdfs:label ?preschool. FILTER(LANGMATCHES(LANG(?preschool), "ko-hangul")) ?eventtemp schoolsys:hasEventPostObject ?postobjecttemp . ?postobjecttemp rdf:type schoolsys:Group . ?postobjecttemp rdfs:label ?postschool. FILTER(LANGMATCHES(LANG(?postschool), "ko-hangul")) ?eventtemp schoolsys:hasEventType <http://dh.aks.ac.kr/ontologies/personnelmatters/schoolsystem#C_PM_0001> . ?eventtemp schoolsys:hasTimeValue ?time }
주석
- ↑ 디지털인문학에 대한 대표적인 포괄적인 선행 연구는 다음과 같다. 김현·임영상·김바로, 『디지털 인문학 입문』, HUEBOOKs, 2016; 立命館大学大学院의 “シリーズ日本文化デジタル・ヒューマニティーズ”시리즈(『日本文化デジタル・ヒューマニティーズの現在』, 2009; 『イメージデータベースと日本文化研究』, 2010; 『京都の歴史GIS』, 2011; 『デジタル・ヒューマニティーズ研究とWeb技術』, 2012; 『京都イメージ―文化資源と京都文化』, 2012; 『デジタル・アーカイブの新展開』, 2012); 項潔 編, “數位人文研究叢書” 시리즈, 國立臺灣大學出版中心(『從保存到創造:開啟數位人文研究』, 2011; 『數位人文研究的新視野:基礎與想像』, 2011; 『數位人文在歷史學研究的應用』, 2011; 『數位人文要義:尋找類型與軌跡』, 2012; 『數位人文研究與技藝』, 2014; 『數位人文:在過去、現在和未來之間』, 2016); Susan Schreibman, Ray Siemens, and John Unsworth, A Companion to Digital Humanities, Blackwell Publishing, 2004; Matthew K. Gold, Debates in the Digital Humanities, Univ Of Minnesota Press, 2012.
- ↑ 김현, 「디지털 인문학 - 인문학과 문화콘텐츠의 상생 구도에 관한 구상」, 『인문콘텐츠』, 제29호, 2013, 12쪽.
- ↑ 설계 영역을 중심으로 전개된 선행 연구는 다음과 같다. 박순의 「고전문학 자료의 디지털고전문학 자료의 디지털 아카이브 편찬 연구 ― 누정기(樓亭記) 자료를 중심으로-」(연세대학교 박사학위논문, 2017)는 누정기 자료를 중심으로 고전문학자료의 지식 정보를 총체적으로 제공하며, 지식 정보 간의 관계 양상을 분석하고 있고, 다중 참여형 지식 정보를 쌓기 위한 온톨로지 구축을 통한 디지털 아카이브의 모델을 제시하고 있다; 이현실의 「온톨로지 기반 한의학 처방 지식관리시스템 설계에 관한 연구」(중앙대학교 박사학위논문, 2003)는 한의학 처방 지식 합성 온톨로지 구축을 통하여 한의학의 특성을 충분히 반영한 정보 시스템을 구현할 수 있도록 한의학의 지식체계를 구조화하였다. 이에 따라서 사진(四診), 변증(辨證), 논치(論治), 방약(方藥)의 4개 단위로 온톨로지를 구축하고, 이들을 통합하는 합성 온톨로지를 구축하였다; 서소리의 「문화유산 지식 정보 데이터 모델 연구 : 불탑 지식 정보망을 중심으로」(한국학중앙연구원 한국학대학원 석사학위논문, 2014)는 불탑을 중심으로 기존 문화유산 지식 정보 모델인 LIDO와 EDM의 데이터 모델을 응용하여 불탑 지식 정보망을 설계하였다. 불탑에 관한 정보를 상세하게 기술하고 관련된 정보 자원들의 의미적 관계망을 형성하였다; 류인태의 「디지털 환경에서의 인문 지식 연구에 관한 小考 ― 修信使 자료 DB 편찬 프로젝트를 중심으로」(『열상고전연구』, 제50호, 2016)는 ‘修信使 자료 DB 편찬 프로젝트’의 연구 수행 방향에 따른 DB(Data Base) 편찬 방향을 제시하고 있다. DB 편찬 방향에서 인물들 간의 명확한 관계 설정을 위한 온톨로지 설계 방안을 제안하고 있다; 구축은 설계를 통한 연구 성과를 바탕으로 인문학 자원을 신규 구축하거나, 기존에 구축된 인문학 데이터를 특정 목적 아래에 재편성하는 영역이다. 데이터 구축을 중심으로 전개된 선행 연구는 다음과 같다. 이양원·구자용·최진무의 「인문지리정보 통합DB 구축을 위한 데이터 모델링 및 온톨로지 연계 방안」(『한국지도학회지』, 제10권, 제2호, 2010)은 효율적인 인문지리정보 DB구축을 위한 방법론과 사례를 제시하였다. 특히 시간에 따른 정보 변화를 관리하기 위한 방안을 제시하였다; 김바로의 「역사기록의 전자문서 편찬방법 탐구 -역사 요소를 중심으로」(『열상고전연구』, 제51호, 2016)는 전통적으로 인문학자들이 수행하는 대상 자료의 분석·해석 작업을 바탕으로 디지털상에서 역사 요소를 중심으로 역사기록의 전자문서를 편찬하는 방법을 탐구하였다; 김현·안승준·류인태의 『고문서 연구를 위한 데이터 기술 모델』(제59회 전국역사학대회, 2016)은 부안 김씨 고문서를 대상으로 고문서의 데이터 모델을 연구하였다. 우선 부안 김씨 문중 고문서의 내용을 개괄하고, 문중 고문서에 적합한 온톨로지를 설계하고 데이터를 구축하여, Neo4J를 통하여 시각화하였다; 윤소영의 「LOD 기반 한국사 콘텐츠 서비스 구축에 관한 연구」(『정보관리학회지』, 제30권, 제3호, 2013)는 국사편찬위원회, 한국학중앙연구원, 문화재청, 한국콘텐츠진흥원의 데이터를 융합하여 한국사 LOD를 구축하기 위한 필요성과 구체적인 방법을 제시하고 있다. 본 논문의 내용을 토대로 국사편찬위원회에서는 2014년부터 한국사 LOD를 서비스하고 있다.
- ↑ 분석 영역을 중심으로 전개된 선행 연구는 다음과 같다. 이상국의 「『안동권씨성화보(安東權氏成化譜)』에 나타난 13~15세기 관료 재생산과 혈연관계」(『대동문화연구』, 제81권, 2013)는 『안동권씨성화보』를 토대로 개인의 관직 획득에서의 아버지와 할아버지의 영향력을 분석하여, 아버지의 영향력이 할아버지의 영향력보다 높음을 밝혀내었다; 김종혁의 「고지명 데이터베이스를 통한 19세기 지명의 지역별·유형별 분포 특징」(『문화역사지리지』, 제20권, 제3호, 2008)은 조선시대 전자문화지도를 통하여 구축된 고지도의 지명 데이터를 토대로 고지도에 수록된 지명의 유형을 분류하고 분석하여 고지도에서 사용되는 지명의 지역별·유형별 분포 특징을 제시하였다; 邱偉雲의 「關鍵詞叢與文本意義挖掘的嘗試:以『清季外交史料』爲例」(項潔 編, 『數位人文在歷史學研究的應用』, 臺灣大學出版中心, 2011)는 청계외교사료 데이터베이스를 토대로 1897년의 “주권”과 “중국”의 연어와 공기어를 분석하여 기존의 학설과는 상이하게 당시에는 아직 주권 개념이 생겨나지 않았음을 밝혀내었다; 김현종의 「조선시대 교통로 복원과 공간 데이터베이스 설계 - 경기도 광주부를 중심으로 -」(한국학중앙연구원 한국학대학원 석사학위논문, 2016)은 경기도 광주부를 중심으로 교통로를 복원하기 위하여 역사지리정보시스템(HGIS)을 이용한 교통로 시공간 데이터 모델 설계안을 제시하였다. 이상국의 「’빅데이터’ 분석 기반 한국사 연구의 현황과 가능성: 디지털 역사학의 시작」(『응용통계연구』, 제29권, 제6호, 2016)은 빅데이터를 바탕으로 하는 양적 분석 방법론의 현황을 정리하고, 현재의 문제점을 보완할 미래 가능성을 제시하였다.
- ↑ 시각화 영역을 중심으로 전개된 선행 연구는 다음과 같다. 허경진·구지현의 『조선시대 표류노드 시각망 연구일지』(보고사, 2016)는 “조선시대 표류노드 시각망 구축 프로젝트”의 수행 과정을 기록한 연구보고서이다. 『표인영래등록(漂人領來謄錄)』, 『조선왕조실록(朝鮮王朝實錄)』, 『변례집요(邊例集要)』를 바탕으로 조선시대 표류기록 데이터를 추출하고, 데이터와 연구 목표에 유효한 온톨로지를 설계한 다음 그에 해당하는 시각화 방안을 제시하였다. 김현승의 「<문효세자 보양청계병> 복식 고증과 디지털 콘텐츠화」(단국대학교 석사학위논문, 2016)는 정조(正祖)의 첫 번째 아들인 원자(문효세자: 文孝世子)를 위해 시행한 보양청(輔養廳) 상견례(相見禮)를 묘사한 <문효세자 보양청계병(文孝世子輔養廳契屛)>을 중심으로 문효세자와 보양관의 상견례시 참여자들이 착용한 복식을 고증한 후 일러스트로 구현하고, 복식 정보 간의 관계를 시각적인 그래프로 보여주기 위하여 온톨로지를 구축하고, 구축된 결과물을 Neo4J로 시각화하였다. 정환석의 「한국 기록문화유산 정보시각화 연구 방안 : 천문류초, 천상열차분야지도를 중심으로」(한국외국어대학교 석사학위논문, 2009)는 조선시대 천문기록문화유산인 『천문류초』와 『천상열차분야지도』를 토대로 데이터베이스를 구축하고, 이를 바탕으로 대상에 대한 최적의 시각화 방안을 모색하였다.
- ↑ <공공데이터의 제공 및 이용 활성화에 관한 법률(법률 제11956호, 2013.7.30. 제정)은 법률 제12844호(2014.11.19., 타법개정)에서 주무책임이 안전행정부장관에서 행정자치부장관으로 변동되었고, 법률 제13723호(2016.1.6., 일부개정)에서 공공기관과 민간의 중복 및 유사한 서비스를 통한 경쟁을 방지하여 공공데이터의 이용을 촉진하도록 일부 개정되었다. 자세한 것은 “공공데이터의 제공 및 이용 활성화에 관한 법률 웹사이트(온라인 참조 : 국가법령정보센터, 법제처, http://www.korealaw.go.kr/lsEfInfoP.do?lsiSeq=179039 )”를 참고하기 바란다.
- ↑ 한국근현대인물자료, 한국사데이터베이스, 국사편찬위원회 : http://db.history.go.kr/item/level.do?itemId=im
- ↑ 직원록자료, 한국사데이터베이스, 국사편찬위원회 : http://db.history.go.kr/item/level.do?itemId=jw
- ↑ 관보DB, 서울대학교 규장각한국학연구원 : http://kyu.snu.ac.kr/home/index.doidx=06&siteCd=KYU&topMenuId=206&targetId=379&gotourl=http://kyu.snu.ac.kr/home/GAN/GAN_MAINLIST.jsp
- ↑ 구한국 관보, 국립중앙도서관 : http://www.nl.go.kr/nl/search/search_wonmun.jsp?detailSearch=true&offer_dbcode_2s=CH43&wonmunTabYn=Y
- ↑ 고신문 아카이브, 한국언론진흥재단 : http://www.bigkinds.or.kr/ (단, 고신문 아카이브는 2017년 4월 현재 국립중앙도서관 대한민국 신문 아카이브( http://www.nl.go.kr/newspaper/ )와 통합중으로 2017년 하반기부터 정상적인 이용이 가능하다.