제도와 인사의 관계성 데이터 수집 방법

김바로 온톨로지 위키(ddokbaro's Ontology WIKI
이동: 둘러보기, 검색

본 논문에서 사용한 조선왕조실록, 한국근현대인물자료 일괄, 직원록 자료 일괄은 정부 3.0에 의거하여 공공데이터포털을 통하여 신청하였다. “공공데이터 제공 및 이용 활성화에 관한 법률[1]”은 공공기관이 보유·관리하는 데이터의 제공 및 그 이용 활성화에 관한 사항을 규정함으로써 국민의 공공데이터에 대한 이용권을 보장하고, 공공데이터의 민간 활용을 통한 삶의 질 향상과 국민경제 발전에 이바지함을 목적으로 한다.[2] 이에 따라서 공공기관은 “공공기관의 정보공개에 관한 법률"[3] 제 9조에 따른 비공개 대상 정보 및 저작권법[4] 및 그 밖의 다른 법령에서 보호하고 있는 제삼자의 권리가 포함된 것으로 해당 법령에 따른 정당한 이용 허락을 받지 아니한 정보를 제외하고는 저작권 표시, 영리적 사용 여부, 내용 변경 등의 모든 제약이 없는 퍼블릭 도메인(public domain)의 형태로 제공하여야 한다. 공공데이터법은 공공기관에만 적용이 되며, 민간에는 적용되지 않는다.


다만 위의 공공데이터 법률이 존재함에도 불구하고 일부 기관에서는 데이터 허깅(DATA Hugging)[5]을 위하여 “개인정보”와 “저작권”을 근거로 삼아 데이터의 제공을 거부하는 경우가 있다.

“공공기관의 정보공개에 관한 법률”에서는 총 9개 항목에 해당하는 정보는 공개하지 않도록 규정하고 있다. 대부분이 국가 안보와 관련된 사항으로 인문학 데이터의 신청에서는 일반적으로 고려할 필요가 없다. 다만 성명, 주민등록번호 등과 같이 공개될 경우 사생활의 비밀 또는 자유를 침해할 우려가 있다고 인정되는 개인정보에 관한 사항은 근현대 역사학 부분에서는 아직 생존해 있는 인물 혹은 해당 인물의 후손들을 근거로 정보 제공을 불허하기도 한다. 하지만 일반적으로 신청되는 인문학 데이터는 인터넷을 통하여 서비스가 되고 있으며, 이 경우 개인정보에 대한 예외 조항 중 “나. 공공기관이 공표를 목적으로 작성하거나 취득한 정보로서 사생활의 비밀 또는 자유를 부당하게 침해하지 아니하는 정보”에 해당한다.

예를 들어서 국사편찬위원회의 한국근현대인물자료의 경우, 해당 자료에 수록된 인물들 중에 현재까지 생존해 있거나 해당 인물의 후손이 존재하고 있기에 원칙적으로는 개인정보보호의 범위에 포함된다. 그러나 한국근현대인물자료는 현재 국사편찬위원회의 한국사데이터베이스 서비스를 통하여 서비스가 되고 있기에 “나. 공공기관이 공표를 목적으로 작성하거나 취득한 정보로서 사생활의 비밀 또는 자유를 부당하게 침해하지 아니하는 정보”에 해당하며, 국사편찬위원회는 이를 제공할 의무가 발생한다.

“저작권”을 통한 정보 제공 거부는 일반적으로 대상 인문학 데이터의 종이 출판 저작권 문제 혹은 웹서비스 저작권만을 소유한 문제에서 비롯된다. 종이 출판 저작권 문제에 대해서는 공공재적인 지식의 유통 저해를 방지하기 위한 보조장치로 마련된 “교육·학술 또는 연구를 위하여 이용하는 경우”에 의한 비영리 목적 이용으로 반박 가능하다. 다만 웹서비스 저작권만을 가지고 있는 경우에는 원저작자에게 신청을 해야 하며, 원저작자가 공공기관이 아니라면 원칙적으로는 신청이 불가하다.

예를 들어서 국사편찬위원회의 조선왕조실록 원문에 대한 저작권은 국사편찬위원회가 가지고 있지만, 번역에 대한 저작권은 고전번역원이 가지고 있기에 번역본에 대한 공공데이터 신청은 고전번역원에 해야 한다. 또한 조선왕조실록 원문 이미지에 대한 저작권은 국가기록원이 가지고 있기에, 원문 이미지에 대한 공공데이터 신청은 국가기록원으로 해야 한다. 문제는 고전번역원의 문집총간의 경우, 원문과 번역문은 고전번역원측에 저작권이 있기에 공공데이터 신청에 문제가 없지만, 원문 이미지의 경우 원문 소장처로부터 웹서비스 용도로만 제공받았기 때문에 원문 소장처 중 민간 소장처에는 공공데이터 신청이 불가하다. 이에 따라서 서울대학교 규장각한국학연구원의 “구한말 관보”는 공공데이터 신청을 통하여 입수하지 못하고, 규장각한국학연구원에서 제공하는 인터넷 서비스[6]를 통하여 수집하였다.

공공데이터 신청의 구체적인 방법과 절차는 다음과 같다.


A. 필요 데이터 공개 여부 확인

현재 공공데이터는 공공데이터포털[7]에서 종합적으로 서비스하고 있다. 우선 자신이 필요한 정보가 있는지 해당 기관 혹은 데이터의 이름으로 검색을 진행한다. 예를 들어서 “조선왕조실록”으로 검색하면 국사편찬위원회의 “조선왕조실록”의 원문과 국역문 XML 데이터와 부가정보 인물 데이터 CSV 데이터 및 한국학중앙연구원의 “조선왕조실록 전문사전”의 XML 데이터가 제공된다. 일반적으로 이미 공개된 데이터는 로그인 없이도 다운로드가 가능하며, 이용 허락 범위도 제한이 없으며 무료이다. 다만 정확한 정보를 확인하기 위해서는 해당 데이터의 “상세정보”를 살펴보면 된다. 해당 데이터의 업데이트 주기, 비용 부과 유무, 등록일, 수정일, 차기 등록 예정일, 이용 허락 범위, 제공 형태 등의 정보를 확인할 수 있다.


B. 공공데이터 신청

만약 필요한 데이터가 공개되어 있지 않다면 공공데이터 포털에 로그인해야 한다. “참여마당 > 공공데이터 제공신청서 작성 > (중앙부처 및 공공기관) 제공신청서 작성” 혹은 “마이페이지 > 공공데이터 제공신청 > (중앙부처 및 공공기관) 제공신청서 작성”의 순서로 이동하면 신청서를 작성할 수 있다.

공공데이터 제공신청서는 크게 신청 내용과 신청인 정보로 구분되어 있다. 신청 내용에는 공공데이터 명칭, 기관명, 공공데이터 내용, 공공데이터 활용 목적을 적시하도록 되어 있다. 신청인 정보는 신청인 성명, 생년월일, 우편번호, 주소, 상세주소, 사업자등록번호, 전화번호, 전자우편주소, 자동등록방지로 구성되어 있다.

공공데이터 명칭에는 현재 웹서비스되고 있는 일반적인 명칭을 기입한다. 기관명은 해당 공공데이터를 보유중인 기관으로 기관의 이름을 검색하여 입력한다. 만약 공공기관이 분명한데 대상 기관이 존재하지 않는다면, 해당 기관의 상위기관을 검색하여 입력한다. “공공데이터의 내용”에는 신청을 하는 데이터에 대한 내용을 최대한 상세하게 기술한다. 예를 들어서 “현재 국사편찬위원회에서 제공 중인 “조선왕조실록”의 RAWDATA(원문, 번역문, 원본 이미지)를 제공 요청 드립니다.”라고 적시하여야 한다. 만약 정확하게 적시하지 않았을 경우 본인이 원하는 정보를 제공받지 못할 수도 있다.

“공공데이터 활용목적”은 공공데이터 활성화를 위한 토대 자료로의 활용을 위하여 기입을 요청하고 있다. 의무적인 기입 사항은 아니지만, 공공데이터법의 혜택을 받고 있는 만큼 본인의 활용 목적에 대해서 명확하게 기술하는 것을 권장한다. 최소한 “교육·학술 또는 연구를 위하여 이용”으로는 적시할 것을 권장한다.


//정보공개 신청 예시

기관명 : 교육부 국사편찬위원회
공공데이터 명칭 : 한국사 데이터베이스 정보공개 신청

공공데이터 내용 : 
현재 국사편찬위원회에서 제공 중인 한국사 데이터베이스 중에서 다음의 세부 제공 요청 목록에 있는 데이터베이스의 이미지 데이터를 제외한 RAWDATA를 제공 요청합니다. 또, RAWDATA에 대응하는 데이터베이스 설계 명세서 혹은 설계 파일(DTD, XSD)의 제공도 같이 요청드립니다. 

-- 정보제공 요청 데이터베이스 세부 목록
1) 삼국사기(원문/국역)
2) 삼국유사(원문/국역)
3) 해동고승전(원문/국역)
4) 한국고대금석문자료집
5) 역주 한국고대금석문
6) 한국고대목간자료
7) 고려사(원문/국역)
8) 고려사절요(원문/국역)
9) 조선왕조실록(원문)
* 번역본의 경우 국사편찬위원회가 아닌 한국고전번역원에 저작권이 있는 것으로 인지하고 있습니다. 다만 만약 번역본도 저작권상으로 제공 가능하다면 제공을 부탁드립니다. 
10) 비변사등록(원문/국역)
11) 각사등록
12) 각사등록 근대편
13) 직원록자료
14) 한국근현대인물자료
15) 일제감시대상인물카드
16) 한국근현대회사조합자료
17) 한국근현대잡지자료
18) 주한일본공사관기록 통감부문서
19) 중추원조사자료
20) 한국근대사자료집성

공공데이터 활용목적 : 
본 연구자는 한국학중앙연구원 한국학대학원 인문정보학 박사수료생으로, 박사 논문의 참고자료로 한국사데이터베이스를 활용하기 위하여 공공데이터베이스 정보공개를 신청합니다. 박사 논문의 제목은 “디지털 인사제도 사전 구축 및 활용 연구 : 1895-1910 근대 학교 자료를 중심으로”로 한국사 데이터베이스 중 근대 학교 관련 자료를 시맨틱 데이터베이스로 통합할 수 있는 방안을 모색하고자 합니다.


C. 공공데이터 신청 처리

원칙적으로는 요청을 받은 날로부터 10일 이내에 제공 여부를 결정하여야 하고, 부득이한 경우 10일의 범위 내에서 연장할 수 있지만, 실제로는 2주에서 4주의 시간이 소요된다. 만약 신청서에 문제가 있다면, 신청 기간에 해당 기관의 공공데이터 담당자가 전화 혹은 이메일로 연락을 해서 세부 사항을 확인한다. 공공데이터 제공이 결정되면 제공방법 및 절차를 통보해 주며, 동시에 공공데이터포털의 목록에 등록된다.

다만 공공데이터의 제공을 거부한다면, 거부 결정의 내용과 사유를 신청인과 행정자치부장관에게 통보하게 된다. 만약 신청인이 거부 내용과 사유에 문제가 있다고 생각한다면, 제공 거부 결정 통지를 받은 날로부터 60일 이내에 공공데이터 제공분쟁조정위원회에 제공거부 분쟁조정을 신청할 수 있다.[8]


주석

  1. 공공데이터의 제공 및 이용 활성화에 관한 법률(법률 제11956호, 2013.7.30. 제정)은 법률 제12844호(2014.11.19., 타법개정)에서 주무책임이 안전행정부장관에서 행정자치부장관으로 변동되었고, 법률 제13723호(2016.1.6., 일부개정)에서 공공기관과 민간의 중복 및 유사한 서비스를 통한 경쟁을 방지하여 공공데이터의 이용을 촉진하도록 일부 개정되었다. http://www.korealaw.go.kr/lsEfInfoP.do?lsiSeq=179039
  2. 공공데이터 제공 및 이용 활성화에 관한 법률(법률 제 13723호, 2016.1.6.) 제1장 총직 제1조(목적), http://www.korealaw.go.kr/lsEfInfoP.do?lsiSeq=179039
  3. 공공기관의 정보공개에 관한 법률(법률 제14185호, 2016.5.29., 일부개정), http://www.korealaw.go.kr/lsEfInfoP.do?lsiSeq=183576
  4. 저작권법(법률 제14634호, 2017.3.21., 일부개정), http://www.law.go.kr/lsEfInfoP.do?lsiSeq=192474
  5. 데이터 허깅(DATA Hugging)은 자신의 데이터를 공개하지 않고 내부적으로 가지고 있으려는 행위의 통칭이다.
  6. “구한말 관보”, 서울대학교 규장각한국학연구원 : http://e-kyujanggak.snu.ac.kr/home/index.do?idx=06&siteCd=KYU&topMenuId=206&targetId=379&gotourl=http://e-kyujanggak.snu.ac.kr/home/GAN/GAN_MAINLIST.jsp
  7. 공공데이터포털 : https://www.data.go.kr
  8. 만약 신청 전에 제공 거부가 될 것으로 의심되거나 불안하다면, 신청 전에도 관련 사항을 공공데이터제공분쟁조정위원회에 문의할 수 있다.