Journal List > J Korean Med Assoc > v.60(6) > 1043196

나, 이, 정, 강, 조, Rah, Lee, Jung, Kang, and Cho: 보건의료 공공데이터 개방 현황과 개방표준 준수 현황

Abstract

In the era of government 3.0, the availability of open government-owned public data and data sharing with the private sector are important. We surveyed the status of public data openness in the healthcare domain and of compliance with the standard open data format based on the “5 stars of linked data” model. We examined healthcare data on the Open Data Portal (https://www.data.go.kr). We also surveyed data on the websites of the public institutions and state administrative agencies that provided healthcare data on the Portal. In terms of data on the Portal, all public institutions except the National Medical Center, the Korea Institute of Science and Technology Information, and the Korea Environment Corporation were found to have provided data in the 3-stars format corresponding to the Public Data Open Standard Maintenance Guide. All data provided by state administrative agencies met the 3-stars format. Only 2 institutions (the Health Insurance Review & Assessment Service and the Korea Health Industry Development Institute) released data in the 3-stars format on their websites. Among the major state administrative agencies providing data on the Portal, none released data in the 3-stars format on their websites. Government-owned data should be provided in a standard format both on the Open Data Portal and on data-holders' websites to facilitate communication and collaboration. Considering the huge potential of linked healthcare data from a single national health insurance system, providing open data in compliance with the standard open format will promote the opening and sharing of public data.

서론

최근 우리나라 정부에서는 정부 3.0 정책 및 2013년 ‘공공데이터의 제공 및 이용 활성화에 관한 법률’ 시행에 따라 공공데이터를 공개하는 다양한 포털사이트가 늘어나면서, 행정기관 및 공공기관에서 공공데이터를 공개하는 사례가 증가하고 있다[1]. 정부 3.0은 공공정보를 개방 및 공유하여 맞춤형 서비스 제공과 일자리 창출을 지원하는 패러다임으로, 공공데이터 개방의 목적이 공공데이터의 민간 활용을 통한 비즈니스 활성화라는 점에서 정부 3.0 정책의 핵심 분야라고 할 수 있다[2]. 공공데이터란 공공데이터전략위원회에 의하면 ‘데이터베이스, 전자화된 파일 등 공공기관이 만들고 취득하여 관리하고 있는 광 또는 전자적 방식으로 처리된 자료 또는 정보’를 의미하며[3], 민간 및 산업 분야에서 공공데이터를 활용하여 효과적인 보건의료서비스를 제공하기 위해서는 공공데이터를 생산하는 기관에 분산되어 있는 데이터를 공개 및 연계하는 것이 필수적이다[45].
미국은 빅데이터를 활용한 정밀의학사업(Precision Medicine Initiative)의 일환으로 100만 명의 유전자정보와 건강정보를 연계한 데이터 구축사업을 추진 중이며, 영국도 10만 명의 유전체정보와 National Health Service 환자의 임상정보를 연계 중에 있다[67]. 국내에서도 정보통신기술을 활용하여 공공 부문과 민간 부문에서 다양한 빅데이터가 구축되고 있으나, 국가 차원에서 보건의료 데이터 구축과 활용에 앞서 있는 미국과 영국에 비해 우리나라는 정밀의학과 맞춤의료를 대비하기 위한 관심과 투자가 시급한 실정이다[8]. 정부 3.0 정책에 따라 공공기관별로 데이터 공개 의무를 확대하고 있고, 개인정보보호 관련 법제도의 개선을 추진 중임에도 불구하고, 공공데이터 개방과 연계를 위해 공개된 자료들은 아직 개인 수준의 데이터 연계가 원활하지 않아 공공데이터의 활용에 한계가 있고[59], 암 등록자료의 경우 일부 예외적인 경우 외에는 자료 사용이 제한적인 상황이다[8910]. 보건의료 빅데이터가 4차 산업혁명의 원동력으로 활용되기 위해서는 각 기관 보유 데이터를 다양한 수요에 맞추어 효과적이면서도 안전하게 통합, 연계하여 제공하는 것이 중요한 과제로 부각되고 있다.
공공분야에서의 빅데이터 활용에 따른 파급효과를 감안하면, 보건의료 빅데이터의 국가적 활용을 높이기 위해서는 보건의료 분야 행정기관 및 공공기관에서 보유하는 공공데이터의 개방과 데이터의 민간 활용의 활성화가 중요한 이슈이다[89]. 개방되는 데이터는 제공자(주로 공공기관)의 입장이 아니라 사용자(연구자, 정책가, 민간 등)가 편리하게 이용할 수 있도록 제공되어야 하지만 현재 공공데이터 포털에서의 데이터 공개는 이러한 목적을 달성하지 못하고 있다. 데이터 표준을 지키면서 공개수준을 높이는 것은 데이터의 재활용 가능성을 예측하는 척도가 될 수 있다[11]. 본 논문에서는 국내 보건의료 데이터 제공기관의 공공데이터 개방 현황과 제공되는 데이터의 표준 준수 현황과 수준을 파악함으로써 향후 각 기관들의 데이터 공개수준을 높이는데 기여하고자 한다.

방법

공공데이터포털(https://www.data.go.kr)에서 행정기관 및 공공기관이 생성한 공공데이터를 통합적으로 제공하는 공공데이터 가운데 보건의료로 분류되는 공공데이터의 개수를 파악하여 제공 현황과 서비스 유형을 조사하였다. 제공되는 공공데이터의 개방표준 준수와 그 수준을 조사하고자, 개방된 공공데이터의 파일유형을 Berners-Lee의 ‘Five-star deployment of open data’ 모델을 Washington과 Morar를 참고하여 분류하였다(Table 1) [1112]. 공공데이터포털뿐 아니라, 보건의료 분야 데이터 제공기관의 웹사이트에 공개되는 데이터 개방 현황도 분석대상으로 하였다. 이를 위해 공공데이터포털에 보건의료로 분류되는 공공데이터를 제공하는 주요 해당 기관의 웹사이트에 공개되는 공공데이터의 제공 현황과 서비스 유형을 조사하였고, 기관 웹사이트에 공개된 데이터의 파일 유형을 변형된 ‘Five-star deployment of open data’ 모델을 활용하여 분류하였다.
공공데이터포털에 개방된 보건의료 분야 공공데이터를 제공기관별로 현황을 파악한 결과, 자치행정기관(지방자치단체 및 소속기관), 공공기관(중앙부처 산하기관), 국가행정기관(중앙행정기관 및 부속기관) 순으로 공공데이터를 제공하고 있다(Table 2). 이 가운데, 개방된 공공데이터의 파급효과를 감안하여, 자치행정기관을 제외한 공공기관과 국가행정기관에서 개방하는 공공데이터를 대상으로 추후 분석을 수행하였다. 보건의료로 분류되는 공공데이터를 공공데이터포털에 제공하는 공공기관(Table 3)과 국가행정기관(Table 4) 가운데, 산술 평균 이상의 공공데이터를 제공하는 기관을 주요 공공기관(Table 5) 및 주요 국가행정기관(Table 6)으로 정의하였으며, 주요 국가행정기관에서 보건복지부 기관 외의 국가행정기관은 제외하였다.

결과

1. 공공데이터포털에서 제공되는 공공기관별 보건의료 분류 공공데이터 현황

포털에 개방된 공공기관별 보건의료 분야 제공 데이터 현황 및 서비스 유형을 조사한 결과, 보건의료분야로 공공데이터를 공개한 공공기관은 국민건강보험공단(National Health Insurance Service), 건강보험심사평가원(Health Insurance Review & Assessment Service), 한국보건산업진흥원(Korea Health Industry Development Institute) 등의 순으로, 130건의 개방 데이터 가운데 94건(72%)이 다운로드 형태로 제공되었다(Table 3). 공공데이터를 제공한 공공기관의 제공 파일형식은 111건(85%)이 3 stars, 16건(12%)이 2 stars, 2건(2%)이 1 stars, 1건(1%)이 0 stars로(Figure 1), 보건의료 분야 데이터를 제공한 공공기관 가운데 국립중앙의료원(National Medical Center), 한국과학기술정보연구원(Korea Institute of Science and Technology Information), 한국환경공단(Korea Environment Corporation)을 제외한 모든 공공기관이 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일을 제공하였다(Figure 1) [13].

2. 공공데이터포털에서 제공되는 국가행정기관별 보건의료 분류 공공데이터 현황

포털에 개방된 국가행정기관별 보건의료 분야 제공 데이터 현황 및 서비스 유형에서는 보건의료 분야로 공공데이터를 제공한 국가행정기관은 질병관리본부(Centers for Disease Control & Prevention), 보건복지부(Ministry of Health and Welfare), 국립재활원(National Rehabilitation Center) 등의 순으로, 107건의 개방 데이터 가운데 81건(76%)이 다운로드 형태로 제공되었다(Table 4). 공공데이터를 제공한 국가행정기관의 제공 파일형식은 80건(75%)이 3 stars, 23건(21%)이 2 stars, 3건(3%)이 1 stars, 1건(1%)이 0 stars로, 보건의료 분야 데이터를 제공한 모든 국가행정기관이 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일을 제공하였다(Figure 2).

3. 주요 공공기관 웹사이트에서 제공되는 공공데이터 현황

보건의료 분야로 공공데이터를 제공한 주요 공공기관의 기관 웹사이트에 제공된 1,216건의 데이터 가운데 1,183건 (97%)이 다운로드 형태로 제공되었고, 기관 웹사이트에 제공되는 데이터의 수는 한국보건산업진흥원, 한국보건의료인 국가시험원(Korea Health Personnel Licensing Examination Institute), 한국국제보건의료재단(Korea Foundation for International Healthcare), 한국보훈복지의료공단(Korea Veterans Health Service), 건강보험심사평가원, 국립암센터(National Cancer Center), 국민건강보험공단 등의 순으로, 한국보건산업진흥원이 839건으로 가장 많은 전체의 69%, 한국보건의료인국가시험원이 107건(9%), 한국국제보건의료재단이 86건(7%)을 차지하였다(Table 5). 주요 공공기관의 기관 웹사이트에 제공되는 데이터의 제공 파일형식은 868건(71%)이 3 stars, 176건(14%)이 2 stars, 126건(10%)이 1 stars, 46건(4%)이 0 stars로 3 stars 형식의 파일이 가장 많지만, 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일을 제공하는 기관은 한국보건산업진흥원과 건강보험심사평가원 2개 기관에(29%) 불과하였다(Figure 3).

4. 주요 국가행정기관 웹사이트에서 제공되는 공공데이터 현황

보건의료분야로 공공데이터를 제공한 주요 국가행정기관(질병관리본부, 보건복지부, 국립재활원)의 기관 웹사이트에 제공된 1,284건의 데이터 가운데 1,248건(97%)이 다운로드 형태로 제공되었고, 기관 웹사이트에 제공되는 데이터의 수는 질병관리본부(817건, 64%), 보건복지부(449건, 35%), 국립재활원(18건, 1%)순으로, 질병관리본부가 가장 많았다(Table 6). 주요 국가행정기관(질병관리본부, 보건복지부, 국립재활원)의 기관 웹사이트에 제공되는 데이터의 제공 파일형식은 1,045건(81%)이 2 stars, 223건(17%)이 1 stars, 16건(1%)이 0 stars로, 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일을 제공하는 행정기관은 없었다(0%) (Figure 4).

고찰

보건의료 분야의 공공데이터 제공기관들의 데이터 공유를 염두에 둔 데이터 개방현황을 파악하고자, 본 논문에서는 국내 보건의료 데이터 제공기관의 공공데이터 개방 현황과 개방된 데이터의 파일형식에 따른 표준 준수 현황을 분석하였다. 공개되는 데이터의 파일형식은 공공데이터의 개방과 공유, 소통과 협력을 고려한 형식이어야 하므로, 행정자치부에서 권고하는 공공데이터 개방표준 정비가이드에 활용된 웹, 데이터의 창시자로 잘 알려진 Berners-Lee가 제안한 ‘Five-star deployment of open data’ 모델에 근거하였다[1213]. 국내 공공데이터 개방 평가지표와 관련하여 Berners-Lee의 ‘Five-star deployment of open data’ 모델에 따른 공개 데이터의 파일형식에 대한 분석은 보고된 바 있으나[1415], 보건의료 분야의 공공데이터에 대해서는 보고된 바가 없다.
분석결과, 공공데이터포털에 보건의료 분야 공공데이터를 제공한 공공기관 가운데, 일부 기관(국립중앙의료원, 한국과학기술정보연구원, 한국환경공단)을 제외한 모든 공공기관과 모든 국가행정기관이 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일형식을 제공하였다. 그러나, 주요 공공기관 가운데(건강보험심사평가원, 국립암센터, 국민건강보험공단, 한국국제보건의료재단, 한국보건산업진흥원, 한국보건의료인국가시험원, 한국보훈복지의료공단), 행정자치부의 공공데이터 개방표준 정비가이드에서 권고하는 오픈 포맷 3단계에 해당하는 파일형식을 해당기관 웹사이트에 제공하는 기관은 한국보건산업진흥원과 건강보험심사평가원 2개 기관에(29%) 불과했고, 주요 국가행정기관 가운데(질병관리본부, 보건복지부, 국립재활원), 행정자치부에서 권고하는 오픈 포맷 3단계에 해당하는 파일형식을 기관 웹사이트에 제공되는 행정기관은 없었다.
정부3.0 시대에 개방과 공유, 소통과 협력을 위해 공개되는 공공데이터의 파일형식은 데이터 공유 측면에서 중요한 요소로서, 데이터 활용에 대한 데이터 제공기관의 의도를 반영할 뿐만 아니라, 데이터 파일양식에 따라서는 공공데이터 사용자에게 장애물로 작용하기도 한다[1116]. 공공데이터포털에 보건의료 분야 공공데이터를 제공한 주요 공공기관 및 국가행정기관 가운데, 행정자치부에서 권고하는 오픈 포맷 3단계에 해당하는 파일형식으로 데이터를 기관 웹사이트에 제공하는 기관의 비율이 매우 저조한 데, 이로 인한 문제점으로 기관별로 다른 데이터의 제공형식에 따른 데이터 활용의 어려움을 들 수 있다[17]. 이에 대한 개선책으로, 공공데이터에 대한 국가 차원의 개방표준의 제정뿐 아니라, 보급 및 활용 편리성을 고려해야 하며, 특히 데이터 개방표준의 준수율을 높여야 하고, 개방표준에 따라 공공데이터를 생산, 관리, 유통 및 활용하는지 관리해야 한다[1117]. 이를 위해서는 개방표준 활용 현황에 대한 조사, 분석과 함께 지속적인 관리 계획이 필요하다. 우리나라의 보건의료 의료수준이 높고, 단일건강보험체계 운영에 따른 보건의료 분야 공공데이터의 연계 가능성이 높은 점을 감안하면, 보건의료 관련 기관들이 데이터 연계를 염두에 두고, 개방하는 공공데이터의 개방표준을 준수할 경우, 원활한 공공데이터 연계 및 데이터의 민간 활용에 괄목할 만한 기여를 할 수 있을 것으로 기대된다[9].
뿐만 아니라, 보건의료 분야의 공공데이터 활용 사업은 데이터를 보유한 기관별로 추진되고 있어, 별도 법으로 데이터 연계의 법적 기준이 제공되는 예외적인 경우를 제외하고는 기관 간 데이터 연계 장벽이 높아서 보건의료 분야 기관 간 데이터 통합사업 추진이 어려운 상황이다[8]. 정밀의료를 위한 공익적 목적으로 개인 수준의 연계 데이터를 제공하기 위해서는 기관 간 자료를 통합하고 연계하는 과정에 환자 식별화 과정이 불가피한데(예: 스코틀랜드의 Trusted Third Party Indexing), 현행 개인정보보호 관련 법제도는 암호화 및 비식별화를 전제로 하고 있어 타 기관이 보유하고 있는 데이터와 연계 과정을 차단하고 있다[81819]. 공익 목적의 보건의료 분야 빅데이터의 연계 구축 및 활용을 예외적으로 허용할 수 있는 법적 근거 마련이 시급하다.

Peer Reviewers' Commentary

본 논문은 빅데이터라는 방대한 자료 분석을 통해 미래, 보건의료의 미래를 예측하고 발전시킬 수 있는 기반을 마련하려는 정부 3.0 정책에 발맞추어 국내 보건의료 데이터 제공 기관의 공공데이터 개방 현황과 제공되는 데이터 표준 준수 현황을 보여주고 있다. 보건의료 분야에서는 국내 공공데이터 개방 평가지표와 관련하여 Berners-Lee의 ‘Five-star deployment of open data’ 모델에 따른 공개 데이터의 파일 형식에 대한 분석은 보고된 바가 없으나 본 논문에서는 이에 대한 분석을 통해 나아가야할 방향을 제시하고 있다. 결과를 볼 때 공공데이터를 제공한 주요 공공기관 및 국가행정기관 가운데, 행정자치부에서 권고하는 오픈 포맷 3단계에 해당하는 파일 형식으로 데이터를 기관 웹사이트에 제공하는 기관의 비율이 저조함을 밝히고, 이로 인한 문제점으로 기관별로 다른 데이터의 제공 형식에 따른 데이터 활용의 어려움에 대한 문제제기를 통해 개선방안을 논의할 수 있는 장을 마련하였다고 판단된다.
[정리: 편집위원회]

Figures and Tables

Figure 1

Five-star file format of open data in health care category presented by public institutions at open data portal (https://www.data.go.kr) in Korea.

jkma-60-506-g001
Figure 2

Five-star file format of open data in health care category presented by state administrative agencies at open data portal (https://www.data.go.kr) in Korea.

jkma-60-506-g002
Figure 3

Five-star file format of open data presented at the websites of major public institutions in health care field in Korea.

jkma-60-506-g003
Figure 4

Five-star file format of open data presented at the websites of major state administrative agencies in health care field in Korea.

jkma-60-506-g004
Table 1

File formats in each star category

jkma-60-506-i001

The 5-star deployment scheme of Berners-Lee was modified according to Washington and Morar [1112].

Table 2

Overview of open data in healthcare category presented at Open Data Portal (https://www.data.go.kr) in Korea

jkma-60-506-i002

Accessed in January 9, 2017.

API, application programming interface.

Table 3

Current status and service type of open data in healthcare category provided by public institutions at Open Data Portal (https://www.data.go.kr) in Korea

jkma-60-506-i003

Accessed in January 9, 2017.

LOD, Linked Open Data.

Table 4

Current status and service type of open data in healthcare category provided by state administrative agencies at Open Data Portal (https://www.data.go.kr) in Korea

jkma-60-506-i004

Accessed in January 9, 2017.

Table 5

Current status and service type of open data presented at the websites of major public institutions in healthcare field in Korea

jkma-60-506-i005

Accessed in January 25, 2017.

Table 6

Current status and service type of open data presented at the websites of major state administrative agencies in healthcare field in Korea

jkma-60-506-i006

Acknowledgement

This research was supported by a grant of the Korea Health Technology R&D Project through the Korea Health Industry Development Institute (KHIDI), funded by the Ministry of Health & Welfare, Republic of Korea (HI16C1094).

References

1. Yi HJ, Nam YJ. A study on revitalizing the use of Korean public data: focused on linked open data strategy. J Korean Soc Inf Manag. 2014; 31:249–266.
crossref
2. Kwon SA, Baek SH, Lee JY. Current domestic public open data status and case analysis. Proc Korea Soc Inf Manag. 2015; 8:37–45.
3. Open Data Strategy Council. Open data [Internet]. Seoul: Open Data Strategy Council;2013. cited 2017 May 28. Available from: http://www.odsc.go.kr/user/nd29024.do.
4. Bradley CJ, Penberthy L, Devers KJ, Holden DJ. Health services research and data linkages: issues, methods, and directions for the future. Health Serv Res. 2010; 45:1468–1488.
crossref
5. Park BJ. Application of big data for public health. J Korean Med Assoc. 2014; 57:383–385.
crossref
6. Shah SH, Arnett D, Houser SR, Ginsburg GS, MacRae C, Mital S, Loscalzo J, Hall JL. Opportunities for the cardiovascular community in the precision medicine initiative. Circulation. 2016; 133:226–231.
crossref
7. Siva N. UK gears up to decode 100,000 genomes from NHS patients. Lancet. 2015; 385:103–104.
crossref
8. Kang HC. National-level use of health care big data and its policy implications. Health Welf Policy Forum. 2016; 238:55–71.
9. Ko MJ, Lim TH. Use of big data for evidence-based healthcare. J Korean Med Assoc. 2014; 57:413–418.
crossref
10. Bae J, Jee S, Nam M, Kim S, Park J, Choi H. Round-table conference of data utilization for public good healthcare study. Seoul: National Evidence-based Healthcare Collaborating Agency;2011.
11. Washington AL, Morar D. Open for whom? An overview of Data.Gov file formats [Internet]. Rochester: SSRN;2016. cited 2017 May 28. Available from: http://dx.doi.org/10.2139/ssrn.2770925.
12. Berners-Lee T. Linked data 5-star open data scheme 2006 [Internet]. [place unknown]: 5 Star Open Data;cited 2017 May 28. Available from: http://5stardata.info/en/.
13. Ministry of Interior. Public open data standard maintenance guide. Seoul: Ministry of Interior;2016.
14. Kim JH. Service level evaluation for open data portal analysis [dissertation]. Cheongju: Chungbuk National University;2016.
15. Kim JH, Cho SW, Lee KH, Cho WS. Service level evaluation through measurement indicators for public open data. Korean J Bigdata. 2016; 1:53–60.
16. Seo H, Myeong S. Policy alternatives for public data disclosure by local government: focusing on operation of public data portal site. J Korean Assoc Reg Inf Soc. 2015; 18:1–27.
17. Kang HJ. Policy challenges for the efficient use of public data. STEPI Insight. 2014; (156):1–30.
18. Kang HC, Choi YJ, Lee SW, Park HW, Shin Y, Lee S. Study on the basic plan for utilizing healthcare big data. Sejong: Korea Institute for Health and Social Affairs;2015.
19. Pavis S, Morris AD. Unleashing the power of administrative health data: the Scottish model. Public Health Res Pract. 2015; 25:e2541541.
crossref
TOOLS
ORCID iDs

HyungChul Rah
https://orcid.org/0000-0002-2015-1979

Kyung-Hee Lee
https://orcid.org/0000-0001-5110-123X

Seung-Hyun Jung
https://orcid.org/0000-0002-3018-5099

Gil-Won Kang
https://orcid.org/0000-0003-0222-1870

Wan-Sup Cho
https://orcid.org/0000-0002-4395-1979

Similar articles