본문 바로가기
IT 둘러보기

개방형 데이터 허브 핵심 기술

by 날고싶은커피향 2023. 9. 6.
반응형

1. 개방형 데이터 허브 핵심 기술 V2.pdf

  1. G‐09 - 1 - <별지 3> 기술이전계획서 부속자료 (기술명 : 개방형 데이터 허브 핵심 기술 v2 )
  2. G‐06 - 2 - 1. 기술이전 개요 가. 기술이전 개요 ╶ 본 기술은 국내외 공공, 민간, 개인 간에 다양한 데이터를 공유하고 활용할 수 있도록, 데이터 카탈로그 표준인 W3C DCAT(Data Catalog Vocabulary) v2 기반의 데이터 관 리 및 공유 기술과 클라우드 기반 분석 개발, 배포, 운영 환경을 제공하는 개방형 데 이터 허브 핵심 기술임 ╶ 본 기술은 데이터 관리 인프라, 클라우드 기반 분석·개발 환경, 의료 데이터 관리 기술 등 3개의 세부 기술로 구성되며, 이 중에서 데이터 관리 인프라는 데이터 관리/유통 관련 표준을 관리하는 오픈 데이터 참조모델 및 데이터 수집·배포 등의 기능으로 세분화됨 ① 데이터 관리 인프라 가) 오픈 데이터 참조모델 관리 - 오픈 데이터 참조모델은 공공, 민간에서 생성되는 각종 데이터의 체계적인 관리, 유통, 활용에 필요한 거버넌스 요소들의 명세와 요소들 간의 연관 관계를 기술한 논리 모델로서 데이터 관리 인프라 구축의 기반이 됨 - 오픈 데이터 참조모델은 W3C DCAT(Data Catalog Vocabulary) 모델을 기반으로 데이터의 분류체계, 카테고리 및 프로파일과 데이터맵 관리 기능을 제공함 - 공공, 민간 등 다양한 분야의 데이터를 분류체계와 카테고리로 분류하여 데이 터셋의 다양한 속성정보(메타데이터)를 관리하는 프로파일링 기능을 제공함. - 데이터의 다양한 속성정보 및 연관정보 기반의 검색 기능을 제공함 - 데이터 소유자(조직, 개인 등)의 데이터셋 및 유통정책 관리 기능 제공함 나) 데이터 수집·배포 기술 - 다양한 메타데이터 정보로 기술된 데이터셋들을 RDF 형식의 데이터맵으로 생 성하고 수집하는 기능을 제공함 - W3C DCAT 기반의 데이터맵 (카탈로그)을 생성하고 배포하며, 외부 데이터셋 정보를 수집하며, 국내외 데이터 포털에서 개방하는 데이터셋 검색 기능을 제 공함 ② 클라우드 기반 분석·개발 환경 - 클라우드 컴퓨팅 인프라를 관리하며, 데이터 분석가와 IT 개발자가 요청하는 CPU, 메모리, 볼륨 등의 컴퓨팅 자원을 조직 및 사용자별로 할당하고 모니터링 하는 기능을 제공함 ③ 의료 데이터 관리 - 본 기술을 의료 도메인에 적용하여 개발한 데이터허브 프로토타입으로서 HL7
  3. G‐09 - 3 - FHIR 오픈소스와 연동하여 환자 의료 데이터를 관리하고, 환자의 동의를 통해 인가된 데이터 조회 기능을 제공함 <그림> 개방형 데이터 허브의 기술 구성도 나. 기술이전의 목적 및 필요성 ╶ 공공, 민간 전 산업 분야에서 데이터에 대한 관심과 수요가 급속히 증가하고 있으나, 대부분의 기관들이 독자적으로 데이터를 수집, 관리하므로 상호간 데이터 소재 파악 이 어렵고 활용도가 저조한 편임. ╶ 특히 중소/영세 기업에게 데이터와 전문 인력 확보, 분석 시스템 구축과 운영 부담 으로 빅데이터, 인공지능 등의 최신 ICT 기술 활용에 장애가 되고 있음. ╶ 향후 데이터를 기반으로 산업 간 융합이 활발히 추진되고 미래 신산업 창출의 계기 가 될 것으로 예측되므로, 여러 분야의 데이터를 체계적으로 관리하며 상호 검색과 공유 및 분석, 활용을 지원하는 개방형 데이터 허브 기술이 중요성이 점차 커지고 있음. 다. 기술의 특징 및 장점 ╶ 국내외 데이터 포털에서 널리 사용 중인 W3C DCAT(Data Catalog Vocabulary) V2 모델 기반의 데이터 인프라, 데이터맵(카탈로그) 공유, 데이터 유통 기능을 제공하는 데이터 산업 전반에 필요한 핵심 기술임. ╶ 데이터의 속성, 품질, 이력 등 다양한 메타데이터 정보를 제공하여 데이터 검색 정확 도와 활용성을 높일 수 있도록 도메인별 분류체계와 카테고리를 구성하고 카테고리 별로 메타데이터를 확장가능한 프로파일 기능을 제공함. ╶ 데이터 소유자 또는 기관이 직접 데이터를 등록하고 유통을 관리하며, 클라우드 환 경에서 접근이 가능한 데이터를 분석하고 분석 결과의 재배포가 가능함.
  4. G‐06 - 4 - ╶ 조직과 사용자별로 컴퓨팅 자원을 할당하고 가용량/사용량 모니터링 기능을 제공함. ╶ 새로운 기능 확장과 교체 등 커스터마이징이 용이한 모듈형 구조의 SW 프레임워크 로서, 신속한 데이터 허브 개발이 가능함. 라. 적용분야 및 기대효과 ╶ 국내외 다양한 분야 및 각종 산업에서 발생하는 방대한 데이터를 검색하고 공유와 활 용을 지원하는 데이터 인프라 기술로서 지속적인 고부가가치 서비스 창출에 기여함. ╶ 필요한 모듈을 쉽게 확장하고 교체할 수 있도록 모듈화된 데이터 허브 프레임워크로 서, 각 기능의 커스터마이징과 추가 기능 확장을 통해 다양한 요구사항에 맞춤화된 데이터 허브를 빠르게 개발할 수 있음. ╶ 여러 사용자들이 개발하고 등록한 데이터, 알고리즘, 분석 컴포넌트들을 축적·공개하고 재사용을 지원함으로서 데이터 산업의 오픈 생태계 활성화에 기여할 것으로 기대됨 ╶ 본 기술은 클라우드 환경에서 누구사 쉽게 데이터를 등록, 관리하며 유통, 활용을 지 원하는 데이터 허브 기술로서, 산업 전반의 데이터 플랫폼, 범용적인 데이터 유통 및 분석 마켓플레이스 구축 등 광범위하게 적용 가능함 <그림> 개방형 데이터 허브 운영 개념도
  5. G‐09 - 5 - <그림> 데이터 허브 프레임워크 활용 개념도 <그림> 환자의 의료 데이터 조회 화면
  6. G‐06 - 6 - 마. 기술성숙도 단계 : ( 6 ) 단계 ※ 기술성숙도(TRL : Technology Readiness Level) 구 분 단계 정 의 세 부 설 명 기초 연구 단계 1 기초 이론/실험 ∘기초이론 정립 단계 2 실용 목적의 아이디어, 특허 등 개념정립 ∘기술개발 개념 정립 및 아이디어에 대한 특허 출원 단계 실험 단계 3 실험실 규모의 기본성능 검증 ∘실험실 환경에서 실험 등으로 기본성능이 검증될 수 있는 단계 ∘개발하려는 부품/시스템의 기본 설계도면을 확보하는 단계 4 실험실 규모의 소재/부품/시스템 핵심성능 평가 ∘시험샘풀을 제작하여 핵심성능에 대한 평가가 완료된 단계 ∘3단계 결과 중에서 최적의 결과를 선택하려는 단계 ∘컴퓨터 모사가 가능한 경우 최적화를 완료하는 단계 시작품 단계 5 확정된 소재/부품/ 시스템 시작품 제작 및 성능 평가 ∘실험실 시작품 제작 및 성능 평가가 완료된 단계 ∘실제 제작한 시작품 샘플은 1~수개 미만인 단계 ∘경제성을 고려하지 않고 기술의 핵심성능으로만 볼 때, 실제로 판매가 될 수 있는 정도로 목표 성능을 달성한 단계 6 파일롯 규모 시작품 제작 및 성능 평가 ∘파일롯 규모(복수 개~양산규모의 1/10정도)의 시작품 제 작/평가 단계 ∘파일 롯 규모 생산 품에 대해 생 산량, 생 산용량 , 불량률 등 제 시 ∘파일롯 생산을 위한 대규모 투자가 동반되는 단계 ∘생산기업이 자체 현장테스트를 실시하여 목표 성능을 만 족시킨 단계 ∘성 능 평 가 결 과 에 대 해 가 능 하 면 공 인 인 증 기 관 의 성 적 서 확 보 실용화 단계 7 신뢰성평가 및 수요기업 평가 ∘실제 환경에서 성능 검증이 이루어지는 단계 ∘수요업체에서 직접 파일롯 시작품을 현장 평가(성능, 신 뢰성 평가) ∘가능하면 인증기관의 신뢰성 평가 결과 제출 8 시제품 인증 및 표준화 ∘표준화 및 인허가 취득 단계 사업화 9 사업화 ∘본격적인 양산 및 사업화 단계 ∘6-시그마 등 품질관리가 중요한 단계
  7. G‐09 - 7 - 2. 기술이전 내용 및 범위(세부기술로 이전할 경우에 한하여 세부기술별로 작성) 가. 기술이전의 내용 A. 세부기술1 : 데이터 관리 인프라 - 테넌트(조직 및 사용자) 인증 및 인가 관리 기술 - W3C DCAT(Data Catalog Vocabulary) V2 기반의 데이터 관리체계 . 각 도메인(의료, 제조, 행정 등)에 대해 여러 개의 분류체계를 정의하고 관리할 수 있음. . 각 분류체계는 계층적(트리구조)으로 세분화된 카테고리로 구성되며, 각 카테고리는 해당 카테고리에 속하는 데이터 속성을 표현하는 메타데이터 항목으로 정의된 프 로파일과 매핑됨 - W3C DCAT V2을 기반으로 프로파일 정보를 포함하는 데이터맵 (카탈로그) 생성, 배포 기술 - 데이터허브 간 데이터맵 수집, 교환 기술 - 데이터셋의 메타데이터 정보와 원본 파일, 다양한 엔드포인트로 제공되는 데이터 서비스, 분석모델(알고리즘, 분석워크플로우 등)의 등록, 배포, 삭제 등의 관리 및 권한 기반 접근제어, 유통 기술 - 외부 데이터셋의 통합 검색 및 필터링 기술 - 외부 기관의 다양한 플랫폼들과의 데이터 상호공유, 검색을 지원하기 위한 데이터 속성정보(메타데이터 항목) 간 매핑을 통한 DCAT RDF 형식의 데이터맵 생성 기술 B. 세부기술2 : 클라우드 기반 분석·개발 환경 - 클라우드 컴퓨팅 인프라 운영관리 및 테넌트 기반 자원 할당관리 기술 - 샌드박스 기반 실행환경 생성 및 실행 관리 기술 - 다양한 데이터 스토리지 연동 개발 지원 (Hadoop, HBase, RDB 등) - 분석 컴포넌트(알고리즘, 노트북, 분석워크플로우 등) 개발환경 프로비저닝 기술 - 분석 컴포넌트(알고리즘, 노트북, 분석워크플로우 등) 등록, 배포관리 기술 C. 세부기술3 : 의료 데이터 관리 - FHIR 기반 의료 데이터 허브 프로토타입 - 의료 기관의 테넌트(의사, 간호사, 환자 등) 관리 및 의료 데이터 인가 관리 기술 나. 기술이전의 범위 A. 세부기술1 : 데이터 관리 인프라
  8. G‐06 - 8 - o 동작환경 - 지원 하드웨어 모델 : x86 기반의 서버 - 지원 운영체제 : ubuntu 16.04.5 LTS - 활용 공개 SW: nodejs, lerna, rimraf, pkg, wait-on, feathersjs, aws-sdk, axios, camelcase, camelcase-keys, compression, config, cors, crypto-random-string, date-fns, dockerode, elasticsearch, fast-csv, forever, fs-extra, helmet, http-proxy-middleware, i18next, influx, joi, kafkajs, keycloak-admin, kubernetes-client, multer, pg, sequelize, serve-favicon, umzug, uuid, winston, pg, influx, sequelize, sequelize-auto, postgreSQL, Keycloak, Apache Jena, Apache Drill, Apache Airflow, minio, Apache Hadoop, Apache HBase, Hasura, rdflib,, node-schedule, Springboot, tomcat, Apache Common, MyBatis, Java, Maven o 기능 - 데이터 분류체계 등록, 수정, 삭제, 조회 기능 - 분류체계의 카테고리 등록, 수정, 삭제, 조회 기능 - 각 카테고리의 데이터 속성정보(메타데이터)을 확장한 프로파일 관리 기능 - 사용자 통합 인증(SSO) 기능 - 테넌트(조직/사용자) 정보 등록, 수정, 삭제, 조회 기능 - 테넌트 활동 로그 관리 기능 - 데이터셋 구매 정보 등록, 삭제, 조회 및 외부 결제 모듈 연동 기능 - 카탈로그 등록, 수정, 삭제, 조회 기능 - 데이터셋, 배포파일 및 데이터서비스의 접근권한 등록, 수정, 삭제, 조회 기능 - DCAT V2 RDF 형식의 데이터맵 생성 기능 - 이종 플랫폼의 메타데이터 정보 매퍼 기반 DCAT V2 RDF 생성 기능 - 데이터셋을 상호 교환하는 외부 데이터 소스 등록, 수정, 삭제, 조회 기능 - 데이터 수집(하베스팅) 및 작업 관리 기능 B. 세부기술2 : 클라우드 기반 분석·개발 환경 o 동작 환경 - 지원 하드웨어 모델 : X86 기반의 서버 - 지원 운영체제 : ubuntu 16.04.5 LTS - 활용 공개 SW: nodejs, lerna, rimraf, pkg, wait-on, feathersjs, aws-sdk, axios, camelcase, camelcase-keys, compression, config, cors, crypto-random-string, date-fns, dockerode, elasticsearch, fast-csv, forever, fs-extra, helmet,
  9. G‐09 - 9 - http-proxy-middleware, i18next, influx, joi, kafkajs, keycloak-admin, kubernetes-client, multer, pg, sequelize, serve-favicon, umzug, uuid, winston, pg, influx, sequelize, sequelize-auto, rdflib, postgreSQL, Keycloak, Apache Jena, Apache Drill, Apache Airflow, minio, Apache Hadoop, Apache HBase, Hasura, kubernetes, openstack o 기능 - 테넌트(조직/사용자)별 클라우드 컴퓨팅 자원 할당, 회수, 수정, 조회 기능 - 개발환경 (Eclipse, Jupyter, R 등) 등록, 수정, 삭제, 조회 기능 - 다양한 데이터 스토리지 (Hadoop, HBase, RDB 등) 연동 지원 기능 - 분석 컴포넌트 (오픈 API, 노트북, 분석 워크플로우 컴포넌트 등) 등록, 수정, 삭제, 조회 기능 - 샌드박스 실행환경 관리 (실행, 삭제, 조회, 중지, 정지) 기능 - 물리머신, Hypervisor, 가상머신, 클러스터, 컨테이너 조회 기능 C. 세부기술3 : 의료 데이터 관리 o 동작 환경 - 지원 하드웨어 모델 : X86 기반의 서버 - 지원 운영체제 : ubuntu 16.04.5 LTS - 활용 공개 SW: hapi-fhir, SpringBoot, Java, Maven, Axios, express, forever, sequelize, vue, vuetify, vuex, koa, fhir-kit-client, joi, pg, uuid, moment, apexchart o 기능 - FHIR 기반 의료 데이터 허브 프로토타입 - 환자 목록 및 상세 조회 기능 - 환자의 검사 목록 및 검사 내용 조회 기능 - 테넌트(의사, 간호원, 환자 등) 별 데이터 인가 관리 기능 다. 특허 A. 세부기술1, 세부기술2
  10. G‐06 - 10 - 관리번호 출원번호 출원일 등록번호 등록일 발명명칭 PR20201178 KR 2020-01707 04 2020-12- 08 - - 오픈 데이터 생태계를 위한 데이터 프로파일 관리 및 공유 방법 PR20201182 KRa 2021-00452 14 2021-04- 07 - - 메타데이터 관리 및 수집을 위한 장치 및 방법 B. 세부기술3 : 의료 데이터 관리 관리번호 출원번호 출원일 등록번호 등록일 발명명칭 PR20201086 KRa 2021-0045 202 2021-04- 07 - - 의료 데이터 접근 관리를 위한 장치 및 방법 PR20201178 KR 2020-017 0704 2020-12- 08 - - 오픈 데이터 생태계를 위한 데이터 프로파일 관리 및 공유 방법 PR20201182 KR 2021-004 5214 2021-04- 07 - - 메타데이터 관리 및 수집을 위한 장치 및 방법 * 오픈소스(GPL V3.0) 정책에 의해 특허에 대해 권리를 주장하지 않고 무상으로 실시하되, 특허의 변경이 있을 경우 특허 침해로 간주함
  11. G‐09 - 11 - 라. 기술문서 A. 세부기술1 : 데이터 관리 인프라 관리번호 기술자료 명칭 비고 4130-2021-00329 플랫폼 연동 방법 및 API 규격서 V2 4130-2021-00330 플랫폼 데이터베이스 설계서 V2 4130-2021-00331 데이터허브 포털 UI 설계서 4130-2021-00332 오픈데이터 참조모델 UI-API 매핑 설계서 4130-2021-00343 W3C DCAT 표준 설명서 4130-2020-00317 데이터맵 퍼블리셔 기능 및 구조 설명서 4130-2020-00413 시험절차서 및 시험결과보고서 v1 - 데이터 하베스팅 4130-2020-00445 개방형 데이터 허브 기술이전 요구사항 정의서 v1.3 B. 세부기술2 : 클라우드 기반 분석·개발 환경 관리번호 기술자료 명칭 비고 4130-2021-00329 플랫폼 연동 방법 및 API 규격서 V2 4130-2021-00330 플랫폼 데이터베이스 설계서 V2 4130-2020-00414 시험절차서 및 시험결과보고서 v1 - 클라우드 기반 분석·개발 환경 4130-2020-00445 개방형 데이터 허브 기술이전 요구사항 정의서 v1.3 C. 세부기술3 : 의료 데이터 관리 관리번호 기술자료 명칭 비고 4130-2021-00329 플랫폼 연동 방법 및 API 규격서 V2 4130-2020-00318 FHIR 기반 의료 데이터 인증/인가 관리 설명서 4130-2020-00415 시험절차서 및 시험결과보고서 v1 - 의료 데이터 관리 4130-2020-00445 개방형 데이터 허브 기술이전 요구사항 정의서 v1.3 마. 프로그램 A. 세부기술1 : 데이터 관리 인프라 관리번호 프로그램 명칭 비고 PG20210093 오픈 데이터 참조 모델 관리 모듈 V2 PG20210092 데이터 관리 인프라 모듈 V2 PG20200450 데이터맵 퍼블리셔 모듈 PG20210091 데이터맵 관리 모듈 V2
  12. G‐06 - 12 - B. 세부기술2 : 클라우드 기반 분석·개발 환경 관리번호 프로그램 명칭 비고 PG20200451 분석 인프라 모듈 C. 세부기술3 : 의료 데이터 관리 관리번호 프로그램 명칭 비고 PG20200455 의료 데이터 인증 및 인가 관리 모듈 PG20200456 의료 워크플로우 포털 3. 타기관/타기업(국내/외)의 동기술에 대한 지식재산권 현황 구분 발명명칭 출원(등록)번호 출원(등록)일자 국가 특허 프로그램
  13. G‐09 - 13 - 4. 기술/시장 동향 가. 기술현황 (1) 국외 기술현황 o 빅데이터, 인공지능, 사물인터넷, 자율주행자동차 등의 4차 산업혁명 기술들이 모두 데이터 기반 기술임에 따라 데이터의 효율적인 관리와 개방, 활용 지원을 위해 각국 정부와 기관들은 데이터 공유와 활용 기술 개발을 활발히 진행 중임 o 데이터의 종류와 형태가 더욱 복잡하고 다양해지며, 데이터 공유와 품질에 대한 이슈가 커짐에 따라, 2020년 W3C DXWG(Data Exchange Working Group)에서는 DCAT(Data Catalog Vocabulary) V2를 발표하였으며, 현재 DCAT V3 규격으로 확장 논의 중임 - 영국 비영리 단체인 OKF(Open Knowledge Foundation)의 오픈소스 개방형 데이터 플랫폼인 CKAN(Comprehensive Knowledge Archive Network)은 영국, 미국, 호주 등 각국 공공 데이터 포털에 적용되어 기관 간 데이터 공유에 활용되고 있음 - CKAN은 W3C DCAT(Data Catalog Vocabulary) 기반의 데이터 공유 기능도 확장 하여 지원하고 있음 o Google, MS, Yahoo 등이 주도하는 오픈 커뮤니티 schema.org는 웹 상의 다양한 종류 의 정보에 대해 구조화된 스키마를 생성, 유지, 관리하고 있으며, 데이터셋을 위해 Dataset 클래스를 추가하여 Google Data Search에 적용하고 있음. o 클라우드 환경에서 컴퓨팅 자원을 할당받아 실행환경을 생성하여 알고리즘 개발, 데이 터 분석을 수행하고 분석결과를 재배포, 공유할 수 있는 데이터 및 분석 허브 기술 개 발이 활발히 진행 중 o 의료분야에서의 데이터 상호운용성을 높이기 위해 개발된 차세대 프레임워크 FHIR(Fast Healthcare Interoperability Resources) 표준에 대한 관심이 커지고 있으며, IBM, MS, smileCDR 등에서 오픈소스 프로젝트로 개발하며 상용화도 지원하고 있음 (2) 국내 기술현황 o 여러 산업 분야에서 AI와 데이터에 대한 관심과 수요가 급속히 증가함에 따라, 공공, 민간 기업 등에서 기존 시스템의 지능화 및 산업간 융합을 시도하는 새로운 비즈니스 모델 기획이 활발히 진행 중 o 한국전자통신연구원(ETRI)은 “데이터맵 기반 지능형 빅데이터 탐색활용 핵심 기술개발” 과제를 수행하며, 데이터 유통, 활용에 필요한 참조모델 표준과 이를 반영하여 운영되 는 개방형 데이터 허브의 안정화, 지능화 기술 개발을 진행 중에 있음
  14. G‐06 - 14 - o 한국전자통신연구원(ETRI)은 “헬스 IoT 및 의료 정보의 통합분석과 협업 진단을 위한 스마트 의료서비스 플랫폼 개발” 과제를 국제공동연구로 수행하며, 개방형 데이터 허브 와 FHIR 의료 플랫폼의 상호운용을 통해 인증/인가 기반의 의료 데이터 공유 기술을 개발함 o 오픈 데이터 유통 참조모델은 공공, 민간에서 생성되는 다양한 데이터를 관리를 위한 확장성 높은 범용적 관리체계, 데이터 연계, 공유, 활용을 위한 기능 및 정책적 요소들 로 구성되며, 참조모델의 확장과 운영관리 지침을 포함 나. 벤더(기업체) 현황 (1) 세계주도 벤더 현황 o 2007년 시애틀에서 설립된 Socrata는 클라우드 기반 오픈데이터 플랫폼을 개발하고, 미 국 연방 정부 및 10여개 주정보의 공공 데이터 포털 구축에 협력 중. o 프랑스 다웩스(Dawex)7)는 데이터 공급자와 용자간의 데이터 거래를 가능하게 하는 글 로벌 데이터 거래 플랫폼을 제공 * EC, Study on Data Sharing between Companies in Europe, European Commission, 2018.1 o Viderum은 CKAN 프로젝트를 주관하는 비영리 재단(Open Knowledge International)에 서 상용 서비스를 위해 2015년에 만든 회사로서, CKAN을 정부기관, 기업 등에서 쉽 게 구축하여 사용할 수 있도록 클라우드 기반으로 호스팅하는 사업 수행 o 클라우드 기반 빅데이터 서비스 기술은 Amazon, Goolge, Microsoft 등이 자사 솔루션 및 오픈소스를 기반으로 다양한 제품을 개발하여 시장에 확산 중임 (2) 국내주도 벤더 현황 o LG CNS 오디피아(ODPia), SKT의 빅데이터 허브, KTH API 스토어 등은 데이터 조회, 분석, API 서비스 및 데이터 유통을 지원하는 국내 민간 데이터 포털임 o 네이버 데이터랩은 공공, 민간 데이터의 활용을 돕는 데이터 포털로서 검색어를 통 해 국내의 다양한 지표를 제공함 o 한국데이터산업진흥원은 한국전자통신연구원과 협력하여 CKAN 기반 개방형 데이터 스토어를 구축하여, 클라우드 환경에서 기업이 데이터를 공개, 유통할 수 있는 서비 스를 제공 다. 관련 제품 및 서비스 동향 (1) 국외 관련 제품 및 서비스 동향
  15. G‐09 - 15 - o 영국, 미국, 캐나다, 호주 등 146개 정부 및 공공기관에서 CKAN을 기반으로 데이터 포털을 구축하여 국내외 데이터 개방과 검색, 공유에 활용하고 있음 o AWS, MS, Google, IBM 등은 자사의 클라우드 인프라 서비스(IaaS)와 더불어, 데이터 연계, 활용 및 분석 등이 가능한 데이터 서비스 플랫폼 기술을 통합하여, 의료 분야 를 포함하여 여러 산업 분야에 진출을 도모하고 있음 (2) 국내 관련 제품 및 서비스 동향 o W3C DCAT, Schema.org, FHIR 등 여러 커뮤니티에서 제정하고 있는 표준 규격과의 상호운용성을 높일 수 있는 브로커링 등의 기술 개발을 진행하고 있음 o 공공 및 정부 기관을 중심으로 공공 데이터를 민간에 개방하기 위한 데이터 포털을 구축하여 서비스 중이며, 민간에도 확산 추세에 있음 라. 시장전망 o 본 과제의 결과물이 직간접적으로 활용될 수 있는 국내외 빅데이터 분석 관련 산업 의 시장규모 및 추정치는 다음과 같음 (단위 : 억달러, 억원) 년도 (2020년) (2024년) (2026년) 세계 시장 규모 598 965 1,188 한국 시장 규모 7,014 11,222 14,021 ※ 출처: IDC’s worldwide Semiannual Big Data and Analytics, 2019.06 ※ 관련 자료를 근거로 본 기술이 적용 가능한 시장을 산출 및 추정하였음 ※ 국내 시장규모는 데이터 거래관련(데이터 거래, 데이터 분석제공) 시장규모를 포함함 o 빅데이터와 관련된 소프트웨어 및 서비스에 대한 세계시장의 매출은 2018년 420억 달러에서 2027년 1,030억 달러로 증가할 것으로 예측되며, 연평균 11.4%의 고성장 을 보일 것으로 추정됨(※ 출처: Bigdata monthly, 빅데이터 동향과 이슈, 2018.06. K-ICT 빅데이터 센터) o 빅데이터와 관련된 애플리케이션 및 분석 시장은 2018년 50억 달러에서 2026년 194억달러로 크게 성장할 것으로 예측되며, 연평균 15.49%의 성장률을 달성할 것으 로 보여짐(※ 출처: Bigdata monthly, 빅데이터 동향과 이슈, 2018.06. K-ICT 빅데이 터 센터)
  16. G‐06 - 16 - 5. 상용화 가능성 가. 상용화를 위한 생산설비 등 추가비용 o 해당사항 없음 나. 상용화를 위한 추가적인 기술개발 내용 o 사업 규모, 사용자 구분, 운영 정책에 따른 API 확장 및 커스터마이징 o 서버 및 SW 구성에 따른 기반 SW 확장 또는 커스터마이징 o 추가 요구되는 다양한 분석 또는 개발환경 통합 작업 o 사업화 대상 요구사항을 반영한 데이터 포털 개발 다. 예상 제품/서비스 및 수요자(층) 예상 제품/서비스 예상 수요자(층) 데이터 허브 기업, 공공기관 클라우드 분석·개발환경(DevOps) 일반사용자, 기업, 공공기관 의료 데이터 플랫폼 의료기관, 공공기관 라. 상용화까지의 단계별 주요 일정 계획 o 상용화 제품 기획 (2개월) o 상용화 제품 개발을 위한 기술 커스터마이징 (4개월) o 소규모 테스트 (1개월) o 실증 테스트 (1개월) 마. 기타 상용화의 애로점과 극복(개선)방안 애로점 극복(개선)방안 국내외 표준체계 정립 단계 표준개발 현황 추적 및 데이터 관리 인프라에 반영 6. 시장성 가. 예상 제품/서비스의 속성
  17. G‐09 - 17 - 예상 제품 /서비스 예상단 가(천원) 이 전 기 술 의 비중 (%) 잠재적/현재적 경쟁자와 가격,시장 등에서 경쟁상 유리한 점 판매 가 능 시기 데이터 허브 200,000 50 a. 가격경쟁력면: (기존제품 대비 가격 50%절감) b. 시장환경면: (예시: 2023년 이후 연간 1천억 예상) c. 기타: 2021 클라우드 개발/운영환경 (DevOps) 200,000 30 a. 가격경쟁력면: (기존제품 대비 가격 50%절감) b. 시장환경면: (예시: 2023년 이후 연간 1천억 예상) c. 기타: 2021 의료 데이터 플랫폼 100,000 20 a. 가격경쟁력면: (기존제품 대비 가격 50%절감) b. 시장환경면: (예시: 2023년 이후 연간 1천억 예상) c. 기타: 2022 나. 관련 제품/서비스의 국내외 시장규모(향후 매 5년 간 추정) (단위 : 백만불, 억원) 관련 제품 /서비스 시장 1차년도 (2021) 2차년도 (2022) 3차년도 (2023) 4차년도 (2024) 5차년도 (2025) 합계 데이터 허브 (의료 분야 등) 해외 3,200 3,900 4,800 5,800 6,960 24,660 국내 348 415 493 585 700 2,541 클라우드 개발/배포환경 (DevOps) 해외 4,100 5,200 6,600 8,300 10,437 34,637 국내 94 125 164 197 228 808 의료 데이터 플랫폼 해외 5,200 6,600 8,300 10,437 34,637 국내 125 164 197 228 808 합계 해외 7,300 14,300 18,000 22,400 27,834 93,934 국내 442 665 821 979 1,156 4,157
  18. G‐06 - 18 - 다. 예상 제품/서비스의 국내외 시장점유율(생산/판매부터 향후 매 5년 간) (단위 : %) 관련 제품 /서비스 시장 1차년도 (2021) 2차년도 (2022) 3차년도 (2023) 4차년도 (2024) 5차년도 (2025) 합계 데이터 허브 해외 0.01 0.05 0.1 0.16 국내 5 10 15 20 클라우드 개발/배포환경 (DevOps) 해외 0.01 0.05 0.1 0.15 0.31 국내 5 10 15 20 50 의료 데이터 플랫폼 해외 0.01 0.05 0.1 0.15 0.31 국내 5 10 15 20 50 합계 해외 0.02 0.11 0.25 0.4 0.78 국내 10 25 40 55 125 라. 예상 제품/서비스의 예상매출액(생산/판매부터 향후 매 5년 간 추정) ※ 예상매출액 = (나)관련 제품/서비스의 국내외 시장규모×(다)예상 제품/서비스의 국내외 시장점유율 (단위 : 백만불, 억원) 관련 제품 /서비스 시장 1차년도 (2021) 2차년도 (2022) 3차년도 (2023) 4차년도 (2024) 5차년도 (2025) 합계 데이터 허브 해외 0.5 2.9 7 10.4 국내 24.6 58.5 105 188.1 클라우드 개발/배포환경 (DevOps) 해외 0.5 3.3 8.3 15.7 27.8 국내 6.3 16.4 29.6 45.6 97.9 의료 데이터 플랫폼 해외 0.5 3.3 8.3 15.7 27.8 국내 6.3 16.4 29.6 45.6 97.9 합계 해외 1.0 7.1 19.5 38.4 66 국내 12.6 57.4 117.7 196.2 383.9
반응형

loading