바로가기 메뉴
본문 바로가기
주메뉴 바로가기
  • RE-99
국가통계 AI도입 활성화 방안 연구
  • 김정민AI정책연구실 선임연구원
날짜2021.07.27
조회수10678
    • 국가통계는 사회통합 기능과 정책수립·평가기능을 갖추고 있는 국가의 중요한 공공재로서 통계법을 통해 엄격히 관리되고 있다. 특히 새로운 국가통계를 생산하기 위해서는 반드시 통계청의 통계작성 승인을 득해야 하므로 승인 기준과 품질 척도의 변화는 통계 생산자 모두에게 중요한 사안으로 볼 수 있다.
    • 최근 국내외를 막론하고 AI 및 빅데이터 기술을 국가통계에 활용할 수 있는가에 관한 논의가 본격적으로 진행되는 추세다. 같은 맥락에서 실제 국가통계에 한시적으로 도입해 보거나 테스트하는 사례 또한 증가하고 있다. 이는 결국 AI 및 빅데이터 기술을 통계 생산에 활용할 시 국가통계로 승인 가능한지에 대한 고려로 확대된다. 국내 통계청 또한 올해 상반기 중 조사통계 심사에 맞추어져 있던 승인 심사 문항을 조사 통계 외 생산 방식에도 적용할 수 있도록 일부 개정하는 방안을 추진하고 있으며, 중장기적으로는 국가의 통계 관리 범위를 확대하기 위한 신규 제도 검토를 예고했다. 국가통계 승인 기준의 변화가 가시화되는 시점이다.
    • 제도적 변화 조짐에도 불구하고 AI 및 빅데이터 기술은 그간 활용했던 통계적 기법과는 방법론의 구조, 평가 기준 등이 상이해 실제 도입에 대한 저항이 존재한다. 그런 연유에서 보고서는 해외의 앞선 논의와 실제 적용 사례를 소개하고 AI기술이 통계 생산에 활용될 시 예상되는 기술적 쟁점이 무엇일지 구체적으로 분석해봄으로써, 도입 촉진에 필요한 요소를 발굴하고 이를 달성하기 위한 방안을 제시하였다.
    • 예상 쟁점 도출을 위해 국가통계에 AI 기술을 도입하는 이슈를 두 가지 시각으로 분리하였다. 조사통계에서 완전히 탈피해 빅데이터에 기반한 통계를 생산하는‘신규 통계 생산’의 시각과 조사통계 생산 과정을 그대로 수용하되 각 생산 과정의 효율성과 성능을 향상시키고자 AI를 도입하는‘통계 생산 프로세스의 현대화’가 그것이다. 서로 다른 두 시각에서 바라본 예상 쟁점은 다음과 같이 요약된다.
    • 신규 통계 생산과 통계 생산 프로세스의 현대화의 예상 쟁점 및 시사점
      구 분 예상 쟁점 시사점
      신규 통계 생산 AI·빅데이터 기반의 분석결과에 관한 신뢰 가 보편적으로 형성되지 않음 신규 통계 생산 시 활용에 적합한 검증된 알고리즘을 공표하고 이에 대한 세부적인 활용 지침 마련이 요구
      신규 통계의 생산방식은 기존의 통계 생산 프레임워크에 맞추어 해석하기에 적합하지 않음 빅데이터 분석 프로세스를 포괄할 수 있는 통계 프로세스 표준의 개정 고려
      재현 불가능한 비결정론적(Non-deterministic) 알고리즘 기반의 결과를 국가통계로 관리 가능한지 여부 인공지능 기술의 특성 분석 및 표준화된 평가 기준 정립이 요구됨
      통계 생산
      프로세스의 현대화
      기존의 방법 대비 우수성을 객관적으로 비교가능한가 전통적 통계 기법-AI 알고리즘의 비교 검증 방안 발굴이 필요
      AI 기술 도입은 통계 생산부터 공표까지의 제한된 생산 기간을 준수할 수 있는 해법 인가 다수의 실증 사업을 통한 도입 적합성 진단 필요
    • 분석된 예상 쟁점들과 그에 따른 시사점을 토대로 AI 및 빅데이터 기술의 국가 통계 도입이 촉진되기 위해 필요한 두 가지 요소를 도출하였다. 첫 번째로 AI 기술의 대표성 부여를 위한 표준화 된 기술 개발 및 품질 평가 기준 마련을 꼽을 수 있겠으며, 두 번째로는 실증 사업 확대를 통해 국가통계 유형별 도입 적합성을 지속적으로 테스트 해볼 수 있는 장이 마련되어야 한다는 점이다. 결과적으로 아래와 같은 AI 표준 수립 기관의 지정될 시 해당 이슈 해결에 효과적임을 제안하였다.
    • Scope Normative References Definitions
    • 이와 더불어 4-5장에서는 금융감독원의 전자공시 외감기업 전수에 해당하는 빅데이터 확보를 전제로 생산 가능한 두 가지 AI·빅데이터 활용 통계 생산 방안을 제안하였다. 첫 번째는 디지털 산업을 분류하기 위해 OECD의 디지털 산업 정의와 국내 전자공시 빅데이터를 활용하는 방안이며, 두 번째는 디지털 전환지수를 개발하는 관점에서 전자공시 빅데이터를 활용하는 연구 모델이다. 국내 차원의 빅데이터 활용 통계에 대한 도입 가능성이 높아짐에 따라 향후 실제 국가 승인을 목표로 제작될 수 있을 것으로 예상된다.
    • 제1장 연구 배경
    • 제2장 국가통계의 AI·빅데이터 기술 도입 논의와 적용사례
    • 제1절 각 국의 문제인식과 관련 논의
    • 제2절 UN의 국가통계의 머신러닝 활용 논의
    • 제3절 해외 AI·빅데이터 활용 통계 도입 사례
    • 제4절 국내 AI·빅데이터 활용 통계 도입 사례
    • 제3장 국가통계의 AI·빅데이터 기술 도입 쟁점과 시사점
    • 제1절 AI·빅데이터 통계 도입 시 예상 쟁점
    • 제2절 국내 통계 제도의 개편 방향과 정책적 시사점
    • 제4장 [부록 1] AI·빅데이터를 활용한 디지털산업 분류 방안
    • 제1절 연구 배경과 목적
    • 제2절 기존의 디지털산업 분류 방법과 한계
    • 제3절 AI·빅데이터를 활용한 디지털산업 분류 방안
    • 제5장 [부록 2] 전자공시 데이터 기반 디지털전환 지수 산출 방안
    • 제1절 배경 및 필요성
    • 제2절 선행연구 및 DART 자료의 특징
    • 제3절 문제인식과 디지털전환 지수 모형제안
    • 제4절 모형 분석 절차
    • 제5절 디지털전환 지수의 활용
    • [참고문헌]