․빅데이터는 원천자료의 출처 및 수집방법에 따라 대표성과 신뢰성에서 큰 차이가 발생하게 되는데, 신뢰성 있는 통계 제공을 위해서는 원천자료의 신뢰성 및 수집방법에서 오는 오류의 측정과 수정이 필요합니다.
*구글의 독감동향분석은 2011~2012, 2012~2013년 사이의 독감철에 미국에서 50%가 넘게 독감바이러스 유병율을 과대평가
․통계청은 신뢰성 높은 빅데이터 활용통계를 국민에게 제공하고자 빅데이터 활용한 통계의 생산방법론을 연구하고 있습니다. 특히, 원천자료의 신뢰성․대표성이 떨어지는 웹 소셜데이터 등을 활용한 통계의 품질검증 및 품질제고도 연구과제에 포함되어 있습니다.
․원천자료의 신뢰성․대표성이 떨어지는 빅데이터의 품질을 측정하고 이를 개선할 수 있는 방안을 수립할 수 있도록 다양한 의견을 주시기 바랍니다.