서울시 도시데이터서포터즈운영 사례
- 연사: 박건철 (서울디지털재단)
서울디지털재단에서는 현재 시민 중심의 도시데이터 생태계를 창출하기 위한 공익데이터 사업을 진행하고 있습니다. 이러한 도시데이터 생태계는 시민-서울시-기업의 순환구조를 구축함으로써 창출될 수 있습니다. 우선 시민들은 데이터를 수집하고 가공하는 과정에 참여하고, 그에 대한 보상을 제공받음으로써 소득 창출의 기회를 제공받을 수 있습니다. 서울시는 문제를 발굴하고 시민들이 수집한 데이터를 정리해 공유하는 역할을 담당합니다. 기업들은 이렇게 구축된 데이터 생태계를 바탕으로 데이터에 기반한 문제해결 서비스를 개발할 수 있게 됩니다. 즉, 수집 및 가공 → 개방 및 공유 → 문제해결의 프로세스가 이뤄지는 과정 속에서 데이터 생태계를 형성될 수 있습니다. 디지털재단의 서울시 도시데이터서포터즈는 이러한 목적 하에서 시민들의 참여를 이끌어내기 위한 사업입니다.
도시데이터 생태계 창출 (자료: 박건철 님 프레젠테이션)
데이터 수집은 크게 두 가지 과정을 통해 이뤄질 수 있습니다. 하나는 기계중심 접근으로, 프로그램을 통해 SNS, 댓글, 뉴스 등 온라인상의 수많은 빅데이터들을 자동 수집하거나 기존에 공공에서 축적된 데이터들 가운데 새로운 활용가치가 있는 데이터를 발굴하는 방식입니다. 그러나 기계가 모든 걸 다 할 수는 없기에, 인간중심 접근이 필요합니다. 인간중심 접근은 시민참여를 통해 원시데이터와 인공지능의 학습데이터를 확보하는 것입니다. 이런 인간중심 접근을 통해 시민들이 데이터를 만들어낸 사례들은 이미 매우 다양합니다. 가령 독일 베를린에서는 시민들이 체감하는 거리의 위험 수준(교통사고, 밤거리 등)을 측정하고, 이렇게 모여진 데이터를 통해 가로등, 횡단보도 설치나 순찰로 재설정 등 도시계획에 반영한 사례가 있습니다. 시민들의 위험에 대한 체감 수준은 기계가 센서로 측정할 수 없지만, 시민들이 일상에서 데이터를 수집함으로써 데이터 축적이 가능해진 것입니다.
기계중심 접근/인간중심 접근 (자료: 박건철 님 프레젠테이션)
디지털재단은 앞으로 시민들의 데이터 수집을 인공지능 학습데이터로 활용하려는 계획을 갖고 있습니다. 이미 미국의 아마존을 비롯해 중국, 인도 등 다양한 나라의 기업들에서 인간중심 접근을 활용해 인공지능 학습을 시도하고 있습니다. 인공지능 머신러닝은 완전히 프로그래밍으로 자동화된 과정으로 이뤄지는 것이 아닙니다. 특히 인공지능의 프로그래밍과 초기 세팅 과정에서는 사람들의 노동력이 투입될 수밖에 없으며, 지속적인 학습과정에도 사람들이 만들고 수집한 데이터가 요구됩니다. 이런 학습 과정을 거쳐야만 인공지능의 데이터 라벨링 작업이 가능해집니다.
데이터 라벨링 작업 (자료: 박건철 님 프레젠테이션)
현재 재단에서는 도시데이터 생태계 구축을 위한 데이터 플랫폼을 운영하고 있으며, 내년에는 시민들이 좀 더 적극적으로 참여할 수 있는 형태의 시스템을 구성할 계획입니다. 이러한 시스템은 데이터 수집, 가공, 분석, 그리고 서비스 개발에 이르는 전 과정에서 공공 및 민간 일자리를 창출할 수 잇을 것으로 기대됩니다. 일자리나 보상이 주어지는 시민들의 참여는 기업들의 활발한 혁신을 이끌어내는 계기가 될 것입니다.
데이터 플랫폼 운영 (자료: 박건철 님 프레젠테이션)
현재 서포터즈 사업을 통해 데이터를 수집해온 몇 가지 사례들이 있습니다. 우선은 재활용 폐기물 이미지 데이터를 수집해 인공지능에 학습시킴으로써, 쓰레기를 분류하고 재활용하는 과정이 자동화될 수 있도록 하는 것입니다. 또한 어린이들의 눈높이에서 보행로를 촬영함으로써 어린이들이 체감하는 위험요소를 파악할 수 있는, 어린이 보호구역 통항 영상의 데이터 셋을 구성했습니다. 그 외에도 서울시 주요 쪽방촌에 대한 온도, 습도, 주거환경 등의 데이터들을 수집하여 환경개선 정책에 활용될 수 있도록 하였습니다. 기존의 공익데이터와 시민들의 지속적인 데이터 수집을 통해 2,601개 서울시 공공건물에 대한 사회적 약자의 접근성 및 이용편의성에 대한 데이터를 확보하여 스마트 서울맵에서 공개하고 있습니다.
서포터즈 데이터 수집 사례들 (자료: 박건철 님 프레젠테이션)
시민들이 데이터를 수집하는 과정에서 IOT 센서가 중요한 도구로 작용하고 있습니다. 서울디지털재단은 S-DoT를 도시의 구조물들에 설치하여 이를 시범운영하고 있습니다. 서포터즈 활동을 하는 시민들이 S-DoT가 설치된 구조물 근처를 지나가면 스마트폰에 알람이 울려 필요한 사진을 촬영하거나 관찰 내용을 기록하도록 하는 방식입니다. 이를 통해 지속적으로 사진을 촬영하고 주변에 오염원 식별 여부를 확인하여 실시간으로 데이터를 수집할 수 있습니다. 물론 서포터즈 운영 과정에서 수집되는 모든 데이터들을 신뢰할 수 있는 것은 아닙니다. 기록이 미비한 있지 않은 데이터, IOT가 설치가 잘 되어 있지 않거나 환경요인에 영향을 받는 경우 등이 발견되곤 합니다. 예컨대 조도센서가 가로등 바로 밑에 설치되어 있거나, 미세먼지 센서가 공사장 옆에 설치되는 경우 등이 그렇습니다. 이를 지속적으로 개선해나갈 예정입니다.
S-DoT 활용방법 (자료: 박건철 님 프레젠테이션)
현재 당면한 과제로는 우선 공공데이터의 양 자체가 부족한 상황이며, 질적으로도 데이터의 완결성과 정확도 측면에서 여러 문제가 있는 상황입니다. 공공데이터를 활용하려는 기업들에서 필요하거나 활용가능한 데이터가 없다는 지적이 계속되고 있습니다. 물론 데이터 기반 서비스 역시 현재 부족한 상황입니다. 데이터를 적극적으로 활용하는 경우는 여전히 소수의 사례에 불과합니다. 이렇게 전반적으로 데이터 수집, 관리, 활용 면에서 부족함이 많기에 지속적인 노력이 필요한 상황입니다.
비록 시민들이 민원 등으로 요구했던 데이터들을 다 수집하진 못했으나, 앞으로 민원에 대한 분석을 통해 공적으로 수요가 있는 데이터들이 무엇인지 파악하려는 계획을 갖고 있습니다. 수요맞춤형 데이터 발굴 및 혁신 서비스 개발을 위해, 시민들이 정말로 생활과 일상에서 필요로 하는 데이터들이 무엇인지 확인해 나가고자 합니다. 또한 이러한 과정은 공공의 일방적 노력으로만 이뤄지지 않을 것입니다. 시민들의 적극적인 참여를 통해서만 도시데이터 생태계를 풍부하게 구축해 갈 수 있습니다. 그리고 그러한 생태계의 구축은 선순환 구조가 되어 시민들을 위한 도시를 만드는 데 기여하게 될 것입니다. 현재 재단에서 진행하는 서포터즈 사업처럼, 시민이 이동하면서 직접 센서가 되어 필요한 데이터들을 찾고 수집하는 사업들이 더 많이 이뤄질 것입니다. 정부 역시 디지털 뉴딜을 통해 데이터산업을 육성하고자 지원하고 있기에 향후 데이터 분야가 더욱 발전해갈 수 있으리라 기대됩니다.