데이터에 둘러싸인 일상을 살고 있는 우리
데이터과학과 빅데이터에 관한 뉴스, 디지털 뉴딜정책의 데이터 댐에서도 '데이터'라는 용어가 사용되는 것을 쉽게 볼 수 있어요. 우리는 데이터가 일상과는 조금 먼 일이라고 여기곤 해요. 그렇지만 사람들의 데이터로 만들어지는 알고리즘은 생활 속 가까이에 있습니다. 친구들끼리 휴대폰을 보다가 무언가를 살 때 "나는 마케팅의 노예였어"라고 하곤 하죠? 이럴 때 우리는 우리들의 데이터를 활용한 서비스를 이용하고 있다는 걸 알 수 있어요.
모두가 데이터를 만들고 활용하고 있어요.
일상 속에서 데이터라는 단어를 많이 쓰죠. "데이터가 있어요? 데이터를 찾았어요?" 무의식적으로 누군가에 의해서만 데이터가 만들어지고 활용한다고 생각하기 쉽습니다. 데이터가 나와 직접적으로 관련이 없다고 여길 수도 있어요. 사실 우리의 삶에 영향을 미치는 정부 정책, 기업 행동, 의사결정이 우리들의 데이터를 분석하고 활용해서 이루어집니다. 우리가 데이터를 만드는 주체이자 데이터를 활용할 수 있는 주체인 것이죠. 데이터 주체인 시민의 자기결정권이 중요해지고 있고, 법적으로 개인정보보호와 연결되어 마이 데이터(My data)개념이 강화되고 있어요.
데이터 주체인 우리는 어떤 행동을 할 수 있을까요? 우리에겐 데이터 생성과 활용에 기여할 수 있도록 데이터 리터러시가 필요합니다. 리터러시(Literacy)는 종이라는 매체를 활용할 때, 글을 읽고 쓸 줄 알고 해석하는 능력을 일컫습니다. 데이터 리터러시(Data literacy)는 종이에 써져있는 글 뿐만 아니라 영상, 그래프, 사진 등 다양한 형태의 데이터를 이해하고, 해석할 수 있는 능력을 의미합니다. 우리 모두가 데이터에 관해선 마이 데이터 라는 인식을 가지고, 폭넓게 데이터를 이해하고 활용할 수 있도록 해야해요.
데이터가 다 같은 데이터가 아니에요. 공익데이터
데이터가 다 같은 데이터라고 생각하기 쉽죠. 사실 데이터의 범주는 크게 취득, 생성 관리 주체에 따라 두가지(공공데이터, 민간데이터)로 구분된다고 합니다. 국가기관, 지방자치단체 및 공공기관이 생성 또는 취득하여 관리하는 광 또는 전자적 방식으로 처리된 자료와 정보가 바로 공공데이터라고 합니다. 그에 반해 민간데이터는 정부 기관에 속하지 않은 기업/시민 등의 사적 주체가 생성 또는 취득하여 관리하는 데이터입니다.
도표에서 볼 수 있듯이 공익데이터는 공공데이터와 민간데이터 모두를 아우르는 개념이에요. 공익데이터는 '누가 데이터의 주체인지'의 여부가 아니라, '어떠한 목적으로 무엇을 위한 것인지'에 방점을 두었습니다. 새로운 개념인 공익데이터는 다양한 정의가 있으나, 공통적으로 공익에 기여한다는 점을 강조하고 있습니다. 우리는 누구나 제한없이 사용할 수 있으면 궁극적으로 시민에게 도움이 되는 데이터를 '공익데이터'라고 부를 수 있어요. 공익데이터가 더욱 의미를 가지는 이유는 공공데이터 뿐만 아니라 민간데이터의 활성화를 이끌어 공익적으로 활용한다는 것에 있는 것이죠.
공익데이터를 검색하면 공공데이터와 공익데이터를 혼재하여 쓰고, 공공데이터를 공익데이터로 생각하기도 해요. 공익데이터는 많은 데이터 중에서 공익을 위해 활용되는 데이터를 뜻합니다. 정부에서 공개한 데이터 즉, 공공데이터가 공익을 위해서 활용된다면 이를 공익데이터라고 부를 수 있는 것입니다. 또한 민간에서 생산하여 관리하는 데이터 역시 공익을 위해서 활용될 수 있다면 역시 공익데이터가 될 수 있습니다. 최근 정부가 해수욕장 혼잡도를 신호등으로 알려주는 데이터가 공개되어 화제인데요. 여기에는 이동통신사가 해수욕장 부근에 휴대전화 신호를 분석한 데이터가 활용됩니다. 이렇게 민간데이터가 공익목적으로 활용되는 경우도 공익데이터 사례로 볼 수 있습니다. 요약하면 공익데이터는 생산 관리 주체와 무관하게 공익 목적으로 누구나가 접근 가능하고 오픈 소스 방식으로 공유되는 데이터라고 볼 수도 있습니다.
공익데이터 활동은 공익데이터를 직접 생산하거나 분석 및 시각화해서, 사회문제를 발견하거나 해결하는데 활용하는 활동이에요. 최근 코로나 19가 급격히 확산되면서 공익데이터 활동이 얼마나 중요한지를 느낄 수 있었습니다. 코로나 19로 내가 사는 곳 주변에서 확진자가 나왔는지의 여부, 확진자 동선 확인, 공적 마스크를 살 수 있는 약국 위치, 공간의 혼잡도와 이동성 등 다양한 정보가 매우 간절했던 시기를 떠올릴 수 있어요. 그때 시민개발자 시빅해커들이 다양한 코로나19 앱과 웹 서비스를 제공했었죠. 시빅해커들이 활용했던 데이터가 바로 공익데이터입니다. 공익데이터를 가공하고 분석한 직관적 시각화와 맵핑 서비스를 활용했고, 시민들이 직접 데이터를 수집 생성해서 구축하고 잘못된 정보의 수정을 요구하기도 했습니다. 데이터를 수집하여 공익을 위해 사용하고, 이를 널리 알리고 검토하는 과정까지 시민의 역할은 많은 비중을 차지하고 있고 얼마나 중요한지를 보여주고 있습니다. 공익데이터 활동은 데이터 제공자이자 데이터 사용자인 시민들이 직접 참여하고 기여하기에 의미가 있어요.
코로나 19와 관련한 공익데이터 활동 사례로 코로나-19: 우리의 기억프로젝트를 들 수 있어요. 중앙대학교 문헌정보학 전공 학생과 사회학과 코딩모임 COSADAMA로 구성된 Team. Cayley가 코로나 19로 인한 사회의 변화, 여러 사실들을 가치중립적으로 기록하고자 'COVID-19: 우리의 기억'이라는 포털을 만들었습니다. 코로나 19의 감염확산 방지를 위한 정부의 정책, 경제적 영향, 교육 방침, 문화활동의 변화 등 다양한 카테고리의 내용을 담은 공익데이터 활동을 진행했습니다. 또한, 수집한 데이터, 이를 정제하고 주제 별로 구축한 데이터, 주제별 분석 코드 및 데이터 시각화 자료까지 모두 공개했습니다. 우리도 공익데이터 활동을 할 수 있어요.
협력적 거버넌스로 공익데이터 활동을 할 수 있어요.
알고 보니 데이터를 자주 접하며 익숙한 환경에서 우리가 살고 있었죠? 더 많은 이들에게 도움을 되는 공익데이터가 중요하고 공익데이터활동이 필요하다고 느낍니다. 공익데이터는 정부, 기업, 시민 모두가 함께 협력해야 공익성에 맞게 진행될 수 있습니다. 정부는 공공데이터를 개방해서 민간에서 접근가능하도록 하고, 공익데이터 활동을 지원하고 참여를 이끌 수 있어요. 기업은 공익 목적의 데이터를 공개하고, 좀 더 사용자를 고려해서 분석과 활용할 수 있도록 하는 사업을 진행해서 공익데이터 활동에 기여할 수 있어요. 데이터 전문가, 데이터 활동가를 포함한 시민들은 직접 데이터를 생성하고 수집할 수도 있고 정부, 기업과 협력적으로 진행해 더 많은 이들에게 도움이 되는 데이터 액티비즘을 할 수 있죠. 공익데이터가 활성화되기 위해서 정부-시민-기업 간 거버넌스로 다양한 이해관계자들이 협력하고 노력해 공익데이터 활동이 이루어져야 합니다.
요즘 공익데이터의 활성화를 위한 많은 시도들이 있습니다. 그 중에 서울시 공유기업촉진사업이 있어요. 서울시는 매년 공유기업과 단체 지정 및 공모사업을 추진하여 '공유'를 통해 사회적 가치를 창출하거나 데이터를 공유하는 기업/단체를 지정하여 지원하고 있어요. 빠띠는 서울시 공유촉진사업 기업으로 선정되어 현재 공유촉진 사업으로 <공익데이터 실험실> 진행할 예정이에요. 빠띠의 공익데이터 활동과 <공익데이터 실험실> 가을 스프린트에 많은 관심과 참여를 부탁드려요.
<공익데이터 실험실> 가을 스프린트
모아놓은 데이터를 분석, 시각화해서 사회문제를 발견하거나 해결하고 싶으세요?
세상에 없던 데이터를 만들거나, 쓰기 좋은 데이터로 가공해 공유하고 싶으세요?
흩어져 있던 데이터를 주제를 정해서 한데 모으거나 아카이빙해보고 싶으세요?
공익데이터, 데이터 액티비즘에 관심 있는 분들 여기 모이세요!
이번 가을동안 짧고 집중적으로 프로젝트를 함께 할 동료와 전문가가 기다려요.
호기심과 열정만 가져오세요. 나머지는 저희가 도와드릴게요.
신청 링크 https://bit.ly/datalab_fw
<공익데이터실험실> 가을스프린트 웹자보
글 편집 | 빠띠 공익데이터팀 data@parti.coop