1. 오늘 이야기를 읽기 전 알아야 할 사전지식. (난이도 하)
1760년대 영국에서는 오늘날 프라이버시 보호 법제로 이어진 최초의 사건이 발생합니다. 영국의 법무장관 찰스 요크는 존 윌크스라는 눈엣가시 정치가를 체포하고 싶었어요. 장관은 체포를 위해 모든 것을 수색할 수 있는 막강한 영장을 발부했습니다. 영장을 받은 관리들은 부실한 정보로 무리한 수색을 진행했어요. 문을 부수고 들어가 가구를 뒤집어엎고 수백 개의 자물쇠를 부쉈어요. 부당함을 느낀 윌크스는 수십 개의 소송을 걸고 국왕과 그 신하들이 수백 년간 누려왔던 권력을 뒤집었습니다. 법원이 윌크스의 손을 들어주며 '수색을 정당화하기 위해서는 훨씬 더 그럴듯한 이유가 있어야 한다'라고 강조했기 때문이에요. 이 소송은 현대적인 프라이버시권의 탄생을 알렸다는 점에서 중요합니다.
내밀한 내 정보를 누군가에 맡겨둔 것은 어떤 의미를 가질까요? 벤저민 프랭클린이 우체국을 발명하고, 미국은 밀봉해 맡긴 편지에 대한 내용을 열어볼 수 있는지 따졌어요. 합당한 이유로 발부된 영장이 없다면 정부도 편지를 열어 볼 수 없었어요. 정부나 우체국이 봉투의 소유권을 가지고 있어도 마찬가지고요. 미국 수정헌법 제4조에서는 '프라이버시에 대한 합리적 기대가 있었는지'로 이 문제를 따졌습니다. 하지만 서류를 상자에 넣어두었고, 그 상자가 사람들이 자유롭게 오가는 곳에 다른 상자들과 함께 쌓여 있다면, 경찰은 영장 없이 서류를 개봉할 수 있었습니다. 수정헌법 제4조가 보호하는 '프라이버시에 대한 합리적 기대가 있었는지'를 포기했다고 보았기 때문입니다.
이렇게 질문해 볼 수 있을 것 같아요. “보고 싶은 서류가 있으면 다른 상자들이 있는 곳으로 가져와서 열람할 수 있다는 거군요?” 하지만 실제로는 쉽게 가능하지 않습니다. 서류가 보호받고 있다면 서류 이동을 위한 조작 없이 불가능합니다. 합리적 기대가 있는 서류의 이동을 강제할 수 있는 권한을 정부는 가지고 있지 않거든요. 하지만 우리나라는 개인을 특정하는 정보에 대한 이동이 내가 잘 모르는 방법으로 이루어지고 있어 결과적으로 온라인상 나의 프라이버시가 침해될 우려가 매우 높습니다. '합리적 기대'를 고려하지 않은 방법으로 정보를 연계하며 서비스를 만들고 있기 때문이에요. 이것의 대상이 되는 ‘정보’. 오늘 이야기할 주제 "CI (연계 정보)"입니다. 데이터 민주주의 포럼에서 CI에 대해 나눈 이야기들. 함께 보면 좋은 글을 공유합니다.
2. CI가 어떻게 사용되고 있는데요? (난이도 중)
“나의 신용등급 조회하기" 금융 앱에서 신용등급을 간단히 조회할 수 있다는 문구를 본 적 있나요. CI는 금융 마이 데이터 신용등급 제공 (KCB, 나이스), 쿠팡, 배달의 민족, 렌터카, 전자고지서 등 온라인상에서 이용자의 정보를 수집할 수 있는 대부분의 서비스에서 이용하고 있어요. 사용자에게 필요한 서비스도 제공하지만 사용자 정보를 이용해 기업의 마케팅 수단으로 악용하기도 하죠. 전화번호를 제공하지 않았는데 카카오톡으로 CI를 이용해 메시지를 전달하는 사례도 있고요. 우리에게 편의를 제공하는 것처럼 메시지를 만들지만, 사실 편의는 우리가 제공하고 기업에서는 정보를 이용하는 것이죠.
3. CI는 어떻게 개인을 식별하고, 어디서 만들어지나요. (난이도 상)
CI는 주민등록번호와 1:1 매칭으로 생성되어 개인에게 부여한 암호화된 고유 번호에요. 고유 번호라는 특성이 있지만 우리가 사용하는 주민번호라고 생각하면 돼요. 온라인에서 개인을 알 수 있는 주민번호 기능을 하기 때문입니다. [어린 왕자]라는 책의 ISBN이 9788932917245인데 이 둘의 생김새는 다르지만 본질은 같은 것 처럼요.
CI는 암호화라는 특징을 가지고 있어요. ‘암호화’라는 단어가 개인을 식별할 수 없을 것 같은 느낌을 주는데요. 암호화는 정보 모형 변화에 불과합니다. CI로 개인을 특정할 수 있어요. CI와 개인의 주민번호가 1:1 매칭되는 특성 때문입니다. 기업이나 공공기관이 온라인에서 CI를 연동해서 사용할 수 있는 이유이기도 합니다. 예를 들어 배달의 민족이 CI를 가지고 있는데, 토스가 가지고 있는 동일한 CI를 같은 사람이라고 특정할 수 있어요.
CI는 2010년 온라인상에서 법령 등에 근거 없이는 주민번호의 수집과 이용을 금지하는 조치를 통해 등장했어요. 주민번호 수집 금지 조치의 대안으로 도입되었습니다. Salt(a.k.a 소금치기) 값을 가진 업체에서 CI를 생성합니다. 정부에 의해 선정된 기업이 CI 생성을 관리한다고 생각하면 됩니다.
해시와매핑: 어렵다! 어려워! 해시하다. 매핑하다. 하나씩 뜯어 볼까요? 해시 함수는 “임의의 길이를 갖는 임의의 데이터를 고정된 길이의 데이터로 매핑하는 함수”를 말합니다. 해시한다는 것은 데이터를 새로운 모습으로 변형시키는 것이라고 생각할 수 있을 것 같아요. 매핑한다는 것은 어떤 값을 다른 값에 대응시키는 과정으로 해시되는 것은 이전의 것과 다른 모습을 하지만 의미는 같고 모형만 바꾸는 것이라고 생각할 수 있어요.
Salt(솔트)란? 해시함수를 돌리기 전에 원문에 임의의 문자열을 덧붙이는 것인데요. 단어 뜻 그대로 원문에 임의의 문자열을 붙인다는 의미의 소금친다(salting) 는 것이다. 여러 서비스를 사용할 때 같은 패스워드를 사용하더라도 salting 된 문자열은 서로 다르기 때문에 각 사용자의 다이제스트는 서로 다른 값으로 저장될 것이다. 쉽게 말해. 해커가 사용자의 비밀번호를 찾아도 솔팅되어있기 떄문에 알기 힘들다는 이야기 입니다.
CI정보는 KISA(한국 인터넷 정보진흥원)에서 사업자들에게 공개하고 있어요. 사업자는 나이스나 다날 등을 통해서 본인인증 기능을 받고 해당 업체를 통해 CI를 발급받아요. 온라인에서 주민번호를 못쓰게 했더니, 주민번호와 1:1로 매칭되는 CI를 발급하는 업체를 만들고 해당 정보가 나도 모르는 방법으로 여러 기업에서 활용하고 있는 상황이에요.
4. 프라이버시 침해 논란에도 기업이 CI를 원하는 이유, 그리고 핑계 (난이도 중)
맞아요. CI는 프라이버시 침해 문제에 직면하고 있어요. 민변 디지털정보위원회와 여러 정보인권 관련 시민단체들은 CI가 “▲개인정보자기결정권 ▲사생활의 비밀 및 자유 ▲익명 표현의 자유 침해 ▲좋은 행정의 권리 등 기본권을 침해하고, 헌법상 과잉금지 원칙, 법률유보 원칙 등에도 위배된다”라고 헌법재판소에 헌법소원을 제기하고 성명을 냈어요. 아래는 어떻게 CI가 프라이버시를 침해하는지 성명의 주요 내용을 가져와봤어요.
이번에 헌법소원을 제기한 청구인들은 국민연금공단, 도로교통공단으로부터 카카오톡을 통해 안내 및 통지 메시지를 수신한 뒤, 해당 공단들에 휴대전화번호를 제공한 적이 없다는 점에 의구심을 느껴 개인정보 열람청구를 진행했다고 해요. 청구인들은 해당 모바일 전자고지 서비스가 주민등록번호와 같은 고유식별번호인 CI를 이용해 청구인들을 식별하고 메시지를 보냈다는 사실을 알게 되었는데 우리도 모르게 또 다른 주민등록번호가 만들어졌고 기업들 사이에서 공공연하게 공유되어 왔던 것이죠.
해당 헌법소원은 CI는 개인 식별이 가능한 정보이기에 개인정보이며, 더 나아가 CI 생성 및 이용은 인터넷 이용자의 신원을 항상 확인하고 식별할 수 있도록 하므로 사생활 비밀 및 자유, 더 나아가 자신의 신원을 누구에게도 밝히지 아니한 채 익명 또는 가명으로 자신의 사상이나 견해를 표명하고 전파할 익명표현의 자유 등 국민의 기본권을 침해한다는 취지에요. 국민의 기본권을 제한하는 행위는 당연히 법률로 정해야하는데, CI의 생성과 이용에 대한 구체적인 내용을 법률에서 규정하고 있지도 않다니 놀라운 일이죠.
특히 CI는 주민등록번호를 기반으로 1대1 연계(매칭)되어 생성되었으며, 한 번 부여되면 주민등록번호를 변경하지 않는 한 변경할 수 없다는 특징을 이용해 CI가 공공·민간부문에서 ‘범용 식별정보’로 광범위하게 이용되고 있어 더욱 문제라고 해요. CI는 인터넷 기업 사이의 온오프라인 서비스 연계를 넘어, 수사기관에 의해 수사대상자 식별 및 수사 목적으로도 활용되고 있으며, 최근에는 규제 샌드박스 임시허가를 통해 공공기관의 ‘모바일 전자고지 서비스’로 그 활용이 확대되고 있어요. 이런 논란에도 불구하고 기업이 CI를 놓지 않는 이유가 뭘까요?
데이터 민주주의 포럼에서는 기업이 CI를 고집하는 이유를 이렇게 생각했어요.
1. “나는 지웠는데, 너도 지웠니?” 기업들 간에 CI 보유에 관한 신뢰 문제.
- 마이 데이터 사업을 시작할 때 CI 정보를 가지고 있던 기업들은 발 빠르게 공동인증서 사업에 대처할 수 있었고, CI 정보를 지운 업체는 공인인증서 사업의 기회를 날렸던 경험.2. CI를 연동해서 기업의 서비스를 개발하는 편의성.
- 암호화하는 것으로도 이용자를 특정할 수 있어 CI를 쌓아 고객 데이터 확보에 용이하다는 것.
- 중복 고객의 발생 가능성을 줄이고, 실제 이용 가능한 사용자 데이터로 정제할 수 있음.
기업이 CI 사용을 고집하는 가장 큰 이유는 “CI 없이는 (손쉽게) 이용자의 중복가입을 막을 수 없다는 것” 입니다. CI를 중복가입 방지용으로 사용하는 건데요. 대안으로 이야기되는 DI를 가지고 이용자 가입을 확인 하면 중복가입을 막을 수 없습니다. DI는 주민등록번호와 1:1 매칭으로 생성되는 값이 아니어서 가입한 이용자를 동일한 사람이라고 확인하기 어려워요. 그러나 CI 사용을 이유가 핑계처럼 들리는 이유는 무엇일까요? CI로 중복가입을 확인하고 저장하지 않는 방법도 있고요. 매번 다른 값으로 해서 개인의 중복가입을 확인하도록 하는 방법도 있어요. CI를 대체하는 기술을 개발하는게 불가능하거나 엄청난 비용이 들것 같지는 않은데, 지금 기술 기반이 CI 위주로 되어있어서 CI 포기하지 않는 것 같아요.
5. CI를 사용하면서 놓친 우리의 프라이버시권과 심각한 문제들. 난이도 중
가장 큰 문제는 서두에서 다룬 시민들이 개인 정보에 대한 “합리적 의심”이 보장되고 있지 않는 현실이에요. 2010년의 주민번호 사용 문제, 2019년 규제 샌드박스 법을 지나오며 기업이 CI를 활용하는 길은 더욱 편해지고 있어요. 기존 문제점의 대안으로 떠오르면서 긍정적인 측면이 부각되었기 때문이라고 생각해요.
기업은 CI를 활용해 사업을 운영하는 것이 당연하다고 생각해요. 기업의 개인정보나 사생활정보 남용에 대해서 시민이 권리를 이야기할 수 있는 분위기는 약해지고 있어요. 이용이나 마케팅 목적으로 서비스 가입에 동의하는 과정에서 CI 수집이 다뤄지는 것 역시 당연하다고 고착화되기 때문이에요. 서비스를 이용하려면 최초 CI 정보 생성에 직접 동의한적도 없고 CI가 무엇인지 몰라도 CI 수집 이용에 동의할 수 밖에 없는 것이죠.
기업의 개인정보와 사생활 정보 이용에 보호장치가 필요하다는 것을 느껴보기 위해 페이스북에서 일어난 심각한 문제를 같이 볼까요? 인스타그램에 페이스북 이용자에게서 수집된 정보를 바탕으로 개인을 특정하는 광고를 실은 사례가 있어요. “당신이 남부 아틀랜타에 위치를 찍은 적이 있어 이 광고가 보이는 것이고, 열린 관계를 지향하는 공인회계사이셔서 광고에 특정되었습니다. 가수 카디비에 좋아요를 누르셨고 천연 피부관리에 관심이 있으시네요.” 이런 내용의 광고가 집행되었어요. 페이스북은 해당 광고를 집행한 계정에 접근 금지를 내렸습니다. 개인을 특정하는 광고를 하지 않는다면. 페이스북이 수집하고 엑세스 한 개인 정보와 기록들을 광고주에게 판매하고 있어요.
섬뜩한 일이죠? 서비스 이용자 기록 데이터 관리에 대한 사례이지만. 우리나라는 페이스북보다 정확하게 개인을 특정하는 CI를 이용하기 때문에 우리나라에서도 충분히 가능한 사례입니다. CI를 가지고 데이터를 모으면 개인의 활동을 모두 CI로 특정되는 개인의 데이터로 구분해 사용할 수 있어요. CI의 대안으로 떠오른 DI는 개인정보 이용의 중요성 논의를 제외하고 개인정보 비연계에 그친 대안입니다. 서비스를 이용하는 시민의 개인정보와 사생활 정보의 이용을 위해서는 기업이 우리에게 정확한 내용을 알리는 노력이 필요한 것 아닌가요.
기업이 온라인에서 개인정보와 사생활 정보를 신중하게 다루어야 한다는 의식이 사회적 공론으로 마련되어야 해요. 그래야만 기업의 입장과 시민의 권리가 조화된 데이터 법안들이 만들어 질 수 있을 거에요. 데이터가 사회에 미치는 영향력이 폭발적으로 증가하고, 의사결정과 일상 서비스의 재료가 되는 지금. CI 문제는 우리에게 필요한 논의거리가 아닐까요?
쿠키🍪
기업이 CI를 계속 사용한다면 우리 생활을 편리하게 하는 서비스를 제공할 수 있어요. 앞에서 지적한 것과 같은 개인정보 오남용 우려와 사생활 침해 문제는 여전히 존재하겠죠. 그러다 보면 불필요한 마케팅의 대상으로 이용될 수 있어요. 다음 편에서는 데이터기본법의 문제와 CI를 시민의 이익이 되는 용도만으로 사용하는 것이 가능한지 이야기하려고 합니다. 시민에게 기술적 서비스를 통한 이익이란 무엇인지. CI의 기술적인 통제가 가능한지. 통제가 가능하다면 어떤 걸림돌이 생기는지. 기업이 받아들일 수 있는 통제 수준은 무엇일지. 이런 내용으로 작성해보려 합니다.
🗞함께 보면 좋은 읽을거리
데이터가 법적으로 ‘물건’이라면, 활용 기업에 대가 물을 수도 [경향신문]
정부 “공공 국민데이터, 기업에 개방”…개인정보 오남용 막을 방안은 ‘빈 칸’ [한겨레]
개인정보보호위 “정보주체 권리 강화…개인정보보호법 개정 추진” [한겨레]
글 사진 | 빠띠 공익데이터팀 큐
편집 | 빠띠 공익데이터팀 data@parti.coop