- 새로운 뉴스를 올려주세요.
Date 21/01/15 22:21:55수정됨
Name   구밀복검
Subject   100억 건 개인정보 침해로 차별과 혐오를 ‘이루다’
https://slownews.kr/79128
https://1boon.daum.net/slownews/79128

대화형 챗봇 ‘이루다’를 개발하고 운영하는 스캐터랩은 2013년 ‘텍스트앳’, 2016년 ‘연애의 과학’ 등의 어플리케이션을 운영하며 카카오톡 등 메신저의 대화 내용을 수집해왔고
이를 자사 다른 제품인 대화형 챗봇 ‘이루다’의 학습용 데이터로 이용했습니다..

..연애의 과학 로그인 페이지에서 “로그인함으로써 개인정보 처리방침에 동의합니다”로 간주하는 것은 ‘각각의 사항’을 알리고 명시적으로 동의를 받도록 한 개인정보보호법 위반입니다(제15조 제2항 또는 제39조의3제1항 및 제22조 위반).. 적법한 동의에 해당하기 위해서는 이용자가 개인정보에 관한 결정권을 충분히 자유롭게 행사할 수 있도록, 통상의 이용자라면 손쉽게 법정 고지사항의 구체적 내용을 알아볼 수 있을 정도로 법정 고지사항 전부를 명확하게 게재해야 합니다. 이처럼 정보주체에게 충분히 설명하지 않고 충분히 인지되지 않은 동의는 제대로 된 동의라고 보기 어렵습니다..

..사용자들이 분석을 위해 제공한 카카오톡 대화는 2인 이상의 대화입니다. 개인정보 보호법 제15조 또는 제39조의3제1항에 따라 마땅히 받아야 할 대화 상대방에 대한 동의 절차는 어디에도 없었습니다. 지난 12일 스캐터랩은 논란이 지속되자 서비스를 중지하고 사과의 뜻을 밝혔지만, 대화 상대방의 동의 부존재에 대해선 한 마디 언급도 없었습니다.. 이러한 데이터는 원본과 가명 정보 모두 폐기해야 마땅합니다.

‘텍스트앳’, ‘연애의 과학’ 서비스는 카카오톡 등 메신저를 통한 사적인 대화 내용을 수집하는 바, 이에는 이름과 연락처, 주소 등 개인의 신원이 드러날 수 있는 다양한 개인정보와 더불어 더 민감한 다른 정보도 포함되어 있습니다. 자신의 사상, 신념, 정치적 견해, 건강상태, 성생활에 대한 정보, 인종과 민족에 대한 정보 등은 민감정보입니다. 숫자뿐 아니라 한글과 이미지 등 다른 형태로 표시된 여권번호, 운전면허번호, 외국인등록번호는 고유식별정보입니다. 민감정보와 고유식별정보는 정보주체의 명시적인 동의나 법령상 허용조항 없이는 누구도 수집하거나 이용할 수 없는데 ‘연애의 과학’은 이에 대한 별도 동의를 받지 않았으며 실제로 성생활 등에 대한 정보가 수집 이용된 것으로 보입니다(제23조제1항 및 제24조 제1항 위반).. 이러한 내용은 스캐터랩과 어플리케이션의 유료 기능의 개인정보 처리방침 어디에도 고지되지 않았습니다..

..이름, 주소 등이 노출되는 사례가 등장하고 있는 것은 스캐터랩의 비식별화 또는 가명처리의 수준이 적정하지 않았다는 점을 분명히 드러내고 있으며, 스캐터랩은 얼마 전까지 연애의 과학에서 추출된 일부 대화 내용을 오픈소스 플랫폼에 훈련 데이터셋으로 공개하기도 했습니다. 해당 데이터셋의 경우 이름, 건강 상태, 직장 등의 개인정보가 비식별화되지 않은 상태였습니다..

..눈에 두드러지는 숫자, 영문, 이름 등만 개인정보인 것이 아닙니다. 다른 정보와 쉽게 결합하여 알아볼 수 있으면 개인정보로서 똑같은 보호 대상입니다. 성명은 지웠지만 여성이고, 이십대라는 점을 알고 있으며, 숫자와 영문은 삭제되었지만, 서울 성북구에 살고, 특정 은행에 계좌가 있고, 특정 대학교 특정 학과 또는 특정 기숙사를 출입한다면 개인을 특정할 수 있습니다..

..이번 이루다 논란은 기업을 위한 데이터3법이 자초한 문제이기도 합니다. 시민사회는 데이터3법이 기업들로 하여금 개인정보를 가명처리한 후 정보주체의 동의 없이 인공지능 제품 등 기업의 상품개발에 거의 무한대로 이용할 수 있도록 허용한 데 대하여 비판해 왔습니다. 공익적 학술 연구 등에 정보주체의 동의 없이 가명정보를 사용할 수 있도록 하는 유럽연합 등의 사례가 있지만, 기업의 상업적인 제품 개발을 위해 정보주체의 기본권을 무시하며 가명정보를 무제한적으로 이용하는 것은 위헌적입니다..

..구속력 있는 ‘법’이나 ‘제도’가 아니라 단순한 자율 규범으로, 아무런 강제성이 존재하지 않는 가이드라인으로 인공지능 제품의 악영향을 막을 수 없을 것입니다. 인공지능 제품과 그 학습 데이터의 편향성의 문제는 윤리가 아니라 법률 규범의 문제입니다. 세계 각국은 인공지능 제품과 그 학습 데이터에 대하여 제조물 책임법, 소비자 보호법, 정보공개법, 개인정보 보호법, 평등법 등 현행법을 정교하게 적용하기 위해 노력하고 있습니다.

유럽연합의 경우 인공지능 제품과 서비스에 대해 기존 법률의 준수는 물론이고, 추가적으로 ‘고위험’ 인공지능에 해당할 경우 훈련데이터, 기록 보존, 정보공개, 견고성, 인적 감독 등의 법적 의무를 추진하고 있습니다. 이 때 공공적으로 법적인 효과를 낳거나 의료, 운수, 에너지 분야에서 중대한 손상을 야기하거나 노동자나 소비자의 권리에 영향을 미치는 인공지능 제품과 서비스는 ‘고위험’에 해당합니다. 이 중 훈련 데이터에 대한 법적 의무로는
△충분히 광범위한 데이터셋에 기반해 훈련하는 등 그 안전을 합리적으로 보장할 것
△금지된 차별을 수반하는 결과로 이어지지 않도록 합리적인 조치를 취할 것
△제품과 서비스를 사용하는 동안 사생활과 개인정보를 적절히 보호할 것
등을 요구할 예정입니다.
캐나다는 이미 2019년부터 공공기관 자동화된 의사결정에 대한 지침(정부 훈령)을 제정하고 모든 공공기관 인공지능 알고리즘에 대하여 영향 평가를 실시하고, 생산 전에 훈련 데이터가 의도하지 않은 데이터 편향을 드러내거나 결과에 부당하게 영향을 미칠 수 있는 요소가 있는지 검사 절차를 거치고 있습니다. 심지어 자율규제의 나라 미국에서도, 법 집행기관의 인공지능 사용과 채용을 위한 인공지능 사용 등 특정 영역을 강하게 규제하는 법이 제정되고 있습니다.



파면 팔수록 괴담에 가깝네요. 스캐터랩이 아니라 (신상) 스크랩이네
자체 어플 이용자들이 어플 쓰면서 제공한 대화록과 신원 정보 긁어가지고 인공지능 채팅봇 데이터로 써먹는다니.. 이거 뭐 완전 흥신소 수준



2


토끼모자를쓴펭귄
페이스북, 인스타그램 등 sns나 원드라이브, 구글 드라이브 등 클라우드에서 인공지능 학습을 위해 데이터를 수집하면서 개인정보 침해를 하고 있을 거라고 생각합니다. 그것이 수면 위로 드러나느냐 그렇지 않느냐의 차이일뿐..
자세히 읽어보시면 그렇게 퉁 칠 일이 아닐겁니다.
토끼모자를쓴펭귄
자세히 읽어봤지만 본질적으로 다를 바 없다고 생각합니다. 제가 놓친 점이 있나요?
수면 위로 드러나느냐를 본질로 볼 게 아니라 데이터 수집에 동의하더라도 해당 데이터에 대한 전/후처리과정에서 비식별화와 같은 작업들이 성실하게 이뤄지느냐, 데이터 활용과정에서의 직업윤리를 얼마나 잘 지키느냐, 데이터를 처리하는 사람들이 정보에 대해 적절한 기준을 지키며 작업하느냐와 같은 절차적 요소들이 지켜지느냐 아니냐가 훨씬 더 중요하다는 것입니다. 부동의가 포인트라면 그냥 동의했는데 뭐 어때와 같은 말밖에 나올 게 없으니까요.
토끼모자를쓴펭귄
저는 저런 sns나 클라우드 기업 등등이 그런 데이터 활용 절차를 제대로 따르지 않고 있을거라는 강한 심증이 있습니다. 이미 우리는 저런 개인정보 위험에 만연하게 노출되어 있는 상태라는 말을 하고 싶었습니다.
구밀복검
해서 그런 빅 테크에도 현재 규제 줄다리기가 가해지고 있지요. 실제로도 상당한 관리하에서 정보가 처리되고 있고요. 적어도 소송전 벌이며 대법까지 가 봐야 책임 소재를 규명할 수 있는 정도의 프로토콜은 수행하고 있는 것이죠. 덧붙여 심리적으로도 차이가 느껴지는 게, 빅테크들이 공급하고 있는 서비스들은 브랜드가 명확하죠. 다들 무의식적으로라도 이 서비스에서 얻는 데이터를 다른 서비스에서 이용하겠거니 하는 짐작을 할 수가 있습니다. 즉 부분적으로라도 공개적인 측면이 있죠. 그만큼 빅테크들은 범사회적인 입지를 갖고 있어 공공적이고 공공연하... 더 보기
해서 그런 빅 테크에도 현재 규제 줄다리기가 가해지고 있지요. 실제로도 상당한 관리하에서 정보가 처리되고 있고요. 적어도 소송전 벌이며 대법까지 가 봐야 책임 소재를 규명할 수 있는 정도의 프로토콜은 수행하고 있는 것이죠. 덧붙여 심리적으로도 차이가 느껴지는 게, 빅테크들이 공급하고 있는 서비스들은 브랜드가 명확하죠. 다들 무의식적으로라도 이 서비스에서 얻는 데이터를 다른 서비스에서 이용하겠거니 하는 짐작을 할 수가 있습니다. 즉 부분적으로라도 공개적인 측면이 있죠. 그만큼 빅테크들은 범사회적인 입지를 갖고 있어 공공적이고 공공연하니까. 법적 책임을 회피하는 논변으로 쓰여선 안 되겠지만 어쨌든 사용자들도 인지한 상태에서 이루어지는 것들이 많다는 거죠. 관련해서 이미 보도도 많았고.. 반면 이루다를 보고서는 그런 짐작을 하기가 어려웠을 거라 생각합니다. 스캐터랩은 듣보였고 스캐터랩의 자체 서비스들이 이루다와 네트워크를 이루고 있다는 건 아는 사람들이나 알 정보였을 테니까. 그래서 기만성이 더 크다고 느껴지네요.
1
토끼모자를쓴펭귄수정됨
근데 현실적으로 국회에서 '~~해야 한다'라는 입법을 해도, 데이터 수집에 환장한 정보 기업들이 과연 그 법을 얼마나 따라줄지 궁금합니다. 저런 영향 평가들과 검사들.. 얼마나 기업들을 잘 감시할지 모르겠어요 뒤로 숨길 구석이 너무 많아보이는지라..

+ 그리고 그 기업들을 감시하는 정부라는 프레임도 저는 믿지 않습니다. 마이크로소프트 등등 기업들과 미국 정부가 한통속으로 전세계인들의 개인정보를 빨아들이고 있다고 생각합니다.
이 건 터지면서 업계 한측에서는 또 긁어부스럼 만들어서 규제만들고 못살게 굴고 ai도 경쟁력 잃겠다는 소리 나오더라구요.
구밀복검
이미 사건이 벌어진 마당에 어불성설일 수도 있겠습니다만 관련 이해당사자들이 선제적으로 적정한 관리 수칙과 규범을 요구하면서 울타리를 치는 게 맞지 않겠나 싶네요. 옳다구나 하고 이참에 속옷까지 털어가는 거 막으려면 점퍼는 내 줘야..
1
사실 이런건 업계 관계자들이 더 빡세게 성토해야죠. 안그러다가 '비효율적 규제'에 불만 터뜨려봐야 별 수 없고. 데이터라는 자산이 지닌 특이성/가치 자체가 혼란스러운 시대라 한 큐에 깔끔하게 잘 정리될 수는 없겠지만서도.
켈로그김
이런게 업계인의 정치감각인 것이고
이게 있어야 살아남죠(...)
1
동네주방장
이거 법적으로도 걸릴꺼에요.
개인정보로 분류되는 데이터들을 사용할때는 기본적으로 무엇을 수집하고, 수집의 목적이 무엇이고, 어디에 사용될건지를 구체적으로 명시해야하는데 정황상 이루다 서비스가 그렇게 수집해서 사용한것 같지는 않아보입니다.

별개로 글로벌 서비스들 역시 마찬가지로 무차별하게 수집하고 있고, 그것을 제대로 고지하고 있지 않습니다. 문제는 정통부에서 이를 제대로 인지하고 있지 않고 있는거 같아요. 중국처럼 일방적으로 통제하는 것까지는 아니라도, 우리도 개인정보에 있어서는 좀더 배타적으로 운용할 필요가 있다고 생각합니다.
보이차
스토커랩...?
목록
번호 제목 이름 날짜 조회 추천
22965 IT/컴퓨터100억 건 개인정보 침해로 차별과 혐오를 ‘이루다’ 13 구밀복검 21/01/15 3307 2
22953 IT/컴퓨터카카오맵 일부 이용자 신상 노출…카카오 "보완하겠다"(종합) 1 다군 21/01/14 3845 0
22944 IT/컴퓨터카카오 "차별·증오발언 강경 대응하겠다" 6 구밀복검 21/01/14 3489 3
22936 IT/컴퓨터'애플카' 얘기 꺼낼까…팀쿡 오늘 밤 중대발표 예고 9 아재 21/01/13 3519 0
22935 IT/컴퓨터비트코인 전자지갑 비번 까먹은 미 남성, 2천600억원 날릴 위기 11 다군 21/01/13 3451 0
22921 IT/컴퓨터이루다 개발사, 연인 카톡 대화 수집하고는 돌려보며 웃었다  6 쿠팡 21/01/12 4991 0
22828 IT/컴퓨터'테슬라', 이마트·신세계 충전소 4년 만에 뺀다 6 먹이 21/01/04 3478 1
22740 IT/컴퓨터'내돈내산'인데 수리는 회사 마음대로? 12 먹이 20/12/25 5793 4
22558 IT/컴퓨터전 구글 엔지니어, 내부고발 후 해고 20 구밀복검 20/12/11 5824 1
22529 IT/컴퓨터'화웨이' 쓰면 미군 빼겠다는데..'LG유플 속앓이' 뒷짐진 정부 17 먹이 20/12/08 4317 0
22471 IT/컴퓨터 120만 원 주고 산 휴대전화…2년도 안 돼 "부품 없다"? 13 다군 20/12/03 3293 0
22412 IT/컴퓨터SKT의 새로운 사명은 '티모'?···상표 출원 4 swear 20/11/27 4219 0
22388 IT/컴퓨터지우려 x 눌렀더니 한눈 가득 광고.. 언론사 무더기 적발 11 알겠슘돠 20/11/25 4617 0
22362 IT/컴퓨터네이버가 일주일만에 만든 AI, 400일 전화돌려 코로나 확산 막았다 11 보리건빵 20/11/22 3926 1
22360 IT/컴퓨터이랜드에 랜섬웨어 공격…뉴코아아울렛 등 점포 절반 영업중단 6 다군 20/11/22 4293 0
22345 IT/컴퓨터카톡 프로필 상대에 따라 다르게…사생활 노출 막는다 18 다군 20/11/19 5120 0
22315 IT/컴퓨터탑건들에 5전5승…AI 전투기 조종사 시대 열린다 2 다군 20/11/16 4238 1
22183 IT/컴퓨터애플, 잡음나는 에어팟 프로 리콜 2 다군 20/11/01 3967 0
22182 IT/컴퓨터美 "한국, 화웨이 쓰면 정보보호 타격"…우회 압박 9 Cascade 20/11/01 3858 0
22166 IT/컴퓨터화재 논란 이어 '벽돌현상'까지..속 타는 코나 전기차 오너 15 먹이 20/10/30 3475 0
22134 IT/컴퓨터아이폰12 ‘친환경 명분’에 숨은 포석 삼성 따라하나... "갤럭시S21서 이어폰 뺄 듯" 7 swear 20/10/27 3911 1
22073 IT/컴퓨터"아이폰12, 아이폰11 뛰어넘었다"…사전주문 200만대 14 swear 20/10/20 4477 0
22048 IT/컴퓨터남양주서 코나 전기차 또 화재…인명피해 없어 4 먹이 20/10/17 4149 1
21964 IT/컴퓨터 삼성전자, 4만원대 스마트밴드 '갤럭시 핏2' 출시... 샤오미와 가성비 대결 9 맥주만땅 20/10/07 3786 0
21945 IT/컴퓨터실체 드러난 네이버의 검색 알고리즘 조작…신뢰성 타격 불가피 9 다군 20/10/06 4916 0
목록

+ : 최근 6시간내에 달린 댓글
+ : 최근 12시간내에 달린 댓글

댓글