월간참여사회 2019년 04월 2019-04-01   4897

[통인] 데이터가 세상을 이롭게 할 수 있을까 – 김슬 닷페이스 개발자

데이터가 세상을 이롭게 할 수 있을까

김슬 닷페이스 개발자 

906A2098 

 

글. 김도연 참여사회 편집위원, <미디어오늘> 기자 

사진. 박영록 자원활동가 

 

세상에 파편처럼 흩어진 데이터를 수집하고 그것을 한데 모아 유의미한 분석의 결과 값을 보여주는 일. 그것을 ‘데이터 저널리즘’이라고들 한다. 개발자는 그 과정에 ‘파이프라인’을 놓는 작업을 주로 한다. 대한민국 고위 공직자 재산이 궁금할 때 특정 이름을 기입하면 바로 재산 내역을 공개해주는 웹사이트 등이 대표적이다. 

 

웹사이트 개발뿐 아니라 공공기관 데이터 수집과 시각화, 음성의 자막화 같은 생산성 도구 향상, 커뮤니티 활성화 작업 등 데이터 저널리즘을 표방하는 언론사에서 개발자 손을 거치지 않는 건 없다. 개발자 몸값이 뛰는 이유이기도 하다.  

 

지난 14일 서울 종로 참여연대 인근에서 만난 개발자 김슬은 ‘더 나은 민주주의 플랫폼’을 말한다. 올해 초 <뉴스타파>를 퇴사한 그의 이름은 ‘내차결함’, ‘박근혜·최순실 게이트 국조특위’, ‘박근혜·최순실 체제의 부역자들’ 등 특별 웹사이트에서 찾아볼 수 있다. 뉴스타파 저널리스트들이 수많은 데이터를 집적·분석한 결과물에서 상관관계를 찾고 이를 시각화해 시민들에게 제공하는 역할이다. 그는 “아직 청렴한 사회가 가능하다고 믿는다”며 “시민들이 실시간으로 지켜보지 않아도 관찰자가 세팅만 되어 있다면 부정부패도 줄 수 있다”고 말했다. 그가 ‘파이프라인’으로 변화와 변혁을 꿈꾸는 이유이기도 하다.   

 

4차 산업혁명 시대라고 말한다. 데이터(Data), 네트워크(Network), 인공지능(AI)은 정부의 3대 핵심 기반 산업이기도 하다. 정부는 데이터를 활용한 공무원들에게 포상을 주는 등 ‘데이터기반 행정’을 전면에 내세우고 있다. IT 기술 혁신이 더 나은 세상일까. 지나친 장밋빛 전망은 아닐까. 김슬은 “블록체인은 쓸모없는 기술”, “AI는 과대 포장돼 있다”며 정부와 ‘사기꾼’들에게 이의를 제기했다. 그가 꿈꾸는 세상을 들어봤다.  

 

지난 1월 말 <뉴스타파>를 떠났다. 이유가 있을까. 근황도 궁금하다.

하고 싶은 일이 몇 가지 있었다. 이미 이룬 일도 있고 아쉽게 하지 못한 것도 있다. 그런 일들을 하기 위해 퇴사한 면도 있다. ‘좋은 소프트웨어는 소프트웨어 회사에서 만들 수 있다’는 생각도 컸다. 언론사 조직과 소프트웨어 회사의 시스템은 각각 장단점이 있고 적합한 것도 다르다. <뉴스타파>를 다니면서 <닷페이스> 활동도 같이 했는데 이제 월급을 주는 곳은 <닷페이스>뿐이다.(웃음) 이 밖에 월급 받지 않는 단체들을 만들거나 운용하고 있다.

 

하고 싶던 일이라 하면?

아직 청렴한 사회가 가능하다고 믿는다. 이와 관련 일종의 ‘파이프라인’ 같은 걸 만들 수 있다고 생각한다. 데이터가 공개되는 시점부터 프로그램이 자동으로 데이터를 수집해 문제점을 찾는 파이프라인. 부정부패를 일삼는 분들이 악인이라 불법을 저지른다고 생각하지 않는다. 편익을 고려해 불법을 저질렀을 때 얻는 편익이 처벌 비용보다 크기 때문에 부정부패를 선택한다고 생각한다.

 

‘파이프라인’이라는 말이 흥미롭다. 조금 더 구체적으로 설명해 달라.

행동경제학자 댄 애리얼리의 책을 읽고 그런 개념을 알게 됐다. 학생들을 대상으로 한 실험이 있다. 시험을 보는 데 걸릴 확률이 거의 없는 환경에선 확실히 학생들이 평균적으로 더 많은 치팅(Cheating·부정행위)을 한다. 흥미로웠던 것은 ‘촬영 테이프는 절대 보지 않고 폐기한다’는 전제로 시험 보는 장면을 촬영했을 때, 치팅이 확 줄었다는 거다. 부정부패도 마찬가지라고 생각한다. 시민들이 실시간으로 지켜보지 않아도 관찰자가 세팅만 되어 있다면 부정부패도 줄어들 수 있다고 믿는다.

 

최근 <중앙일보> ‘우리동네 지방의회’ 같은 디지털 플랫폼이 대표적이다. 많은 이들이 꼼꼼하게 보며 ‘이건 문제야’ 라고 지적하지 않아도 감시하는 플랫폼이 있다는 사실만으로 의원들의 행동이 달라질 거라 생각한다. 금융권에서는 ‘이상금융거래탐지시스템(Fraud Detection System·FDS)’ 등으로 사기 행위를 사전에 탐지하는데, 정부나 나라를 대상으로 한 시스템은 없는 것 같다. 그런 걸 만들어보고 싶다.

 

<뉴스타파>가 개발한 ‘내차결함’ 등이 매우 인상적이었다.

출시했을 때 반응은 되게 좋았다. 그러나 웹사이트나 소프트웨어의 출시는 전체 프로세스에서 20% 정도에 불과하다. 향후 소프트웨어를 어떻게 업데이트하느냐가 더 중요하다. 업데이트할 수 있는 동력이 줄어 아쉽기도 했다. ‘좋은 소프트웨어는 소프트웨어 회사에서 만들 수 있다’고 이야기하는 까닭도 여기에 있다. 소프트웨어를 만드는 사람은 출시가 전부가 아니라는 걸 무척 잘 안다. 그 이후가 훨씬 중요하다.

반면 소프트웨어 쪽이 아닌 분들은 출시를 가장 중요하게 본다. 출시만 하면 모든 게 끝난다는, 그런 생각을 갖고 계신 것 같다. 꾸준한 관심이 중요하다. 수많은 소프트웨어 가운데 2년 뒤 남아있는 건 몇 개나 될까, 그런 생각을 하곤 한다.

 

개발은 특히 협업이 요구되는 분야로 알려져 있다. 언론사와의 협업에 어려운 점은 없었나. 

개발자와 협업이 어렵다는 말은 과장된 것 같다. 협력은 그 자체로 어려운 일이다. 그걸 인정하고 서로를 존중하는 자세, 즉 애티튜드가 중요하다. 다만 권위의식이 강한 조직에서는 소프트웨어가 만들어지기 어렵다고 생각한다. 선후배 문화가 견고한 조직 말이다. 또 회의를 많이 한다고 해서 커뮤니케이션이 잘 되는 것도 아니다. 오히려 회의를 많이 하는 곳에서, 회의했다는 사실에 기대어 커뮤니케이션에 신경 쓰지 않는 경우가 있다.

 

<닷페이스>는 운영 초기부터 소프트웨어 회사처럼 시스템을 설계했는데, 회의 방식이나 팀 구성 등을 지속적으로 바꿔왔다. 또 프로젝트든 조직이든 어떤 것이든 그에 대한 ‘회고’를 진행하고 있다. 그 회고를 통해 서로와 스스로를 자주, 그리고 깊이 평가할 수 있다고 생각한다.

 

김슬 개발자가 참여한 데이터저널리즘 프로젝트  

 

 월간참여사회 2019년 4월호 (통권 264호)

박근혜-최순실 체제 부역자들

 

월간참여사회 2019년 4월호 (통권 264호)

내차결함(리콜, 무상수리 등 차량의 결함 정보를 제공하는 플랫폼)

 

출처 뉴스타파 홈페이지 

 

평소 강연이나 발표에서 데이터와 통계 분석이 틀릴 수 있다는 것을 매우 강조한다. 무지와 실수를 인정하기, 겸손함, 협업 등의 태도가 개발에 미치는 영향이 있을까? ‘애티튜드(attitude·자세)’가 차이를 만들어내는 것인가? 

중요한 차이를 만든다. 같은 데이터로 정반대 결론이 나오기도 한다. 때문에 ‘내가 항상 틀릴 수 있다’는 자세가 중요하다. 학계에서 ‘재현성의 위기’라고 부르는데 잘못된 통계를 기반으로 한 실험 결과들이 재현되지 않는 거다. 작업을 보다 투명하게 하고, 겸손한 마음가짐을 갖는 게 중요한 것 같다.

 

인공지능(AI)과 블록체인 시대라고들 한다. 인공지능에 블록체인이 결합했다는 기사도 쉽게 볼 수 있다. ‘혁신 성장’을 강조하는 문재인 대통령은 지난 1월 신년 기자회견에서 “데이터, 인공지능, 수소경제의 3대 기반 경제에 총 1조 5천억 원 예산을 지원할 것”이라고 밝혔다. 정부가 IT업계를 바라보는 관점에 문제는 없을까. 개발자 시선에서 바라본 문재인 정부의 4차 산업혁명 정책이 궁금했다. 

 

문재인 정부의 ‘4차 산업혁명’ 정책에 총평을 한다면?

전반적으로 비민주적이다. 전문가 의견이 제대로 반영되지 않는다. 그러니까 계속 ‘사기꾼’들 의견만 반영된다. 또 기본적으로 ‘데이터 만능주의’에 빠져 있다. 데이터만 잘 활용하면 뭐든 쉽게 해결될 거라 보고 방해되는 걸 자꾸 없애려 한다. 

 

대표적 사례가 있다면?

자격증 분야인 것 같다. 자격증 효용이 크지 않는데 계속 만든다. (사물인터넷 인력 양상을 위한) 아두이노(Arduino) 자격증이나 국가자격증으로 격상하는 데이터분석 자격증 등이 그렇다. 정부도 비(非)소프트웨어 회사처럼 소프트웨어에 대한 오해를 갖고 있다. 출시만 하면 된다는 마인드다. 이를테면 캐글(Kaggle·크라우드소싱 플랫폼)과 유사한 사이트를 만들겠다고 하는데, 웹사이트 코드가 전부가 아니다. 그것을 운영하거나 그곳에서 활동하고 있는 사람들이 어떻게 관계 맺고 커뮤니티를 형성해 협력하는지가 더 중요하다. ‘웹사이트를 출시하면 사람들이 거기서 활동할 거야’라고 생각해선 안 된다. 커뮤니티를 만들고 그걸 건강하게 지속시키는 건 쉬운 일이 아니다.

 

정부의 블록체인에 대한 관심도 큰 듯하다. 

전문가들 사이에서 의견이 갈리기도 하지만 대체로 블록체인은 쓸모없는 기술이다. 만들어진 지 오래된 기술인데도 유용한 프로덕트는 없었다. 세상에서 가장 똑똑하다는 사람들이 오랜 시간 사용처를 찾아봤지만 없었다. 개발자로 있다 보면 ‘거품 용어’를 접하게 되는데, 사기인지 아닌지 구분하는 기술이 생긴다. ‘본질이 뭐냐’다. 블록체인은 결국 ‘데이터베이스’인데, 블록체인이 들어간 문장을 데이터베이스로 바꿔서 읽어보라. 데이터베이스로 민주주의를 혁명한다? 데이터베이스로 음악시장을 바꾼다? 블록체인을 데이터베이스로 바꿔 읽었을 때 말이 안 된다.

 

인공지능에 대한 사회적 관심이 큰데, 그것도 과장된 면이 있나.

매우 거품이다. ‘AI’라는 용어 자체가 문제다. 인류는 아직 지능이 무엇인지 제대로 모른다. 사칙연산을 하는 계산기는 지능이 아닌가. 지능을 써야 하는 일을 컴퓨터가 일부 대체하고 있는 건 맞다. 그러나 인간의 방식과 다르게 하고 있다. 실제 우리 지능이 동작하는 방식과 완전 다른 방식으로 기능하는 걸 AI로 불러야 하는지 의문이다. 자동차를 인공다리라 부르지 않는 것처럼 말이다. 현재의 인공지능 기술 대부분은 회귀분석이라 생각한다. AI도 회귀분석으로 바꿔 읽어보라. 회귀분석으로 안전한 세상을 만들 것이다? 회귀분석으로 병을 고친다? 물론 데이터를 통해 많은 부분이 바뀌고 기술도 발전하겠지만 매우 과대 포장돼 있는 건 사실이다.

 

정부 부처의 데이터 수집 정도는 어느 수준으로 보나?

낮은 수준이다. 그보다 앞서 중요한 건 평소 공무와 데이터가 맞닿아 있느냐 여부다. 업무 결과를 데이터화 하는 프로세스의 도입보다 더 중요한 일이다. 평소 자신들이 하는 일을 계량화하고, 분석적 사고를 갖고 계량화한 그 데이터에 접근하는 일, 이 부분이 미비한 것 같다. 하는 업무 자체가 디지털이 아닌 상황에서 ‘데이터 공개’는 더 나중의 일일 수밖에 없다. 정부가 발의했던 법안 가운데 데이터기반행정 활성화에 관한 것이 있다. 데이터를 활용하면 공무원들에게 가산점을 주겠다는 건데, 제대로 된 데이터 활용과 분석이 가능할지 의문이다. 

 

정부의 정보공개에서 나타나는 문제점이 있다면?

어떤 것은 정보공개법으로, 어떤 것으로 공공데이터법으로, 또 어떤 것은 통계법에 근거해 공개한다. 정보공개법을 통한 공개의 경우 기계가 판독할 수 없는 자료들을 제공하곤 한다. 지난 3월 2일, 세계 오픈데이터데이를 맞아 개발자들이 모여 가장 많은 시간을 들인 것이 정부가 제공한 PDF 이미지에 기재돼 있는 숫자나 주소를 엑셀에 옮기는 작업이었다. 분명 정부의 원본 데이터는 디지털로 돼 있을 텐데, 이미지 파일로 공개하고 있다. ODI(Open Data Institute)라는 단체가 각 나라 정보공개 평가 지표를 공개한 적 있다. 한국의 경우 다른 분야는 비교적 상위에 있었지만 정부 관련 데이터를 기계가 읽을 수 없어서 그 부분 점수가 매우 낮았다.

 

‘사기꾼’들이 눈 가린 정부 혹은 ‘사기꾼’과 정부의 유착. 방관만 해선 안 될 것 같은데?

회사를 떠난 이유와도 연관이 있다. 정답을 갖고 있는 건 아니지만 그 부분을 고민하는 데 시간을 써야겠다는 생각이 들었다. 정부를 감시하는 조직을 만들 계획이 있다. IT업계 사람들은 정부 정책을 비판할 뿐 실제 정책을 바꿔보는 데 참여는 하지 않았다. 문제 제기를 하는 건 소수였다. 정부 정책에 ‘사기꾼’들이 참여하고 다시 ‘사기꾼’들을 키우는 현상은 IT업계뿐만 아니다. 정부 정책에 관한 활동을 했을 때 느낀 건 공무원들이 생각보다 듣고자 한다는 거다. 조금이라도 참여 방법을 아는 사람들이, 조금이라도 더 해본 사람들이 가이드를 줘야 한다.

 

906A1805

 

하이퍼텍스트 시스템을 고안한 팀 버너스리는 얼마 전 월드와이드웹(World wide web·WWW) 제안 30주년 인터뷰에서 웹이 공공선을 위한 도구가 될 수 있는지 사람들 사이에 의구심이 생기고 있다고 말했다. 웹은 공공선을 위한 도구인가.

그럴 수도 있고 아닐 수도 있다. 다루는 사람들이 어떻게 하느냐에 달린 문제 아닐까. 본디 인터넷은 인간이 하는 일을 가속한다고 생각한다. 인간의 악한 면은 악한 면대로, 선한 부분은 선한 부분대로 가속한달까. 만약 세상에 평화의 시대가 온다면 인터넷에 의해 도래할 거라 기대한다.

 

참여연대도 ‘열려라 국회’를 비롯해 축적된 데이터를 시민과 나누는 고민을 하고 있다. 방대한 데이터가 시민들에게 유용한 정보가 되기 위해 필요한 것이 있다면?

오픈소스 프로젝트를 할 때 중요한 것은 ‘참여’다. 어떤 문제가 발생했을 때 직접 해결하는 대신 다른 사람이 참여할 수 있게 ‘잘 정의된 어떤 문제로 만들 것인가’가 중요하다. <오마이뉴스>가 세세하게 공개해놨지만, ‘우리 동네 국회의원 후원금 사용내역 청구해보기’처럼 정의된 문제로 만들어 시민들에게 제공한다면 참여가 이뤄질 수 있다.

 

개발자들이 쉽게 빠지는 함정인데, 웹사이트를 구현하는 기술만 가지면 참여가 뒤따른다고 생각한다. 그러나 참여를 위해선 참여자들의 심리도 잘 알아야 한다. 어떻게 하면 사람들이 부담 없이 친근하게 느낄까. 기능만 구현한다고 협력하지 않는다. 아무리 기술이 발전해도 ‘당신 어제 운동 안 했습니다’라는 AI의 알림과 ‘왜 어제 운동 안 했어요?’라고 묻는 인간의 말은 다를 수밖에 없다. 설득의 효과에 차이가 있다.

 

마지막으로 개발자를 꿈꾸는 이들에게 조언한다면? 참고할 만한 입문서나 사이트가 있을까?

요즘 개발을 배울 수 있는 리소스가 많아진 것은 사실이지만 정확히 말해서 개발을 배운다는 말은 없는 것 같다. 개발은 수단이다. 자기가 하고 싶은 개발이 뭔지 정확히 정의하는 게 가장 중요하다고 생각한다. 개발을 통해 무엇을 할 것인지 정하는 게 교육 리소스 찾는 것보다 중요한 일이다. 프로그램 언어는 전체 개발에서 일부분이다. 

 

[번외편] 개발자 김슬에게 궁금한 10문 10답 

 

1. 컴퓨터를 켜고 제일 먼저 띄우는 사이트는?

일단 컴퓨터를 안꺼서 켤 일이 없고요. 앉아서 처음 보는 사이트는 다른 분들과 비슷할것 같아요. 이메일, 메세지, 뉴스 확인, 페이스북.

 

2. 남들 보기에 쓸데 없지만 나한테만 유독 유용한 앱이 있다면?

유용함은 개발자라고 다르게 느껴지지 않는 것 같아요.

 

3. 정보공개청구 몇 달을 기다려 받은 자료가 PDF일 때 가장 먼저 하는 일은?

자료가 이미지 형태라면 변환하는데 얼마나 시간이 들어갈지, 자동화 할 수 있는 부분은 없을지 이리저리 굴려보고 만만하다 싶으면 변환을 진행합니다. 공무원의 업무 과정에서 생성되는 자료가 기계판독 불가능한 자료라면 이를 그대로 전달한 정보공개 담당 공무원에게 변환의 의무까지 있다고 생각은 하지 않아요. 오픈데이터 이전에 업무의 데이터화가 필요하다고 생각해요. 업무를 분석적인 사고로 바라보고 계량화하고 기록하는것이요.

 

4. 내가 짠 코드가 어떻게 진행되고 있는지 나도 잘 모를때 기분은?

특별한 기분이 들진 않습니다. 현재 상태를 기반으로 원인을 추정하고 검증하는 과정을 반복할 뿐입니다.

개발을 하는 과정에서는 프로그램이 잘 돌아가고 있는 상황일 때 보다 아닌 상황의 시간이 훨씬 많은 비중을 차지 합니다. 이 상태에 스트레스를 크게 받는지 아닌지 여부가 직업으로 개발자를 할 수 있느냐 없느냐를 가르는것 같아요.

 

5. 역사상 가장 위대한 업적이라고 생각하는 Tool은?

하나만 뽑기는 어렵네요. 지금의 IT라고 퉁쳐서 불리는것은 정말 다양한 분야의 많은 위대한 업적이 쌓이고 합쳐져서 이룩된것이라서요. 하지만 사람들이 꼭 한번 다시 돌아봤으면 하는 지점이 두 지점이 있습니다. 하나는 이반 서덜랜드의 Sketchpad(1963)고 하나는 더글라스 앵갤버트의 NLS(1968)입니다. Sketchpad에서는 화면에 펜을 가르켜 다이어그램이나 3D 모델을 그리는 개념을 선보였는데 이 프로그램을 개발한 연구소의 학생들과 동료들은 어도비, 픽사, SGI같은 회사들의 창업자가 되기도 했고 애플에서 현대적인 GUI를 만들거나 OOP의 개념을 만들기도 했습니다. 어떻게 한 그룹의 사람들이 다양한 분야에서 커다란 혁신을 이룰 수 있었는지 생각하며 보면 흥미로운 점이 많이 있습니다.

NLS에서는 마우스와 하이퍼미디어를 비롯해 많은 혁신적인 개념을 처음 선보였는데 시간이 흐른 지금 이들 중 어떤 부분들이 세상에 받아들여지고 어떤 부분들이 받아들여지지 않았는지 그 당시의 고민했던 기록들과 함께 살펴보면 많은 영감을 받기도 하고 재미도 있습니다. 지금 널리 사용하고 있는 개념들이 원래부터 있었던 당연한 것이라고 생각하지 않고 여러 아이디어들 중에 트레이드 오프를 고민하여 선택된 것들이라고 생각하는 자세를 가지면 더 많은걸 상상할 수 있습니다.

 

6. 개발자로 살아서 좋은 점을 한 가지만 꼽는다면?

배우는 것에 익숙해지는 점. 이 지점 때문에 개발자는 직업이라기 보다 삶을 살아가는 방식에 더 가깝다고 생각합니다. 주변에 실력 좋은 개발자들을 보면 악기를 잘 다루거나 다른 분야로 가서도 금방 두각을 나타내는 경우가 많은데 이런 이유가 아닐까 생각합니다.

 

7. 개발하면서 가장 힘이 되는 문구나 말이 있다면?

말보다도 밖에서 제가 만든 걸 쓰는 모르는 사람을 만났을때 가장 힘이 납니다.

 

8. 개발이 간단한 줄 아는 오너 또는 동료에게 하고 싶은 말 한마디

다른 사람들이 여러 시간 고생하던 작업을 해결하고 난 뒤에 꼭 붙이는 말이 있습니다.

“이건 15분 걸린게 아니고 15년 걸린겁니다.”

 

9. 만약 향후 나의 자녀나 조카가 개발자의 길을 걷는다고 하면?

지금의 개발자라는 직업과 그때의 개발자라는 직업은 (남아있다면) 매우 다른 직업이겠지요. 지금의 개발자를 기준으로 살펴본다면 질문 6의 이유로 추천할만한 삶의 방식인것 같아요.

 

10. 개발자로 생을 마감한다면, 묘비에 새기고 싶은 말은?

저는 생각하고 있는 장례식의 형태가 있어요. “장례식이라는 게 이 세상에 없고 새롭게 발명해야 하는 상황이라면 어떻게 만들까?”라고 생각해서 만든 거예요. 핵심은 죽기 전에 하고 있던 일들이 앞으로 어떻게 이어져 진행될지 사업 계획 발표 하듯이 하는 겁니다. 그 발표 영상이 곧 묘비라고 생각해요.

‘생산성 향상분의 공점’이나 ‘생산되는 가치와 지불의 일치’ 같은 문제 해결에 기여를 하는 프로젝트를 하고 있으면 좋겠고 그런 문제를 어느정도는 해결한 사람으로 소개할 수 있으면 좋겠어요.

 

정부지원금 0%, 회원의 회비로 운영됩니다

참여연대 후원/회원가입


참여연대 NOW

실시간 활동 SNS

텔레그램 채널에 가장 빠르게 게시되고,

더 많은 채널로 소통합니다. 지금 팔로우하세요!