빅데이터(Big Data)는 더 이상 데이터 전문가들의 전유물이 아니다. 일반대중도 빅데이터를 모르면 시대 흐름에서 뒤처진다는 사실을 인지하고 있다. 사물인터넷(IoT)과 다양한 소셜미디어를 통해 축적된 방대하고 복잡한 데이터를 빠르게 처리할 수 있는 인공지능 알고리즘이 개발되면서 빅데이터 분석은 기업,  비영리단체 그리고 정부를 포함한 모든 조직의 성패를 좌우할 정도로 중요한 위치를 점하고 있다. 위키피디아에 의하면 빅데이터는 1990년대부터 사용되기 시작했는데 일반대중에게 널리 알려진 것은 몇 년 되지 않는다. 그럼에도 빅데이터는 이 시대의 가장 중요한 자원으로 모든 분야에 걸쳐 막강한 영향력을 행사하고 있으며 앞으로 더욱 그럴 것이다

사진. 픽사베이

어떤 데이터든 우리에게 유익한 정보를 제공할 때 비로소 가치를 갖는다. 간단히 말해 '데이터 + 의미 = 정보'라는 공식이 성립하는데, 이것은 빅데이터의 경우 더욱 그렇다. 과거와는 달리 빅데이터가 주목받는 이유는 보다 정확한 정보를 얻을 수 있는 원천이기 때문이다. 빅데이터를 통해 발견되는 다양한 패턴들은 과거에는 얻을 수 없었던 가치 있는 정보를 제공한다. 그리고 우리는 이런 정보를 바탕으로 더 나은 결정을 내릴 수 있다. 만약 이런 정보를 제공할 수 없다면 빅데이터는 문자 그대로 양만 많은 잡동사니에 불과할 것이다. 양(quantity)과 질(quality)이라는 양립하기 어려운 정보의 두 가지 측면이 빅데이터 분석을 통해 하나로 통합되고 있는 것이다. 이것은 정보이론의 관점에서  매우 중요한 진전이다.

이와 같이 정보의 관점에서 빅데이터를 바라볼 때 상반된 두 가지 측면이 존재한다. 우선 밝은 측면부터 살펴보자. 빅데이터는 사물인터넷과 소셜미디어를 통한 빅데이터의 생성 → 인공지능 알고리즘을 이용한 분석 → 새로운 정보에 입각한 가시적 성과 → 새로운 빅데이터의 생성이라는 선순환을 통해 모든 조직의 효율을 높일 수 있다. 예를 들어 기업은 비용을 절감하고 시장점유율을 높임으로써 더 많은 이윤을 얻을 수 있다. 기후 변화에 대처하는 국제기구는 기후 변화에 영향을 미치는 요인과 관련된 정확한 정보를 바탕으로 문제 해결을 위한 효과적인 방안을 강구할 수 있을 것이다. 건강과 관련해서는 웨어러블 센서를 통해 얻은 빅데이터를 분석해 인간의 건강 유지와 수명 연장에 크게 기여할 것이다. 한 마디로 기업은 더 많은 이익을 얻고, 정부는 더 효과적으로 공공서비스를 제공하고, 개인은 더 건강하게 오래 살 수 있을 것이다. 이 모두가 빅데이터와 인공지능 알고리즘이 가져올 미래의 긍정적인 모습이다.

이처럼 빅데이터가 가져올 미래에 대한 전망은 대체로 낙관적이다. 빅데이터가 우리 삶을 더욱 풍요롭게 하고 미래를 보다 정확하게 예측하도록 유도해 여러 가지 위험을 줄이고 자원을 효율적으로 활용하는 데 기여하리라는 기대감 때문이다. 종합적으로 볼 때 필자도 사회 전반의 효율성을 높이는 데 크게 기여하리라는 주장에 동의한다. 빅데이터 전문가 버나드 마(Bernard Marr)는 저서 <빅데이터: 4차 산업혁명의 언어>에서 45개의 다양한 기업과 비영리조직의 사례를 구체적으로 분석했다. 그는 크고 작은 기업들이 빅데이터를 활용해 어떻게 비용을 절감하고 고객의 요구에 적절히 대응해 시장을 넓히고 수익을 늘릴 수 있었는지 보여주었다. 또한 그는 자신의 논리가 페이스북, 구글, 우버, 에어비앤비 등 인터넷 플랫폼 기반의 IT 기업뿐 아니라 월마트, 제너럴일렉트릭 등 전통적 대기업, 더 나아가 정육점이나 레스토랑 체인 등 작은 기업에도 적용된다는 점을 강조했다. 한 마디로 크고 작은 다양한 조직이 빅데이터를 이용해 최대 효율을 달성할 수 있다는 것이다. 이것은 빅데이터의 밝은 면에 해당한다.

그런데 빅데이터는 동시에 어두운 면을 드러내고 있다는 사실을 유념할 필요가 있다. 예컨대 빅데이터 전문가로서 알고리즘 개발에 참여해 온 캐시 오닐(Cathy O’Neil)은 저서 <대량살상 수학무기>에서 빅데이터 분석을 위한 수학적 알고리즘이 인공지능과 결합해 여러 분야에서 파괴적 영향을 미치고 있는 다양한 사례들을 보여주었다. 오닐이 특히 강조한 점은 수학적 알고리즘이 대부분의 경우 공평하지 않다는 것이다. 알고리즘을 작성하는 과정에는 설계자의 주관적 판단이 개입되는 경우가 상당할 뿐 아니라 현실과 모델의 차이로 말미암아 부정적 피드백 루프(feedback loop)가 형성된다고 주장했다. 이런 이유로 빅데이터는 대부분 공평한 결과를 달성하기는커녕 불공평을 조장한다는 것이다. 물론 오닐의 주장 가운데 액면 그대로 받아들이기 어려운 부분도 있다. 그렇더라도 어떤 기업도 공평과 같은 가치를 전제로 빅데이터 분석을 위한 알고리즘이 개발하지 않는 것만은 분명하다. 어떤 기업도 이런 가치를 전제로 빅데이터를 활용하지 않기 때문이다.

이처럼 빅데이터의 빛과 그림자는 ‘효율과 공평’이라는 관점에서 접근할 수 있다. 빅데이터는 자원의 효율적 사용을 가능하게 만들어 사회 구성원 모두에게 이익을 가져다줄 수 있지만 현재와 같이 소수의 초국적기업들이 데이터를 독점하는 상황에서는 공평이 훼손될 수 있다. 가뜩이나 불평등이 악화되고 있는 현 시점에서 이와 같은 데이터 독점은 부와 소득의 불평등을 극단으로 몰고 갈 수 있다. 아니 그럴 가능성이 매우 높다. 최근 주목을 받고 있는 역사학자 유발 하라리(Yuval Harari)는 저서 <호모 데우스>에서 빅데이터를 이용한 인공지능 알고리즘으로 인해 많은 사람들이 일자리를 잃고 쓸모없는 계층(useless class)으로 전락할 수 있다는 점을 강조했다. 이어서 그는 최근 저서 <21세기를 위한 21가지 제언>에서 모든 권위가 인간으로부터 인공지능 알고리즘으로 넘어갈 것을 우려하면서 다음과 같이 말했다. “우리는 지금 엄청난 두 가지 혁명이 합쳐지는 지점에 와 있다. 한편으로는 생물학자들이 인간 신체, 특히 인간의 뇌와 감정의 신비를 해독하고 있다. 동시에 컴퓨터 과학자들은 우리에게 유례없는 데이터 처리능력을 선사하고 있다. 생명기술 혁명과 정보기술 혁명이 합쳐지면 빅데이터 알고리즘을 만들어낼 것이고, 그것은 내 감정을 나보다 훨씬 더 잘 모니터하고 이해할 것이다. 그런 다음에 권위는 아마도 인간에게서 컴퓨터로 이동할 것이다.”

지금 우리는 빅데이터에 기반을 둔 약인공지능(ANI)이 제공하는 서비스를 통해 효율과 편리함을 즐기고 있지만 이는 일종의 중독 과정이라는 것도 유념할 필요가 있다. 예컨대 스마트폰은 등장한지 불과 10여 년 밖에 안 되었지만 우리 모두의 일상을 바꿔 놓았다. 많은 사람들이 스마트폰이 없으면 아무 것도 할 수 없는 존재가 되었다고 느낄 것인 바, 특히 젊은이들의 더욱 그럴 것이다. 스마트폰은 스스로 생각하는 능력을 점점 고갈시키고 있기에 극단적으로 말하자면 우리 모두 스마트폰 좀비(zombie)가 되어가고 있는 느낌이다. 구글맵이나 티맵과 같은 지도 서비스에 의존하지 않고는 감히 길을 찾을 엄두조차 내지 못하고 있는 실정이다. 이러니 좀비가 되어간다고 볼 수밖에 없다. 

앞으로 더 많은 데이터가 축적되어 인간을 완벽하게 통제할 수 있는 수준으로 빅데이터 알고리즘이 개발된다면 지금과 비교해 상황이 크게 달라질 수 있다. 이런 알고리즘을 개발한 기업이나 조직은 인간을 통제할 수 있는 힘을 사적인 이익을 위해 사용하려는 유혹을 떨칠 수 없을 것이기 때문이다. 데이터 독점은 결국 경제적 자원의 독점으로 이어질 것이고 이는 정보기술에 기반을 둔 새로운 전체주의로 발전할 수 있다. 현재 시장경제와 민주주의를 양대 축으로 하는 자유주의 시스템은 더 이상 유지되기 어려울 가능성이 매우 크다. 이것은 현 시점에서 우리가 예상할 수 있는 가장 우울한 시나리오다. 이런 이유로 빅데이터 시대를 마냥 반길 수만은 없다.

이와 관련해 유발 하라리가 <호모 데우스>에서 언급한 데이터주의(Dataism)는 데이터 독점에 따라 예상되는 상황을 묘사한 적절한 용어다. 하라리는 데이터를 신(神)처럼 받드는 한편 인간 스스로 자유의지를 부정하고, 빅데이터의 분석 결과를 맹종하는 상황을 묘사하기 위해 이런 용어를 만들어냈다. 예를 들어 아마존, 구글, 페이스북 등 우리의 일거수일투족에 대한 방대한 데이터를 축적한 기업이 우리가 누구이고, 무엇을 필요로 하는지 우리 자신보다 더 많이 안다면 우리는 자유의지를 포기하고 이들 기업의 지시에 따를 가능성이 높다. 그래서 하라리는 “데이터주의에 따르면 우주는 ‘데이터 스트림’으로 구성되어 있으며, 어떤 현상이나 실체 가치는 데이터 처리에 기여하는 바에 따라 결정된다”고 경고한 것이다. 이 말은 곧 데이터 처리 관점에서 인간보다 인공지능 알고리즘이 뛰어나다면 인간은 더 이상 가치가 없다는 것을 함축하고 있으며, 무엇이든 데이터 축적에 기여할수록 더욱 가치 있다는 뜻을 담고 있다. 바야흐로 데이터 자체가 목적이 되고, 이에 기여하지 못하는 인간은 쓸모없는 계층으로 전락할 수 있다는 것이다. 데이터주의의 종착역은 바로 데이터에 의한 인간 소외(疏外)다.

빅데이터는 오늘날 우리가 직면하고 있는 모든 문제를 해결해주는 마법 램프가 아니다. 오히려 빅데이터는 ‘빛과 그림자’라는 대극적인 두 측면을 내포하고 있기 때문에 조심스럽게 다루어야 한다는 점을 유념해야 한다. 특히 개인의 사생활 보호와 보안에 취약할 뿐 아니라 정보 독점을 통해 시장경제의 기반을 취약하게 만들고 민주주의를 약화시킬 수도 있으므로, 이런 의미에서 빅데이터의 문제점에 대해 진지하게 고민해 봐야 한다. 최근 소셜미디어가 민주주의를 위협할 수 있다는 언론 보도는 결코 과장된 이야기가 아니다.

빅데이터로 인한 문제를 해결하는 가장 효과적인 방법은 데이터 주권을 회복하여 데이터 민주주의를 실현하는 것이다. 이는 소수의 기업들이 빅데이터를 소유하는 대신 데이터의 원래 주인인 개인들에게 소유권을 돌려주어야 한다는 것을 의미한다. 그런데 이것은 결코 간단한 문제는 아니다. 무엇보다도 실행 가능한 구체적인 방법을 고안해 개개인들이 데이터의 소유권을 지킬 수 있도록 해야 하기 때문이다. 필자 생각에 이를 위한 가장 좋은 방법은 지금 한창 주목을 받고 있는 블록체인(blockchain) 기술을 활용하는 것이다. “공개 분산 원장(open distributed ledger)”이라는 블록체인 기술의 기본 특성을 활용한다면 네트워크에 참여한 사람들은 모두 동일한 데이터에 접근할 수 있다. 최근 필자가 확인한 바에 의하면 빅데이터와 블록체인 기술을 결합하려는 움직임이 활발하게 진행되고 있는 것 같다. 그렇지만 이것이 데이터 주권을 실현하도록 해주는 기술로 발전할지는 아직 미지수다.

이런 상황에서 최근 중국에서 블록데이터(Block Data)라는 개념이 등장했다는 사실을 유념할 필요가 있다. 이 개념을 제시한 중국의 전문가들은 빅데이터는 데이터 이기주의에 따른 데이터 독점으로 인한 부작용을 피하기 어렵지만 블록데이터를 통해서는 데이터 이기주의를 극복할 수 있다고 주장한다. 이들은 블록데이터는 빅데이터의 일부나 복제품이 아니라 빅데이터의 상위 버전에 해당한다고 말한다. 그러면서 빅데이터가 인류사회의 미래 예측에 도움을 준다면 블록데이터는 사회구조와 경제적 기능, 조직형태, 가치체계를 재구성하도록 할 것이라고 주장한다.

그런데 이들은 블록데이터가 ‘블록체인과 빅데이터의 결합’과는 다른 개념이라고 주장하지만 필자가 보기에 결국은 같은 개념으로 수렴할 것 같다. 어쨌든 이들은 블록데이터를 이용하면 데이터 중심에서 인간 중심으로의 전환이 가능하다고 주장한다. 이는 향후 빅데이터와 인공지능의 결합으로 예상되는 부작용을 감안할 때 매우 고무적인 사실이다. 무엇보다도 유발 하라리가 우려하는 데이터주의를 극복할 가능성이 엿보이기 때문이다. 나아가 이들은 자본주의를 보완하는 협력적 소비사회, 즉 공유사회를 실현하는 데 블록데이터가 큰 역할을 하리라는 점을 강조한다. 이 또한 우리가 주목할 만한 대목이다.

앞서 언급했듯 빅데이터는 지나치게 효율에 초점을 맞추고 있어 공평, 정의 등 민주주의의 기초가 되는 공동선을 유지하는 데 오히려 저해 요인으로 작용할 수 있다. 이로 말미암아 시장경제와 민주주의의 기초가 위태로울 수도 있다. 그런데 블록데이터는 이런 약점을 보완하고 대중이 물질적 가치와 정신적 가치를 공유하는 데 크게 기여할 수 있다는 것이다. 애덤 스미스가 말한 ‘보이지 않는 손’을 현실화시킬 수 있는 잠재력이 블록데이터에 내재해 있다고 역설한다.  즉 사회의 모든 구성원이 공정하고 투명하게 사적 이익을 추구하는 가운데 이를 통해 사회적 이익, 즉 공익을 실현할 수 있다면 이것이 바로 ‘보이지 않는 손’의 은유가 시사하는 바이다. 만약 블록데이터 기술이 사회 전반에 보급된다면 진정한 의미에서 민주주의와 자유시장경제의 발전을 위한 기반이 될 수 있다는 것이 이들 주장의 핵심이다.

현재 진행 중인 4차 산업혁명이 미래를 어떻게 변모시킬지 누구도 장담할 수 없는 실정이다. 그렇지만 한 가지 분명한 것은 기술에 관한 기술, 즉 메타기술로서 정보기술이 사회·경제·문화의 중심을 차지할 것이라는 점이다. 그리고 그 결과 기술적 유토피아가 실현될지 아니면 디스토피아가 출현할지 전문가들 사이에서도 의견이 분분하다. 이런 불확실한 상황에서 과연 우리는 어떻게 행동해야 하는가? 생존 본능을 최대한 발휘하여 정보를 단지 쉽게 활용할 수 있는 대상으로 여기는 대신 정보에 내재된 의미를 진지하게 고민하면서 행동해야 한다는 점을 깊이 인식할 필요가 있다. 약간의 감각적 쾌락을 더 얻기 위해 자발적으로 빅데이터의 구성요소로 전락한다는 것은 인간으로서의 존엄성을 포기하는 것과 다름없다. 빅데이터 시대에 인간이 중심이 될지 아니면 데이터가 중심이 될지 여부는 정보에 대한 우리의 태도에 달려있다는 것을 유념해야 할 것이다.

저작권자 © 데일리임팩트 무단전재 및 재배포 금지