• 흐림동두천 2.1℃
  • 흐림강릉 8.1℃
  • 서울 3.6℃
  • 흐림대전 3.9℃
  • 흐림대구 1.6℃
  • 맑음울산 5.5℃
  • 구름많음광주 5.4℃
  • 맑음부산 9.2℃
  • 흐림고창 5.8℃
  • 구름조금제주 14.5℃
  • 흐림강화 2.4℃
  • 흐림보은 1.2℃
  • 흐림금산 2.6℃
  • 구름조금강진군 4.7℃
  • 구름많음경주시 1.7℃
  • 구름조금거제 5.9℃
기상청 제공

다가오는 빅데이터 시대…우리나라는?

빅데이터에 대한 관심 증가했지만 실질적 성과 미비

빅데이터는 매우 큰 규모의 데이터를 말한다. 빅데이터는 디지털 형태(digital form)로 데이터를 생성하는 수많은 기계가 일상생활에 사용됨에 따라 생성되었다. 빅데이터는 우리가 잘 아는 컴퓨터, 인터넷뿐만 아니라 각종 기계, 센서, 감시 카메라 등 다양한 형태로 수집된다. 이러한 빅데이터는 크고(Volume) 다양할 뿐만 아니라(Variety) 매우 빠르게 증가하지만(Velocity) 데이터의 품질이 균일하지 않다 (Veracity)는 특성을 가진다. 


사람들이 빅데이터에 관심을 갖게된 것은 빅데이터 안에 이전에 알려지지 않았던 정보, 나아가 지식이 있다고 생각하기 때문이다. 사람들은 빅데이터를 잘 활용하면 사업에서 성공할 수 있고, 질병을 이길 수 있으며, 더 효율적으로 공장을 운영할 수 있다고 기대한다. 빅데이터에 대해 이런 관심이 일어나게 된 시점은 대략 2010년대를 기점으로 보고 있다. 이런 관심은 구글, 페이스북, 아마존 등 인터넷 기반의 거대 기업들의 성공적인 빅데이터 활용, 미국이 오바마 행정부를 비롯한 주요 선진국의 빅데이터 프로젝트 추진, 정보 기술 기업들의 솔루션 개발과 판매 등으로 더욱 확산되었다. 빅데이터는 최근 관심이 급격히 증가하고 있는 인공지능, 사물인터넷, 4차 산업혁명의 기반으로 자리매김하면서 빅데이터에 대한 관심은 앞으로도 지속될 것으로 보인다.


이런 시대적 배경을 바탕으로 한국에서도 빅데이터에 대한 관심이 증가하였다. 그렇다면 한국은 빅데이터에 얼마나 많은 관심이 있을까? 몇 가지 주요 사례를 찾아보자. 국가종합전자조달 사이트인 나라장터(http://www.g2b.go.kr)에는 정부와 지자체, 공공기관 등에서 발주하는 사업에 관한 정보가 올라온다. 최근 6개월 내에 입찰공고를 조회해 보면 약 293여개의 사업이 공고된 것을 볼 수 있다(2018년 4월 ~ 2018년 9월). 학술연구정보를 서비스하는 RISS사이트(http://www.riss.kr)에서 ‘빅데이터’라는 키워드를 사용하여 검색을 해보면, 학위논문 1,897편, 국내학술지논문 4,870편, 단행본 1,622건 등의 결과를 제공한다. 구글 검색 엔진에서 ‘빅데이터’를 키워드 검색하면 대략 23백만 개의 검색 결과가 있음을 보여 준다. 시장조사기관인 ‘드레스너 어드바이저리 서비스(Dresner Advisory Services)’의 조사 결과에 따르면 2018년 한국의 빅데이터 시장은 지난해에 비해 30.2% 성장한 5,600억이라고 한다.1)


정말 관심이 많다. 그러나 이제까지 실행된 수많은 빅데이터 사업들이 성공적이었을까? 현장의 사람들을 만나보면 의외로 회의적인 반응들이 많다. 사실 빅데이터 사업 추진에 관한 이야기는 많이 들었지만 실질적인 성과에 대한 사례는 찾기 어렵다. 그래서 ‘빅데이터는 거품이다’라고 말하는 사람도 있다.2)


 현장 사람들의 빅데이터에 대한 회의적인 반응과 더불어 가장 많이 듣는 말은 ‘데이터는 많은데 이것을 어떻게 활용할 수 있을지 모르겠다.’는 말이다. ‘구슬이 서 말이라도 꿰어야 보배’라는 말이 있다. 이 말을 응용하면 ‘데이터가 아무리 빅데이터라도 활용 방법을 알아야 가치 있는 자산’이라고 할 수 있다. 빅데이터의 활용 방법은 데이터 안에 내재되어 있는 패턴을 찾아내는 데이터 분석 방법을 말한다. 이런 작업을 수행하는 사람들을 데이터 분석 전문가 또는 데이터 과학자라고 한다. 기업과 정부가 빅데이터의 활용에 관심을 갖게 됨에 따라 이런 인력의 육성에 대해 관심을 갖게 되는 것은 자연스러운 현상이라고 할 수 있다. 


최근 정부는 이런 필요에 부응하여 데이터 분석 인력 육성 계획을 발표하였다. 분석 인력 육성에 대한 관심은 바람직하다고 할 수 있지만 우려되는 점이 있다. 육성 계획의 대부분은 소위 말하는 ‘데이터 분석 전문가’에 초점을 맞추고 있다. 그래서 데이터 전문가 몇 만 명 육성이라는 양적인 목표를 설정하였다. 이것은 빅데이터라는 것을 단순히 기술적인 문제로 보고 접근했기 때문에 나온 당연한 결과다. 그러나 빅데이터는 단순한 기술적인 문제가 아닌 문화적 문제이다. 빅데이터가 나오게 된 것은 새로운 디지털 환경에서 기존의 문제해결 방법이 작동하지 않았기 때문이다. 빅데이터는 데이터를 활용하여 삶의 문제를 해결해 보자는 것이다. 이것은 기술이 아니라 문제를 바라보는 태도 더 나아가 문화가 중요하다는 말이다. 사회 전반에 걸쳐 데이터 중심 문화가 정립되지 않고 단순히 인력을 육성하는 것만으로는 성공을 보장할 수 없다. 기업의 임원부터 직원까지, 정부의 최고위층부터 현장의 공무원까지 데이터의 가능성과 활용에 대한 새로운 마음가짐이 있어야 한다. 새 포도주는 새 부대에 담아야 하는 것이다. 

 

관련기사





[가까운AI] AI 킬러 활용법 – AI 검사기로 AI 글을 ‘내 글’로 바꾸기 “AI 검사기를 돌렸더니 ‘AI 생성 의심 90%’가 나왔습니다.” 한 교수의 말에 학생들은 고개를 끄덕였다. 정작 학생은 “저 AI 안 썼어요”라고 항변하지만, 검사 결과는 이미 교수에게 부담과 의심을 던져놓은 뒤다. AI 시대의 글쓰기는 교수도, 학생도 어느 한쪽만의 문제가 아니다. 사고 방식, 글쓰기, 평가 방식이 새롭게 바뀌는 과도기적 상황 속에서 모두가 혼란을 겪고 있다. ● 교수도 난감하고, 학생도 난감하다 AI 검사기는 문장 패턴과 구조를 기반으로 ‘AI일 가능성’을 제시하지만 절대적이지 않다. 교과서적 표현이나 정제된 문장을 자주 쓰는 학생일수록, 혹은 정보 기반 개념 정리를 하는 글일수록 AI 문체와 유사하게 보일 수 있다. 교수들은 “결과만 믿자니 학생이 억울해 보이고, 학생 말을 그대로 믿자니 책임이 생기는 상황”이라고 말한다. 학생들도 마찬가지다. 성실하게 썼는데 AI 비율이 높게 나오면 억울함과 불안감이 뒤따른다. ‘AI에게 개념만 물어보는 것도 AI 사용인가?’, ‘교정 기능은 어디까지 허용인가?’ 학생들은 AI를 어떻게 사용해야 하는지 경계가 불명확한 상황에서 스트레스를 느낀다. AI 검사기에서 오해가 생기는 주요 원인은 다음과 같