금융보안원은 지난 2017년 1월 5일에 4차 산업혁명 시대 도래에 따른 환경변화에 금융권이 적극적으로 대응하고, 금융회사가 IT 및 보안전략 수립시 활용할 목적으로 국내·외 관련 자료에 대한 빅데이터 분석과 금융회사 온라인 설문조사, 전문가 인터뷰 등을 병행하여 올 한해 금융권이 주목해야할 IT·보안 10대 이슈를 선정하여 발표하였습니다. 이 글에서는 두번째 10대 이슈 빅데이터에 대하여 간략히 알아보도록 하겠습니다.
빅데이터란?
빅데이터란 과거 아날로그 시대에서 생성되던 데이터에 비교하여 규모는 방대하고, 생성 주기는 짧으며, 단순히 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터(mass data)를 말합니다. PC와 인터넷, 모바일 기기 이용이 생활화되면서 디지털 경제의 확산으로 우리 주변에는 규모를 가늠할 수 없을 정도로 많은 정보와 데이터가 생산되는 '빅데이터(Big Data)' 환경이 도래하고 있습니다. 과거에는 상점에서 물건을 살 때만 데이터가 기록되었지만, 디지털 경제 시대로 들어서면서 인터넷쇼핑몰에 구매를 하지 않고 단순히 접속만 하더라도 방문자의 접속 기록이 자동적으로 데이터로 저장되어 어떤 상품에 관심이 있는지, 얼마 동안 쇼핑몰에 머물렀는지를 알 수 있습니다. 쇼핑에서의 데이터는 디지털 경제 분야의 단적인 한가지 예일뿐 은행, 증권과 같은 금융거래를 비롯해 경제적 개념에서 더 나아가서 교육과 학습, 여가활동, 자료검색과 email 등에서 발생하는 데이터의 종류와 규모는 무궁무진합니다. 사람과 기계, 기계와 기계가 서로 정보를 주고받는 사물지능통신(M2M, Machine to Machine)의 확산도 디지털 정보가 폭발적으로 증가하게 되는 이유입니다. 사용자가 직접 제작하는 UCC를 비롯한 동영상 콘텐츠, 휴대전화와 SNS에서 생성되는 문자 등은 데이터의 증가 속도뿐 아니라, 형태와 질에서도 기존과 다른 양상을 보이고 있습니다. 특히 블로그나 SNS에서 유통되는 텍스트 정보는 내용을 통해 글을 쓴 사람의 성향뿐 아니라, 소통하는 상대방의 연결 관계까지도 분석이 가능하며 사진이나 동영상 콘텐츠를 PC를 통해 이용하는 것은 이미 일반화되었고 방송 프로그램도 TV수상기를 통하지 않고 PC나 스마트폰으로 보는 세상입니다. 트위터(tweeter)에서만 하루 평균 1억 5500만 건이 생겨나고 유튜브(YouTube)의 하루 평균 동영상 재생건수는 40억 회에 이를 정도입니다. 주요 도로와 공공건물은 물론 심지어 아파트 엘리베이터 안에까지 설치된 CCTV가 촬영하고 있는 영상 정보의 양도 상상을 초월할 정도로 엄청나며 그야말로 일상생활의 행동 하나하나가 빠짐없이 데이터로 저장되고 있는 셈입니다. 공공 분야에서 양산되는 데이터도 만만치 않습니다. 센서스(Census)를 비롯한 다양한 사회 조사, 국세자료, 국정기록, 의료보험, 연금 등 각 기관별 데이터 등 다양한 분야에서 생산되고 있으며 스마트워크의 본격화도 데이터 증가를 가속화할 전망입니다.
빅데이터의 특징과 이용
빅데이터의 3V로 그 특징을 설명할 수 있습니다. 데이터의 양(Volume), 데이터 생성 속도(Velocity), 형태의 다양성(Variety)인데. 최근에는 여기에 가치(Value)나 복잡성(Complexity)을 덧붙이기도 합니다. 이처럼 다양하고 방대한 규모의 데이터는 미래 경쟁력의 우위를 좌우하는 중요한 자원으로 활용될 수 있다는 점에서 주목받고 있습니다.대규모 데이터를 분석해서 의미있는 정보를 찾아내는 시도는 예전에도 존재했지만 현재의 빅데이터 환경은 과거와 비교해 데이터의 양은 물론 질과 다양성 측면에서 패러다임의 전환을 의미합니다. 이런 관점에서 빅데이터는 산업혁명 시기의 석탄처럼 IT와 스마트혁명 시기에 혁신과 경쟁력 강화, 생산성 향상을 위한 중요한 원천으로 간주되고 있습니다. 기업은 보유하고 있는 고객 데이터를 활용해 마케팅 활동을 활성화하는 고객관계관리(CRM, Customer Relationship Management) 활동을 1990년대부터 시작했습니다. 기업의 CRM 활동은 자사 고객 데이터뿐 아니라 제휴회사의 데이터를 활용한 제휴 마케팅도 포함하며 최근에는 구매 이력 정보와 웹로그(web-log) 분석, 위치기반 서비스(GPS) 결합을 통해 소비자가 원하는 서비스를 적기에 적절한 장소에서 제안할 수 있는 기술 기반을 갖추었습니다. 이러한 고객분석은 빅데이터 시대를 맞이해 전환점을 맞고 있는데 분산처리방식과 같은 빅데이터 기술을 활용해서 과거와 비교가 안 될 정도의 대규모 고객정보를 빠른 시간 안에 분석하는 것이 가능해진 것입니다. 트위터와 인터넷에 생성되는 기업 관련 검색어와 댓글을 분석해 자사의 제품과 서비스에 대한 고객 반응을 실시간으로 파악해 즉각적인 대처를 할 수 있으며, 소프트웨어나 하드웨어도 오픈 소스 형태의 하둡(Hadoop)이나 분석용 패키지인 R과 분산병렬처리기술, 클라우드 컴퓨팅 등을 활용하면 기존의 비싼 스토리지와 데이터베이스에 기반한 고비용의 데이터웨어하우스를 구축하지 않더라도 효율적인 시스템 운용이 가능하게 됩니다.
외국 기업의 빅데이터 활용 사례
Google : 빅데이터 활용 사례의 선두 주자는 구글입니다. 구글은 데이터 양이 많으면 많을수록 얻을 수 있는 정보의 품질이 좋아진다는 것을 인터넷 검색에서 실천하고 있는 기업입니다. 접근할 수 있는 모든 웹 페이지를 탐색해서 제목과 내용이 검색어와 얼마나 밀접한 관계를 가지는지를 측정해 지수로 환산하는데 이렇게 방대한 작업을 빠른 시간에 처리하기 위해서 구글분산파일 시스템과 맵리듀스라는 새로운 처리 기술을 개발했습니다. 구글은 자사가 개발한 자동번역 시스템의 기술을 통계적 기계 번역(statistical machine translation)이라고 표현하는데 이는 컴퓨터에게 문법을 가르치지 않고 사람이 이미 번역한 수억 개의 문서에서 패턴을 조사해서 언어 간 번역 규칙을 스스로 발견하도록 하는 방식으로 문법은 예외가 많은 규칙이기 때문에 참고할 문서가 많으면 많을수록 번역이 잘 될 가능성이 높아지게 됩니다.
IBM : IBM 연구소가 개발한 슈퍼컴퓨터 '왓슨'도 인간의 언어에 대한 이해를 기반으로 방대한 정보를 빠르게 검색하는 기술의 힘을 입증한 사례입니다. 왓슨은 2011년 2월 미국에서 가장 인기 있는 퀴즈쇼 ‘제퍼디’에 출연해서 인간 챔피언과 겨뤄 승리했습니다. 제퍼디 퀴즈의 질문은 분야가 광범위하고 은유적인 표현이 포함되어 사람들조차도 의미를 파악하기 어려울 정도인데 왓슨은 4테라바이트(TB)의 디스크 공간에 저장된 2억 페이지에 달하는 콘텐츠를 활용했습니다. 왓슨은 의료보험 데이터 분석과 종양 진단과 처리에 활용할 예정이며 씨티그룹(Citi group)과 금융 분야의 활용 방안을 모색하고 있습니다.
Amazon : 온라인 쇼핑몰의 선구자 아마존도 빅데이터 활용의 역사가 깊은데 아마존은 고객의 도서 구매 데이터를 분석해 특정 책을 구매한 사람이 추가로 구매할 것으로 예상되는 도서 추천 시스템을 개발하여 고객이 읽을 것으로 예상되는 책을 추천하면서 할인쿠폰을 지급합니다.
또한 고객이 구매하기 전에 배송을 준비하는 ‘예측 배송(anticipatory shipping)’ 서비스를 제공하고 있는데 예측 배송’은 고객이 구매할지 여부가 불확실한 상황에서 고객 주소지 근처의 물류창고로 배송을 시작하는 것으로, 이는 기존 주문과 검색 내역, 위시 리스트와 쇼핑 카트에 담아놓은 상품, 반품 내역, 마우스 커서가 머무른 시간 등을 활용해 고객 자신보다 고객을 더 잘 이해하는 것으로 알려져 있는 아마존의 빅데이터 분석 역량에 바탕을 두고 있습니다. 이와 관련해 월스트리트저널(WSJ)은 ‘예측 배송은 방대한 고객 데이터를 제대로 활용하고 있는 아마존만이 가능한 서비스로 경쟁 업체들과 비교해 강력한 차별화 포인트가 될 수 있을 것이다’고 전망했습니다.
라쿠텐 : 일본의 최대 전자상거래 업체인 라쿠텐(樂天)은 슈퍼 데이터베이스를 구축해 이를 기반으로 다양한 마케팅 활동을 벌이고 있습니다. 슈퍼데이터베이스는 회원의 기본 정보와 구매 내역, 서비스 예약 정보가 통합되어 있는데 라쿠텐은 이를 활용해 그룹 내 전자상거래 사업과 신용·결제 서비스, 포털, 여행, 증권, 프로스포츠 사업 부문에서 공동 활용합니다.
Nexflix : 미디어 콘텐츠 유통기업인 넷플릭스(Netflix)는 이용자의 영화 대여 목록에 기초해서 새로운 영화를 추천해주는 시네매치(Cinematch) 시스템을 개발하여 운영하고 있습니다. 넷플릭스는 시네매치 시스템의 정확도를 높이기 위해 상금을 걸고 경진대회를 열기도 합니다. 넷플릭스의 빅데이터 경영은 경쟁자인 블록버스터(Blockbuster)를 파산에 이르게 한 동인으로 평가하고 있습니다.
YouTube : 하루 40억 회 이상 동영상이 검색되는 유튜브도 이용자가 자신이 선호하는 동영상 채널을 구성할 수 있는 개별 홈페이지를 제공하고 있습니다. 개인별로 동영상 이용 데이터가 축적되면 이를 SNS 정보, 인적 네트워크 정보와 연계해 다양한 개인 맞춤형 서비스를 제공할 수 있습니다.
Zara :패스트 패션의 선도자인 자라는 현재 유행하는 패션 트렌드를 즉시에 반영해 단기간에 다품종 소량 생산하는 초스피드 전략을 채택하고 있습니다. 이러한 전략을 뒷받침하기 위해서 상품 수요를 예측하고 매장별 적정 재고를 산출하며 상품별 가격 결정과 운송 계획까지 실시간 데이터 분석에 의존하고 있습니다. 빅데이터 활용을 위해 자라는 MIT 연구팀과 최적 재고관리 시스템을 개발했습니다. 빅데이터 분석을 활용해 전세계 매장의 판매 현황을 실시간으로 분석한 뒤 고객 수요가 높은 의류를 실시간으로 공급할 수 있는 물류망을 구축함으로써 재고 부담은 줄이고 매출은 극대화하는 성과를 거두고 있습니다
Aviva 생명 : 영국의 아비바생명은 운전자의 운전 패턴에 기반을 둔 맞춤형 보험 상품을 제공하고 있는데, 이를 위해 차량 내 운행기록 장치를 통해 실제 운전 행태를 수집 및 분석하고 있으며, 주로 운전하는 시간과 지역 등을 감안해 보험료를 산정하는 ‘Pay-as-you-drive’ 상품인 ‘RateMyDrive’를 내놓아 고객들로부터 좋은 반응을 얻었습니다.
Southwest Airlines : 저가 항공의 대명사인 사우스웨스트 항공은 비행기 좌석 스크린에 승객별로 다른 광고를 제공하고 있는데 미국인의 96%를 비롯해 전세계적으로 5억 명에 달하는 고객 정보를 갖고 있는 액시엄(Acxiom)社의 DB에 저장되어 있는 항공기 탑승객의 쇼핑 습관과 구매 패턴 등을 분석한 후 승객별 최적화된 광고를 제공하고 있습니다.
DHL : 일별 배송 정보를 분석하여 소비자의 물류 서비스 이용 흐름과 패턴 파악에 활용하고 있는 DHL은 실시간 교통상황, 수신자 상황, 지리적/환경적 요소를 고려한 최적화된 배송 경로를 실시간으로 분석해 적기 배송 실패율을 제로 수준으로 만드는 한편 불필요한 연료 소모도 최소화하고 있습니다. 또한 이렇게 얻어진 데이터 분석 결과는 물류 서비스 수요 증가 추세를 예측하여 물류센터 확장과 배송차량 추가 등에 대한 투자 결정에도 활용하고 있습니다
FUJITSU : 후지쯔는 농지작업 실적과 작물 이미지 등 데이터를 분석해 수확량 증가와 품질을 향상시키는 클라우드 기반의 농업용 빅데이터 분석 솔루션을 2012년부터 제공하고 있습니다. 이는 기후와 토양환경 등에 대해 센서로부터 수집되는 데이터와 과거 수확실적 등을 비롯한 빅데이터를 분석하여 최적의 파종, 농약 살포, 수확 시점을 제공합니다.
국내 기업의 빅데이터 활용 사례
우리나라 기업에서 빅데이터 이용은 카드사와 통신사 등이 내/외부 데이터의 융복합/분석 등을 통해 고객 관계관리/경험의 변화와 신규 Value Proposition 창출을 통한 신사업 발굴 등에 빅데이터를 활용하는 사례가 등장하고 있으나, 규모나 고도화 등의 측면에서 해외 기업과 비교해 아직 부족한 실정입니다.
신한카드 : 신한카드는 자사의 월평균 승인 건수 2억 건과 2,200만 명에 달하는 고객의 빅데이터 분석을 바탕으로 소비패턴에 따라 남녀 각각 9개씩 18개의 생활방식을 도출해 새로운 상품체계인 ‘코드나인’을 선보였습니다. 신한카드는 ‘코드나인’을 활용한 세부적인 맞춤형 카드를 앞세워 포화 상태에 이른 국내 카드 시장에서 활로를 모색하고 있습니다.
삼성 SDS : 삼성 SDS는 제조, 물류 등 다양한 서비스에 활용될 수 있는 데이터 분석 솔루션 '브라이틱스(Brightics)'의 '실시간 생산시설분석', '물류 리스크 모니터링' 등을 앞세워 고객사들의 생산성 향상을 지원하는 한편, 빅데이터 서비스 사업 기회 발굴을 추진하고 있습니다. 삼성전자가 삼성SDS의 '브라이틱스' 솔루션을 국내외 법인간 물류 효율화에 적용해 생산성 증대에 활용하고 있으며, 다수의 기업들이 품질관리 등에 해당 솔루션을 활용하고 있는 것으로 알려져 있습니다.
SK텔레콤 : SK텔레콤은 국내 최대 이동통신 사업자로서 보유한 강점을 적극적으로 레버리지해 유동 인구와 지리 정보, 소비 업종과 상품 판매 현황을 종합적으로 분석하여 1 지오비전(Geovision)이라는 상권 분석 및 타겟 마케팅 지원 서비스를 개발하여 제공하고 있습니다.
카드 등 금융사와 유통 업체, SI 기업, 통신사업자 등 일부 대기업을 중심으로 빅데이터 활용 사례가 늘어나는 추세이나, 최근 NIA의 조사에 따르면 국내 기업의 빅데이터 활용도는 그동안의 장밋빛 전망과는 달리 아직 낮은 것으로 나타났는데, 중견기업(매출액 천억 원 이상)의 빅데이터 도입률이 9.6%에 그치고 있으며, 특히 종업원 수 100명 이상 기업의 도입률은 4.3%에 불과한 실정입니다.
NIA가 최근 실시한 조사에 따르면 아직까지 국내기업에서 빅데이터 분석을 도입하지 않고 있는 가장 큰 이유는 빅데이터라고 부를 만한 데이터가 없다는 것이 가장 큰 비중을 차지하고 있습니다. 결국 경험이 쌓여야 아마존의 ‘예측 배송’과 같은 고도화된 빅데이터 분석이 가능할 수 있을텐데 경험이 쌓일 수 있는 전제사항이 되는 데이터가 부족하거나 사실상 없다시피 하다 보니 빅데이터 분석의 도입/활용 수준과 고도화 정도가 상대적으로 취약하다는 것입니다. 또한, 빅데이터 분석 도입 효과를 확신할 수 없다 3는 것도 중요한 이유로 나타났으며, 빅데이터 분석에 대한 CEO의 무관심이나 국내 기업 환경에서 데이터 중심의 의사결정 문화가 부족한 것도 걸림돌로 작용하고 있습니다. 또한, 국내는 실제로 빅데이터 분석을 통해 어떤 활동을 할 수 있는지, 빅데이터 자체가 무엇인지에 대한 이해도 현장에서 부족하다는 지적도 있습니다. 많은 기업들이 빅데이터 분석의활용 방안을 모르고 있으며, 빅데이터 분석을 활용한 성공사례가 아직 드물기 때문에 특히 중소기업이 쉽게 진입하지 못 하는 상황입니다.
4차 산업혁명 시대의 도래를 앞둔 상황에서 국내 기업들의 빅데이터 분석 활용 수준은 전반적으로 제고되어야 할 것입니다. 이를 위해서는 기업들의 빅데이터 분석에 대한 인식과 문화가 바뀐 토대 위에서 명확한 활용 목적 수립과 활용 가능한 데이터에 대한 정확한 파악 및 추가 데이터 확보, 분석 단계별 필요 인력과 솔루션을 확보 등에 대한 노력을 기울일 때 국내 기업들의 빅데이터 분석 활용이 활성화될 수 있을 것입니다..
아울러 정부의 지원도 절실한데, 기업의 빅데이터 분석 활용에 대한 인식 제고를 위해 정부 차원에서 관련 성공사례를 창출하고 전파하는 것 뿐 아니라, 기업 자체적으로는 해결하기 어려운 부분, 가령 데이터 소스 부족 해결에 필요한 개인정보보호 제도 정비 등은 정부가 앞장서 해결해 주어야 할 것입니다.
최근댓글