데이터는 일반 사람들 뿐만 아니라 전문가들이 보아도 복잡하게 되어 있습니다.
이 복잡한 데이터를 이해하기 쉽게 시각적으로 표현해주는 것이 데이터 시각화입니다.
오늘은 데이터 시각화 란? 무엇인지 알아보고 원칙과 시각화 설계 및 활용 사례를 알아보도록 하겠습니다.
데이터 시각화 란?
데이터란 텍스트, 숫자, 기호 등으로 되어 있는 정보를 말합니다.
이러한 데이터는 매우 복잡하게 되어 있어 전문가들도 어려워합니다.
이러한 복잡한 데이터를 이해하기 쉽게 시각적(차트, 지도, 그래프 등)으로 표현한 것을 데이터 시각화 라고 합니다.
특징
데이터를 시각화하면 복잡한 데이터를 보다 쉽게 이해를 할 수 있고, 패턴과 트렌드 발견이 쉬워집니다.
또한 결정 내리는데 도움이 되어 정보 전달 효과가 향상이 됩니다.
- 데이터 이해 향상
- 패턴 및 트렌드 발견 가능성
- 결정 개선
- 정보 전달 효과 향상
원칙 3가지
데이터를 보다 효과적으로 시각화하기 위해서는 원칙 3가지(명확성, 정확성, 효율성)를 이해를 하고 적용을 해야 합니다.
- 명확성 : 데이터를 이해를 쉽게 하기 위해서는 데이터가 깔끔하고, 간결해야 합니다. 그래야 전달에 필요한 정보를 제대로 전달할 수 있습니다. +
- 정확성 : 모든 데이터는 정확성이 기본입니다. 데이터 시각화 역시 정확성을 기반으로 하기 때문에 데이터 검증이 필요하고 정확한 눈금 및 레이블로 객관적으로 표현을 해야 합니다. 절대 왜곡된 표현은 피해야 합니다.
- 효율성 : 데이터 시각화 도구를 사용하는 사용자에게 정보를 쉽게 이해를 하기 위해서입니다. 그렇기 위해서는 핵심 정보를 강조하고 전달하려는 정보를 명확하게 표현을 해야 합니다. 또한 일관성을 유지하고 보다 쉽게 접근할 수 있도록 해야 합니다.
효과적인 시각화 설계
데이터 시각화는 복잡한 데이터를 보기 쉽게 표현해 주는 도구로서 보다 효과적인 시각화 설계를 위해서는 각 설계 단계를 꼼꼼히 해야 챙겨야 합니다.
- 1단계 (목적 및 대상 선정) : 데이터 시각화를 위해서는 목적 와 대상을 선정을 해야 해당 데이터 정보 및 분석을 할 수 있습니다. 그렇기 때문에 사용자의 지식수준과, 시각적 인지 능력, 관심사 등을 먼저 확인을 해야 합니다.
- 2단계 (데이터 이해) : 목적 및 대상을 선정을 하였으면 목적에 맞는 데이터의 형태, 범위, 결측값, 분포 등을 분석하여 핵심 정보를 추출합니다.
- 3단계 (차트 유형 선택) : 데이터 차트는 목적에 맞는 차트가 별도로 존재합니다. 크게 나누면 목적 및 대상에 맞는 차트와 데이터 특성에 맞는 차트로 나눌 수 있습니다.
- 4단계 (목적 및 대상에 맞는 차트 유형 선택)
- 정보 전달: 막대그래프, 선 그래프, 파이 차트 등
- 비교 분석: 꺾은선 그래프, 막대그래프, 히스토그램 등
- 패턴 및 트렌드 발견: 산점도, 히스토그램, 박스 플롯 등
- 시간 순서 데이터: 꺾은선 그래프, 히스토그램, 열 차트 등
- 지리적 정보: 지도
- 5단계 (데이터 특성에 맞는 차트 유형 선택)
- 수치 데이터: 막대그래프, 선 그래프, 파이 차트 등
- 범주형 데이터: 막대그래프, 파이 차트 등
- 시간 순서 데이터: 꺾은선 그래프, 히스토그램, 열 차트 등
- 지리적 정보: 지도
- 6단계 (시각적 요소 디자인 선택) : 이해를 돕는데 에는 시각적 요소 디자인을 빼놓을 수 없습니다. 시각적 요소 디자인 이란 색상, 글꼴, 레이아웃 및 백 그라운드 등을 말합니다. 예를 들어 강조하고 싶은 정보는 색상을 잘 보이는 색으로 별도로 구별을 내놓는 것을 말합니다.
- 7단계 (상호작용 및 접근성) : 데이터 탐색 및 이해를 돕기 위해 필터링 기능 및 툴팁 기능 등을 추가하여 상호 작용을 원할 하게 하고, 다양한 사용자가 접근할 수 있도록 색상 및 텍스트 크기 등을 고려해야 합니다.
- 8단계 (디자인 검토 및 개선) : 데이터 시각화를 완성이 되었다면 제대로 작성이 되었는지 확인을 하기 위하여 다양한 사용자 테스트 및 피드백 반영을 해야 합니다.
주요 데이터 시각화 도구
데이터 시각화 도구는 매우 다양합니다.
그중 대표가 되는 5가지를 알려 드리겠습니다.
- Tableau : 시각화 도구 중 가장 강력하고 다양한 기능을 가지고 있는 도구로 다양한 차트 및 데이터 분석 기능을 가지고 있으며, 대시 보드 생성 및 시도 시각화 기능 등 이 있습니다. 또한 직관적인 인터페이스 기능과 다양한 데이터 소스 연결이 가능하기 때문에 매우 유용합니다. 하지만 금액이 다른 도구에 비해서 비싸다는 단점과 대규모 데이터 처리 능력이 떨어진 다는 단점을 가지고 있습니다.
- Power BI : Microsoft에서 만들어진 도구로 Microsoft Azure와 연동이 가능하며 클라우드 기반 데이터 분석 및 시각화 기능이 있습니다. 또한 Excel과 유사한 인터페이스가 많아 Excel을 사용하신 분들은 익숙하게 사용이 가능합니다. 단점으로는 커뮤니티 지원이 부족하며, Tableau에 비해 기능이 부족합니다.
- Qlik Sense : 직관적인 인터페이스를 가진 시각화 도구로 강력한 탐색적 분석으로 자유롭게 탐색 및 분석이 가능합니다. 하지만 Tableau, Power BI에 비해 기능이 부족하고 금액이 높은 게 단점입니다.
- Google Charts: : 무료로 사용할 수 있는 데이터 시각화 도구로, 간단한 차트 제작하기에 안성맞춤입니다. 또한 Google 계정 연동이 가능합니다. 단점으로는 기능이 부족하다는 점과 사용자 정의 제한 등이 있습니다.
- Datawrapper : 무료로 사용 가능한 데이터 시각화 도구로, 간편하고 인터랙티브 차트 제작하기에 적합합니다. 또한 다양한 템플릿을 제공합니다. 단점으로는 기능이 부족하고, 사용자 정의 제한 등이 있습니다.
이외에도 Excel 및 ggplot 등 다양한 도구들이 있습니다.
도구를 선택하실 때에는 사용 목적 및 데이터 양, 복잡성을 확인하시고 그에 맞는 도구를 선택하시면 됩니다.
성공적인 데이터 시각화 활용 사례 3가지
- 뉴욕 타임즈의 코로나 19 확산 추적 : 코로나 19는 전 세계적으로 전염을 시킨 강력한 전염병입니다. 그 당시 뉴욕 타임즈는 코로나 19 확산 상황(시간에 따른 확진자 수 그래프 및 국가별 확진자 및 사망자 수 등)을 시각화하여 전 세계에 정보를 제공하였습니다. 이러한 효과로 전 세계 사람들은 코로나 19의 상황을 쉽게 이해를 할 수 있었고, 그에 맞는 예방을 위해 노력을 하였습니다.
- 넷플릭스의 추천 시스템 : 넷플릭스는 사용자의 시청 기록을 분석하여 개인 맞춤형 콘텐츠를 만들어 많은 인지도를 이끌어 냈습니다. 또한 계속적인 데이터 기반 콘텐츠 제작 및 마케팅 전략을 수립하는 노력을 보이고 있습니다.
- 우버의 운전기사 및 승객 매칭 시스템 : 보다 편한 여행을 선택할 때 많이 선택하는 방법이 우버 기능입니다. 우버는 승객 위치를 운전기사와 연결해 주는 기능을 가지고 있어 실시간으로 현 정보를 분석하여 매칭을 시켜 주십니다. 이러한 기능은 운전기사에게는 불필요한 이동 감소, 승객에게는 기다리는 시간 절감 및 효율성 증대의 효과를 가져옵니다. 또한 운행 데이터 분석을 통해 운영 효율 개선 및 배용 절감 효과를 가져옵니다.
마치며
오늘은 데이터 시각화 란 무엇이고, 원칙과 설계, 성공적인 사례 등을 알아보았습니다.
데이터 시각화는 효과적인 정보 전달 및 이해에 도움이 되기 때문에 다양한 분야에 활용이 되고 있습니다.
보다 나은 데이터 시각화를 위해서는 활용 목적과 데이터 특성에 맞는 시각화 설계를 통해 정보를 전달해야 합니다.
감사합니다.