데이터 시각화(태블로)/3단원 7

3-7. 워드 클라우드 : 단어 분석 중심의 시각화

* 워드 클라우드란? 다양한 단어가 구름(cloud) 모양으로 떠있는 차트로, 중요도에 따라 크기가 다르게 표시된다. * 상황별 워드 클라우드 사용법 1. 워드 클라우드는 서술형 데이터를 분석할 때 효과적이다. 수치나 범주형으로 된 정량적인 데이터를 주로 분석하지만, 설문 응답이나 영화 리뷰처럼 의견을 글로 표현하는 정성적인 데이터를 분석해야 하는 경우, 고객의 서비스 만족도를 알아보기 위해 여러 기업, 기관에서 주로 사용하는 데이터 분석 방법이다. 리뷰 속 단어에서 불필요한 어미, 조사 등은 제거하고 의미 있는 단어만 추출하기 위해 워드 클라우드를 사용하려면 "자연어 데이터 전처리 작업" 또한 진행해야 한다. * 자연어 데이터 전처리 작업을 할 때 고려할 내용 1) 분석할 필요가 없는 단어(불용어 (어..

3-6. 하이라이트 지도 : 지리적 데이터 분석 중심의 시각화

* 하이라이트 지도란? 하이라이트 테이블처럼 색상으로 항목값을 돋보이게 하나, 지리적 데이터 분석에 초점이 맞춰져 있는 방법이다. 상황별 하이라이트 지도 사용법 1) 하이라이트 지도는 데이터를 지리적으로 비교할 때 유용하다. 2) 하이라이트 지도는 시간별 지리적 데이터 변화를 확인할 때 유용하다. -> 이는 시간의 흐름에 따른 지리적 데이터 변화를 동적으로 보여줌으로서, 조금 더 효과적으로 트렌드를 파악할 수 있다. * 하이라이트 지도를 사용할 때 알아두면 좋은 내용 1) 시각화 효과를 극대화하기 위해서는 데이터에 맞는 지도 배경을 사용해야 한다. 특히, 코로나 확진자 발생 지역처럼 주의가 필요한 내용을 다룰 때는 어두운 배경 지도를 활용한다. 정확한 좌표(경도, 위도)가 요구되는 데이터를 시각화하고 싶..

3-5. 하이라이트 테이블 : 데이터 포착 중심의 시각화

* 하이라이트 테이블이란? 표의 행, 열에 배치된 항목값의 크기를 색상으로 구분하는 시각화 방법 (행, 열에 항목이 다양하다면 분석할 수 있는 조합 또한 다양해진다.) * 상황별 하이라이트 테이블 사용법 1) 하이라이트 테이블은 여러 항목값 조합의 차이점을 비교할 때 유용하다. 2) 하이라이트 테이블은 주목해야 하는 값을 포착할 때 유용하다. 아래의 그림처럼 고객 유형 - 지역별 연간 매출을 월별로 정리하였을 때, 1월에 동아시아 지역의 기업에 특별한 이슈가 있었는가? 3월에 동남아시아 지역의 일반 소비자를 겨냥한 경쟁사의 신제품이 출시되었는가? 등의 문제를 분석할 수 있다. 즉, 다양한 조합 속에서 먼저 주목해야 하는 조합을 직관적으로 보여준다. * 하이라이트 테이블을 사용하는 TIP 1) 의도를 명확..

3-4. 분산형 차트 : 관계 분석 중심의 시각화

* 분산형 차트란? 가로(x)축과 세로(y)축으로 구성된 좌표에 점을 찍어서 산점도 그래프로 나타내는 방법 * 상황별 분산형 차트 사용법 1) 분산형 차트는 항목 간 관계를 확인할 때 유용하다. 분산형 차트로 확인할 수 있는 관계는 다음과 같이 4가지로 나뉜다. (a) 양의 선형 관계 : x 값이 증가하면 y 값도 증가한다. (일차식으로 표현, 상관계수가 +1에 가깝다.) (b) 음의 선형 관계 : x 값이 증가하면 y 값이 감소한다. (일차식으로 표현, 상관계수가 -1에 가깝다.) (c) 비선형 관계 : x 값이 증가함에 따라 y 값이 증가할수도, 감소할수도 있다. (이차식 이상의 다항식으로 표현) (d) 관계 없음 : 두 항목 간의 연관성을 찾을 수 없는 관계 (상관 계수가 0에 가깝다.) 2) 분산..

3-3. 파이 차트 : 비율 분석 중심의 시각화

* 파이차트란? 데이터의 구성 요소들이 전체 데이터에서 차지하는 비율을 원 모양으로 그리는 시각화 방법 * 상황별 파이 차트 사용법 1) 항목의 비율을 파악할 때 유용하다. 2) 항목 간 상대적인 크기를 비교할 때 유용하다. * 파이 차트를 사용할 때 알아두면 좋은 내용 1) 핵심을 제대로 전달하기 위해서는 파이를 너무 많은 조각으로 나누지 않도록 한다. (4~8조각 정도가 적당..) 2) 크기를 명확하게 비교하기 위해 조각이 큰 순서대로 나열하도록 한다. 3) 정확한 정보를 보여주기 위해, 핵심 정보만 담도록 한다. 인천광역시 시군구별 인구는 어떻게 구성되어 있을까? 1) 데이터 준비하기 2) 데이터로 알고 싶은 내용 질문하기 시군구별 유소년 인구 구성 비율은 어떠한가? 시군구별 생산 연령 인구수와 고..

3-2. 선 차트 (시간에 따른 변화 중심의 시각화)

* 선차트란? 선으로 데이터를 표현하는 시각화 방법, 트렌드나 미래 값을 예측하는 등 시간에 따른 변화를 파악할 때 효과적이다. * 상황별 선 차트 사용법 1) 시간의 흐름에 따른 데이터 변화를 보여줄 때 유용하다. 2) 항목 간 트렌드 변화를 비교할 때 유용하다. * 선 차트를 사용할 때 Tip 1) 핵심을 정확하게 전달하려면 너무 많은 선을 사용하지 않도록 한다. 2) 항목을 차별화하고 싶다면 색상을 사용하도록 한다. 3) 항목값이 과장되지 않도록 세로 축 범위를 적절하게 조정하여야 한다. 제주특별자치도 자연 휴양림 이용객 현황은? 1) 데이터 준비하기 2) 데이터로 알고 싶은 내용 질문하기 방문객이 가장 많은 휴양림과 가장 적은 휴양림은 어디인가? 휴양림별 이용객수는 어떻게 차이가 존재하는가? 휴양..

3-1. 막대 차트 : 비교 분석 중심의 시각화

막대 차트란? 직사각형 막대로 데이터를 표현하는 시각화 방법으로, 항목별 구체적인 수치를 비교할 때 유용하다. (수직 막대 차트, 수평 막대 차트) 막대 차트의 상황별 사용법 1. 트렌드를 파악할 때 유용하다. (가로 축은 연도, 세로 축은 방문객수로 나타내기) 2. 수직 막대 차트는 순위를 비교할 때 유용하다. (가로 - 회원, 세로 - 판매량 및 점수) 3. 수평 막대 차트는 달성도를 확인할 때 유용하다. (가로 축에 달성도, 세로 축에 회원) → 목표치를 참조선으로 표현하여, 목표를 달성한 사원수를 직관적으로 파악하고 싶을 때 더욱 효과적인 차트로 응용이 가능하다. 막대 차트를 사용할 때 알아두면 좋은 Tip 1. 항목이 많다면 수평 막대 차트를 사용한다. (일반적으로 우리의 시선은 위->아래, 왼..