[신병훈련소] 1일차 과제 : 막대차트, 트리맵, 도구설명, 산점도, 맵, 대시보드
1. 카테고리 별 평균 칼로리 & 평균 카페인
막대 차트를 이용해 카테고리 별 평균 칼로리와 평균 카페인을 비교하는 시각화
* 막대 차트는 수치 데이터 값들 간의 작은 양적 차이를 비교하는데 유용한 시각화
비슷한 값들의 비교를 명확하게 하기 위해서 데이터를 정렬하는 것을 권장
* 버블 차트는 정확한 값의 비교가 아닌 전체적인 데이터의 트렌드를 본다거나 대시보드에서 필터로 유용하게 사용
Q. 다이어트 중이라서 칼로리가 낮은 음료면서 상대적으로 카페인 함유가 적은 카테고리가 무엇인가요?
A. 칼로리가 낮은 음료는 브루드커피, 티바나, 스타벅스 주스가 있는데 이 중 카페인이 가장 적은 카테고리는 스타벅스주스(병음료)입니다!
WHY?) 칼로리와 카페인의 집계 형태를 평균으로 변경
카테고리를 기준으로 합계로 집계해주면 카테고리 안에 있는 메뉴들의 칼로리와 카페인 값이 모두 더해져서,
카테고리 별로 메뉴들의 총 합계 칼로리, 총 합계 카페인 값이 보임
--> 따라서 카테고리 별로 평균 칼로리와 평균 카페인 값을 보는 것이 좋음
2. 메뉴명 별 칼로리 & 카페인
더 아래 수준인 메뉴명 수준까지 칼로리와 카페인을 함께 표현
칼로리는 사각형의 크기로, 카페인은 색상으로 표현
* 트리맵은 계층 구조의 데이터를 표시하는데 적합한 시각화로 전체 대비 부분의 비율이 얼마나 되는지 비교하는데 많이 사용
사각형의 크기와 색상에 따라 데이터의 패턴을 확인할 수 있을 뿐만 아니라 많은 데이터를 한 번에 볼 수 있다는 장점
Q. 다이어트 중이라서 칼로리가 낮은 음료면서 상대적으로 카페인 함유가 적은 음료를 마시고 싶어요
A. 카페인 7mg, 칼로리 100Kcal인 '아이스 오렌지 플로터' 추천드릴게요!
3. 카테고리와 메뉴명을 한 번에 살펴보기
카테고리에 마우스 오버하면, 해당 카테고리에 해당되는 메뉴가 나타나도록
도구 설명 이용
도구 설명 -> 삽입 -> 시트 -> 원하는 시트 클릭 -> 확인
4. 당분 함유량과 칼로리 상관관계
스캐터 플롯 (산점도) 시각화 이용
* 스캐터 플롯은 2개의 연속형 데이터에 대한 상관관계를 분석하는데 가장 많이 사용되는 시각화
두 개의 축으로 데이터가 얼마나 퍼져 있는지 분포 확인 가능
상수 라인 / 평균 라인 / 사분위수 및 중앙값 / 추세선 등과 같은 참조 라인을 추가하여 값의 분포를 비교하기에도 유용
WHY?) 메뉴명을 마크 선반의 세부 정보에 놓
시각화의 집계 기준이 전체에서 메뉴명 수준으로 변경됨
메뉴명 수준(기준)으로 당류와 칼로리를 살피기 가능
Q. 당분 함유량과 칼로리 상관관계는 어떤가요?
A. 1. 당류가 높을 수록 칼로리가 높음
2. 비슷한 당류가 들어가도 칼로리가 메뉴에 따라 달라짐
5. 시군구 별 매장 분포 현황
시군구 별 매장의 분포를 맵으로 확인
6. 대시보드 만들기
[추가 도전 과제]
1. 칼로리가 낮으면서 카페인이 높지 않은 메뉴를 마시고 싶을 때, 어떤 시각화로 답을 찾아볼 수 있을까요?
메뉴별 칼로리와 카페인의 상관관계를 보여주는 차트
A. 민트 블렌드