Louie NRT Story

[[Visualization] python_libs Seaborn 본문

에너지

[[Visualization] python_libs Seaborn

hyeok0724.kim@gmail.com 2020. 7. 4. 20:08
반응형

Seaborn을 이용해서 표현 할 수 있는 그래프를 알아보고자 정리하였음

자료는 유튜버 채널: 재즐보프(youtu.be/TIjsrH_THhs) 통하여 실습 해보았음

 

1장 분포도 그래프

1. 식당에서 팁에 대한 Pandas로 이루어진 데이터셋을 가져옴

- total_bill(전체 비용), tip(팁), sex(성별), smoker(흡연여부), day(방문요일), time(식사시간), size(일행수)

2. total_bill과 tip에 관한 그래프를 그릴 수 있음

- 여기서 조금 데이터 분석이 들어가면 total_bill이 높아진다하더라도 tip이 많지는 않다는 것을 알 수 있음

3. hue 라는 옵션을 이용하여 색상을 설정 할 수 있음

4. hue 옵션에 size를 입력함으로 maker를 할 있음

5. smoker와 size를 동시에 보여 줄 수 있음

6. palette 옵션을 통하여 색상을 표현 할 수 있음

7. size 옵션을 통하여 마커의 사이즈를 조절 할 수 있음

 

2장 선형 그래프

1. dataframe을 통하여 random 값을 만들어주고 선형 그래프를 만듬

2. fmri 데이터를 활용하여 선형 그래프를 그림

- 같은 timepoint에 데이터가 많아서 그 데이터들에 대한 오차(표준편차)와 함께 표현됨

3. 평균 값만 표현하기

4. 데이터들에 대한 오차(표준편차)와 함께 표현됨

5. 데이터를 Class로 묶어서 표현함

3장 범주형 데이터 그리기(카테고리별)

1. 데이터를 가져와 요일별로 데이터를 표현 할 수 있음

2. marker가 쳡치지 않도록 퍼지게 그려놓음

3. box-plot 그래프를 그림

- 그래프의 설명은 다음과 같다

1) 최솟값 : 제 1사분위에서 1.5 IQR1을 뺀 위치이다.

2) 제 1사분위(Q1) : 25%의 위치를 의미한다.

3) 제 2사분위(Q2) : 50%의 위치로 중앙값(median)을 의미한다.

4) 제 3사분위(Q3) : 75%의 위치를 의미한다.

5) 최댓값 : 제 3사분위에서 1.5 IQR을 더한 위치이다.

 

4. 양쪽의 데이터를 비교 할 때 사용함

5. 다양한 옵션으로 표현 할 수 있음

5. 타이타닉 데이터를 활용하여 보여짐

4장 Jointploit

1. 간단하게 데이터를 만들어라

2. 두개의 데이터를 한번에 볼 수 있도록 도와줌

 

 

반응형

'에너지' 카테고리의 다른 글

[Visualization] python_libs folium  (0) 2020.07.04
[[Visualization] python_libs Bokeh  (0) 2020.07.04
[Model] VAR(Vector AutoRegression) - Todo  (0) 2020.07.01
[Model] ARIMA - Todo  (0) 2020.07.01
[Statistics] 용어 기본 정리 - Todo  (0) 2020.07.01
Comments