본문 바로가기
[인공지능]

[오렌지] 통계의 시각화

by Hevton 2020. 12. 11.
반응형

데이터의 성격을 나타내는 대푯값

- 평균

- 중앙값 (오름차순으로 정렬된 값 중에 중앙값)

- 최빈값

 

 

하지만 이런 수적인 대푯값만으론 데이터의 성격을 파악하는게 쉽지 않다. (평균이나 중앙값이 같아도 데이터의 크기범위가 천차만별일 수 있어서) 따라서 데이터의 분포를 보는 것이 중요.

 

 

데이터 시각화 도구 box plot

 

- 데이터의 대푯값들을 확인 가능.

- 데이터의 분포를 확인하기 위한 사분위수/표준편차 기능 제공.

 

정보를 직관적 - 감각적으로 이해 가능.

 

 

 

산점도, Scatter plot

 

- 데이터를 좌표평면 그래프로 확인 가능. -> 데이터의 변화/분포 확인 가능

- 상관관계에 있는 열들을 파악할 수 있게 도와줌.

반응형