반응형
데이터의 성격을 나타내는 대푯값
- 평균
- 중앙값 (오름차순으로 정렬된 값 중에 중앙값)
- 최빈값
하지만 이런 수적인 대푯값만으론 데이터의 성격을 파악하는게 쉽지 않다. (평균이나 중앙값이 같아도 데이터의 크기범위가 천차만별일 수 있어서) 따라서 데이터의 분포를 보는 것이 중요.
데이터 시각화 도구 box plot
- 데이터의 대푯값들을 확인 가능.
- 데이터의 분포를 확인하기 위한 사분위수/표준편차 기능 제공.
정보를 직관적 - 감각적으로 이해 가능.
산점도, Scatter plot
- 데이터를 좌표평면 그래프로 확인 가능. -> 데이터의 변화/분포 확인 가능
- 상관관계에 있는 열들을 파악할 수 있게 도와줌.
반응형
'[인공지능]' 카테고리의 다른 글
[오렌지] 지도학습 / 회귀 (0) | 2020.12.13 |
---|---|
[오렌지] 오렌지로 머신러닝 회귀 구현 (0) | 2020.12.11 |
[인공지능] 오렌지 (0) | 2020.12.10 |
[인공지능] 머신러닝의 분류 (0) | 2020.12.09 |
[인공지능] 인과관계와 독립변수 종속변수 (0) | 2020.12.09 |