반응형
사용 예시
사용 방법
파일 읽기 : pd.read_csv('/경로/파일명.csv')
모양 확인 : print(데이터.shape)
칼럼 선택 : 데이터[['칼럼명1', '칼럼명2', '칼럼명3']]
칼럼명 출력 : print(데이터.columns)
맨 위 5개 관측치 출력 : 데이터.head()
지도학습 문제를 풀기 위해서
우선 데이터를 읽어들여서, 독립변수 / 종속변수를 분리해야한다. 그 과정과 간단한 사용방법들이 아래에 있다.
# 라이브러리 사용
import pandas as pd
---
# 파일로부터 데이터 읽어오기
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
레모네이드 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
보스턴 = pd.read_csv(파일경로)
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv'
아이리스 = pd.read_csv(파일경로)
---
# 데이터의 모양확인
print(레모네이드.shape)
print(보스턴.shape)
print(아이리스.shape)
(6, 2) # 관측치 데이터 6개, 컬럼 2개
(506, 14)
(150, 5)
---
# 데이터 칼럼이름 확인
print(레모네이드.columns)
print(보스턴.columns)
print(아이리스.columns)
Index(['온도', '판매량'], dtype='object')
Index(['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
'ptratio', 'b', 'lstat', 'medv'],
dtype='object')
Index(['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭', '품종'], dtype='object')
---
# 독립변수와 종속변수 분리
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]
print(독립.shape, 종속.shape)
독립 = 보스턴[['crim', 'zn', 'indus', 'chas', 'nox',
'rm', 'age', 'dis', 'rad', 'tax',
'ptratio', 'b', 'lstat']]
종속 = 보스턴[['medv']]
print(독립.shape, 종속.shape)
독립 = 아이리스[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
종속 = 아이리스[['품종']]
print(독립.shape, 종속.shape)
(6, 1) (6, 1) # 관측치 데이터 6개, 컬럼 1개
(506, 13) (506, 1)
(150, 4) (150, 1)
---
# 각각의 데이터 확인해보기. head()는 상위 5개 출력
print(레모네이드.head())
print(보스턴.head())
print(아이리스.head())
온도 판매량
0 20 40
1 21 42
2 22 44
3 23 46
4 24 48
crim zn indus chas nox ... tax ptratio b lstat medv
0 0.00632 18.0 2.31 0 0.538 ... 296 15.3 396.90 4.98 24.0
1 0.02731 0.0 7.07 0 0.469 ... 242 17.8 396.90 9.14 21.6
2 0.02729 0.0 7.07 0 0.469 ... 242 17.8 392.83 4.03 34.7
3 0.03237 0.0 2.18 0 0.458 ... 222 18.7 394.63 2.94 33.4
4 0.06905 0.0 2.18 0 0.458 ... 222 18.7 396.90 5.33 36.2
[5 rows x 14 columns]
꽃잎길이 꽃잎폭 꽃받침길이 꽃받침폭 품종
0 5.1 3.5 1.4 0.2 setosa
1 4.9 3.0 1.4 0.2 setosa
2 4.7 3.2 1.3 0.2 setosa
3 4.6 3.1 1.5 0.2 setosa
4 5.0 3.6 1.4 0.2 setosa
[ ]
---
출처 - opentutorials.org/
반응형
'[인공지능]' 카테고리의 다른 글
[TensorFlow] 지도학습 전체과정 2 (Feat. 딥러닝) (0) | 2020.12.15 |
---|---|
[TensorFlow] 지도학습 전체과정 (Feat. 딥러닝) (0) | 2020.12.15 |
[TensorFlow] 목표 : Tensorflow를 이용해 지도학습 문제 해결 (Feat. 딥러닝) (0) | 2020.12.15 |
[오렌지] 모델/알고리즘의 특징 비교 (0) | 2020.12.13 |
[오렌지] 지도학습 / 분류 (0) | 2020.12.13 |