[TensorFlow] 표를 다루는 도구, 판다스

사용 예시

사용 방법

파일 읽기 : pd.read_csv('/경로/파일명.csv')

모양 확인 : print(데이터.shape)

칼럼 선택 : 데이터[['칼럼명1', '칼럼명2', '칼럼명3']]

칼럼명 출력 : print(데이터.columns)

맨 위 5개 관측치 출력 : 데이터.head()

지도학습 문제를 풀기 위해서

우선 데이터를 읽어들여서, 독립변수 / 종속변수를 분리해야한다. 그 과정과 간단한 사용방법들이 아래에 있다.

# 라이브러리 사용
import pandas as pd

---

# 파일로부터 데이터 읽어오기
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/lemonade.csv'
레모네이드 = pd.read_csv(파일경로)
 
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
보스턴 = pd.read_csv(파일경로)
 
파일경로 = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/iris.csv'
아이리스 = pd.read_csv(파일경로)

---

# 데이터의 모양확인
print(레모네이드.shape)
print(보스턴.shape)
print(아이리스.shape)

(6, 2) # 관측치 데이터 6개, 컬럼 2개
(506, 14)
(150, 5)

---

# 데이터 칼럼이름 확인
print(레모네이드.columns)
print(보스턴.columns)
print(아이리스.columns)

Index(['온도', '판매량'], dtype='object')
Index(['crim', 'zn', 'indus', 'chas', 'nox', 'rm', 'age', 'dis', 'rad', 'tax',
       'ptratio', 'b', 'lstat', 'medv'],
      dtype='object')
Index(['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭', '품종'], dtype='object')

---

# 독립변수와 종속변수 분리
독립 = 레모네이드[['온도']]
종속 = 레모네이드[['판매량']]
print(독립.shape, 종속.shape)
 
독립 = 보스턴[['crim', 'zn', 'indus', 'chas', 'nox', 
            'rm', 'age', 'dis', 'rad', 'tax',
            'ptratio', 'b', 'lstat']]
종속 = 보스턴[['medv']]
print(독립.shape, 종속.shape)
 
독립 = 아이리스[['꽃잎길이', '꽃잎폭', '꽃받침길이', '꽃받침폭']]
종속 = 아이리스[['품종']]
print(독립.shape, 종속.shape)

(6, 1) (6, 1) # 관측치 데이터 6개, 컬럼 1개
(506, 13) (506, 1)
(150, 4) (150, 1)

---

# 각각의 데이터 확인해보기. head()는 상위 5개 출력
print(레모네이드.head())
print(보스턴.head())
print(아이리스.head())

   온도  판매량
0  20   40
1  21   42
2  22   44
3  23   46
4  24   48
      crim    zn  indus  chas    nox  ...  tax  ptratio       b  lstat  medv
0  0.00632  18.0   2.31     0  0.538  ...  296     15.3  396.90   4.98  24.0
1  0.02731   0.0   7.07     0  0.469  ...  242     17.8  396.90   9.14  21.6
2  0.02729   0.0   7.07     0  0.469  ...  242     17.8  392.83   4.03  34.7
3  0.03237   0.0   2.18     0  0.458  ...  222     18.7  394.63   2.94  33.4
4  0.06905   0.0   2.18     0  0.458  ...  222     18.7  396.90   5.33  36.2

[5 rows x 14 columns]
   꽃잎길이  꽃잎폭  꽃받침길이  꽃받침폭      품종
0   5.1  3.5    1.4   0.2  setosa
1   4.9  3.0    1.4   0.2  setosa
2   4.7  3.2    1.3   0.2  setosa
3   4.6  3.1    1.5   0.2  setosa
4   5.0  3.6    1.4   0.2  setosa
[ ]

---

출처 - opentutorials.org/

'[AI]' 카테고리의 다른 글

[TensorFlow] 지도학습 전체과정 2 (Feat. 딥러닝) (0)	2020.12.15
[TensorFlow] 지도학습 전체과정 (Feat. 딥러닝) (0)	2020.12.15
[TensorFlow] 목표 : Tensorflow를 이용해 지도학습 문제 해결 (Feat. 딥러닝) (0)	2020.12.15
[오렌지] 모델/알고리즘의 특징 비교 (0)	2020.12.13
[오렌지] 지도학습 / 분류 (0)	2020.12.13

[TensorFlow] 표를 다루는 도구, 판다스

'[AI]' 카테고리의 다른 글

관련글

티스토리툴바