취미가 좋다

[pandas] 1. pandas 기초 본문

Data Engineer/pandas

[pandas] 1. pandas 기초

benlee73 2021. 9. 8. 10:51

pandas란

데이터를 수정하고 목적에 맞게 변경하는 python 라이브러리이다.

 

기본 사용법은 아래와 같다.

import pandas as pd			# 라이브러리를 가져온다.

data_frame = pd.read_csv('example.csv') # csv파일을 가져와서 데이터 프레임을 생성한다.
data_frame.head()			# 앞 5개의 데이터를 가져온다.
data_frame.tail(3)			# 뒤에서 3개의 데이터를 가져온다.

데이터 프레임 (Data Frame)

판다스에서 사용하는 2D array로 엑셀과 유사하다.

엑셀로는 프로그램을 만들 수 없고 pandas가 numpy를 사용하여 빠르기 때문에 엑셀로 pandas를 대체할 수 없다.

 

시리즈 (Series)

데이터 프레임의 각 column을 series라고 부른다.

시리즈는 리스트로 만들 수 있다.

아래와 같이 리스트로 시리즈를 만들고, 시리즈로 데이터 프레임을 만들 수 있다.

import pandas as pd

s1 = pd.core.series.Series( [1,2,3] )
s2 = pd.core.series.Series( ['one','two','three'] )

pd.DataFrame(data = dict(num=s1, word=s2))

https://youtu.be/pFXipjh0ghw

 

[Pandas 강의] 팬더스, 데이터프레임, 시리즈 알아보기

팬더스, 데이터프레임, 시리즈를 예제와 함께 간략히 알아봅니다.

youtu.be

 

Comments