Data Engineer/pandas
[pandas] 1. pandas 기초
benlee73
2021. 9. 8. 10:51
pandas란
데이터를 수정하고 목적에 맞게 변경하는 python 라이브러리이다.
기본 사용법은 아래와 같다.
import pandas as pd # 라이브러리를 가져온다.
data_frame = pd.read_csv('example.csv') # csv파일을 가져와서 데이터 프레임을 생성한다.
data_frame.head() # 앞 5개의 데이터를 가져온다.
data_frame.tail(3) # 뒤에서 3개의 데이터를 가져온다.
데이터 프레임 (Data Frame)
판다스에서 사용하는 2D array로 엑셀과 유사하다.
엑셀로는 프로그램을 만들 수 없고 pandas가 numpy를 사용하여 빠르기 때문에 엑셀로 pandas를 대체할 수 없다.
시리즈 (Series)
데이터 프레임의 각 column을 series라고 부른다.
시리즈는 리스트로 만들 수 있다.
아래와 같이 리스트로 시리즈를 만들고, 시리즈로 데이터 프레임을 만들 수 있다.
import pandas as pd
s1 = pd.core.series.Series( [1,2,3] )
s2 = pd.core.series.Series( ['one','two','three'] )
pd.DataFrame(data = dict(num=s1, word=s2))
[Pandas 강의] 팬더스, 데이터프레임, 시리즈 알아보기
팬더스, 데이터프레임, 시리즈를 예제와 함께 간략히 알아봅니다.
youtu.be