취미가 좋다
[pandas] 1. pandas 기초 본문
pandas란
데이터를 수정하고 목적에 맞게 변경하는 python 라이브러리이다.
기본 사용법은 아래와 같다.
import pandas as pd # 라이브러리를 가져온다.
data_frame = pd.read_csv('example.csv') # csv파일을 가져와서 데이터 프레임을 생성한다.
data_frame.head() # 앞 5개의 데이터를 가져온다.
data_frame.tail(3) # 뒤에서 3개의 데이터를 가져온다.
데이터 프레임 (Data Frame)
판다스에서 사용하는 2D array로 엑셀과 유사하다.
엑셀로는 프로그램을 만들 수 없고 pandas가 numpy를 사용하여 빠르기 때문에 엑셀로 pandas를 대체할 수 없다.
시리즈 (Series)
데이터 프레임의 각 column을 series라고 부른다.
시리즈는 리스트로 만들 수 있다.
아래와 같이 리스트로 시리즈를 만들고, 시리즈로 데이터 프레임을 만들 수 있다.
import pandas as pd
s1 = pd.core.series.Series( [1,2,3] )
s2 = pd.core.series.Series( ['one','two','three'] )
pd.DataFrame(data = dict(num=s1, word=s2))
[Pandas 강의] 팬더스, 데이터프레임, 시리즈 알아보기
팬더스, 데이터프레임, 시리즈를 예제와 함께 간략히 알아봅니다.
youtu.be
'Data Engineer > pandas' 카테고리의 다른 글
[pandas] 6. 행과 열을 생성, 수정하기 (0) | 2021.09.21 |
---|---|
[pandas] 5. 행과 열을 선택하고 필터링하기 (1) | 2021.09.08 |
[pandas] 4. 데이터 프레임을 파일로 저장하기 (1) | 2021.09.08 |
[pandas] 3. 데이터 프레임 생성하기 (0) | 2021.09.08 |
[pandas] 2. 파일에서 데이터 불러오기 (0) | 2021.09.08 |
Comments