취미가 좋다
[pandas] 8. 중복 데이터 삭제하기 본문
중복 데이터 삭제하기
duplicated() 함수로 각 인덱스 별로 중복 여부를 알 수 있다.
drop_duplicates() 함수로 중복된 데이터를 쉽게 삭제할 수 있다.
중복의 기준 변경
중복의 기준을 인자를 통해 새로 설정할 수 있다.
아래는 중복의 기준을 name으로 하여 다른 데이터가 다르더라도 이름이 같으면 중복처리하여 삭제한다.
keep 인자를 통해 앞의 데이터와 뒤의 데이터 중 어느 것을 살릴 것인지 결정할 수 있다.
'first', 'last' 중 살릴 것을 선택해서 넣으면 되고 default는 'first'이다.
'Data Engineer > pandas' 카테고리의 다른 글
[pandas] 10. apply, map, applymap 함수 활용하기 (0) | 2021.09.21 |
---|---|
[pandas] 9. None/NaN 찾아서 다른 값으로 변경 (0) | 2021.09.21 |
[pandas] 7. 데이터 그룹 만들기 (0) | 2021.09.21 |
[pandas] 6. 행과 열을 생성, 수정하기 (0) | 2021.09.21 |
[pandas] 5. 행과 열을 선택하고 필터링하기 (1) | 2021.09.08 |
Comments