예시 데이터프레임을 먼저 생성합니다.
import pandas as pd
df = pd.DataFrame({'col1':[1,1,1,1,1,1,1,1,1,2,2,2,2,3,3,1],
'col2':['A','A','A','B','B','B','B','D', 'D','C', 'C', 'A','A','A',None,None]})
[ unique ]
고유한 값 목록 출력
df['col2'].unique()
> array(['A', 'B', 'D', 'C', None], dtype=object)
df['col2'].dropna().unique() #NA 제외
> array(['A', 'B', 'D', 'C'], dtype=object)
[ nunique ]
고유한 값 개수 출력 (NA 제외)
df['col2'].nunique()
> 4
df['col2'].nunique(dropna=False) #NA포함
> 5
'⚙️ Tech > Pandas' 카테고리의 다른 글
matplotlib 기본 차트 사용법 (0) | 2025.05.22 |
---|---|
[pandas] value_counts (0) | 2025.02.09 |
[pandas] 메모리 관리를 위한 대용량 데이터프레임 다루기 (0) | 2025.02.09 |
[pandas] 결측값 처리 (isnull, isna, dropna, fillna) (0) | 2025.02.09 |