⚙️ Tech/Pandas

[pandas] unique, nunique

fiftyline 2025. 2. 9. 14:56

 

예시 데이터프레임을 먼저 생성합니다.

import pandas as pd
df =  pd.DataFrame({'col1':[1,1,1,1,1,1,1,1,1,2,2,2,2,3,3,1], 
               'col2':['A','A','A','B','B','B','B','D', 'D','C', 'C', 'A','A','A',None,None]})

 

[ unique ]

고유한 값 목록 출력

df['col2'].unique()
> array(['A', 'B', 'D', 'C', None], dtype=object)

df['col2'].dropna().unique() #NA 제외
> array(['A', 'B', 'D', 'C'], dtype=object)

 

[ nunique ]

고유한 값 개수 출력 (NA 제외)

df['col2'].nunique()
> 4
df['col2'].nunique(dropna=False) #NA포함
> 5