데이터 분석

[Pandas] 주소 데이터 정제하기 | str.split() 본문

Python/Pandas

[Pandas] 주소 데이터 정제하기 | str.split()

딱한아이 2025. 2. 13. 16:15

주소 데이터 다루기

 

 

✅ 주소 정보가 들어가 있는 address 컬럼을 정제하여 시, 도 정보를 담고 있는 'sido' 컬럼과 시, 군, 구 정보를 담고 있는 'sigungu' 컬럼을 생성하자. 그다음 각 행정구역별 카페 개수를 집계해 보자.

import pandas as pd

df = pd.read_csv('/content/drive/MyDrive/cafes.csv')
df.head()

 

 

 

💡주소 데이터 분리를 하기 위해 str Accessor 활용

df['sido'] = df['address'].str.split().str[0]
df['sigungu'] = df['address'].str.split().str[1]

df.head()

 

 

 

✔️각 행정구역별 카페 개수를 집계하고, 카페 개수가 많은 순으로 정렬

target = df.groupby(['sido', 'sigungu']).size().reset_index(name='cnt')
target.sort_values('cnt', ascending=False, ignore_index=True)