Development/Python
Pandas 재정리 데이터 전처리
Kirok Kim
2022. 2. 10. 18:55
조건
- 조건에 맞는 값 변경조건값
-
# grades 값이 80 이라면 result 는 'B' df.loc[df['grades'] == 80, 'result'] = 'B' # result 값이 'A' 나 'B' 가 아니라면 result 는 'F’ df.loc[df['result'] != ('A' or 'B') , 'result'] = 'F’
- 조건값
-
df[~df['컬럼명'].isin(['값','값2'])] # 반대 조건 df[~df['컬럼명'].isin(['값','값2'])]
날짜형식으로 변경
- pd.to_datetime
- order_all['delivered_date']=pd.to_datetime(order_all['delivered_date'])
- 연도 추출
-
df['year'] = pd.DatetimeIndex(df['ArrivalDate']).year df['year'] = df['ArrivalDate'].dt.year
- 월 추출
-
df['month'] = pd.DatetimeIndex(df['ArrivalDate']).month df['month'] = df['ArrivalDate'].dt.month
- 원하는 형식으로 추출
-
order_all['delivered_month'] = order_all['delivered_date'].apply(lambda x:x.strftime('%Y%m'))
반응형