Development/Python

Pandas 재정리 데이터 전처리

Kirok Kim 2022. 2. 10. 18:55
조건
  • 조건에 맞는 값 변경조건값
  • # grades 값이 80 이라면 result 는 'B'
    df.loc[df['grades'] == 80, 'result'] = 'B'
    
    # result 값이 'A' 나 'B' 가 아니라면 result 는 'F’
    df.loc[df['result'] != ('A' or 'B') , 'result'] = 'F’
    
  • 조건값
  • df[~df['컬럼명'].isin(['값','값2'])]
    
    # 반대 조건
    df[~df['컬럼명'].isin(['값','값2'])]
    
날짜형식으로 변경
  • pd.to_datetime
  • order_all['delivered_date']=pd.to_datetime(order_all['delivered_date'])
  • 연도 추출
  • df['year'] = pd.DatetimeIndex(df['ArrivalDate']).year
    df['year'] = df['ArrivalDate'].dt.year
    
  • 월 추출
  • df['month'] = pd.DatetimeIndex(df['ArrivalDate']).month
    df['month'] = df['ArrivalDate'].dt.month
    
  • 원하는 형식으로 추출
  • order_all['delivered_month'] = 
    order_all['delivered_date'].apply(lambda x:x.strftime('%Y%m'))
    
반응형