Development/Python
2BPerfect...10
Kirok Kim
2022. 1. 26. 10:38
Pandas
import pandas as pd
s=pd.Series(seq_data)
np.nan=NaN
s=pd.Series(seq,index=datetime)
pd.date_range(start=none,end=none,periods=none,freq='d')
freq
d b w m bm q qs h s
pd.data_range(start='2022-01-01',end='2022/01/25')
# DataFrame
df=pd.DataFrame(data,[,index=index_data,columns=columns_data])
pd.DataFrame(data,columns=['a','b','c']) # ์ด๋ฐ์์ผ๋ก ์์๋ ๋ฐ๊พธ๊ธฐ ๊ฐ๋ฅ
#dict์ ๊ฒฝ์ฐ ์๋์ ์ผ๋ก ํค๊ฐ columns๋ก ์ง์ ๋จ
df.mean()
df.std()
df.mean(axis=1) # axis=0 ๊ธฐ๋ณธ๊ฐ axis=0์ ์ด๋ณ axis=1์ ํ๋ณ
df.describe()
df.index
df.columns
df.values
.head(5) ๊ธฐ๋ณธ๊ฐ 5
.tail(5)
df[1:3]
df.loc[index_name]
df.loc['2011'] index๊ฐ ์ค์ ์ฐพ์์ ๊ฐ์ ํ์
df.loc['2013':'2016']
df['๊ฒฝ๋ถ์ ktx'] columns์ค ์ฐพ์์ ๋ฐํ
df['๊ฒฝ๋ถ์ ktx']['2012':'2014']
df['๊ฒฝ๋ถ์ ktx'][2:5]
df['๊ฒฝ๋ถ์ ktx'].loc['2012':'2014']
df.loc['2013':'2016']['๊ฒฝ๋ถ์ ktx']
df.loc['2013':'2016','๊ฒฝ๋ถ์ ktx'] ๋ ๊ฐ๋ฅ
df.T # ํ๊ณผ ์ด์ด ๋ฐ๋๋ ์ ์น๊ฐ ์์ฉํจ
## ํ์ถ๊ฐ
df.append(df1) ํ์ด ์ถ๊ฐ๋จ
df.append(df1,ignore_index=True)ํ๋ฉด df ์ธ๋ฑ์ค์ ์๋ ๋ฐ์
#ํ์ง ์์ผ๋ฉด df1์ ์ธ๋ฑ์ค๋ฅผ ๊ทธ๋๋ก ์ ์ง
๋ง์ฝ columns๊ฐ ๊ฐ์ง ์์ ๊ฒฝ์ฐ ํด๋น ๊ฐ์ NaN์ด ์ ์ฅ๋จ
## ์ด ์ถ๊ฐ
df.join(df1)
## ํน์ ์ด์ ๊ธฐ์ค์ผ๋ก ํตํฉ
df.merge(df1)
df.merge(df1,how=merge_method,on=key_label)
how ์ ํ์ธ์
left ์ผ์ชฝ ๋ฐ์ดํฐ๋ ๋ชจ๋ ์ ํํ๊ณ ์ง์ ๋ ์ด(key)์ ๊ฐ์ด ์๋ ์ค๋ฅธ์ชฝ ๋ฐ์ดํฐ๋ฅผ ์ ํ
right ๋ฐ๋๋ก ์ค๋ฅธ์ชฝ ๋ฐ์ดํฐ ๋ชจ๋ ์ ํ ์ง์ ๋ ์ด(key)์ ๊ฐ์ด ์๋ ์ผ์ชฝ ๋ฐ์ดํฐ ์ ํ
outer ์ง์ ๋ ์ด(key)์ ๊ธฐ์ค์ผ๋ก ์ผ์ชฝ ์ค๋ฅธ์ชฝ ๋ชจ๋ ์ ํ
inner ์ง์ ๋ ์ด(key)์ ๊ธฐ์ค์ผ๋ก ์ผ์ชฝ ์ค๋ฅธ์ชฝ ๋ฐ์ดํฐ ์ค ๊ณตํต ํญ๋ชฉ๋ง ์ ํ
## ๋ฐ์ดํฐ ํ์ผ์ ์ฝ๊ณ ์ฐ๊ธฐ
df=pd.read_csv(file_name[,options])
df=pd.read_csv(file_name,encoding='cp949')์๋์ฐ์์ ์์ฑ๋ ํ๊ธ์ ์ฝ์ด์ฌ๋ ์ฌ์ฉ
df=pd.read_csv(file_name,sep=" ")
df=pd.read_csv(file_name,index_col='์ฐ๋')์๋ ์ธ๋ฑ์ค ๋์ ์ฐ๋๊ฐ ์ธ๋ฑ์ค ๋ผ๋ฒจ์ด ๋จ
### ์ฐ๊ธฐ
df.to_csv(filename,[,options])
df.index.name='user' ์ธ๋ฑ์ค ์ด๋ฆ ์ค์
#์์
bmi=df['weight']/(df['height']/100)**2
df['BMI']=bmi ์ถ๊ฐ
df
df.to_csv('filename')# ๊ฒฝ๋ก๋ ํฌํจํด์ผํจ
df.to_csv(filename,sep='',encoding='')
๋ฐ์ํ