๊ด€๋ฆฌ ๋ฉ”๋‰ด

๐Ÿฆ• ๊ณต๋ฃก์ด ๋˜์ž!

2BPerfect...10 ๋ณธ๋ฌธ

Development/Python

2BPerfect...10

Kirok Kim 2022. 1. 26. 10:38
Pandas
import pandas as pd

s=pd.Series(seq_data)

np.nan=NaN

s=pd.Series(seq,index=datetime)
pd.date_range(start=none,end=none,periods=none,freq='d')
freq
d b w m bm q qs h s
pd.data_range(start='2022-01-01',end='2022/01/25')

# DataFrame
df=pd.DataFrame(data,[,index=index_data,columns=columns_data])
pd.DataFrame(data,columns=['a','b','c']) # ์ด๋Ÿฐ์‹์œผ๋กœ ์ˆœ์„œ๋„ ๋ฐ”๊พธ๊ธฐ ๊ฐ€๋Šฅ
#dict์˜ ๊ฒฝ์šฐ ์ž๋™์ ์œผ๋กœ ํ‚ค๊ฐ€ columns๋กœ ์ง€์ •๋จ
df.mean()

df.std()

df.mean(axis=1) # axis=0 ๊ธฐ๋ณธ๊ฐ’ axis=0์€ ์—ด๋ณ„ axis=1์€ ํ–‰๋ณ„
df.describe()
df.index
df.columns
df.values
.head(5) ๊ธฐ๋ณธ๊ฐ’ 5
.tail(5)

df[1:3]

df.loc[index_name]
df.loc['2011'] index๊ฐ’ ์ค‘์— ์ฐพ์•„์„œ ๊ฐ’์„ ํ‘œ์‹œ
df.loc['2013':'2016']

df['๊ฒฝ๋ถ€์„ ktx'] columns์ค‘ ์ฐพ์•„์„œ ๋ฐ˜ํ™˜

df['๊ฒฝ๋ถ€์„ ktx']['2012':'2014']

df['๊ฒฝ๋ถ€์„ ktx'][2:5]

df['๊ฒฝ๋ถ€์„ ktx'].loc['2012':'2014']

df.loc['2013':'2016']['๊ฒฝ๋ถ€์„ ktx']
df.loc['2013':'2016','๊ฒฝ๋ถ€์„ ktx'] ๋„ ๊ฐ€๋Šฅ

df.T # ํ–‰๊ณผ ์—ด์ด ๋ฐ”๋€Œ๋Š” ์ „์น˜๊ฐ€ ์ž‘์šฉํ•จ

## ํ–‰์ถ”๊ฐ€
df.append(df1) ํ–‰์ด ์ถ”๊ฐ€๋จ
df.append(df1,ignore_index=True)ํ•˜๋ฉด df ์ธ๋ฑ์Šค์— ์ž๋™ ๋ฐ˜์˜
#ํ•˜์ง€ ์•Š์œผ๋ฉด df1์˜ ์ธ๋ฑ์Šค๋ฅผ ๊ทธ๋Œ€๋กœ ์œ ์ง€

๋งŒ์•ฝ columns๊ฐ€ ๊ฐ™์ง€ ์•Š์„ ๊ฒฝ์šฐ ํ•ด๋‹น ๊ฐ’์— NaN์ด ์ €์žฅ๋จ

## ์—ด ์ถ”๊ฐ€
df.join(df1)

## ํŠน์ • ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ํ†ตํ•ฉ
df.merge(df1)
df.merge(df1,how=merge_method,on=key_label)

how ์„ ํƒ์ธ์ž
left   ์™ผ์ชฝ ๋ฐ์ดํ„ฐ๋Š” ๋ชจ๋‘ ์„ ํƒํ•˜๊ณ  ์ง€์ •๋œ ์—ด(key)์— ๊ฐ’์ด ์žˆ๋Š” ์˜ค๋ฅธ์ชฝ ๋ฐ์ดํ„ฐ๋ฅผ ์„ ํƒ
right  ๋ฐ˜๋Œ€๋กœ ์˜ค๋ฅธ์ชฝ ๋ฐ์ดํ„ฐ ๋ชจ๋‘ ์„ ํƒ ์ง€์ •๋œ ์—ด(key)์— ๊ฐ’์ด ์žˆ๋Š” ์™ผ์ชฝ ๋ฐ์ดํ„ฐ ์„ ํƒ
outer  ์ง€์ •๋œ ์—ด(key)์„ ๊ธฐ์ค€์œผ๋กœ ์™ผ์ชฝ ์˜ค๋ฅธ์ชฝ ๋ชจ๋‘ ์„ ํƒ
inner  ์ง€์ •๋œ ์—ด(key)์„ ๊ธฐ์ค€์œผ๋กœ ์™ผ์ชฝ ์˜ค๋ฅธ์ชฝ ๋ฐ์ดํ„ฐ ์ค‘ ๊ณตํ†ต ํ•ญ๋ชฉ๋งŒ ์„ ํƒ

## ๋ฐ์ดํ„ฐ ํŒŒ์ผ์„ ์ฝ๊ณ  ์“ฐ๊ธฐ
df=pd.read_csv(file_name[,options])
df=pd.read_csv(file_name,encoding='cp949')์œˆ๋„์šฐ์—์„œ ์ž‘์„ฑ๋œ ํ•œ๊ธ€์„ ์ฝ์–ด์˜ฌ๋•Œ ์‚ฌ์šฉ
df=pd.read_csv(file_name,sep=" ")
df=pd.read_csv(file_name,index_col='์—ฐ๋„')์ž๋™ ์ธ๋ฑ์Šค ๋Œ€์‹  ์—ฐ๋„๊ฐ€ ์ธ๋ฑ์Šค ๋ผ๋ฒจ์ด ๋จ

### ์“ฐ๊ธฐ
df.to_csv(filename,[,options])
df.index.name='user' ์ธ๋ฑ์Šค ์ด๋ฆ„ ์„ค์ •

#์˜ˆ์‹œ
bmi=df['weight']/(df['height']/100)**2

df['BMI']=bmi ์ถ”๊ฐ€
df

df.to_csv('filename')# ๊ฒฝ๋กœ๋„ ํฌํ•จํ•ด์•ผํ•จ
df.to_csv(filename,sep='',encoding='')

๋ฐ˜์‘ํ˜•

'Development > Python' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

2BPerfect...12  (0) 2022.01.27
2BPerfect...11  (0) 2022.01.26
2BPerfect...9  (0) 2022.01.25
2BPerfect...8  (0) 2022.01.25
2BPerfect...7  (0) 2022.01.24
Comments