'Data/Dacon' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/08 »
일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Tags more

Archives

Today

Total

관리 메뉴

목록Data/Dacon (6)

🦕 공룡이 되자!

집 값 예측 분석...3

상관관계 시각화 1장 부분 # 먼저 상관계수 계산을 위해 텍스트 형식의 데이터를 숫자로 변환해줌. from sklearn.preprocessing import LabelEncoder # 딥 복사 corr_df = data.copy() corr_df[corr_df.columns[corr_df.dtypes=='O']] = corr_df[corr_df.columns[corr_df.dtypes=='O']].astype(str).apply(LabelEncoder().fit_transform) corr_df['Exter Qual'].unique() ## 상관관계를 분석해보면 반비례적 요소가 많음 #이 부분은 sklearn을 통해 제대로 된 수치화가 이루어지지 않았다고 생각함. corr_df.info() 개선된 코드..

Data/Dacon 2022. 2. 8. 21:24

집 값 예측 분석...2

수치형데이터 및 명목형 데이터 시각화 #수치형 데이터 numeric_feature = data.columns[(data.dtypes==int) | (data.dtypes== float)] # 카테고리형 데이터 categorical_feature = data.columns[data.dtypes=='O'] import matplotlib.pyplot as plt %matplotlib inline plt.style.use("ggplot") feature = numeric_feature # Boxplot 을 사용해서 데이터의 분포를 살펴봅니다. plt.figure(figsize=(20,15)) plt.suptitle("Boxplots", fontsize=40) for i in range(len(feature))..

Data/Dacon 2022. 2. 8. 21:09

집 값 예측 분석...1

명목형 데이터 변환 및 히트맵의 자세한 내용은 3장에서 다룰 예정 습작(연구중) !pip install pandas !pip install numpy !pip install matplotlib !pip install seaborn !pip install sklearn import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.preprocessing import LabelEncoder # 1. train.csv : 학습 데이터 # id : 데이터 고유 id # OverallQual : 전반적 재료와 마감 품질 # YearBuilt : 완공 연도 # YearRemodAdd : ..

Data/Dacon 2022. 2. 3. 20:34

Dacon 와인 품질 경진대회...3

fig, axes = plt.subplots(4, 3, figsize=(25, 15)) fig.suptitle('feature distributions per quality', fontsize= 40) for ax, col in zip(axes.flat, train.columns[1:]): sns.violinplot(x= 'quality', y= col, ax=ax, data=train) ax.set_title(col, fontsize=20) plt.tight_layout() plt.show() sns.color_palette("Set2") fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize = (30, 9)) scatter_fix = sns.histplot(data..

Data/Dacon 2021. 12. 10. 00:41

Dacon 와인품질 경진대회...2

클래스 분포 확인 counted_values = train['quality'].value_counts() plt.style.use('ggplot') plt.figure(figsize=(12, 10)) plt.title('class counting', fontsize = 30) value_bar_ax = sns.barplot(x=counted_values.index, y=counted_values) value_bar_ax.tick_params(labelsize=20) 와인 품질별 고유 특성 확인 qualities = {} for i in range(4, 9): quality_description = train[train['quality'] == i].drop(['id', 'quality'], axis=1)..

Data/Dacon 2021. 12. 7. 23:09

Dacon 와인 품질 경진대회

목표 : 와인의 성분 함량을 분석해서 해당 와인의 품질을 분류 데이터 불러오기 import pandas as pd import matplotlib.oyplot as plt import seaborn as sns from matplotlib import patches %matplotlib inline train = pd.read_csv('train.csv') train.head() 결측치 확인 def check_missing_col(dataframe): counted_missing_col = 0 for i, col in enumerate(dataframe.columns): missing_values = sum(dataframe[col].isna()) is_missing = True if missing_va..

Data/Dacon 2021. 12. 6. 23:50

Prev 1 Next

목록Data/Dacon (6)

🦕 공룡이 되자!

티스토리툴바