kaggle
-
[Binary classification : Tabular data] / 3rd level / ROC-AUCKnowledge for Data Analysis/통계 공부 2021. 8. 4. 13:24
[Binary classification : Tabular data] 이 문제에서 모델의 성능을 확인하기 위해 📈ROC-AUC 지표를 확인하고 있다. ROC-AUC를 이해하기 위해 필요한 개념들을 알아보자. 1️⃣ Positive, Negative의 기준은 어떻게 세우나? 일반적으로 예측해야 하는 것을 Positive 레이블로 설정한다. *악성 종양이나 아니냐? → 악성 종양을 예측하는 것이 중요하다. → (Positive) 악성 종양 / (Negative) 악성이 아닌 종양 *대출 상환 가능한지? → 대출 상환을 못하는 사람을 찾는 것이 중요하다. → (Positive) 대출 상환 못하는 경우 / (Negative) 대출 상환 가능한 경우 2️⃣ TP, TN, FP, FN이란? 🗣해석 방법 : (앞)예..
-
[Binary classification : Tabular data] / 3rd level / 지도학습Knowledge for Data Analysis/통계 공부 2021. 8. 3. 20:49
Kaggle Study Binary Classification: Tabular data 3rd level. Home Credit Default Risk Introduction: Home Credit Default Risk Competition Introduction to Manual Feature Engineering Stacking Test-Sklearn, XGBoost, CatBoost, LightGBM LightGBM 7th place solution 💡Tabular Data란? : 표로 구성된 데이터를 의미하며, 데이터의 가장 일반적인 형태라고 볼 수 있다. 1️⃣ 문제 설명 분석 목표: 과거 대출 신청 데이터를 분석하여 신청자가 미래에 대출을 상환할 수 있는지 예측한다. 학습 방법: 지도 학습의..