본문 바로가기

santander customer satisfaction2

Santander Customer Satisfaction EDA (2) 이전 포스트를 이어서 계속 모델을 학습하겠다. 예측이 제대로 되지 않아서 수정을 해기 때문에 코드가 이전 게시물과 달라졌다.문제에 대한 정보 수집문제 정의분석 대상에 대한 이해Santander Customer Satisfaction data set을 이용한 EDA공통 코드오차행렬(Confusion matrix) 및 평가 지표분석 및 시각화Santander Customer Satisfaction data set에 대한 기본적인 정보feature 분석이상치 탐색Data cleaningFeature Engineeringnoise 처리모델 학습XGBoostLightGBMCatBoostEnsemble결론3. 모델 학습2. LightGBM지금까지 var3과 var38에 대한 처리를 아래와 같이 하고 있었다. 여러 .. 2024. 9. 5.
Santander Customer Satisfaction EDA (1) Santander Customer Satisfaction data는 이전에 진행했던 titanic data와 다르게 feature의 갯수도 많으며 데이터의 양도 많다. 뿐만 아니라 feature의 대부분이 개인정보를 이유로 feature의 이름이 공개되지 않았다. 따라서 이번엔 분석할 Santander Customer Satisfaction은 titanic data와 다른 의미로 어려움이 있을 수 있다. 또한, 이번에는 titanic에서 다루지 않았던 오차행렬, 재현율, 정밀도, F1 score, ROC 곡선과 AUC에 대해서도 다룰 것이다.순서는 다음과 같이 진행될 것이다. 문제에 대한 정보 수집문제 정의분석 대상에 대한 이해Santander Customer Satisfaction data set을 이.. 2024. 9. 1.
728x90