Titanic2 titanic 데이터 - EDA(2) 최근 프로젝트가 하나 생겨서 다음 포스트 진행이 오래걸렸다... 이번에는 titanic data를 가지고 모델을 학습해 보고 결론을 통해 마무리하고자 한다. 이전에 Randomforest를 이용해 간단하게 모델을 학습했었다. 결과는 0.77751로 개인적으로 나쁘지 않은 점수라고 판단하고 있다.오늘은 여러 모델들을 활용해 보고 GridSearchCV, hyperopt를 활용해 모려고 한다.titanic에 대한 정보 수집문제 정의분석 대상에 대한 이해titanic data set을 이용한 EDA공통 코드titanic data에 대한 기본적인 정보통계 및 시각화여성과 아이들나이사회적 지위Embarked(중간 정착 항구)Cabin(선실 번호)SibSp, Parch(같이 탑승한 형제자매 또는 배우자 인원수, .. 2024. 8. 30. titanic 데이터 - EDA(1) 타이타닉은 세계에서 가장 유명한 침몰선이라 할 수 있으며 사고로부터 100년이 넘게 지난 오늘날까지도 관련 연구가 활발하게 이루어지며 대중매체 등에서 많이 다뤄지고 있다. 그래서 많은 사람들이 머신러닝의 학습을 처음 시작할 때 Kaggle에서 제공하는 titanic data를 이용해 Kaggle 자체 대회에 참여하고 있다.따라서 필자 역시 titanic data를 이용한 Kaggle titanic 대회에 참여해 가능한 높은 점수를 얻어보고자 이렇게 시작하게 되었다.추가적으로 이번 편에서는 RandomForest를 이용한 모델 학습만 진행할 예정이다.순서는 다음과 같이 진행될 것이다.titanic에 대한 정보 수집문제 정의분석 대상에 대한 이해titanic data set을 이용한 EDA공통 코드titan.. 2024. 8. 20. 이전 1 다음 728x90