타이타닉1 titanic 데이터 - EDA(1) 타이타닉은 세계에서 가장 유명한 침몰선이라 할 수 있으며 사고로부터 100년이 넘게 지난 오늘날까지도 관련 연구가 활발하게 이루어지며 대중매체 등에서 많이 다뤄지고 있다. 그래서 많은 사람들이 머신러닝의 학습을 처음 시작할 때 Kaggle에서 제공하는 titanic data를 이용해 Kaggle 자체 대회에 참여하고 있다.따라서 필자 역시 titanic data를 이용한 Kaggle titanic 대회에 참여해 가능한 높은 점수를 얻어보고자 이렇게 시작하게 되었다.추가적으로 이번 편에서는 RandomForest를 이용한 모델 학습만 진행할 예정이다.순서는 다음과 같이 진행될 것이다.titanic에 대한 정보 수집문제 정의분석 대상에 대한 이해titanic data set을 이용한 EDA공통 코드titan.. 2024. 8. 20. 이전 1 다음 728x90