분류 전체보기28 강아지 VS 고양이(Cat vs Dog), 강아지 고양이 구분 1. 프로젝트 목표프로젝트 목표 및 분석 대상에 대한 이해 데이터셋의 전반적인 구성2. 기대 효과딥러닝 모델의 성능 검증과 비교딥러닝 학습 과정 이해3. 요약프로젝트 흐름도결과4. 분석 대상 확인이미지 샘플 확인5. 모델 훈련직접 설계한 모델사전 훈련 모델결과6. 결론1. 프로젝트 목표1. 프로젝트 목표 및 분석 대상에 대한 이해 이 프로젝트의 목표는 Kaggle에서 제공하는 강아지와 고양이 사진 데이터셋을 이용해 두 동물을 정확히 분류할 수 있는 머신러닝 모델을 만드는 것이다. 사람은 강아지와 고양이를 구분하는 것이 비교적 쉬운 일이지만, 컴퓨터는 그렇지 않다. 강아지와 고양이는 모두 눈, 코, 귀, 수염, 네 발, 털, 꼬리를 가지고 있어 비슷한 특징을 공유하며, 이러한 이유로 컴퓨터가 둘을 구별하는.. 2024. 11. 9. 패션 MNIST 데이터셋을 활용한 딥러닝 모델 성능 비교와 분석 이제는 딥러닝에 대한 게시글도 작성해 보려고 한다. 지금까지는 전통적인 알고리즘 기반의 학습으로, 분류, 회귀, 클러스터링을 하는 머신러닝을 주로 했었다. 이제는 머신러닝의 일종이지만, 신경망 기반의 학습으로 대규모 데이터와 복잡한 패턴 인식에 강점이 있는 기술인 딥러닝도 같이 게시물을 올려보려고 한다. 처음 머신러닝 게시물이 타이타닉 생존자 예측이었다. 딥러닝 역시 패션 MNIST 데이터셋을 이용해 딥러닝을 시작하려고 한다. 1. 문제에 대한 정보 수집문제 정의분석 대상에 대한 이해 - 데이터셋의 전반적인 구성과 속성을 파악2. 기대 효과딥러닝 모델의 성능 검증과 비교딥러닝 학습 과정 이해3. 요약프로젝트 흐름도결과4. 분석 대상 확인이미지 샘플 확인5. 모델 훈련직접 설계한 모델사전 훈련 모델6. 결.. 2024. 11. 5. 서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출(수정 - 데이터 추가 및 모델 하이퍼파리미터 튜닝) 이전에 올렸던 '서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출' 게시물에서는 2023년 6월부터 2024년 6월까지의 데이터를 가지고 진행했었다. 이번에는 데이터를 더 추가해서 2022년7월부터 2024년 5월까지의 데이터를 기반으로 같은 방법으로 분석 및 모델 예측을 진행했다. 서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출장태훈https://github.com/jangtaehun1. 분석 개요1.1 기획 배경1.2 분석의 필요성1.2 분석 목적 2. 데이터 수집2.1 데이터 분석 프로세스 수립2.zzangtaeprogramming.tistory.com기존의 게시물에서 데이터를 2022년부터 사용하지 않고 202.. 2024. 10. 26. LGAimers 5기 - 오프라인 해커톤(Phase III) 9월 28일LGAimers의 오프라인 해커톤 대회가 있었다. 온라인 해커톤에서 상위 100여명에 속할 수 있었기 때문에 이천에 있는 LG인화원에 갈 수 있었다.결론부터 말하면 온라인 해커톤 1달, 오프라인 준비 기간 약 3주 기간보다 1박 2일 해커톤이 더 많은 것을 배웠던 것 같다.오프라인 해커톤 참여 순위에 들었고 PPT를 제출하면 메일이 온다.메일을 받고 안심할 수 있었다...ㅎ링크에 들어가면 단체티 사이즈, 이동 수단 선택 참여 여부 등을 입력해야 한다.안심하고 이제 제대로 다시 분석도착하면 이렇게 개인 숙소를 배정받는다.1인 1실숙소는 진짜... 자취를 하면 이렇게 꾸며야지 하는 방 그대로 여서 너무 마음에 들었다...제일 궁금했던 웰컴 박스우산, 텀블러, 가습기, USB, 에코백(?), 양치도.. 2024. 10. 14. kaggle - House Prices - Advanced Regression Techniques(상위 6%) kaggle에서 진행한 House Prices - Advanced Regression Techniques는 Bike Sharing Demand, titanic data와 같이 머신러닝을 입문하는 사람들이 가장 먼저 시작하는 kaggle의 대회 중 하나이다. 이번에는 House Prices - Advanced Regression Techniques를 통해서 Regression 연습하고자 한다.문제에 대한 정보 수집문제 정의분석 대상에 대한 이해House Prices - Advanced Regression Techniques을 이용한 EDA공통 코드분석House Prices - Advanced Regression Techniques에 대한 기본적인 정보(구조 파악)시각화Data cleaningFeature .. 2024. 10. 10. LGAimers 5기 - 온라인 해커톤(Phase II) - 2, 문제 발생 및 느낀점 온라인 해커톤이 끝이나면 상위 100여명은PPT를 제출해서 코드 검증도 거쳐야 하고 코드를 설명해야 한다.정확히 기억은 안 나지만 상위 100여명은 각 팀별로 PPT를 제출할 수 있는 3~4일의 시간이 주어진다.그렇게 우리 팀은 오프라인으로 모였다.총 다섯 명으로 구성된 팀이지만 한 분은 지방에 살고 있어서 해당 팀원을 제외하고 오프라인으로 진행했다.하지만 오프라인 진출을 위해 PPT를 제작하고 코드 검증을 위해 정리를 하면서 문제가 있다는 것을 알았다.문제1처음에는 문제 없이 각자 맡은 부분을 잘 진행했다.문제가 있다는 걸 인지했을 때는 두 시간 정도 진행하고 '한 번 전체적으로 실행을 해볼까?'하고 실행했을 때 였다.예측을 진행했을 때 결과가 항상 같아야 한다.하지만 결과가 달랐다...정확히는 제출했.. 2024. 10. 4. 이전 1 2 3 4 5 다음 728x90