본문 바로가기

분류 전체보기28

LGAimers 5기 - 온라인 해커톤(Phase II) - 1 LGAimesr Phase II두 번째 단계는 온라인 해커톤이다.Phase I가 끝날 쯤(?) 자유 게시판에 온라인 해커톤 팀원을 모집하는 글이 많이 올라온다.필자 역시 자유 게시판에 올라온 팀원 모집 글을 보고 팀원을 모집하는 분에게 메일을 보냈다.필자는 Phase II부터는 팀원들의 팀워크를 중요하다고 생각했다. 그래서 선택한 팀원 모집 게시글은 다음과 같다. '이전에 LGAimers에서 진행했던 대회 데이터를 이용해 팀프로젝트를 진행해보자' 즉, 팀원들끼리 미리 프로젝트를 한 번 진행해보면서 잘 맞는지 확인해보고 Phase II를 같이 진행할지 결정하자는 것이다.이렇게 이전 게시글에서 작성했 듯 Phase II를 진행하기 전에 미리 팀워크를 확인해 봤다. Phase II 시작부터 팀을 구성하는 것 .. 2024. 10. 1.
서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출 서울시 공공 자전거 대여 패턴 분석 및 이용 활성화 전략 도출장태훈https://github.com/jangtaehun1. 분석 개요1.1 기획 배경1.2 분석의 필요성1.2 분석 목적 2. 데이터 수집2.1 데이터 분석 프로세스 수립2.2 데이터 처리 및 가공2.3 결과2.4 시각화 3.모델 결정3.1 요인별 상관성 측정3.2 모델 생성 및 비교3.3 공공 자전거 대여에 영향을 준 요인 3.4 2023년 공공 자전거 대여 건수 예측 결과 4. 분석 결과4.1 군집화 및 시각화 5. 분석 활용 방안5.1 데이터 분석 기준 마케팅5.2 고객 세그먼트 기준 마케팅 6. 프로젝트 요약 및 향후 개선 방향6.1 프로젝트 요약6.2 한계점 및 어려웠던 점1. 분석 개요1.1 기획 배경 공공 자전거는 2008년 창.. 2024. 10. 1.
LGAimers 5기 - 시작(Phase I) LG Aimers는 LG에서 진행한 교육 프로그램이다. 2024년 06월 03일~2024년 06월 20일 18시까지 지원서 접수를 했다.필자 역시 이 기간에 지원했다.지원에 특별히 까다로운 조건은 없었다. (조건이 없는 것은 아니기 때문에 신청 전에 꼼꼼한 확인이 필요하다)LG Aimers 홈페이지 내에서 신청을 하고 미래내일일경험사업에서 프로그램 신청을 하는 것이다.교육은 2024년 07월 01일부터 시작했다.총 3단계로 나눠지며, 다음과 같다.Phase I - 온라인 AI 교육: 07월 01일~07월 26일Phase II - LG AI 해커톤 (온라인): 08월 01일~08월 30일Phase III - LG AI 해커톤 (오프라인): 09월 28일~09월 29일Phase I를 이수해야 다음 단계인 P.. 2024. 9. 24.
'utf-8' codec can't decode byte 0xbf in position 0: invalid start byte 상황공공 데이터 분석을 위해 csv 파일을 읽으려고 하니깐 에러가 발생했다.import pandas as pdimport numpy as npdata = pd.read_csv('../../data/house/주택도시보증공사_신규분양세대수_20240731.csv')'utf-8' codec can't decode byte 0xbf in position 0: invalid start byte내용 = utf-8 방식으로 디코딩을 할 수 없다는 에러이다.아 맞다. encoding 설정을 안 했네... 원인 파이썬 파일 읽기 기본 설정: 파이썬에서 파일을 열 때 encoding을 따로 지정하지 않으면, 기본적으로 default 값인 UTF-8로 디코딩을 시도합니다.파일 인코딩 불일치: 파일이 UTF-8 이외의 다른.. 2024. 9. 23.
군집화 - 데이터 기반 고객 세그먼테이션 및 맞춤형 마케팅 전략 수립: UCI Online Retail 분석 데이터 기반 고객 세그먼테이션 및 맞춤형 마케팅 전략 수립: UCI Online Retail 분석 장태훈https://github.com/jangtaehun 1. 머리말1.1 프로젝트 목표1.2 기획 배경1.3 기대 효과 2. 고객 세그먼테이션2.1 정의2.2 유형2.3 중요성 3. 분석 절차3.1 데이터 수집3.2 데이터 전처리3.3 세그먼트 기준 설정3.4 군집 분석 및 모델링 4. UCI, Online Retail Data Set을 이용한 고객 세그먼테이션 분석4.1 데이터 수집 및 전처리4.2 세그먼트 기준 설정4.3 군집 분석 및 모델링4.4 결과 해석 5. 마케팅 분석 및 전략5.1 클러스터별 특성 분석5.2 마케팅 전략 제안- Cluster 0 (VIP 고객)- Cluster 1 (이탈 가능.. 2024. 9. 21.
kaggle Bike Sharing Demand(1) - 자전거 수요 예측(상위 약 5%) kaggle에서 진행한 Bike Sharing Demand는 2014년부터 2015년까지 1년간 진행된 kaggle의 대회이다. 특히, Bike Sharing Demand는 titanic data와 같이 머신러닝을 입문하는 사람들이 가장 먼저 시작하는 데이터 중 하나이다. 따라서 필자 역시 회귀 게시물 첫 시작을 Bike Sharing Demand으로 시작하려고 한다.순서는 다음과 같이 진행될 것이다. 문제에 대한 정보 수집문제 정의분석 대상에 대한 이해Bike Sharing Demand을 이용한 EDA공통 코드분석Bike Sharing Demand에 대한 기본적인 정보(구조 파악)시각화Data cleaningFeature Engineering모델 학습RandomForestCatBoostXGBoostTo.. 2024. 9. 17.
728x90