본문 바로가기
LGAimers

LGAimers 5기 - 온라인 해커톤(Phase II) - 1

by 짱태훈 2024. 10. 1.
728x90

LGAimesr Phase II

두 번째 단계는 온라인 해커톤이다.


Phase I가 끝날 쯤(?) 자유 게시판에 온라인 해커톤 팀원을 모집하는 글이 많이 올라온다.

필자 역시 자유 게시판에 올라온 팀원 모집 글을 보고 팀원을 모집하는 분에게 메일을 보냈다.

필자는 Phase II부터는 팀원들의 팀워크를 중요하다고 생각했다. 그래서 선택한 팀원 모집 게시글은 다음과 같다.

 

'이전에 LGAimers에서 진행했던 대회 데이터를 이용해 팀프로젝트를 진행해보자'

 

즉, 팀원들끼리 미리 프로젝트를 한 번 진행해보면서 잘 맞는지 확인해보고 Phase II를 같이 진행할지 결정하자는 것이다.

이렇게 이전 게시글에서 작성했 듯 Phase II를 진행하기 전에 미리 팀워크를 확인해 봤다.

 

Phase II 시작부터 팀을 구성하는 것 보다는 일주일 정도 개인 플레이를 추천한다.

하루에 제출을 다섯 번만 가능한데 팀을 구성하면 팀 전체가 하루에 다섯 번만 제출이 가능하기 때문이다. 

일주일 기간이 주어지는데 이때 팀을 구성하지 않고 개인 플레이를 진행하면서 이것저것 시도해보길 추천한다.


Phase II 시작

8월 1일부터 8월 30일까지 진행하는 온라인 해커톤

 

처음 데이터를 받고 이게 뭐지...?

굉장히 당황스러웠다. train, test 데이터가 따로 분리된 것이 아닌 하나의 파일로 제공되었다.

결론부터 말하면  data leakage가 있었다.

특정 제품이 여러 번 작업되었다면 불량품이기 때문에 제품의 이상 여부를 판별을 쉽게 할 수 있었다.

 

처음에 우리팀은 점수가 0.15~17 정도인데 리더보드에서 점수가 0.98인 것을 보고 와... 머신러닝에 천재가 너무 많다...

이렇게 생각했는데 어느날 공지가 올라왔다.

 

온라인 해커톤 대회 중지 안내

 

다행...

나만 어려운 게 아니였구나...

데이터셋이 수정되고 나서 모두가 비슷한 점수를 가지게 되었다.


팀명: 케찹도둑 (원래는 롯데리아 케찹도둑)

노션을 만들어 분석한 코드를 공유하고 일정관리를 진행했다.

디스코드를 통해 매주 두 번 이상의 회의를 진행했다.

(코드나 데이터셋에 대해서는 공유하면 안 된다는 조건이 있어서 자세하게 보여줄 수 없다는 점이 아쉽다.)

위의 일정과 같이 정해진 시간에 매번 회의를 진행했다.

점수가 너무 안 좋아서 분석하고 다시 분석하고 유튜브 찾아보고... 놓친 것이 있었는지 컬럼으로 주어진 좌표를 이용해서 추측도 해보고

좌표를 이용한 정리는 틀렸다. 처음에는 무엇인가 있다! 하고 좋아했는데 계산을 잘 못 했다...ㅎ

 

분석하고 다시 분석하고 처음으로 돌아가서 또 다시 분석하고 한 달 정도는 꿈에서도 생각날 정도로 지지고 볶았다.

나중에 알았지만 LG 측에서도 이번 대회는 매우 어려웠다는 것을 알고 있었다 ㅋㅋㅋㅋ

오프라인 대회 때 LG AI연구원 멘토도 이런 데이터로 좋은 점수를 낸다는 것이 불가능하다고 말할 정도...


8월 마지막 주에는 이제 진짜 뭘 해야하지... 할 정도로 답이 없었다.

그래도 포기하지 않고 우리는 다시 시작했다.

노션에 새로운 페이지를 만들었다.

<가능전사들>

 

일주일 정도는 새벽까지 진행했다.

모두 잠을 포기하고 모든 일정을 뒤로 미루고 뭐라도 하나 건질려고 계속 시도했다.


8월 30일 마지막 날

점수에 매달리지 않고 우리팀만의 객관적인 점수를 믿었다.

Public 점수는 굉장히 낮았다.

솔직히 우리팀은 거의 포기를 한 상태였다.


8월  30일 6시

Private 점수 공개

????????????????

문닫고 오프라인 해커톤에 진출했다.

자물쇠 잠궜다. 이제 아무도 못 들어오게

 

지금 생각해도 믿어지지가 않는다.

일등한 팀은 떨어지고 157위인 우리팀이 26위로...

이렇게 본선 진출을 성공했다.

 

728x90