kyejin0412 님의 블로그

Week 10-7 심화프로젝트 - 머신러닝 모델링 본문

내일배움캠프-데이터분석

Week 10-7 심화프로젝트 - 머신러닝 모델링

kyejin0412 2025. 12. 28. 20:40

 

오늘은 주말 출근을 해서 머신러닝을 마무리짓기로 했다. 어제 약속이 있었어서 오늘 일어나서 후다닥 돌려보았다.

다른 팀원들은 진심으로 재밌어서 하시기도 하는데 정말 대단한 것 같다. 이런 사람들이 분석가를 하는거구나 싶었다..ㅋㅋㅋ

이번주는 약간 주눅들고 캠프를 관두고 싶단 생각도 처음 들었다.ㅜㅜ 다들 이런 시기 한번쯤은 있겠지? 나만 못하는것 같다~

그래도 이제 심화프로젝트가 이틀 남았다. 좀만 더 버텨보자..!

 


 

헷갈리는 개념 정리

1. 재현율(Recall)

2. f1-score

3. 정밀도 (Precision)

4. 정확도 (Accuracy)

 

 

 

어려웠던 점

XGBoost를 맡아 돌려보았다. 파라미터 3개를 조정해볼 수 있었다. 트리수, 학습률, 트리 깊이이다. 이 3가지 변수들을 하나씩 조정해보면서 어떨 때 유의미한 차이를 보이는지 각각 확인해보았다. 그 후 두가지씩 조합해서 조정했다.

내가 했을 때는 아래처럼 하는게 결과가 가장 괜찮았다. 그렇다고 해도 쓸 수 있는 수준의 모델은 아니었다. 어떤 지표를 얼마나 조정해도 되는지가 어려웠다.

 

배운점

다른 팀원들은 파생변수를 생성해서 더 넣어보기도 하고, 임계점을 설정해서 recall을 무조건 임계값으로 맞춰서 한다든지, feature importance를 본다든지 했다. 이런건 생각 못해보고 튜터님 코드에서 파라미터 튜닝만 했어서 새로 배웠다.