kyejin0412 님의 블로그
Week 10-7 심화프로젝트 - 머신러닝 모델링 본문
오늘은 주말 출근을 해서 머신러닝을 마무리짓기로 했다. 어제 약속이 있었어서 오늘 일어나서 후다닥 돌려보았다.
다른 팀원들은 진심으로 재밌어서 하시기도 하는데 정말 대단한 것 같다. 이런 사람들이 분석가를 하는거구나 싶었다..ㅋㅋㅋ
이번주는 약간 주눅들고 캠프를 관두고 싶단 생각도 처음 들었다.ㅜㅜ 다들 이런 시기 한번쯤은 있겠지? 나만 못하는것 같다~
그래도 이제 심화프로젝트가 이틀 남았다. 좀만 더 버텨보자..!
헷갈리는 개념 정리
1. 재현율(Recall)
2. f1-score
3. 정밀도 (Precision)
4. 정확도 (Accuracy)


어려웠던 점
XGBoost를 맡아 돌려보았다. 파라미터 3개를 조정해볼 수 있었다. 트리수, 학습률, 트리 깊이이다. 이 3가지 변수들을 하나씩 조정해보면서 어떨 때 유의미한 차이를 보이는지 각각 확인해보았다. 그 후 두가지씩 조합해서 조정했다.
내가 했을 때는 아래처럼 하는게 결과가 가장 괜찮았다. 그렇다고 해도 쓸 수 있는 수준의 모델은 아니었다. 어떤 지표를 얼마나 조정해도 되는지가 어려웠다.
배운점
다른 팀원들은 파생변수를 생성해서 더 넣어보기도 하고, 임계점을 설정해서 recall을 무조건 임계값으로 맞춰서 한다든지, feature importance를 본다든지 했다. 이런건 생각 못해보고 튜터님 코드에서 파라미터 튜닝만 했어서 새로 배웠다.

'내일배움캠프-데이터분석' 카테고리의 다른 글
| Week 11-5 태블로 시작 (0) | 2026.01.02 |
|---|---|
| Week 11-1 심화프로젝트 - 발표자료 준비 (0) | 2025.12.29 |
| Week 10-3 심화 프로젝트 - 데이터 전처리 기준 정리 (1) | 2025.12.24 |
| Week 9-5 심화 프로젝트 - 도메인 조사, 컬럼 솎아내기 (1) | 2025.12.19 |
| Week 9-3 발표 세션 정리 (0) | 2025.12.17 |