kyejin0412 님의 블로그

Week 19-4 최종프로젝트 - BERT 지도학습을 위한 라벨링 본문

카테고리 없음

Week 19-4 최종프로젝트 - BERT 지도학습을 위한 라벨링

kyejin0412 2026. 2. 26. 21:25

오늘은 진전은 크게 없었다.

600개의 데이터를 직접 라벨링하는 작업을 했다.

비정형 데이터를 우리가 정한 기준으로 지도학습을 하기 위해서는, 직접 라벨링을 해주는 작업이 필요하다.

이 작업이 정말 하루 종일 걸려서 오늘은 라벨링만 하다가 끝났다...

 

나눠서 하면 각자의 기준이 달라 모델링을 위한 기준 라벨링 데이터가 명확하지 않아질 것을 우려하여,

모두가 라벨링을 하고 서로 다른 것만 맞춰보기로 했다.

따라서 우리가 정한 기준을 라벨과 같이 적어줬다. (라벨: 부정:0, 중립부정: 1, 중립: 2, 긍정: 3, 타브랜드: 4)

나중에 왜 이렇게 라벨을 붙였는지 얘기하기 편하게 하기 위함이다.

 

비정형 데이터가 정말 오래걸리고 애매한 경우가 많다는 것을 몸소 실감했다.

손이 많이 가는 작업인 만큼, 완성했을 때 애정이 커질 것 같다.

그나저나 시간이 좀 촉박하다...!!

 


라벨링 작업

 

라벨링 작업

 

 

감성분석 기준

유형 기준

부정 명확한 불만·피해·공격적 표현
중립부정 불안, 의심, 걱정(소문 포함), 추측
중립 정보공유, 질문, 구매후기/인증, 투표글
긍정 만족, 추천, 칭찬

 

감정, 행동 섞인 경우

→ 감정으로 판단

 

감정이 여러 개인 경우 (감정1 + 행동 + 감정2 …)

→ (부정 + 중립부정/긍정 감정이 섞여있을 때)

a. 부정 감정이 하나라도 있으면 부정

 

→ (부정 or 중립부정 키워드 있을 때)

b. 브랜드가 고칠 수 있는 문제(브랜드 운영/제품 품질/가격/유통/CS에 대한 언급)면 부정

c. 확실한 부정표현이 있으면 부정

d. 본인이 겪지 않은거 + 의심, 걱정, 추측, 소문, 들어보니~ 어떻다던데 괜찮나요? : 중립부정

j. 본인이 겪은거 + 저만 이런가요?, 걱정, 추측, 의심o / 그냥 쓰려구요 등 불만 표현 x : 중립부정

k. 본인이 겪은거 + 확실한 불만, 화남, 피해, 공격적 표현 : 부정 - 웨이팅 길었는데 겨우 샀어요 처럼 부정 키워드 섞인 경험을 직접 겪은 경우

 

→ (자기 취향에 대한 불만)

e. 브랜드가 고칠 수 있는 문제(제품 규격/설계 문제 제기, “왜 이렇게 나오냐” 운영 비판)면 부정

f. 고칠 수 없으면(디자인 취향, 개인 체형 문제, 퍼스널 컬러 문제 등 + 부정적 감정) 중립부정 - ‘’안 이쁘다”, “촌스러”, “질린다”, “유행 끝”, “흔해짐”, “사진빨”, “생각했던 것과 다름” - 부정감정 예시 : “막상 샀는데 다른게 더 예뻐서 후회된다/교환/환불할까 고민된다”

  • 교환, 환불 고민? : 중립불안?

 

정보성 글, 질문, 구매후기/인증글, 투표글(투표, 골라주세요)

여러 감정표현이 섞였지만 딱히 우세한 감정은 없음, 제품/사이즈 고민 중(골라주세요X)

→ g. 중립

 

칭찬, 만족, 추천 등 긍정 감정만 있는 경우

→ h. 긍정

 

다른 브랜드 글이 대부분이고, '저도 까르띠에 있어요' 와 같이 유의미한 내용이 없을 경우

→ i. 라벨링 별도로 붙이기 (4)

 

개인간 거래, 가품, 리셀

→ L. 불만표현o : 쌓일 경우 브랜드 이미지 손상되므로 중립부정

→ z. 불만표현x : 중립

 

 

중립불안/부정 기준

  1. 부정 : 부정감정이 확실한 것 + 브랜드가 고칠 수 있는 문제
  • 약간 디자인이 별로인 것 같은데 저만 이런가요? → 중립부정 (개인 취향)