5-1 문장 쌍 분류 모델 훑어보기

1. 과제 소개

2. 모델 구조

  1. 전제와 가설 두 문장 각각 토큰화

  2. [CLS] + 전제 + [SEP] + 가설 + [SEP]

  1. BERT 모델에 입력

  2. 문장 수준의 벡터(pooler_output) 뽑기 → 전제와 가설의 의미 응축되어 있음

  3. (+작은 추가 모듈)→ 모델 전체의 출력 = [전제에 대한 가설이 참/거짓/중립일 확률] 형태가 되도록

3. 태스크 모듈

Untitled

5-2 문장 쌍 분류 모델 학습하기