트랜스포머(Transformer)

신경망 아키텍처

기존 순환망과 같은 순차적 방식이 아닌 병렬로 입력 시퀀스를 처리하는 기능

트랜스포머 기반 모델의 학습 방법

트랜스포머 모델 구조

모델 학습 구조 학습 방법 학습 방향성
BERT 인코더 오토 인코딩 양방향
GPT 디코더 자기 회귀 단방향
BART 인코더+디코더 오토 인코딩+자기 회귀 양방향+단방향
ELECTRA 인코더+판별기 오토 인코딩+대체 토큰 탐지 양방향
T5 인코더+디코더 오토 인코딩+자기 회귀+다양한 자연어 처리 작업을 학습 양방향

Transformer