반응형
1. 핵심 요약
- 기존 NR 모델
- learned numerical reasoning capabilities를 interpolate
- BUT training set에 unseen numbers에까지 좋은 성능 X
- 이번 모델
- key findings : 모델이 unseen numbers를 extrapolate X
- 해결
- model input : digit-by-digit numbers 추가
- extrapolation 부족 완화
- text에서 number를 다르게 취급해야 한다는 사실을 알아냄
- : E-digit number form
- model input : digit-by-digit numbers 추가
2. 논문 링크
https://aclanthology.org/2021.emnlp-main.563/
3. 논문 설명 링크
반응형