코딩무민의 슬기로운 코딩생활

  • 홈

Palm 1

[PaLM 논문 리뷰] PaLM: Scaling Language Modeling with Pathways

1. 핵심 요약 최근 모델들 BERT, T5 등의 encoder-only, encoder-decoder architectures 들이 MLM, span corruption 등을 활용하며 NLP tasks에서 좋은 성적을 냄. 위 모델의 한계점 model fine-tuning을 위해 상당한 양의 task-specific training examples를 필요로 함 task에 맞게 fitting 하는 과정에서 model parameter update가 필요함 → model finetuning & deployment에 complexity를 더함 GPT-3 Model few-shot predictions을 사용한 extremely large Autoregressive LMs → decoder-only Trans..

NLP 2022.04.26
1
더보기
프로필사진

  • 분류 전체보기 (45)
    • NLP (19)
    • etc (26)
      • 자격증 (4)
      • [Window} FTP (5)
      • [Python] Flask (5)
      • Visualization (3)
      • Crawling (3)
      • BlockChain (3)
      • TISTORY (2)

Copyright © AXZ Corp All rights reserved.

티스토리툴바