Transformer精读-AttentionIsAllYouNeed

阅读思路

  • 以往的模型存在的问题/瓶颈——结构的哪些缺陷导致了性能的有限
    • Intro和BG
  • 论文提出的注意力结构解决了什么问题,为什么可以解决
    • 核心:Transformer架构和Self-Attention机制
    • 对应:Model ,Why Self-Attention
阅读更多
+ + +