上海古都建筑设计集团,上海办公室装修设计公司,上海装修公司高质量的内容分享社区,上海装修公司我们不是内容生产者,我们只是上海办公室装修设计公司内容的搬运工平台

Transformer|Encoder(未完成)

guduadmin291月前

文章目录

  • Transformer|Encoder编码器
    • 注意力机制
    • 残差
      • 残差的作用

        Transformer|Encoder编码器

        Transformer|Encoder(未完成),在这里插入图片描述,第1张

        注意力机制

        Transformer|Encoder(未完成),在这里插入图片描述,第2张

        比如说已经得到腰围和体重的两份数据,此时给出一个查询——腰围为57的人的体重为多少?可以根据以往的腰围数据对体重进行估计,比如说腰围为56的体重为43,腰围为58的人体重为48,那么腰围为57的人体重应该介于43和48之间。

        而不妨假设43占一半的作用,48占一半的作用,所以预测的体重为45.5.

        而“一半的作用”就是所谓的权重系数(注意力权重,为了得出结果应该放多少注意力到这个级别的体重上来),而这个权重系数需要计算出来。

        所以,做个小总结,Query通过Key和Value得到对应的估计值。

        而以上有个问题,就是并没有将Key矩阵的51纳入到考虑中。

        所以进一步,为了考虑到所有的影响,我们可以使用softmax来归一化Key矩阵每一个元素对答案的贡献的占比。算出注意力权重的具体过程如下——

        Transformer|Encoder(未完成),在这里插入图片描述,第3张

        得到注意力权重系数后,我们就可以对查询对应的结果进行进一步的估计了。

        Transformer|Encoder(未完成),在这里插入图片描述,第4张

        残差

        Transformer|Encoder(未完成),在这里插入图片描述,第5张

        残差的作用

        Transformer|Encoder(未完成),在这里插入图片描述,第6张

网友评论

搜索
最新文章
热门文章
热门标签
 
 梦见老公出轨周公解梦  梦见被狗追着咬是什么预兆  梦到鞋坏了