產品列表PRODUCTS LIST

首頁 > 技術與支持 > 網絡解碼器采用的技術特點
網絡解碼器采用的技術特點
點擊次數:1546 更新時間:2019-05-14
   網絡解碼器是一個很成功的翻譯模型。這個模型接受一個序列作為輸入,并將序列中的信息編碼為中間表示。然后解碼器解碼中間表示為目標語言。在我們的這個項目中,輸入序列是法語句子,輸出是相應的英語翻譯。
 
  在我們深入網絡解碼器如何工作之前,我們需要了解下模型是如何表示我們的數據的。在對模型的工作機制一無所知的情況下,我們可以合理地推測如果我們給模型一個法語句子,模型能給我們對應的英語句子。也就是說,輸入一個單詞序列,模型應該輸出另一個單詞序列。然而,模型只不過是一組參數,在輸入上進行多種運算。模型并不知道什么是單詞。類似ASCII編碼將字母映射到數字,我們的單詞也需要轉成數值表是。為此,數據集中的每個的單詞需要有一個的索引。模型接受的實際上不是一個單詞序列,而是一個索引序列。
 
  一次傳入一個句子,這沒什么問題。不過,怎樣才能一次傳入多個句子以加速訓練過程呢?句子長短不一。這些數字序列又該如何組織呢?答案是輸入序列將表示為維度等于(batch大小 × 大句子長度)的張量(矩陣)。這樣就可以一次輸入一組句子,短于數據集中長句的句子可以用事先確定的“補齊索引”補齊。
 
  回顧下編碼器輸出張量,序列維度的每一項保存了RNN輸出的向量。注意力模塊就批次中的每個樣本在序列維度上取這些向量的加權和。這樣,每個樣本得到一個向量,表示當前輸出序列步驟計算所需的相關信息。
 
  下面我們將舉一個具體的例子。如果輸入句子的個單詞包含了給定輸出單詞所需的所有重要的信息,那么個單詞分配的權重是一,其他各項權重為零。也就是加權向量等于輸入句子的個單詞對應的向量。
 
  模型需要學習如何分配這些權重,所以我們使用了一個全連接層。序列中的每個單詞對應一個權重,所以權重數量等于長句子長度。權重之和應等于一,所以全連接層將使用softmax激活函數。注意力模塊將接受網絡解碼器先前的隱藏狀態與解碼器前一步輸出的預測單詞的詞嵌入的連接作為輸入,從而決定這些權重的值。
主站蜘蛛池模板: 美国式禁忌免费| 67194成手机免费观看| 最近中文字幕高清中文字幕电影二| 免费看AV毛片一区二区三区| 91成人免费版| 国精产品wnw2544a| 中文字幕亚洲综合久久菠萝蜜 | 又大又粗又爽a级毛片免费看| 日本一二三精品黑人区| 夜鲁鲁鲁夜夜综合视频欧美| 中文字幕人妻偷伦在线视频| 日韩精品无码人妻免费视频| 亚洲欧美韩国日产综合在线| 精品无码人妻一区二区三区不卡| 国产成人精品久久综合| 91短视频在线高清hd| 影音先锋无码a∨男人资源站| 久久无码专区国产精品s| 欧美大香a蕉免费| 亚洲老妈激情一区二区三区| 精品综合久久久久久97| 国产偷亚洲偷欧美偷精品| www.色日本| 国内精品伊人久久久久AV一坑| 一级特黄aaa大片| 日本精品高清一区二区2021| 亚洲伊人精品综合在合线| 清纯秘书被总经理吸乳小说| 北岛玲亚洲一区在线观看| 资源在线www天堂| 国产日韩精品一区二区在线观看播放 | 女网址www女高清中国| 丰满老**毛片| 日韩在线观看中文字幕| 亚洲啪啪av无码片| 波多野结衣电影一区二区 | 日本免费一区二区三区最新 | 丰满少妇三级全黄| 日韩午夜在线视频| 亚洲丶国产丶欧美一区二区三区| 波多野结衣不打码视频|