一文理解 Transformer 的工作原理

- - IT瘾-tuicool

目前，自然语言处理中，有三种特征处理器：卷积神经网络、递归神经网络和后起之秀 Transformer. Transformer 风头已经盖过两个前辈，它抛弃了传统的卷积神经网络和递归神经网络，整个网络结构完全是由注意力机制组成. 准确地讲，Transformer 仅由自注意力和前馈神经网络组成. 那幺，Transformer 在自然语言处理中，是如何工作的.

学完这些，你就可以理解透 Transformer，手搓一个 ChatGPT了

- -

第一部分：短视频讲解-- 通俗易懂，感兴认识. 强推，可视化整个GPT模型，并讨论其智力程度：. 关于 AI 的深度研究：ChatGPT 正在产生心智吗. 【Transformer模型】曼妙动画轻松学，形象比喻贼好记_哔哩哔哩_bilibili. 【BERT模型】暴力的美学，协作的力量_哔哩哔哩_bilibili.

华硕展示 Transformer Prime，世界首款四核 Tegra 3 平板

- Kidwind - 谷安——谷奥Android专题站

华硕之前放出了一个很有挑逗性的下一代 Transformer 平板的宣传视频，我们都认为这是 Transforemer 2 不过数小时之后当 Jonney Shih 在 Asia D 会议上从公文包里拿出该平板后这发生了一些变化. 实际上这款产品叫做 Transformer Prime，从视频中你可以看到可拆卸的键盘底座以及超薄的机身，看上去很有吸引力，不过还有一个最重要的值得关注的原因是它是首款采用 NVIDIA 四核 Kal-El（Tegra 3）处理器的平板产品.

华硕官方网站宣示 Transformer Prime 即将到来

- martin - Engadget 中国版

在香港的 AsiaD 刚刚露过面，我们已经知道 ASUS 华硕 Transformer 的继任者 Transformer Prime，将会搭载 NVIDIA 的最新四核 Tegra 3 芯片. 现在官方网站也已经发布了，上面写道其将会是世界首款四核平板电脑. 网页上的图片没有展露机器的全身图，不过依然露出了边角，并且有一个闪亮的反光.

很有霸氣的新一代 ASUS Eee Pad Transformer 宣傳片

- SotongDJ - Engadget 中文版

ASUS 剛剛在他們的 Facebook 專頁上發放了一段有關下一代 Eee Pad Transformer 平板的宣傳片. 片段的主題為「The next Transformation」，其中不單展示了它那個跟第二代 MacBook Air 相近的水滴形、漸薄式設計（特別是在配備了鍵盤底座的狀態下），而且還透露了它的後置鏡頭將會有補光燈.

ASUS：Eee Pad Transformer 將會得到 ICS 升級，日期方面...

- SotongDJ - Engadget 中文版

我們目前已經知道 Google Nexus S、ASUS Padfone、Motorola RAZR 及其餘跑 Gingerbread 的手機將可以吃 Ice Cream Sandwich，那麼平板方面呢（雖然 Padfone 也可算是半部平板）. 根據 Pocket-lint 的報導，華碩的發言人只說了他們的 Eee Pad Transformer「將可以升級到 ICS」，不過當問到何時的時候，他們則只說「目前還不能提供一個時間表」.

ASUS：Eee Pad Transformer 将会得到 ICS 升级，日期方面...

- martin - Engadget 中国版

我们目前已经知道 Google Nexus S、ASUS Padfone、Motorola RAZR 及其余跑 Gingerbread 的手机将可以吃 Ice Cream Sandwich，那么平板方面呢（虽然 Padfone 也可算是半部平板）. 根据 Pocket-lint 的报导，华硕的发言人只说了他们的 Eee Pad Transformer「将可以升级到 ICS」，不过当问到何时的时候，他们则只说「目前还不能提供一个时间表」.

理解Git工作流

- joyoner - FeedzShare

来自: 黑客志 - FeedzShare . 发布时间:2011年08月04日, 已有 2 人推荐. 如果你不了解Git背后的设计初衷，那么你正处在危险境地，当然有很多参数可以强迫Git按照你的意愿行事，但这并不是Git被设计的工作方式，这就好比你可以把改锥当锤子使用，并且它也可以完成工作，但这对改锥没什么好处.

华硕Transformer 2可能成为首款NVIDIA Kal-El核心设备

- 洞箫 - cnBeta.COM

华硕第二代Transformer平板产品虽然有可能被延迟，但这依然不影响它成为首款NVIDIA Kal-El核心的设备，来自Fudzilla的消息显示，华硕Transformer 2将是第一款装载1.5GHz四核心Tegra 3芯片的平板.

一文理解 Transformer 的工作原理

概述

引言

目录

序列到序列模型：背景

基于递归神经网络的序列到序列模型

挑战

Transformer 简介

理解 Transformer 的模型架构

掌握自注意力的技巧

自注意力的计算

Transformer 的局限性

理解 Transformer-XL

使用 Transformer 进行语言建模

使用 Transformer-XL 进行语言建模

自然语言处理的新感觉：Google 的 BERT

BERT 的模型架构

BERT 预训练任务

1. 掩码语言建模（Masked Language Modeling，MLM）

2. 下一句的预测

结语

作者介绍

相关 [理解 transformer 工作] 推荐：