如何评价在20个任务上超越BERT的XLNet？

- - 知乎每日精选

谢 @henryWang 邀. （不知道为啥我又 at 不上人. 效果就不比了，屠榜了没什么好说的. BERT 有两个目标，Masked Language Model 和 Next Sentence Prediction，前者用于提取单词之间的关系，后者用来提取句子之间的关系. 前者带来的问题在于，训练时引入 [MASK] token 使得 train/test 不一致，于是又用了很多乱七八糟的方法来补救（以一定概率保留原词，一定概率换成别的单词等等）.

NLP历史突破！谷歌BERT模型狂破11项纪录，全面超越人类！

- - 博客园_新闻

来源：新智元（AI_era）. （来源：arXiv、知乎；编辑：新智元编辑部）. 今天，NLP 领域取得最重大突破. 谷歌 AI 团队新发布的 BERT 模型，在机器阅读理解顶级水平测试 SQuAD1.1 中表现出惊人的成绩：全部两个衡量指标上全面超越人类，并且还在 11 种不同 NLP 测试中创出最佳成绩.

谷歌最强 NLP 模型 BERT 解读

- - 雷锋网

雷锋网 AI 科技评论按：本文是追一科技潘晟锋基于谷歌论文为 AI 科技评论提供的解读稿件. 最近谷歌研究人员通过新的BERT模型在11项NLP任务中夺得STOA结果，这在自然语言处理学界以及工业界都引起了不小的热议. 作者通过在33亿文本的语料上训练语言模型，再分别在不同的下游任务上微调，这样的模型在不同的任务均得到了目前为止最好的结果，并且有一些结果相比此前的最佳成绩得到了幅度不小的提升.

当Bert遇上Keras：这可能是Bert最简单的打开姿势

- - 机器之心

Bert 是什么，估计也不用笔者来诸多介绍了. 虽然笔者不是很喜欢Bert，但不得不说，Bert 确实在 NLP 界引起了一阵轩然大波. 现在不管是中文还是英文，关于 Bert 的科普和解读已经满天飞了，隐隐已经超过了当年 Word2Vec 刚出来的势头了. 有意思的是，Bert 是 Google 搞出来的，当年的 word2vec 也是 Google 搞出来的，不管你用哪个，都是在跟着 Google 大佬的屁股跑.

一大批中文（BERT等）预训练模型等你认领！

- - 机器之心

预训练模型已经成为了 NLP 领域最重要的资源之一. 当我们拿到一个 NLP 数据集时，首要任务是寻找一个预训练模型. 当然，目前大家会趋同的选择 Google 发布的 BERT 模型 [1]. 不过本文将为大家提供更多的中文预训练模型的选择. 本文将介绍如何利用一个预训练模型框架 UER（Universal Encoder Representations）去使用性质各异的中文预训练模型，从而在下游任务上取得比 Google BERT 更好的效果.

XLNet团队：只要公平对比，BERT毫无还手之力

- - IT瘾-tuicool

今天，我们应该使用 BERT 还是 XLNet. 直观看来 XLNet 要比 BERT 好一些，毕竟提出模型以后，XLNet 在 GLUE基准及其它很多 NLP 任务上都超过了 BERT，或者说超过了 BERT 和 BERT 的各种变体. 而且从模型原理上来说，似乎 XLNet 那种随机排列的语言模型更适合预训练语言建模.

Trover 超越 Instagram ？

- PH囧ENIX - 爱范儿 · Beats of Bits

5月4日，Trover 上线，第二周成为 App Store 的 “本周推荐”，现在已经有来自140个国家的用户上传了照片. Trover 是一家小公司，由３名程序员和一名设计. Trover 的起步和 Instagram 很像，尽管它还有一些不完善的地方，但由于其拥有一些 Instagram 不具备的元素，我认为它将超越 Instagram.

任务完成

- pp2moonbird - YesKafei Daily

这段令人激动又伤感的视频，集合了航天飞机的自始至终. 你可以一览航天飞机执行的所有任务，人类探索太空的渴望和梦想，但也看到了挑战者号和哥伦比亚号的悲剧画面. 如同视频中的配乐，每一次失败，并不能动摇航天飞机冲向太空的决心，航天飞机的再次发射升空令失去得到尊重. 现在，她完美的谢幕，科技永不止步，下一代STS（Space Transportation System）会更强大.

Java 任务处理

- - 码蜂笔记

最近梳理其他同事以前写的 job 后有点想法，记录下. 在大多数的系统都有类似这样的逻辑，比如下单了给用户赠送积分，用户在论坛上发表了帖子，给用户增加积分等等. 下单赠送积分，那么一个订单肯定不能重复赠送积分，所以需要一些状态来比较来哪些是已赠送的，哪些是没有赠送的. 或许可以在订单表里加个字段来标记是否赠送了积分.

Spark 任务调度

- - IT瘾-dev

Spark的核心是基于RDD来实现的，Spark任务调度就是如何组织任务去处理RDD中每个分区的数据，根据RDD的依赖关系构建DAG，基于DAG划分Stage，然后将每个Stage中的任务（Task）分发到指定的节点去运行得到最终的结果. Application：用户编写的Spark应用程序，由一个或多个Job组成.

如何评价在20个任务上超越BERT的XLNet？

1、监督信号的提取

2、数据规模

3、优化方法

4、彩蛋：

5、吃瓜群众可以干什么

相关 [任务超越 bert] 推荐：