[深度]周明：自然语言处理的未来之路 | CCF-GAIR 2019

- - 雷锋网

雷锋网按：7 月 12 日-7 月 14 日，2019 第四届全球人工智能与机器人峰会（CCF-GAIR 2019）于深圳正式召开. 峰会由中国计算机学会（CCF）主办，雷锋网、香港中文大学（深圳）承办，深圳市人工智能与机器人研究院协办，得到了深圳市政府的大力指导，是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会，旨在打造国内人工智能领域极具实力的跨界交流合作平台.

如何用深度学习做自然语言处理？这里有份最佳实践清单

- - 机器之心

对于如何使用深度学习进行自然语言处理，本文作者 Sebastian Ruder 给出了一份详细的最佳实践清单，不仅包括与大多数 NLP 任务相关的最佳实践，还有最常见任务的最佳实践，尤其是分类、序列标注、自然语言生成和神经机器翻译. 作者对最佳实践的选择很严格，只有被证明在至少两个独立的群体中有益的实践才会入选，并且每个最佳实践作者至少给出两个参引.

自然语言处理概览

- - 互联网 - ITeye博客

自然语言处理研究的是词、句、文档等几个层次的内容. 一、发展历史（前两个是理论、后一个是经验）. 1、形式语法（复杂特征集）. 2、词汇主义方法（WordNet、ConceptNet、FrameNet），人工总结和整理概念、层次、结构等 . 3、统计语言模型（语言有统计规律性，让机器去自己学习规律）.

自然语言处理某个pipeline

- - 互联网 - ITeye博客

1、数据源：包括文本、pdf、数据库等不同来源. 2、使用到的库：jieba gensim sklearn keras . 3、可以实现的服务：找出相关和相近词（以分词为准）、比较2个分词的相似度、和哪些相关同时和别的不相关（语义上的模糊查找）. 数据源的load->gensim->classifier(传统基于词频的/深度学习的 keras).

统计自然语言处理的基础学习之一

- - CSDN博客互联网推荐文章

理性主义：其实就是纯粹使用规则的方法处理自然语言，并认为这些语言规则天生就存在人的基因中. 在计算机中重现这些规则，就能学会人的语言处理能力. 经验主义：认为人有感知和学习能力，通过概括、模式识别、联想等能力，来学习到自然语言的结构. 哲学上的问题，类似于起源之类，就先别考虑的. 统计方法在NLP中的地位是什么.

[微信机器人_04]自然语言处理简单实现

- - CSDN博客互联网推荐文章

这篇博文中将介绍奇迹蛋自然语言处理模块的实现，自然语言处理的三个关键词：分词、建库、匹配. 机器人要如何来记忆这两组对话呢?. 这样存储当然没有问题，但是显然太土了，有没有其它的办法呢. 在存储过程中，总是希望能够去除冗余，即相同的词语能够只存储一次. 很容易想到，把句子拆分成词来存储. 如图所示，每个问题都拆分成词，并以词为节点建立树.

Quora在自然语言处理上的所做的工作

- - 标点符

问答网站最核心的内容是提供给优质的内容，如何让内容更加优质，处理分析大量的文本数据也是必不可少的工作. Quora有大量的文本数据，分布在Quora的数百万个问题、答案和评论中. 不仅如此，还有大量的元数据来补充我问答，包括”赞”和”踩”，用户对话题的兴趣或擅长与否，问题和话题的关系，话题去重合并，用户的社交和关系和影响力幅射，以及用户在Quora的每一个操作历史.

自然语言处理词向量化总结

- - 冰火岛

distributed representation 分布式表达（一类表示方法，基于统计含义），分散式表达（从一个高维空间X映射到一个低维空间Y）分布假说(distributional hypothesis)为这一设想提供了理论基础:上下文相似的词，其语义也相似.. 自然语言处理的基础是词向量化，即文本数值化，后面进行数据挖掘工作就和常见的任务类似，即分类，聚类等等.

自然语言处理之词性标注集

- - 标点符

词性标注（Part-of-Speech tagging 或POS tagging)，又称词类标注或者简称标注，是指为分词结果中的每个单词标注一个正确的词性的程序，也即确定每个词是名词、动词、形容词或其他词性的过程. 实词：名词、动词、形容词、状态词、区别词、数词、量词、代词. 虚词：副词、介词、连词、助词、拟声词、叹词.

自然语言处理第一番之文本分类器

- - 小石头的码疯窝

文本分类应该是自然语言处理中最普遍的一个应用，例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等，在生活中有很多例子，这篇文章主要从传统和深度学习两块来解释下我们如何做一个文本分类器. 传统的文本方法的主要流程是人工设计一些特征，从原始文档中提取特征，然后指定分类器如LR、SVM，训练模型对文章进行分类，比较经典的特征提取方法如频次法、tf-idf、互信息方法、N-Gram.

[深度]周明：自然语言处理的未来之路 | CCF-GAIR 2019

一、什么叫自然语言处理？

二、技术体系

三、未来发展

四、未来之路

相关 [深度自然语言未来之路] 推荐：