更新于:12-15 23:30

有关[语言]分类推荐

自然语言处理领域重要论文&资源全索引

于10-14 03:51 - 刘晓坤 -
自然语言处理(NLP)是人工智能研究中极具挑战的一个分支. 随着深度学习等技术的引入,NLP 领域正在以前所未有的速度向前发展. 但对于初学者来说,这一领域目前有哪些研究和资源是必读的. 最近,Kyubyong Park 为我们整理了一份完整列表. GitHub 项目链接:https://github.com/Kyubyong/nlp_tasks.

GitHub - hankcs/HanLP: 自然语言处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁转换

于08-18 06:08 - -
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用. HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点. 基于互信息和左右信息熵的短语提取. 简繁分歧词(简体、繁体、臺灣正體、香港繁體). 基于神经网络的高性能依存句法分析器. CoNLL UA/LA/DA评测工具.

自然语言处理某个pipeline

于08-02 09:34 - eric_weitm -
1、数据源:包括文本、pdf、数据库等不同来源. 2、使用到的库:jieba gensim sklearn keras . 3、可以实现的服务:找出相关和相近词(以分词为准)、比较2个分词的相似度、和哪些相关同时和别的不相关(语义上的模糊查找). 数据源的load->gensim->classifier(传统基于词频的/深度学习的 keras).

如何用深度学习做自然语言处理?这里有份最佳实践清单

于07-26 06:16 - 机器之心 -
对于如何使用深度学习进行自然语言处理,本文作者 Sebastian Ruder 给出了一份详细的最佳实践清单,不仅包括与大多数 NLP 任务相关的最佳实践,还有最常见任务的最佳实践,尤其是分类、序列标注、自然语言生成和神经机器翻译. 作者对最佳实践的选择很严格,只有被证明在至少两个独立的群体中有益的实践才会入选,并且每个最佳实践作者至少给出两个参引.

自然语言处理概览

于07-04 10:10 - eric_weitm -
自然语言处理研究的是词、句、文档等几个层次的内容. 一、发展历史(前两个是理论、后一个是经验). 1、形式语法(复杂特征集). 2、词汇主义方法(WordNet、ConceptNet、FrameNet), 人工总结和整理概念、层次、结构等 . 3、统计语言模型(语言有统计规律性,让机器去自己学习规律).

自然语言处理技术(NLP)在推荐系统中的应用

于06-28 00:00 - - geek
作者:张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作. 多年来主要从事推荐系统以及机器学习,也做过计算广告、反作弊等相关工作,并热衷于探索大数据和机器学习技术在其他领域的应用实践. 责编:何永灿(heyc@csdn.net). 《程序员》原创文章,更多精彩文章请. 个性化推荐是大数据时代不可或缺的技术,在电商、信息分发、计算广告、互联网金融等领域都起着重要的作用.

自然语言处理第一番之文本分类器

于06-18 06:05 - burness - 机器学习 NLP 深度学习 machine learning tensorflow
文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下我们如何做一个文本分类器. 传统的文本方法的主要流程是人工设计一些特征,从原始文档中提取特征,然后指定分类器如LR、SVM,训练模型对文章进行分类,比较经典的特征提取方法如频次法、tf-idf、互信息方法、N-Gram.

周明:未来5-10年,自然语言处理将走向成熟

于06-14 09:58 - 微软亚洲研究院 -
近日,微软亚洲研究院副院长周明在「自然语言处理前沿技术分享会」上,与大家讲解了自然语言处理(NLP)的最新进展,以及未来的研究方向,以下内容由CSDN记者根据周明博士的演讲内容编写,略有删减. 周明博士于1999年加入微软亚洲研究院,不久开始负责自然语言研究组. 近年来,周明博士领导研究团队与微软产品组合作开发了微软小冰(中国)、Rinna(日本)、Zo(美国)等聊天机器人系统.

为什么说Python是伟大的入门语言

于05-24 00:00 - - bigdata
作者:Elliott Hauser. 本文作者列举了一些Python特性,并认为Python是最适合入门的编程语言,一起来看一下. 最近发表了三篇关于我的艺术史背景是如何影响我教学的文章. 现在要分享一篇,为什么Python对于青少年和成年人是入门语言的最佳选择. 伟大的入门编程语言有什么特征呢. 或者换一种方式问,“当我们教他们编程时,应该给予他们什么.

自然语言处理之词性标注集

于10-29 07:52 - 标点符 - 程序开发 自然语言处理
词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为 分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程. 实词:名词、动词、形容词、状态词、区别词、数词、量词、代词. 虚词:副词、介词、连词、助词、拟声词、叹词.

从NLP到“自然语言理解”,Facebook如何让Messenger更懂人类?

于04-21 13:43 - - 人工智能
雷锋网按:Facebook的AML和FAIR团队合作进行自然语言处理对自然语言理解进行着合作研究. 在2017年4月19日举办的F8开发者大会上,Facebook向公众介绍了他们的研究进展、自然语言理解在Facebook产品中的应用,并且介绍了平民化的自然语言理解平台CLUE,希望依靠大家的力量,继续丰富自然语言理解的应用.

自然语言处理词向量化总结

于04-04 15:52 - bicloud - 数据挖掘
distributed representation 分布式表达(一类表示方法,基于统计含义),分散式表达(从一个高维空间X映射到一个低维空间Y) 分布假说(distributional hypothesis)为这一设想提供了 理论基础:上下文相似的词,其语义也相似.. 自然语言处理的基础是词向量化,即文本数值化,后面进行数据挖掘工作就和常见的任务类似,即分类,聚类等等.

哪些人在Twitter上发言的语法最规范?比尔盖茨排第二

于03-01 15:21 - -
美国有个诡计的节日,叫国家语法日(National Grammar Day),可能一般人是不知道的,但Grammarly不会忘记. Grammarly是个应用,据说它真正懂英语. 大概是要庆祝国家语法日,Grammarly对Twitter上粉丝最多的50个名人最近发的150条推文进行了研究,排除了那些转发的推文,确保研究对象是这些名人自己说的.

2015年需要了解的前端框架和语言

于08-19 13:05 - techug - 业界观察
Node.js 第一,PHP 第二,JavaScript 第三. 因为Node.js的社区很多,所以这个结果你也不用太意外. 如果你知道JavaScript,你已经一只脚踏进了用Node.js来构建Web APP的可能. AngularJS 处于框架的领导地位. 大量的公司和企业已经采用 Angular,这就要求开发者更多的具备使用这个框架的技能.

Quora在自然语言处理上的所做的工作

于10-19 13:04 - 标点符 - 产品设计 程序开发 自然语言处理
问答网站最核心的内容是提供给优质的内容,如何让内容更加优质,处理分析大量的文本数据也是必不可少的工作. Quora有大量的文本数据,分布在Quora的数百万个问题、答案和评论中. 不仅如此,还有大量的元数据来补充我问答,包括”赞”和”踩”,用户对话题的兴趣或擅长与否,问题和话题的关系,话题去重合并,用户的社交和关系和影响力幅射,以及用户在Quora的每一个操作历史.

华为宣布开源流处理平台查询语言 StreamCQL

于10-25 02:44 - - 综合新闻
华为在本周一开始的华为开发者大会上宣布开源其流处理平台查询语言StreamCQL(Stream Continuous Query Language),在Github网站上已能看到其项目代码和文档,具体网页地址: https://github.com/HuaweiBigData/StreamCQL.

[翻译]理解 GO 语言的内存使用

于04-03 10:01 - admin - 程序开发 golang
许多人在刚开始接触 Go 语言时,经常会有的疑惑就是“为什么一个 Hello world 会占用如此之多的内存. Understanding Go Lang Memory Usage 很好的解释了这个问题. 不过“简介”就是“简介”,更加深入的内容恐怕要读者自己去探索了. 另外,文章写到最后,作者飘了,估计引起了一些公愤,于是又自己给自己补刀,左一刀,右一刀…….

thrift总结 - 跨语言服务开发

于07-02 05:57 - uule -
IBM-Apache Thrift - 可伸缩的跨语言服务开发框架. Thrift入门及Java实例演示. Thrift是一个软件框架,用来进行 可扩展且跨语言的服务的开发. thrift允许你定义一个简单的定义文件中的数据类型和服务接口. 以作为输入文件,编译器生成代码用来方便地生成RPC客户端和服务器通信的无缝跨编程语言.

著名黑客雷蒙评价最重要的几种编程语言

于01-06 09:41 - techug - 编程技术
虽说C语言在内存管理方面存在严重的缺陷,不过它还是在某些应用领域里称王称霸. 对于那些要求最高的效率,良好的实时性,或者与操作系统内核紧密关联的程序来说,C仍然是很好的选择. C良好的可移植性也为它加了分. 不过现在很多其他的语言可移植性越来越好,C在这方面的优势可能会逐渐丧失. 现有的很多程序可以产生非常棒的C代码,比如语法分析器、GUI Builder等,这时候C语言也是有吸引力的,因为你所需要编写的代码只是整个程序的一小部分.

通过Stack Overflow标签分析编程语言新趋势

于01-05 09:42 - -
近日, Salsita Software 的 CEO  Matthew Gertner 发表了一篇题为《通过 StackOverflow 上的标签分析软件开发语言/工具的趋势》的 博文. 在文章中,Matthew 介绍了通过对 Stack Overflow 上标签的分析而得出编程语言/工具的新趋势.

Thrift跨语言样例开发

于01-30 16:12 - san1156 -
1、有一台部署好thrift框架的电脑,本人采用centos5下的thrift框架. (部署步骤可以参看 http://blog.csdn.net/san1156/article/details/41146483 ). 2、部署的thrift环境需要支持java和c++. 使用c++做服务端,java做客户端,客户端远程调用服务端的服务.

科学家仍然在广泛使用 Fortran 语言

于05-08 05:05 - - 综合新闻
有机会参观美国大学物理系的研究实验室或国家实验室,你会看到被称之为前沿和研究的东西,它们大多数都是你从未见过的,其中你可能会看到研究人员在超级计 算机终端上进行的前沿模拟. 然而在几乎所有的美国大学,这些计算机模拟程序使用的都是1950年代的语言Fortran. 美国国家大气研究中心的大气模型和气候预测程序,洛斯阿拉莫斯国家实验室和劳伦斯利弗莫尔国家实验室的机密核武器和激光核聚变程序,NASA的全球气候变化模型,量子色动力学研究人员计算夸克行为、质子和中子成分的代码,等等,它们都是使用Fortran写就的.

TIOBE 11月编程语言排行榜 09年7月以来Java再次超过20%

于11-09 13:58 - -
Java 在 TIOBE 指数仍然持续上涨,现在已打败了 20%. 因为 10 月底成功召开的 JavaOne 大会,它的受欢迎程度有可能进一步上升. 目前 Java 和C两大语言和其余的包之间的差距现在超过 10%. 本月前 50 排名上升幅度较大的是 OpenEdge ABL(从 19 上升至 38),VBScript(从 77 上升至 46)和 GO(从 65 上升至 48).

几种流行的编辑器标记语言

于10-06 05:02 - xiemingmei -
编辑器标记语言是一种有转换功能的标记语言,最终都是转换成html,以在浏览器上展示. 非常流行的几种编辑语言如下:. Wikitext语言,亦称Wiki标记语言,是一种轻量级标记语言,被用于撰写Wiki网页,例如维基百科,而且也是一个简单化的,非正统的,中间性的HTML. 它的最终目的是被wiki软件转换成HTML,并且重新回到浏览器中.

Python语言在企业级应用上的十大谬误

于01-01 04:12 - 陈舸 - 程序员 编程技术 Python
语言多元化是PayPal编程文化中一个重要的组成部分. 在C++和Java长期流行的同时,更多的团队选择了JvaScript和Scala. 同时, Braintree的收购也引入了一个久经世故的Ruby社区. Python作为一门特别的语言,在eBay和PayPal有很长的历史. eBay的开发者支持Python这个应用于基层领域多年的语言.

如何开始编程语言?给初学者的几个小贴士

于12-11 01:33 - techug - 业界观察 初学者
在美国,计算机科学是一个蓬勃发展的行业,并且它的薪资待遇是极好的. 对于顶尖的、有才华的工程师需求从没间断过,这就是为什么学习代码看起来是一个有吸引力的选择. 但是和任何新的技术一样,很难知道从何处开始. 这里有一些你应该在早期采用的步骤,适合 初学编程语言的人. “拖拽编程”是一种基本的技术,可以让你通过拖拽块或其他视觉线索来创建代码,而不是手动编写基于文本的代码.

jdk1.6 java语言 连接pcsc读卡器 发送APDU指令

于09-22 00:13 - wyx100 -
java语言操作读卡器  jdk1.6 提供的Package javax.smartcardio可以直接连接pcsc读卡器、和读卡器进行指令交互. Package javax.smartcardio详细信息. 作者:wyx100 发表于2014-9-22 0:13:28 原文链接. 阅读:147 评论:0 查看评论.

美国一名程序员对Swift语言的看法

于06-03 14:09 - -
近 20 年来,苹果一直把 Objective-C 作为主要的编程语言,而在今天举行的全球开发者大会上,苹果推出了一个全新的编程语言 Swift. 据悉,苹果此次发布的 Swift 兼容 Objective-C 语言,从其开发者指南中,我们看到 Swift 从 Python 和 JavaScript 中吸取了许多东西,从而让 Swift 更易读,或者说更为“口语化”.

swift语言是什么?

于06-03 12:47 - - 资讯编译
译/新浪科技   导语:CNET网站今天刊文称,苹果公司(以下简称“苹果”)在今年的WWDC(全球开发者大会)上发布了一款重要产品:编程语言Swift,并随后发布了对这一语言进行详解的iBook电子书. 终端用户或许很难感知到这一编程语言带来的改变,但这可能推动苹果应用开发者社区的变革. 许多人可能都已忘记苹果WWDC中的“D”代表了“开发者”.

苹果WWDC 2014汇总:iOS 8、OS X和新的编程语言

于06-03 02:16 - -
北京时间6月3日凌晨1点,苹果在美国旧金山Moscone中心举行了一年一度的WWDC开发者大会. 传闻中的iPhone 6、Retina版本的MacBook Air、4K分辨率的iMac均爽约,这是一场只有软件没有硬件的发布会. 1.  全新的Mac OS X 10.10 Yosemite. 没有任何悬念,今年的 WWDC 如期发布了全新的OS X Yosemite.