更新于:07-30 01:38

有关[语言]分类推荐

GitHub - hankcs/HanLP: 自然处理 中文分词 词性标注 命名实体识别 依存句法分析 关键词提取 自动摘要 短提取 拼音 简繁转换

于08-18 06:08 - -
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用. HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点. 基于互信息和左右信息熵的短语提取. 简繁分歧词(简体、繁体、臺灣正體、香港繁體). 基于神经网络的高性能依存句法分析器. CoNLL UA/LA/DA评测工具.

自然处理某个pipeline

于08-02 09:34 - eric_weitm -
1、数据源:包括文本、pdf、数据库等不同来源. 2、使用到的库:jieba gensim sklearn keras . 3、可以实现的服务:找出相关和相近词(以分词为准)、比较2个分词的相似度、和哪些相关同时和别的不相关(语义上的模糊查找). 数据源的load->gensim->classifier(传统基于词频的/深度学习的 keras).

如何用深度学习做自然处理?这里有份最佳实践清单

于07-26 06:16 - 机器之心 -
对于如何使用深度学习进行自然语言处理,本文作者 Sebastian Ruder 给出了一份详细的最佳实践清单,不仅包括与大多数 NLP 任务相关的最佳实践,还有最常见任务的最佳实践,尤其是分类、序列标注、自然语言生成和神经机器翻译. 作者对最佳实践的选择很严格,只有被证明在至少两个独立的群体中有益的实践才会入选,并且每个最佳实践作者至少给出两个参引.

自然处理概览

于07-04 10:10 - eric_weitm -
自然语言处理研究的是词、句、文档等几个层次的内容. 一、发展历史(前两个是理论、后一个是经验). 1、形式语法(复杂特征集). 2、词汇主义方法(WordNet、ConceptNet、FrameNet), 人工总结和整理概念、层次、结构等 . 3、统计语言模型(语言有统计规律性,让机器去自己学习规律).

自然处理技术(NLP)在推荐系统中的应用

于06-28 00:00 - - geek
作者:张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作. 多年来主要从事推荐系统以及机器学习,也做过计算广告、反作弊等相关工作,并热衷于探索大数据和机器学习技术在其他领域的应用实践. 责编:何永灿(heyc@csdn.net). 《程序员》原创文章,更多精彩文章请. 个性化推荐是大数据时代不可或缺的技术,在电商、信息分发、计算广告、互联网金融等领域都起着重要的作用.

自然处理第一番之文本分类器

于06-18 06:05 - burness - 机器学习 NLP 深度学习 machine learning tensorflow
文本分类应该是自然语言处理中最普遍的一个应用,例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等,在生活中有很多例子,这篇文章主要从传统和深度学习两块来解释下我们如何做一个文本分类器. 传统的文本方法的主要流程是人工设计一些特征,从原始文档中提取特征,然后指定分类器如LR、SVM,训练模型对文章进行分类,比较经典的特征提取方法如频次法、tf-idf、互信息方法、N-Gram.

周明:未来5-10年,自然处理将走向成熟

于06-14 09:58 - 微软亚洲研究院 -
近日,微软亚洲研究院副院长周明在「自然语言处理前沿技术分享会」上,与大家讲解了自然语言处理(NLP)的最新进展,以及未来的研究方向,以下内容由CSDN记者根据周明博士的演讲内容编写,略有删减. 周明博士于1999年加入微软亚洲研究院,不久开始负责自然语言研究组. 近年来,周明博士领导研究团队与微软产品组合作开发了微软小冰(中国)、Rinna(日本)、Zo(美国)等聊天机器人系统.

为什么说Python是伟大的入门

于05-24 00:00 - - bigdata
作者:Elliott Hauser. 本文作者列举了一些Python特性,并认为Python是最适合入门的编程语言,一起来看一下. 最近发表了三篇关于我的艺术史背景是如何影响我教学的文章. 现在要分享一篇,为什么Python对于青少年和成年人是入门语言的最佳选择. 伟大的入门编程语言有什么特征呢. 或者换一种方式问,“当我们教他们编程时,应该给予他们什么.

从NLP到“自然理解”,Facebook如何让Messenger更懂人类

于04-21 13:43 - - 人工智能
雷锋网按:Facebook的AML和FAIR团队合作进行自然语言处理对自然语言理解进行着合作研究. 在2017年4月19日举办的F8开发者大会上,Facebook向公众介绍了他们的研究进展、自然语言理解在Facebook产品中的应用,并且介绍了平民化的自然语言理解平台CLUE,希望依靠大家的力量,继续丰富自然语言理解的应用.

自然处理词向量化总结

于04-04 15:52 - bicloud - 数据挖掘
distributed representation 分布式表达(一类表示方法,基于统计含义),分散式表达(从一个高维空间X映射到一个低维空间Y) 分布假说(distributional hypothesis)为这一设想提供了 理论基础:上下文相似的词,其语义也相似.. 自然语言处理的基础是词向量化,即文本数值化,后面进行数据挖掘工作就和常见的任务类似,即分类,聚类等等.

自然处理之词性标注集

于10-29 07:52 - 标点符 - 程序开发 自然语言处理
词性标注(Part-of-Speech tagging 或POS tagging),又称词类标注或者简称标注,是指为 分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程. 实词:名词、动词、形容词、状态词、区别词、数词、量词、代词. 虚词:副词、介词、连词、助词、拟声词、叹词.

Quora在自然处理上的所做的工作

于10-19 13:04 - 标点符 - 产品设计 程序开发 自然语言处理
问答网站最核心的内容是提供给优质的内容,如何让内容更加优质,处理分析大量的文本数据也是必不可少的工作. Quora有大量的文本数据,分布在Quora的数百万个问题、答案和评论中. 不仅如此,还有大量的元数据来补充我问答,包括”赞”和”踩”,用户对话题的兴趣或擅长与否,问题和话题的关系,话题去重合并,用户的社交和关系和影响力幅射,以及用户在Quora的每一个操作历史.

[翻译]理解 GO 的内存使用

于04-03 10:01 - admin - 程序开发 golang
许多人在刚开始接触 Go 语言时,经常会有的疑惑就是“为什么一个 Hello world 会占用如此之多的内存. Understanding Go Lang Memory Usage 很好的解释了这个问题. 不过“简介”就是“简介”,更加深入的内容恐怕要读者自己去探索了. 另外,文章写到最后,作者飘了,估计引起了一些公愤,于是又自己给自己补刀,左一刀,右一刀…….

TIOBE 11月编程排行榜 09年7月以来Java再次超过20

于11-09 13:58 - -
Java 在 TIOBE 指数仍然持续上涨,现在已打败了 20%. 因为 10 月底成功召开的 JavaOne 大会,它的受欢迎程度有可能进一步上升. 目前 Java 和C两大语言和其余的包之间的差距现在超过 10%. 本月前 50 排名上升幅度较大的是 OpenEdge ABL(从 19 上升至 38),VBScript(从 77 上升至 46)和 GO(从 65 上升至 48).

华为宣布开源流处理平台查询 StreamCQL

于10-25 02:44 - - 综合新闻
华为在本周一开始的华为开发者大会上宣布开源其流处理平台查询语言StreamCQL(Stream Continuous Query Language),在Github网站上已能看到其项目代码和文档,具体网页地址: https://github.com/HuaweiBigData/StreamCQL.

2015年需要了解的前端框架和

于08-19 13:05 - techug - 业界观察
Node.js 第一,PHP 第二,JavaScript 第三. 因为Node.js的社区很多,所以这个结果你也不用太意外. 如果你知道JavaScript,你已经一只脚踏进了用Node.js来构建Web APP的可能. AngularJS 处于框架的领导地位. 大量的公司和企业已经采用 Angular,这就要求开发者更多的具备使用这个框架的技能.

thrift总结 - 跨服务开发

于07-02 05:57 - uule -
IBM-Apache Thrift - 可伸缩的跨语言服务开发框架. Thrift入门及Java实例演示. Thrift是一个软件框架,用来进行 可扩展且跨语言的服务的开发. thrift允许你定义一个简单的定义文件中的数据类型和服务接口. 以作为输入文件,编译器生成代码用来方便地生成RPC客户端和服务器通信的无缝跨编程语言.

Thrift跨样例开发

于01-30 16:12 - san1156 -
1、有一台部署好thrift框架的电脑,本人采用centos5下的thrift框架. (部署步骤可以参看 http://blog.csdn.net/san1156/article/details/41146483 ). 2、部署的thrift环境需要支持java和c++. 使用c++做服务端,java做客户端,客户端远程调用服务端的服务.

著名黑客雷蒙评价最重要的几种编程

于01-06 09:41 - techug - 编程技术
虽说C语言在内存管理方面存在严重的缺陷,不过它还是在某些应用领域里称王称霸. 对于那些要求最高的效率,良好的实时性,或者与操作系统内核紧密关联的程序来说,C仍然是很好的选择. C良好的可移植性也为它加了分. 不过现在很多其他的语言可移植性越来越好,C在这方面的优势可能会逐渐丧失. 现有的很多程序可以产生非常棒的C代码,比如语法分析器、GUI Builder等,这时候C语言也是有吸引力的,因为你所需要编写的代码只是整个程序的一小部分.

通过Stack Overflow标签分析编程新趋势

于01-05 09:42 - -
近日, Salsita Software 的 CEO  Matthew Gertner 发表了一篇题为《通过 StackOverflow 上的标签分析软件开发语言/工具的趋势》的 博文. 在文章中,Matthew 介绍了通过对 Stack Overflow 上标签的分析而得出编程语言/工具的新趋势.

Python在企业级应用上的十大谬误

于01-01 04:12 - 陈舸 - 程序员 编程技术 Python
语言多元化是PayPal编程文化中一个重要的组成部分. 在C++和Java长期流行的同时,更多的团队选择了JvaScript和Scala. 同时, Braintree的收购也引入了一个久经世故的Ruby社区. Python作为一门特别的语言,在eBay和PayPal有很长的历史. eBay的开发者支持Python这个应用于基层领域多年的语言.

为什么放弃Go【转载

于12-20 16:14 - Aaron5 -
转载地址: http://blog.csdn.net/liigo/article/details/23699459. 有好几次,当我想起来的时候,总是会问自己:我为什么要放弃Go语言. 开门见山地说,我当初放弃Go语言(golang),就是因为两个“不爽”:第一,对Go语言本身不爽;第二,对Go语言社区里的某些人不爽.

开源领袖Eric Raymond对主流编程的评价

于12-17 06:00 - ajaxj - General
【译注】:Eric Raymond是开源运动的领袖人物,对于UNIX开发有很深的造诣,主持开发了fetchmail. 他的《大教堂与集市》被奉为开源运动的经典之作. 下面对几大开发语言的评价非常中肯,是我近年来看到的比较出色的评论. 特别是他评价中抱有的那种“简单就是好”的思想,很值得我们深思. 我特别选译出一些段落,供大家阅读思考.

如何开始编程?给初学者的几个小贴士

于12-11 01:33 - techug - 业界观察 初学者
在美国,计算机科学是一个蓬勃发展的行业,并且它的薪资待遇是极好的. 对于顶尖的、有才华的工程师需求从没间断过,这就是为什么学习代码看起来是一个有吸引力的选择. 但是和任何新的技术一样,很难知道从何处开始. 这里有一些你应该在早期采用的步骤,适合 初学编程语言的人. “拖拽编程”是一种基本的技术,可以让你通过拖拽块或其他视觉线索来创建代码,而不是手动编写基于文本的代码.

java常用性能优化技巧

于11-11 14:41 - xiong1025 -
java语言常用性能优化技巧介绍.     java程序常用的方法有以下几种:.     1.不用new关键词创建类的实例. 用new关键词创建类的实例时,构造函数链中的所有构造函数都会被自动调用. 但如果一个对象实现了Cloneable接口,我们可以调用它的clone()方法. clone()方法不会调用任何类构造函数.

jiebaR 0.1 发布,R中文分词

于11-04 06:06 - - 软件更新新闻
jiebaR是"结巴"中文分词的R语言版本,支持最大概率法(Maximum Probability),隐式马尔科夫模型(Hidden Markov Model),索引模型(QuerySegment),混合模型(MixSegment),共四种分词模式,同时有词性标注,关键词提取,文本Simhash相似度比较等功能.

最值得阅读学习的 10 个 C 开源项目代码

于10-29 03:27 - -
Webbench是一个在linux下使用的非常简单的网站压测工具. 它使用fork()模拟多个客户端同时访问我们设定的URL,测试网站在压力下工作的性能,最多可以模拟3万个并发连接去测试网站的负载能力. Webbench使用C语言编写, 代码实在太简洁,源码加起来不到600行. 下载链接: http://home.tiscali.cz/~cz210552/webbench.html.

50行Python代码写一个检测器

于10-28 07:34 - -
你有没有曾经好奇过Chrome浏览器是如何知道一个网页的语言,并对外国文字的网页提供翻译服务的. 或者,Facebook是如何翻译你朋友用写在你主页上的外国文字. 检测一种语言实际上非常简单,改进了用户体验,而且不需要用户做任何的事情. 我无意中发现的 ActiveState recipe for a language detector in Python这是非常不错的一段程序,但是我决定做点小小的改进.

几种流行的编辑器标记

于10-06 05:02 - xiemingmei -
编辑器标记语言是一种有转换功能的标记语言,最终都是转换成html,以在浏览器上展示. 非常流行的几种编辑语言如下:. Wikitext语言,亦称Wiki标记语言,是一种轻量级标记语言,被用于撰写Wiki网页,例如维基百科,而且也是一个简单化的,非正统的,中间性的HTML. 它的最终目的是被wiki软件转换成HTML,并且重新回到浏览器中.

jdk1.6 java 连接pcsc读卡器 发送APDU指令

于09-22 00:13 - wyx100 -
java语言操作读卡器  jdk1.6 提供的Package javax.smartcardio可以直接连接pcsc读卡器、和读卡器进行指令交互. Package javax.smartcardio详细信息. 作者:wyx100 发表于2014-9-22 0:13:28 原文链接. 阅读:147 评论:0 查看评论.