语言学家开发出算法识别Twitter用户性别

- geek2live - Solidot

网民多以假名掩盖身份，雌雄难辩，男扮女女扮男屡见不鲜，然而他们的言语和喜好会暴露他们的身份. Mitre公司的语言学研究人员，在苏格兰举行的自然语言处理实证方法会议上公布了一篇论文(PDF)，称他们开发出一种算法能根据Twitter用户的帖子内容识别出其性别，他们的依据是女性所用语言和男性存在相当大的差异.

IT新职业：算法开发者

- ashuai - Solidot

德州大学的研究人员认为，当算法与软件变得泾渭分明，未来将会出现算法开发者和算法工程专业. 计算机科学教授András Faragó说，我们可能将目睹历史新趋势的出现，他指出算法的重要性日益上升，将重现计算机历史上软件取代硬件成为行业明星的一幕. 今天没有人质疑软件的价值，但算法的价值却未必得到认真对待.

mahout贝叶斯算法开发思路（拓展篇）2

- - CSDN博客云计算推荐文章

如果想直接下面算法调用包，可以直接在 mahout贝叶斯算法拓展下载，该算法调用的方式如下：. 这一步骤相当于 TrainNaiveBayesJob的第二个prepareJob，其中mapper和reducer都是参考这个job的，基本没有修改代码；代码如下：. 其实也就是设置一个标识的个数而已，其他参考AbstractJob的默认参数；.

mahout贝叶斯算法开发思路（拓展篇）1

- - CSDN博客云计算推荐文章

首先说明一点，此篇blog解决的问题是就下面的数据如何应用mahout中的贝叶斯算法. 完结篇）blog最后留的问题，如果想直接使用该工具，可以在 mahout贝叶斯算法拓展下载）：. 前篇blog上面的数据在最后的空格使用冒号代替（因为样本向量和标识的解析需要不同的解析符号，同一个的话解析就会出问题）.

我为什么从算法岗转 Java 开发？

- - IT瘾-dev

数据结构和算法、操作系统、计算机网络、计算机组成原理. 后台回复 “ 计算机基础” 即可获取下载链接. 最近发现许多同学对算法岗好奇. 一部分准研究生在思考读研以后是该做算法还是做开发，一部分做开发的同学则是想了解做算法的同学是在学什么、做什么. 我情况比较特殊，开发和算法都做过，目前我也在做自然语言处理中知识图谱的相关工作.

缓存算法

- lostsnow - 小彰

没有人能说清哪种缓存算法由于其他的缓存算法. （以下的几种缓存算法，有的我也理解不好，如果感兴趣，你可以Google一下）. 大家好，我是 LFU，我会计算为每个缓存对象计算他们被使用的频率. 我是LRU缓存算法，我把最近最少使用的缓存对象给踢走. 我总是需要去了解在什么时候，用了哪个缓存对象.

BFPRT算法

- zii - 小彰

BFPRT算法的作者是5位真正的大牛（Blum 、 Floyd 、 Pratt 、 Rivest 、 Tarjan），该算法入选了在StackExchange上进行的当今世界十大经典算法，而算法的简单和巧妙颇有我们需要借鉴学习之处. BFPRT解决的问题十分经典，即从某n个元素的序列中选出第k大（第k小）的元素，通过巧妙的分析，BFPRT可以保证在最坏情况下仍为线性时间复杂度.

贪心算法

- Shan - 博客园-首页原创精华区

顾名思义，贪心算法总是作出在当前看来最好的选择. 也就是说贪心算法并不从整体最优考虑，它所作出的选择只是在某种意义上的局部最优选择. 当然，希望贪心算法得到的最终结果也是整体最优的. 虽然贪心算法不能对所有问题都得到整体最优解，但对许多问题它能产生整体最优解. 如单源最短路经问题，最小生成树问题等.

缓存算法

- 成 - FeedzShare

来自: 小彰 - FeedzShare . 发布时间:2011年09月25日, 已有 2 人推荐. 没有人能说清哪种缓存算法由于其他的缓存算法. （以下的几种缓存算法，有的我也理解不好，如果感兴趣，你可以Google一下）. 大家好，我是 LFU，我会计算为每个缓存对象计算他们被使用的频率.

K-Means 算法

- - 酷壳 - CoolShell.cn

最近在学习一些数据挖掘的算法，看到了这个算法，也许这个算法对你来说很简单，但对我来说，我是一个初学者，我在网上翻看了很多资料，发现中文社区没有把这个问题讲得很全面很清楚的文章，所以，把我的学习笔记记录下来，分享给大家. k-Means 算法是一种 cluster analysis 的算法，其主要是来计算数据聚集的算法，主要通过不断地取离种子点最近均值的算法.

语言学家开发出算法识别Twitter用户性别

相关 [语言学家开发算法] 推荐：