- - 开源中国社区最新新闻
主要修改:改进对数字、时间、日期的朗读. 涉及平台:Linux、Android(粤语版). 下载地址: https://sourceforge.net/projects/e-guidedog/files/Ekho/5.8.2/. 软件首页: http://www.eguidedog.net/ekho.php.
- - 开源中国社区最新新闻
Ekho(余音)是一个免费、开源的中文语音合成软件. 它目前支持粤语、普通话(国语)、广东台山话、诏安客语、藏语、雅言(中国古代通用语)和韩语(试验中),英语则通过 eSpeak 或 Festival 间接实现. Ekho 支持 Linux、Windows 和 Android 平台. 台山被称为中国第一侨乡,海外的台山籍人比台山市常住人口还要多.
- - 统计之都
本文作者李绳,博客地址 http://acepor.github.io/. 一位文科生曾励志成为语言学家. 出国后阴差阳错成了博士候选人. 三年后交完论文对学术彻底失望. 回国后误打误撞成了数据科学家. 作为一个处理自然语言数据的团队,我们在日常工作中要用到不同的工具来预处理中文文本,比如 Jieba 和 Stanford NLP software.
- -
3,结构化表示--构建词向量空间. 即已经分好类的文本资料(例如:语料库里是一系列txt文章,这些文章按照主题归入到不同分类的目录中,如 .\art\21.txt). 推荐语料库:复旦中文文本分类语料库,下载链接:http://download.csdn.net/detail/github_36326955/9747927.
- - 精品绿色便携软件
EmEditor Professional以运行轻巧、敏捷而又功能强大、丰富著称,作为简单好用的文本编辑器, EmEditor支持多种配置,可自定义颜色、字体、工具栏、快捷键、行距等,支持文本列块选择、无限撤消/重做等,是 替代记事本的最佳编辑器. 我最近一直在用EmEditor,其便携性很适合影子系统, 标签窗口也是极方便操作,现提供 EmEditor 11.0.3中文便携版,分别为EmEditor 32位和64位版.
- - JavaScript - Web前端 - ITeye博客
今天工作时,遇到了一个问题:需要将上传文件的input框中的值清空,在上传文件保存成功之后,(上传控件在IE浏览器下有input框)在IE浏览器下input框中依然还显示刚刚上传文件的路径,尝试着使用普通文本框清空的方法去做,但是起不到效果. 后来在网上看到需要将原有的标签用新的标签替换就行了. 这样保存完信息后,同时刚刚input框中文件的路径值就消失了~~.
- - moxiaomomo的专栏
假设现在有N行文本,每行文本的第一列已经打好标签, Y 或 N, 用于标识该行文本是否包含敏感词汇;第二列之后的每一列是对某些句子或文本进行中文分词之后的词汇. N 朴素贝叶斯算法 是 生成模型 中 最经典 分类算法 之一
Y 这是 一条 包含 色情 的 语句. 我们现在用pyspark结合NaiveBayes分类算法来进行训练和测试,这个过程大概包括:.
- -
其中train存放的是训练集,answer存放的是测试集,具体看下train中的文件:. 下面有20个文件夹,对应着20个类,我们继续看下其中的文件,以C3-Art为例:. 每一篇都对应着一个txt文件,编码格式是gb18030.utf8文件夹下的是utf-8编码格式的txt文件. 其中C3-Art0001.txt的部分内容如下:.
- Amo - 電腦玩物
開場白還是那句老話:Evernote是我個人慣用的數位筆記本. 接著,繼之前「Evernote Android 關鍵更新,支援富文本編輯與桌面預覽便利貼」後,今天Evernote的iOS App也進行了一番大改造,其中最關鍵的新功能,就是繼Android版本後,現在iPhone、iPad上的Evernote也可以擁有富文本編輯工具列,並且擁有中文介面了.
- -
TextRank算法可以用来从文本中提取关键词和摘要(重要的句子). TextRank4ZH是针对中文文本的TextRank算法的python算法实现. Python 3下需要将上面的python改成python3,pip改成pip3. 在Python 2.7.9和Python 3.4.3中测试通过.