[Python] [不分词版]Chinese-Text-Classification： Tensorflow CNN 模型实现的中文文本分类器

- - V2EX

从现在的结果来看，分词的版本( https://www.v2ex.com/t/404977#reply6 )准确率稍微高一点. 项目地址： https://github.com/fendouai/Chinese-Text-Classification. jieba 分词的版本在 master 分支，不分词的版本在 dev 分支.

发布一个python的分词模块

- bin - One Piece of Programming

第一个版本实现了基于的MMSEG中文分词算法Python 实现. MMSEG实际上是一个正向最大匹配+多个规则的分词算法. 链接给出的几个网站写的很清楚了. 在开发过程中我增加了一个规则来处理原来的算法中有可能出现的冲突问题. 当所有的规则都无法唯一的确定一个chunk时，优先选择后面比较长的词. 开发过程中参照了MMSEG的Java实现和ruby实现.

Python分词模块推荐：结巴中文分词

- - 标点符

就是前面说的中文分词，这里需要介绍的是一个分词效果较好，使用起来像但方便的Python模块：结巴. 基于Trie树结构实现高效的词图扫描，生成句子中汉字所有可能成词情况所构成的有向无环图（DAG). 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合. 对于未登录词，采用了基于汉字成词能力的HMM模型，使用了Viterbi算法.

BBC: The Chinese Accent 中国人的英语口音：单音篇

- Jimmy - 中文热文榜|最新

还有 bamboo, xiaoxie, Li, Ao, 推荐，查看全部 6 个推荐. 东方文化西方语发表于2010-08-08 08:04:45. 【我过去写过一篇博文说中国人说英语没有“口音”，因为各地中国人说英语五花八门没有规律，不像印度人或者其他国家的人说英语有特定的规律可循. 最近BBC播送了一个节目，专门谈中国人说英语的口音，转发供参考】.

Chinese Sentiment （中国情节） / 摄影师沈玮

- Interomeo - 60designwebpick

摄影师沈玮作品-Chinese Sentiment （中国情节）. Chinese Sentiment （中国情节）is a personal journey for me to reconnect with the authentic Chinese life, both in the private and public space.

GitHub - liuruoze/EasyPR: An easy, flexible, and accurate plate recognition project for Chinese licenses in unconstrained situations.

- -

EasyPR是一个开源的中文车牌识别系统，其目标是成为一个简单、高效、准确的非限制场景(unconstrained situation)下的车牌识别库. 相比于其他的车牌识别系统，EasyPR有如下特点：. 它基于openCV这个开源库. 这意味着你可以获取全部源代码，并且移植到opencv支持的所有平台.

[Python] [不分词版]Chinese-Text-Classification： Tensorflow CNN 模型实现的中文文本分类器

相关 [python 分词 chinese] 推荐：