NLPIR技术助力中文智能数据挖掘

- - 互联网 - ITeye博客

　　随着数据技术的飞速发展以及广泛应用，许多企业和部门建立了自身的数据管理系统，经过长年努力，已经积累了越来越多的数据. 于是，人们开始渴望通过对这些庞大的数据分析得到更多的有助于决策的信息. 虽然，目前的数据系统可以高效率地实现数据的录入、查询、统计等功能，但由于数据量庞大以及数据库系统中分析方法的严重缺乏，使得它无法发现数据中隐藏的相互联系，更无法根据当前和历史的数据去预测未来的发展趋势.

再说中文分词技术

- - 标点符

众所周知，英文是以词为单位的，词和词之间是靠空格隔开，而中文是以字为单位，句子中所有的字连起来才能描述一个意思. 例如，英文句子I am a student，用中文则为：“我是一个学生”. 计算机可以很简单通过空格知道student是一个单词，但是不能很容易明白“学”、“生”两个字合起来才表示一个词.

Google 基于 HTML 5 打造的网络技术读物有了中文版

- Phineux - cnBeta.COM

Google在去年年底发布了一个技术型网站：20 Things I Learned About Browsers & The Web（我从浏览器和网络里学到的20件事儿），利用HTML 5介绍HTML 5的知识. 今天，Google推出了此书的中文版（其实一共有15种语言，可在网站的下拉条里切换），同时还开放了源代码.

Google 基于 HTML 5 打造的网络技术读物有了中文版并开源

- syeye - 谷奥——探寻谷歌的奥秘

Spring Retry框架——看这篇就够了 - MarvelCode - OSCHINA - 中文开源技术交流社区

- -

软件架构从当初的单机，演变到后来的集群，再到后来的分布式应用. 原本看似可以信任的服务调用，加上了网络因素就变得不再可靠. 再考虑到一些调用链路的特殊性，又要保证性能，又要尽可能增加成功率，所以调用方必须肩负起重试的责任. 重试并不复杂，首先来分析下重试的调用场景，可以想到业务当中不止一处会需要重试能力，并且业务其实更关乎自己的代码块被重试就可以了，而不在乎如何实现的重试.

Translation of 可能是迄今为止（2025）中文互联网上，对自制力最硬核的技术讨论

- - xLog Latest

I expect this article to become the most revolutionary technical discussion on self-control in the Chinese internet (as of 2025), bar none.. The exploration process of these two generations of techniques was also an interesting and winding journey of continuous trial and iteration regarding the phenomenon of "self-control.".

我们为什么要开发一个新的中文输入法——英库拼音输入法背后的技术和故事

- - 微软亚洲研究院

编者按：为什么微软还要做一款新的输入法. 本文作者马特·斯科特，是微软英库拼音输入法开发负责人. 他认为中文输入法的症结远未解决，比如中英混杂输入，以及图片视频等富媒体的输入. 每个输入框都相当于搜索框，而英库输入法将把搜索的内容从纯文本拓展到其他形式的富媒体内容. 作者：Matt Scott 英库拼音输法开发负责人及项目经理，微软亚洲研究院高级开发主管.

使用logstash同步至ES的几个坑 - 一位帅气的网友的个人空间 - OSCHINA - 中文开源技术交流社区

- -

记录使用logstash从sqlserver同步数据到ES中遇到的几点问题. 使用的版本是es6.8.3+logstash6.8.3. jdbc_driver_library => "/usr/local/logstash-6.8.3/logstashconfs/sqljdbc4.jar"#sqlserver的驱动jar包jdbc_driver_class => "com.microsoft.sqlserver.jdbc.SQLServerDriver".

前端技术

- - CSDN博客综合推荐文章

随着互联网产业的爆炸式增长，与之伴生的Web前端技术也在历经洗礼和蜕变. 尤其是近几年随着移动终端的发展，越来越多的人开始投身或转行至新领域，这更为当今的IT产业注入了新的活力. 尽管Web前端技术诞生至今时日并不长，但随着Web技术的逐渐深入，今后将会在以下几方面发力. JavaScript的兄弟们.

SSI技术

- - 开源软件 - ITeye博客

1. SSI，通常称为“服务器端包含”技术. 使用了SSI技术的文件默认的后缀名为.shtml，SSI技术通过在html文件中加入SSI指令让web服务器在输出标准HTML代码之前先解释SSI指令，并把解释完后的输出结果和HTML代码一起返回给客户端. 2. SSI技术的优点：SSI技术是通用技术，它不受限于运行环境，在java、dotnet、CGI、ASP、PHP下都可以使用SSI技术；解释SSI的效率比解释JSP的效率快很多，因为JSP规范提供了太多的功能，这些功能都需要servlet引擎一一进行解释，所以效率比较低.

NLPIR技术助力中文智能数据挖掘

相关 [nlpir 技术中文] 推荐：