浅析聊天机器人的技术和前景

标签: 聊天 机器人 技术 | 发表时间:2014-01-18 03:25 | 作者:aofengdaxia
出处:http://blog.csdn.net

最近利用业余时间,团队开发了一个简单的聊天机器人雏形( http://robot.ly863.com)。对聊天机器人的技术和前景有了简单的了解。大概的整理下,期望与大家分享和交流,能在这个领域内进一步的发展,能把聊天机器人做的更加完善。

目前聊天机器人的大概水平:

国内外目前聊天机器人我们认为最先进的应该非苹果的siri莫属。从效果上来看siri会有很好的知识匹配,同时有一定的自动学习功能,同时有简单的上下文理解功能。在体验度上使用了语音识别和自然语音两个功能,很好的让聊天机器人有更高的用户体验。关于语音识别和自然语音功能不在我们讨论范围,本文主要讨论聊天部分的功能。目前最成熟,最可以学习和观摩的机器人应该是aliceBot. 具体网址: http://www.alicebot.org/  他使用了AIML一种用来表示语义的XML语料库。通过一问一答的形式来形成机器人的大脑,来决定机器人在什么情况下回答什么问题。为了更好的回答,他规定了一些简单的语法和格式,可以实现简单的随机回复、部分词语的抽取、加入javascrip命令可以完成检索、计算等功能、同时可以做一些简单的上下文匹配的功能。然后通过模式识别,从AIML中寻找最适合的回答,把问题的答案回复给人们。目前最流行的聊天机器人应该非小黄鸡莫属,他使用了韩国人开发的系统,进行了简单的外挂。根据测试和推测,韩国人的机器人应该是简单的模式匹配,甚至要比aliceBot更加弱一些。国内的聊天机器人也有很多款,比如淘宝的千牛,小i机器人等等,当然还有我们开发的小机器人。

        目前主流的核心技术和优缺点

         1、直接把一问一答写入数据库。

优点:简单易用,任何能写一个动态网站的人就可以写出来。就可以施展一番。

缺点:难以模糊匹配,需要去模仿和模拟大量的语句,少一个字或者多一个字就可能难以匹配,知识库的添加会一个很大的工程,只适合玩玩,不适合聊天。

         2、使用AliceBot类似的AIML方式。

优点:开源,任何人都可以下载,了解和学习,甚至可以稍加修改就成为自己的产品。

缺点:aliceBot使用空格进行分词,非常适合西文,但是不适合亚洲文字,所以必须自己写分词库。此外AliceBot有大量的英文语料库,而中文的为空白,即便有,大家也没开源,自己去整理和翻译这些语料库,会累死人的。

         3、使用搜索引擎的方式进行检索

优点:可以模糊识别,而且有部分开源的组建可以学习或者拿来主义

缺点:过度的模糊会导致答非所问,同时无法对接命令,只能简单的聊天,而且无法实现随机回答,让人感觉跟搜索引擎一样。

         4、目前高端大气上档次未知技术,据推测可以为:神经网络、语义识别、深度学习等等。

优点:你可以展开自己的想象力,推测可以做到有情感,可以上下文理解,懂得语义,可以自己造句,总之更人一样。

缺点:目前真实的产品我没简单过,相信多数人也没看到过。所以技术高深,而且没得参考,研究许久,也许只能写一个不可行报告。

我们认为未来聊天机器人应该具备以下特点:

1、可以通过互联网进行自动学习和获取知识,而非一问一答的方式进行学习。

2、语义化的理解,而非靠词语和词频去匹配

        3、有上下文理解功能

        4、有一定的情感和情绪

        5、有自己造句的能力

        6、可以归纳和总结,有自己的知识和观点


        概括的说基本上等于人脑,但是比人脑有更快更优秀的学习能力

          如果能达到上述的特点,那么这个机器人可以做以下的事情

         1、迅速建立专家库,成为某个领域的专家,比如医疗、程序等等

         2、能更加精准的理解人的需求,取代搜索引擎

         3、可以进行情报的整理和分析,进行统计和决策

……

        我们的机器人

用到的技术:

1、中文分词

2、lucene等开源的搜索引擎知识

3、AliceBot类似的模式识别技术

4、自己写的一些语句筛选和过滤算法

5、自己写的命令模块,提取一次词语,执行匹配以外的命令,比如搜索百度,或者执行某个其他程序

6、自己写的一个简单的上下文词语匹配来达到上下文理解(效果很差)

 

目前我们的缺点:

1、语料库太少,如果语料库足够多,可以做到比aliceBot优秀的效果

2、添加语料库太过麻烦,需要一问一答的形式来添加

3、没有语义识别

4、基本没有很好的上下文识别

5、没有情感识别

6、还有很多缺点,就无法一一列出了

我们正在或者打算做的:

1、增加和完善命令模块,让机器人可以搜索天气、城市、指定搜索信息和未知信息。

2、增加计算模块,让机器人真的懂得数学。

3、我们正在做一个很便捷的语料库获得方式,比如爬虫走过,自己生成问答。

4、我们打算在做一个爬虫,爬去一些权威的资料,然后进行语素统计和语义的简单匹配和识别,企图通过这些信息让我们更好的掌握中文语义,为下一步做出来语义机器人做准备。

5、我们在观察婴儿学习,从根本上理解语义机器人。


我们下一步能做到

目前我们机器人做到的仅仅是词语的匹配和模糊的检索,以及一些小小的技巧和算法,以便让机器人可以更加圆滑的回答,或者挑选最好的回复。我们认为我们简单可以实现的功能:

         1、对一些词语进行褒贬赋值,可以实现机器人的情绪积累,进而产生情绪效益。比如你一直说机器人好,机器人对你和蔼,你一直对机器人说坏话,机器人对你不客气。

         2、简单的语句分析,可以从一段文章中自己对原话进行分析和匹配,产生语料库。

         3、可以加上语音识别和语音播放功能,实现类似siri一般的效果。当然需要借助别人的sdk

         4、完善命令模块,不知道的知识可以通过搜索引擎获得知识,比如百度百科、百度知道等等。

         5、尝试一些简单的语义识别和回复。


         


          

作者:aofengdaxia 发表于2014-1-17 19:25:25 原文链接
阅读:67 评论:0 查看评论

相关 [聊天 机器人 技术] 推荐:

浅析聊天机器人的技术和前景

- - CSDN博客研发管理推荐文章
最近利用业余时间,团队开发了一个简单的聊天机器人雏形( http://robot.ly863.com). 对聊天机器人的技术和前景有了简单的了解. 大概的整理下,期望与大家分享和交流,能在这个领域内进一步的发展,能把聊天机器人做的更加完善. 国内外目前聊天机器人我们认为最先进的应该非苹果的siri莫属.

聊天机器人Cleverbot骗过人类

- firedragoon - Solidot
聊天机器人Cleverbot看起来在图灵测试中骗过了人类. 在印度举行的Techniche节上,三十名志愿者与不知名的对象文字聊天4分钟,然后参与者和观众根据聊天内容投票判断对方是机器人还是人类. 有59.3%的人认为Cleverbot是人类,而人类对话者的投票率只有63.3%. Cleverbot开发者和AI专家 Rollo Carpenter说,总投票数为1334,超过了以往的任何图灵测试.

seq2seq 模型实现聊天机器人

- - EasyApple
这是一个用Python+Tensorflow实现的聊天机器人程序,使用seq2seq模型训练. 示例所用训练数据集是IMDB600多部电影中的英文台词对话部分,训练时间为3天左右(2012款MacBook Pro i7),目前仅支持英文. 另外程序包含一个简单的Python+Flask WebUI,并实现了微信公众号对接功能.

聊天机器人学习 | 李强的博客

- -
人工智能一直以来是人类的梦想,造一台可以为你做一切事情并且有情感的机器人,像哆啦A梦一样,现在这已经不是一个梦了:iPhone里会说话的siri、会下棋的阿法狗、小度机器人、大白……,他们都能够具有智能,和人类交互,帮人类解决问题,这听起来非常神奇,实际上我们自己也可以做一个这样的机器人,从今天开始分享我将我学习和制作的过程.

微信公众平台开发(二)--简单的聊天机器人

- - BlogJava-首页技术区
1.设置成为开发者模式 登录微信工作平台,选择高级功能-进入开发模式,成为开发者. URL配置的信息是指,微信的后台服务器把您的用户消息发送到该URL处理. Token是你和微信之间的一个密码,用来验证消息是否是从微信的服务发送而来,而不是其他来攻击你的系统. 现在你还不能设置,在设置时微信会GET请求你设置的URL,已检测接口是否可以使用.

DeepPavlov:一个训练对话系统和聊天机器人的开源库

- - IT瘾-tuicool
项目地址: https://github.com/deepmipt/DeepPavlov. 这是一个开源的对话 AI 库,建立在 TensorFlow 和 Keras 上,其用途是:. 复杂对话系统的实现和评估. 我们的目标是为研究者提供:. 用于实现和测试他们自己的对话模型并随后将模型共享的框架;.

当两个聊天机器人进行对话时... 「没输没赢,笑到不行」

- 龑 - Engadget 中国版
看完康乃尔大学创意机器实验室(Cornell's Creative Machines Lab)发表的这则影片后,我们的第一个反应是:「干嘛要让两个屏幕聊天啊. 原来这是 CCML 为了参加一年一度的 Loebner 人工智能竞赛所研发出的作品. 这个竞赛每年吸引不少研究团队参加,哪支队伍的机器人最能够说「人话」就能赢得十万美元.

外媒专访吴恩达:聊天机器人在中国的普及将比美国快

- - 雷锋网
在刚刚过去的2016年,科技圈内谈论最多的就是自动驾驶和机器人,而驱动两者快速前行的核心动力,就是迅猛发展的人工智能(AI). 它对人类未来又会产生什么深远的影响. 在很多业内人士看来,2017年认为是机器人之年. 这里所说的机器人,并不是《终结者》系列中的T-1000,也不是每隔几个月上头条的人形机器,而是出现在你的客厅,拥有人工智能的各种独立设备.

十大半机器人技术:传心术可用于心灵控制

- sakda - cnBeta全文版
据国外媒体报道,美国国防部希望,未来的美军部队将会更快、更强、更具战斗力. 因此,美国人一直在致力于未来电子人等技术的研究. 在所谓的电子人部队中, 电子人拥有更加警觉而灵活的眼睛,异常敏感的皮肤以及可弯曲、可抓握的机器假肢. 在机器人技术、纳米技术和神经系统科学等相关技术的帮助下,电子人部队将 越来越多地出现于真正的战场之上.

盖茨:机器人将成下一项改变世界的技术

- - 博客园_新闻
早在 2007 年,盖茨就曾预言,将来家家都有机器人. 北京时间 2 月 12 日晚间消息,微软创始人比尔·盖茨(Bill Gates)周一表示,机器人将成为科技市场下一项改变世界的技术. 盖茨周一参加了网络社区 Reddit 的“什么都能问”(Ask Me Anything)问答活动,此次活动的问题是“你认为今天的哪些新技术将像家庭计算机一样给普通消费者的生活带来巨变.