从逻辑规则到数据驱动——人工智能杂谈

标签: 行业动感 | 发表时间:2012-08-17 00:37 | 作者:chentingpc
出处:http://www.tektalk.org

传统的人工智能的书,翻开书前几章基本都会讲谓词演算等逻辑推理的方法,甚至有的人工智能的书花了大量篇幅就在讲这个东西。一方面,这可以看出,早期的人工智能是基于规则与逻辑的,另一方面,这其实也是一种误导。因为现在的人工智能被机器学习所主导,机器学习与传统的人工智能很不同,现在的机器学习很大程度上都是数据驱动的,因此当初我看规则与逻辑推理后,却不知道能做什么,什么专家系统的都太遥远。当然了,key point不在于这种变化对于一个初学者的影响,而是人工智能整个发展趋势所给人的反思与启发。人们很清楚的看到从规则与逻辑到了数据与统计这种发展主线,我们想做的东西也不多,就是希望能够让机器看懂我们看懂的、让机器听懂我们听懂的、让机器能懂我们的思考、能像我们一样思考,但这条路,这么多学者在走,却走的如此困难。我们能发现知识、拥有知识、玩弄知识,但却难以让机器像我们一样拥有知识。

一个最基本的问题是:什么是知识?这就是知识的表示问题。早期研究者觉得逻辑就是知识,可以用来做一些推理,但是很直接的一个问题是,对于机器视觉,当机器看到许许多多的像素点的时候,那些谓词逻辑显得那么无力。于是,我们开始认为数据中的某些pattern就是知识,大家就开始寻找各种特征、各种子空间。数据驱动开始盛行。然而,哪怕这种方法多么有效的解决了如机器视觉中浅层知识表示的问题,但回到文本知识上,它却仍然非常无力。

文本,或许是最丰富的知识载体吧,因为它包含各种抽象。对于文本本身,不过是一些ASCII码而已,把这些ASCII码建立倒排表,我们可以索引,把这些ASCII码做矩阵分解(pLSI),我们可以搞一些浅层语义分析,但我们觉得这还不够,我们用LDA这种generative方法来描述文本,认为文本是bag of words,是由topics产生的。当然,这种方法有道理,很intuitive,而且也确实让人们迈出了很大的一步,慢慢开始理解ASCII码统计背后隐藏的语义。然而,这就到了终点了吗?我们就满足了吗?别忘了,我们的目标是要让机器明白我们的知识、运用我们的知识。要做到这一点,bag of words肯定是不够的,topics肯定是不够的,我们要重新提出我们的知识表示模型。于是,另一种思想,也就是knowledge base的思路出现了,每个节点是实体,不同类型的实体,实体是唯一的,不同实体之间有边来连接,表示不同的关系。然而,尽管语言学家和计算机学家研究了很多年,即便能够用这种方法更好理解用户的问题、改善搜索结果,但也仍然没有通过这种表示方式让计算机真正懂知识,知识的表示仍然模糊。或许,知识是一个很高维度的空间,而word只是这个空间中的稀疏样本,我们要通过这些词来重建那些知识是一件很难的问题,但是,这并不该是停止的理由。

为什么要建模那种基于文本的抽象知识呢?一个很简单的理由就是,每个人在知识的高维空间上都有自己的子空间和独特的拓扑,当我们面对一个task的时候,我们需要知识,当我们不懂的时候,我们要花很大代价去得到那不懂的一小部分,这一小部分,往往不是人类的空白,而是落在其他人或文献的知识子空间中,如果我们能够建模这种抽象知识,我们就能把这一切连接起来,让人们真正能够互相share知识。

总的来说,本文的主要观点就是人工智能从逻辑规则驱动到现在的数据驱动,我们都是尝试去让机器去理解各种人类面临的各种不同的task中的不同的知识,我们可能在形象知识、数据密集的知识上面有不错的精确度,但是,对于抽象知识的建模却做得非常有限。未来一定会往这个方向发展的,或许规则与数据会结合,或许我们需要通过很多中间层、中间步骤才能走到那里,但是这并没有阻止我们回头看看我们走了多远,没有阻止我们抬头看看前面的路,更无法阻止人类知识不断前进的步伐。未来在这里,一切都很interesting。

(原创来自 http://chentingpc.me/article/article.php?id=862)

相关 [逻辑 规则 数据] 推荐:

从逻辑规则到数据驱动——人工智能杂谈

- - 弯曲评论
传统的人工智能的书,翻开书前几章基本都会讲谓词演算等逻辑推理的方法,甚至有的人工智能的书花了大量篇幅就在讲这个东西. 一方面,这可以看出,早期的人工智能是基于规则与逻辑的,另一方面,这其实也是一种误导. 因为现在的人工智能被机器学习所主导,机器学习与传统的人工智能很不同,现在的机器学习很大程度上都是数据驱动的,因此当初我看规则与逻辑推理后,却不知道能做什么,什么专家系统的都太遥远.

产品设计中的逻辑规则——增删查改显算传

- - 牛国柱
产品如同人一样,有样貌、皮肤等外在结构,也有筋骨、神经网络等内在的体系. 在产品设计及规划中,产品经理除了要对UI、UE等外在负责外,还需要对产品的筋骨、神经网络负责. 产品的筋骨、神经网络即产品隐含的逻辑规则,是产品运转正常的保证. 设计合理且逻辑清晰的规则,是产品成功的必要条件. 而网络广告产品,可能是网络产品中逻辑规则最复杂的一类产品.

数据读取之逻辑读简单解析--关于BUFFER CACHE

- - CSDN博客数据库推荐文章
数据读取之逻辑读简单解析--BUFFER CACHE. 一、实验数据准备--查出一条数据的ROWID,及FILE_ID,BLOCK_ID等信息. 使用下面语句查出相应行的FILE_ID,BLOCK_ID,关于ROWID,详见:http://blog.csdn.net/q947817003/article/details/11490051.

浅谈大数据平台基建的逻辑

- - 透明思考
这篇文章主要目的是面向初接触大数据的朋友简单介绍大数据平台基础建设所需要的各个模块以及缘由. 按照 Ralph Hughes的观点,企业数据仓库参考架构由下列几层构成:. 接入层(Landing):以和源系统相同的结构暂存原始数据. 整合层(Integration):持久存储整合后的企业数据,针对企业信息实体和业务事件建模,代表组织的“唯一真相来源”.

11 个重要的数据库设计规则

- - 博客园_新闻
英文原文: 11 Important Database designing rules. 在您开始阅读这篇文章之前,我得明确地告诉您,我并不是一个数据库设计领域的大师. 以下列出的 11 点是我对自己在平时项目实践和阅读中学习到的经验总结出来的个人见解. 我个人认为它们对我的数据库设计提供了很大的帮助.

逻辑入门

- snowflip - Pure Pleasure - Reborn
你好,笑来,我想我问关于逻辑学方面的书籍有什么比较值得推荐的吗. 其实,我总觉得很多人缺的不是逻辑训练,而是“自省”训练,以及“道义”教育. Beyond Feelings,这是我当年的启蒙书籍(是我边读边敲做成电子版的). 想明白(系列)分类里的文章,建议你看看. TTC出过一个24讲的”Argumentation”,到Google上搜索“TTC+Argumentation”就可以找到.

电商数据挖掘:“啤酒+尿布”的关联算法规则

- - 人人都是产品经理
  关联,其实很简单,就是几个东西或者事件是经常同时出现的,“啤酒+尿布”就是非常典型的两个关联商品. 所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识. 当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义. 第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度.

数据解读:社交媒体中, 人际交往的潜规则

- - 199IT互联网TMT数据
有没有想过,你为什么会去刷朋友圈、微博. 我们在网上的各种行为背后都隐藏着动机,尤其是在社交媒体上,朋友、家人在极大程度上影响我们点击、分享和点赞的行为. 最新一个调查研究也证明了这一点. 该调查结果涵盖了人们相互影响与回应的方式,花费在网上的时间,以及所做的购买决策. 分析这个结果很有意思,相信做市场的你了解一下也有好处.

苹果的逻辑

- Jacky - It Talks-魏武挥的blog
玩iPad也有大半年了,有一件事我一直不会,那就是删应用. 我知道长按一个图标会出现一个大叉,点击这个大叉能有“删除”的功能. 但我一直疑惑的是,究竟是删除了这个图标呢,还是真地删除了这个应用. 由于iTunes会同步应用回去,在我删了几次并被同步回去以后,我便一直认定,这只是在删除图标,就像windows桌面上删除一个快捷一样(我同步iPad一般是在睡觉的时候让电脑自己干,故而没有认真观察过).

周报的逻辑

- Shell Wang - 坏脾气的小肥
最近新同事加入很多,按照我的要求,入职半年内需要发送周报给我,半年后自己选择是否仍需发送. 行业内可能大部分的人都认为,周报就是流水账,是主管显示权力的手段. 最后还就真把它给搞成了一封流水账,或寥寥数语. 在职场中,有一条冷酷定律,叫做“如果主管不知道你做了某件事情,相当于你就没有做过这件事情. ”听上去不近人情,其实完全符合实用逻辑.