将搜索引擎的机器学习技术用于风控,氪信希望指数级提高金融模型的训练效率

标签: 早期项目 | 发表时间:2016-03-23 11:07 | 作者:老扎
出处:http://36kr.com

氪信的创始人朱明杰之前是搜索引擎的数据工程师,现在他把技术应用在了金融风控上,近期获得了真格基金700万人民币的天使投资。

氪信的产品包括非或然引擎(下文简称“引擎”)和XCloud两部分,“引擎”是一套数据模型处理系统,解决的是不同场景下的风控模型校正问题。以物流行业为例,通过输入企业ERP数据、位置信息数据等场景内数据,以机器学习的技术调整各数据维度的权重,从而建立针对场景的风控模型。

XCloud是一个数据收集和整理系统,对接身份信息、个人信用信息等通用信息,同时可以输出一个普适的模型,也可以为“引擎”建模提供外部数据基础。氪信对传统场景的贡献首先在于对其数据进行了适配和存储,提炼出有风控意义的指标,以供未来使用。

据朱明杰介绍, 机器学习的模型和统计的做法完全不同。初期通过业务人员的辅助,以半监督式的学习方式,机器的学习速度可以达到传统模型的上百倍,传统上金融机构需要十万个样本才能建立的模型,机器只需要几千个样本就够了。

目前氪信的“引擎”输出的是授信额度和违约概率,供金融机构进行决策参考。朱明杰表示,他们和一些P2P公司进行了测试,其综合衡量 准确率和召回率的KS指标明显高出同类产品。 长远来讲,氪信希望用技术解决场景化的风控问题,建立完全数据化的风控模型,不再依赖人力进行风控审核,从而提高信贷的效率

“海量数据的处理能力是我们的核心技术。”朱明杰说。朱明杰曾在雅虎、eBay搜索做了10年的数据挖掘、机器学习工作,据他介绍,搜索引擎需要服务数亿用户,理解用户真实的搜索意图,其数据维度通常有数万个,而其负责训练机器进行学习的人员可能仅有上百人。金融风控方面的数据维度明显少于搜索引擎,因此做金融模型算是能力降维。

信贷本身是一个体量大、需求旺盛的市场,分拆到不同的场景,其规模仍然很可观,仍然拿物流举例,其行业规模占到GDP的18%,这一个场景就可以支持数千亿的信贷规模。目前氪信对XCloud按照流量进行收费,而对非或然引擎根据定制程度按套收费。

朱明杰毕业于中科大少年班,微软亚洲研究院博士,曾在德国马克思普朗克研究院从事大规模数据挖掘工作。COO孙楠曾在海外工作数年,回国后负责携程的国际网站。目前氪信服务物流、供应链、商户贷、房产等几个领域,已与民生银行、证通、小赢理财、爱屋吉屋等10几家机构达成合作。

我是 36 氪专注报道互联网金融和教育行业的作者 Justin,欢迎大家与我联系,切磋讨论。我的微信是 :196215239

相关 [搜索引擎 机器学习 技术] 推荐:

将搜索引擎的机器学习技术用于风控,氪信希望指数级提高金融模型的训练效率

- - 36氪
氪信的创始人朱明杰之前是搜索引擎的数据工程师,现在他把技术应用在了金融风控上,近期获得了真格基金700万人民币的天使投资. 氪信的产品包括非或然引擎(下文简称“引擎”)和XCloud两部分,“引擎”是一套数据模型处理系统,解决的是不同场景下的风控模型校正问题. 以物流行业为例,通过输入企业ERP数据、位置信息数据等场景内数据,以机器学习的技术调整各数据维度的权重,从而建立针对场景的风控模型.

搜索引擎的认识误区与技术展望

- - 互联网的那点事
搜索结果越多越好,技术差距决定优劣,SEO可以提高搜索排名……,媒体和公众对搜索引擎的这些普遍认知,其实都是严重的认识误区. 聚合规则,排序方法,展现方式,将成为未来搜索引擎竞争的关键,而竞价排名,将随着竞争的展开逐步退出历史舞台. 随着360搜索的上线以及3B大战的展开,网络爱好者们对搜索引擎技术及市场的讨论成为近期的互联网小热点.

【技术贴】9个基于Java的搜索引擎框架

- - 行业应用 - ITeye博客
9个基于Java的搜索引擎框架. 1.Java全文搜索引擎框架Lucene. 毫 无疑问,Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引 擎. Lucene为开发人员提供了相当完整的工具包,可以非常方便地实现强大的全文检索功能.

[译] 理解机器学习技术

- - IT瘾-dev
第1讲 理解机器学习技术. 学完本模块的内容,读者将能够:. 讨论机器学习的技术和商业应用. 学完本讲的内容,读者将能够:. 解释各类机器学习方法和算法. “机器学习领域的突破,其价值10倍于微软. 你是否曾经为计算机能够下象棋或者机器人能够完成复杂任务而感到惊奇. 一旦你理解了机器如何学习和适应各种问题、提供合适的解决方案时,这些看上去很复杂的问题实际上相当简单.

IBM收购搜索引擎初创企业Blekko技术及团队

- - 36氪
蓝色巨人今天在博客 宣布已收购了搜索引擎初创企业Blekko的技术,后者的团队已经加盟IBM Watson. 打开Blekko网站我们看到先是弹出如下的页面,然后网站被跳转到Watson的博客上. Blekko原本是一家做垂直搜索引擎的初创企业,由全球首个病毒制造者Rich Skrenta与人联合成立于2007年.

uSniff:BT种子搜索引擎

- leqoqo - 软件志
一、uSniff相关信息: 1、官方主页:http://www.usniff.com/ 2、简介:uSniff是一个BT种子搜索引擎,简单、易用、实时是其最大的优点,其搜索引擎数据库包含了17个知名种子站点的种子信息,目的是想发展成为世界上最大的BT种子搜索引擎,而且对于每个种子,该搜索引擎都会进行安全认证,以保证用户的正常使用.

机器学习跌下神坛?一些技术趋势正在消失

- -
未来,在路边等待 Uber 或 Lyft 来载你或将成为过去式,届时,我们要做的可能就是走到直升机降落场,叫上一辆无人机. 这种未来的“空中飞的”不仅将减少交通堵塞,而且省去了人类驾驶员. 说到打飞的,事实上无人机技术还远未成熟到可以为我们提供民主化交通服务的地步. 其中第一个挑战便来自于人类对自动化技术的掌握.

人眼启发视觉搜索引擎

- feng823 - Solidot
Google上周宣布将支持声音和图片进行搜索,但一家创业公司在图像搜索方面走在了Google前面. 源自伦敦帝国学院研究项目的创业公司Cortexica,开发出视觉搜索工具,通过手机拍摄产品照片,它会自动呈现价格信息. Cortexica已经发布了一个用于比较酒价格的工具WINEfindr. Cortexica的视觉搜索技术是受到了人眼视觉系统的启发,它能识别出一个目标的关键特征,不受方位、大小、光线亮暗的影响.

比较好的学术搜索引擎

- hfut_chen - C++博客-首页原创精华区
     摘要: 1、http://scholar.google.com/. Google学术搜索滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数. 略显不足的是,它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几页可能大部分为中文的一些期刊的文章.

Blekko 对搜索引擎的新探索

- thinkingit - 知乎的博客
Blekko 这款搜索产品做的如何. 从目前我的使用过程来看,Blekko还是很让人激动的. 在谈Blekko之前就要先问:为何在搜索这个看似已经垄断的行业还会有人想去分一杯羹,这些小团队能与Google或微软这样的巨头抗衡吗. 比如之前的Powerset,后来的Cuil,和现在的Blekko. 在Google之前Yahoo是靠人工收录网页,Google的算法和蜘蛛革了搜索的命,一直垄断搜索业十余年,而现在随着WEB 2.0的发展,让人又看到了搜索业革命的火种,可以说Blekko就是这样的一个产品.