将搜索引擎的机器学习技术用于风控,氪信希望指数级提高金融模型的训练效率
氪信的创始人朱明杰之前是搜索引擎的数据工程师,现在他把技术应用在了金融风控上,近期获得了真格基金700万人民币的天使投资。
氪信的产品包括非或然引擎(下文简称“引擎”)和XCloud两部分,“引擎”是一套数据模型处理系统,解决的是不同场景下的风控模型校正问题。以物流行业为例,通过输入企业ERP数据、位置信息数据等场景内数据,以机器学习的技术调整各数据维度的权重,从而建立针对场景的风控模型。
XCloud是一个数据收集和整理系统,对接身份信息、个人信用信息等通用信息,同时可以输出一个普适的模型,也可以为“引擎”建模提供外部数据基础。氪信对传统场景的贡献首先在于对其数据进行了适配和存储,提炼出有风控意义的指标,以供未来使用。
据朱明杰介绍, 机器学习的模型和统计的做法完全不同。初期通过业务人员的辅助,以半监督式的学习方式,机器的学习速度可以达到传统模型的上百倍,传统上金融机构需要十万个样本才能建立的模型,机器只需要几千个样本就够了。
目前氪信的“引擎”输出的是授信额度和违约概率,供金融机构进行决策参考。朱明杰表示,他们和一些P2P公司进行了测试,其综合衡量 准确率和召回率的KS指标明显高出同类产品。 长远来讲,氪信希望用技术解决场景化的风控问题,建立完全数据化的风控模型,不再依赖人力进行风控审核,从而提高信贷的效率。
“海量数据的处理能力是我们的核心技术。”朱明杰说。朱明杰曾在雅虎、eBay搜索做了10年的数据挖掘、机器学习工作,据他介绍,搜索引擎需要服务数亿用户,理解用户真实的搜索意图,其数据维度通常有数万个,而其负责训练机器进行学习的人员可能仅有上百人。金融风控方面的数据维度明显少于搜索引擎,因此做金融模型算是能力降维。
信贷本身是一个体量大、需求旺盛的市场,分拆到不同的场景,其规模仍然很可观,仍然拿物流举例,其行业规模占到GDP的18%,这一个场景就可以支持数千亿的信贷规模。目前氪信对XCloud按照流量进行收费,而对非或然引擎根据定制程度按套收费。
朱明杰毕业于中科大少年班,微软亚洲研究院博士,曾在德国马克思普朗克研究院从事大规模数据挖掘工作。COO孙楠曾在海外工作数年,回国后负责携程的国际网站。目前氪信服务物流、供应链、商户贷、房产等几个领域,已与民生银行、证通、小赢理财、爱屋吉屋等10几家机构达成合作。
我是 36 氪专注报道互联网金融和教育行业的作者 Justin,欢迎大家与我联系,切磋讨论。我的微信是 :196215239