由于互联网金融涉及货币发行(比特币)、第三方支付、投资理财(网络银行、保险、基金、证券、财富管理)、信贷(P2P、众筹、网络微贷)、征信等等,各个领域的风控策略并不尽相同,不能一概而论,下面讨论只能涵盖了常见的风控策略。
个人认为“大数据”除了强调数据的海量外,更重要的在于用于风控的历史数据的广度和深度,其中:
数据的广度:指用于风控的数据源多样化,任何互联网金融企业并不能指望依据单一的海量数据就解决风控问题,正如在传统金融风控中强调的“交叉验证”的原则一样,应当通过多样化的数据来交叉验证风险模型。以下的风控策略也如此,可能对同一风险事件采用了多种策略。
数据的深度:指用于风控的数据应当基于某个垂直领域真实业务场景及过程完整记录,从而保证数据能够还原真实的业务过程逻辑。
一个关于数据深度典型的反例:第三方支付貌似有丰富的真实交易记录,但由于大部分场景下无法获取交易商品的详细信息及用户身份,在用于风控时候价值大打折扣。
回到题主的话题:互联网金融产品如何利用大数据做风控。大致有如下一些常见方法:
1、基于某类特定目标人群、特定行业、商圈等做风控
由于针对特定人员、行业、商圈等垂直目标做深耕,较为容易建立对应的风险点及风控策略。
例如:
针对大学生的消费贷,主要针对大学生人群的特征
针对农业机具行业的融资担保。
针对批发市场商圈的信贷。
2、基于自有平台身份数据、历史交易数据、支付数据、信用数据、行为数据、黑名单/白名单等数据做风控
身份数据:实名认证信息(姓名、身份证号、手机号、银行卡、单位、职位)、行业、家庭住址、单位地址、关系圈等等。
交易数据/支付数据:例如B2C/B2B/C2C电商平台的交易数据,P2P平台的借款、投资的交易数据等。
信用数据:例如P2P平台借款、还款等行为累积形成的信用数据,电商平台根据交易行为形成的信用数据及信用分(京东白条、支付宝花呗),SNS平台的信用数据。
行为数据:例如电商的购买行为、互动行为、实名认证行为(例如类似新浪微博单位认证及好友认证)、修改资料(例如修改家庭及单位住址,通过更换频率来确认职业稳定性)。
黑名单/白名单:信用卡黑名单、账户白名单等。
3、基于第三方平台服务及数据做风控
互联网征信平台(非人行征信)、行业联盟共享数据(例如小贷联盟、P2P联盟) FICO服务
Retail Decisions(ReD)、Maxmind服务
IP地址库、代理服务器、盗卡/伪卡数据库、恶意网址库等
舆情监控及趋势、口碑服务。诸如宏观政策、行业趋势及个体案例的分析等等
4、基于传统行业数据做风控
人行征信、工商、税务、房管、法院、公安、金融机构、车管所、电信、公共事业(水电煤)等传统行业数据。
5、线下实地尽职调查数据
包括自建风控团队做线下尽职调查模式以及与小贷公司、典当、第三方信用管理公司等传统线下企业合作做风控的模式。
虽然貌似与大数据无关,但线下风控数据也是大数据风控的重要数据来源和手段。
来源:知乎 www.zhihu.com
作者:
梁川
【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载
此问题还有
3 个回答,查看全部。
延伸阅读:
大数据在金融领域是如何应用的?
研究互联网金融可以参考哪些数据?