顾凌云:一切数据皆为信用数据

来源:零壹财经 作者:顾凌云 日期:2014年04月01日    【字体:

顾凌云:一切数据皆为信用数据
 
  (本文为2013年10月24日,顾凌云在“硅谷对话北京——2013互联网金融创新峰会”上的演讲全文。)
 
  大家可以看一看这个题目,我本身不是很八卦人。但是以一段八卦开始演讲,原因很简单,八卦非常明确把这个题目给融入其中,可以形象说明硅谷和金融怎么结合在一起。
 
  我从我自己ZestFinance生涯开始说起,ZestFinance是一头双头怪兽,有两个创始人。主要目的希望把谷歌和硅谷大数据这些经验应用到线上音乐当中去,并且有效打击盗版。但是ZestFinance另外一头怪兽,自己负责100亿美元风控。两个人相同成功经验,两个人离开公司有相同心酸经历。
 
  私下里里面交流,一个公司犯一次错误没关系,犯两次没关系,最难别人犯几十年错误我还在犯。两个人有同样意愿积累很多经验,觉得自己做一点事情,两个人从来不认识没有任何交际,两个人背景完全不同,一个人是典型南方文化,但是另一个人出生在芝加哥典型大户人家,想法等等不太一样,两个人读书独树一帜。肖恩布德本人是计算机毕业进入金融,找人找风险投资时候不认识,两人分别找了同样一家VC,传统银行最多不能超过36%利息,500%到36%没人做,传统行业可以分期付款。我准备把中间这一部分也用分期付款来做,风险投资一想你们两人说都靠谱不完全靠谱,你们俩认识一下,如果你们俩谈得来你们来就做我就投,你们俩谈不来就一个不投,这样情况之下两个人第一次见面,两个人见面以后随后展开,两个人在一起吃喝住两个星期时间互相了解对方,决定是不是有这个可能办一家这样公司,结果是比较良好的。两个人可以说一拍即合,在很多价值理念上观念都是一致的。两个人都认为工作做完就可以,不用在那里耗时间。不影响他们金融创新作风。二者之间创业者本身就是硅谷大数据和传统金融行业结合。
 
  两个人建立ZestFinance以后,严格来说ZestFinance想吃蛋糕传统行业大家没有能力吃,或者暂时吃不到,传统行业以FICO分数在美国社会当中广泛应用,标准社会体系,买房用FICO超过740分最好利息拿到,低于740想办法,租房子、买车、找工作都用FICO,生活方方面面都会用到FICO,但是FICO不是万能。
 
  1.FICO分数被广泛使用,变量数目对于某些人群变量没有,变量没有做模型怎么计算分数。
 
  2.分数变形有限
 
  租房、买车找工作都是同一分数不合理。我同样人做周围同事态度很好,但是可能同人多面不一样,同样对一件事情态度很认真,不代表对另外一个事情很认真,怎么衡量一个人生活当中需要。同这种角度来说FICO有局限的地方,我们想要吃什么样蛋糕,FICO被有效使用人群占85%左右,美国一共3亿人口现在更多。从这个角度来说85%市场非常大,这是为什么传统美国四大国有银行,从某种程度来说对它们来讲85%足够吃,从立法机构监管机构来说去吃15%蛋糕风险非常大,所以他们有的时候既不愿意也不愿意碰这块蛋糕15%。
 
  人群是怎么被遗忘的?
 
  第一部分土生土长信用差,有分数无意义。
 
  这些人能看到分数可能是550、可能是558分不是分数越高信用值越好,不是的,所以即使有分数也完全没有意义。
 
  第二种人确实很厉害土生土长,信用无比差,没分数,没记录。这种人在美国生长银行没有别提信用卡,这两批人都是在美国出生长大,信用不好从自身找原因。
 
  第三批人,我当年先到美国读书的时候,我有全额奖学金不赖帐,我刚去怎么知道我这个人怎么样,换而言之信用太短也是FICO不稳定方式,这批人短期内不能积累自己信用,成为被遗忘的人。
 
  从这个角度来说85%和15%相对来说比较有意义,对我们来说新兴创新公司15%切取一部分蛋糕对我来说有意义。美国有三分之一,从某种程度来说划分是Subprime为,还有50人,咱15%左右,或者没有FICO,或者有也不管用。可能在座都是行家,不知道简单介绍一下,等到发工资那天把支票兑现这就是Payday,手续费极高,有1700万到2000万使用Payday产品。大部分跟嗑药一样,嗑过一次继续嗑平均9次左右,这是非常庞大的市场。大部分家庭用户收入大家可以看到,都在5万元以下,33%是5000美元一样,跟超美客户群公司比起来,我们所面临的是公司真正在刀尖上跳舞,而且是在刀尖上跳拉丁,相当危险。
 
  但是ZestFinance市场角色什么样?我个人认为做金融创新企业有两个出路,或许解决传统模式不能解决的问题,或者你解决传统模式解决不好的问题,在这两个方向当中做到一点基本来说成功方向靠近一点。咱们ZestFinance做第一个东西传统模式不能解决的问题。我们现在公司我们解决是两个同样的问题,我们都解决。包括传统模式解决不好我们也会解决。但是有个共同点服务15%人群,ZestFinance前面说过Payday14天还款,14天当中没钱还你200块可不可以不可以,滚动到下一个14天,直到有钱。从某种程度来说客户没有这样成熟度,ZestFinance传统行业中规模和城市引用这部分当中人群来。想早还钱没关系,你说我还不清也没关系,我们就可以分期付款,不用14天14天滚动都可以。这个角度来说给客户更多自由度。
 
  第三点说ZestFinance本身一个新兴产业形成,我们不怕竞争,尤其良性竞争给行业形成带来更好促进和有效催化。所以ZestFinance并不是这个行业第一家,但是跟这个行业里面做更好几家公司相比来说我们发展更快,但是我们之间关系很友好。金融创新从某种程度也不创新,他们产品从200块到800块,我们产品也是从200块到800块钱,很多产业链也是一致。一旦能够证明你是好的客户会在第二次时候,几何几数减低你的利息,利息和银行信用卡差的利息基本达到一致,15%人群放到85%健康人群当中去,因为承载社会责任,使ZestFinance曝光度比较高。
 
  我来谈一谈我们做模型一些经验。
 
  一切数据皆为信用数据
 
  没有什么东西不重要,回流成海对我来说一样。美国申请信用卡,姓名有可能全部小写,也有可能全部大写。这在我们看来信用完全不一样的,一个人如果能力知道何时大小写他的姓名,从某种程度来说姓名指数更好,跟教育背景形成正相关。还有很多例子经常问客户,你是开什么样车,并不是希望通过开什么样车判断车价值或者最后怎么样,但是你开什么样车跟还款能力有很大关系,开一辆本田、雅阁,开尼桑350Z从一定程度来说风险程度不一样。开尼桑往往更激进,还款程度来说更快一些。这样信息太多太多。
 
  经常来说对我们来看,所有信息看关联不看因果,在大数据之中最关键的重要看点之一。很多人都认为我总要看到因果关系是什么?没有因果关系不愿意做出判断。实际上面来说只看关联不看因果从某种程度来说更好的。
 
  举一个例子大家看身高以后判断出体重,实际不一样。有的人个子高体重不是很重。从某种程度来说肌肉松紧不一样,这种程度来看判断不相同,数据也是一样。
 
  就说用户你给我信息就可以,至于你是不是说谎有意隐藏信息写错信息没关系,全收。经常问一个问题一年收入多少,有客户说一年收入3000块钱,写月收入多少,没关系也是一条信息,在我们看来每一条自己写错信息也是关键信息。
 
  对于在美国来说做起来相对好起来,我们相对来说会比较合理一些。我们包括对于特征变换,特征提取,独立模型建立和合成模型这四个部分,从头到尾,我们简单讲一下特征选取。从某种程度上大数据,你把所有信息全部扔给我,相对来说选取特征,有时候会出错误,这个人最近搬家次数,每个都是独立特征。如果只是用积极选取,只能选出其中一类这是不合理,把信息全部串联起来,像超美女士讲到搬家次数明显加快,还是降低。从信用角度来说有巨大区别。在人工当中如何进行选取和变换也是非常重要。
 
  我们现在作为这里CRO我们做什么东西,我们个人信用评级和中小企业信用评级都做,尤其现在做中小企业评级,美国现在很多大企业基本上都可以发型自己债券,因为三大主要信用评级公司都在做。中小企业借贷成本比较高,跑到银行去,过两个星期告诉你不合适,银行想来想去这些人全部拒了算了。这部分人对我们来说也是主要客户,我们在当中引入了社交网络数据,社交网络数据这些企业在上面有比较多信息,什么时候做了促销客户群什么样子,这点刚才陈超美女士讲过,美国监管很重要。对我们来说刀尖上跳舞不能随便跳,年龄、性别、婚姻不能看,很多不能看。中小企业比较放松很多可以做,所以从这个角度很好。
 
  网络分析数据,你IP地址哪里来,用什么电脑,玩不玩游戏这些东西在我们信用评价都很重要。
 
  最后想要解决是什么?我看来信用评估两点。第一有没有还款意愿,有没有还款能力就是信用。二者之间不能完美解决,原因很简单,因为有一个滞后性,公司解决办法希望把离散的变成是连续的,把离散的变成连续的,在我印象当中有完美世界,对我来说希望最终产生的版本每分每秒改变,根据不同进来数据源,每分每秒都在变,不是等两三个月信息才改变一次。
 
  所以最后这点至于使用股票交易进行信用评级这里简单略过,我自己认为对于金融创新互联网领域一段比较贴切描述。马克思在共产党宣言讲过一段话“伟大变革中,我们失去只是锁链,获得将是整个世界”我坚信我们今天所处这个领域会获得整个世界,谢谢大家。

标签: 大数据
 
0
零壹投资咨询(北京)有限公司 版权所有 未经许可不得转载