品钛2019中国金融创新论坛“十佳智能风控创新奖”

品钛首席科学家任然受邀出席2019中国金融创新论坛,并参加“风控管理与创新”圆桌论坛。本次论坛演讲与与会嘉宾有原中国银监会副主席蔡锷生、CFT50首席

品钛首席科学家任然受邀出席2019中国金融创新论坛,并参加“风控管理与创新”圆桌论坛。本次论坛演讲与与会嘉宾有原中国银监会副主席蔡锷生、CFT50首席经济学家杨涛、中国信托业协会会长姚江涛,以及工商银行、建设银行、中国银行、农业银行等百余家银行与金融机构代表。品钛凭借SaaS+服务体系获“十佳智能风控创新奖”。

  (2019中国金融创新论坛)

以下为品钛任然演讲实录:

|沙子中淘金Vs金山里淘沙

我曾经在Capital One研究风控反欺诈,也做过业务。传统意义上经常将信贷分成贷前、贷中、贷后,而将风控集中在贷前——只有当用户申请信贷时,才开始进行风控,这样的风控我认为应该定义为“贷时”风控。真正有效的做法,其实应该贯穿全流程,将风控延伸到最最开端的营销获客和流量入口。

品钛的商业模式就是从这一端开始。品钛的团队不仅仅提供建模服务,因为风控模型所带来的数据决策辅助效用只是一方面。另一方面的价值,也是银行客户们对品钛尤其感兴趣的一点,是品钛在连接金融机构时为其所带来的优质场景与流量。

品钛的SaaS+业务体系,“SaaS”是软件系统,“+”则是增值服务。品钛一端是金融机构,一端对接上百家商业场景,一方面是帮商业伙伴打造了很多金融创新产品,另一方面也让金融机构在开放银行的进程当中加速场景布局,在多样化场景的支撑下,为金融机构开发出更多的金融能量。这里的上百家商业机构包括了携程去哪儿等在线旅游平台、唯品会等电商、学霸君等在线教育平台、以及中国电信、中国移动等运营商,还包括了银联商务和拉卡拉等聚合支付平台、百望等财税平台,等等。

 (品钛SaaS+服务体系)

我们怎么样去帮金融机构找到一个好用户?这个过程,其实很大程度上已经决定了风险。

在砂砾里面找金子,是一件很难的事,不是不能做,只是商业持续性不够优秀。那要怎样把这个过程变成从金山里淘沙呢?就是通过风控前置。把风控要前置在营销端,从获客时甚至在获客之前,用户可能还没有来申请业务,你对他就已经有风险上的把控和分层了。

最开始,这一连接的需求是集中在商业机构端的。在BATJ体系以外有很多消费金融的长尾客户,他们聚集在各种各样的线上、线下平台。这些平台也想去做流量的金融变现和客户的转化提升,也需要类似于花呗、借呗、白条等的产品。但是从他们本身的电商性质来看,并不擅长金融。而品钛则可以在这个过程中帮他们完成一个一个的环节,连接一个一个的金融机构,最终开启白牌业务。品钛的团队也在不断增多的业务场景、用户筛选、模型迭代等全流程中得到了充足的实战经验。

在此之后,越来越多的金融机构开始看到场景的力量。银行客户最常关注的、品钛的两个增值服务:数据模型和场景流量,两者在与业务场景结合时也都爆发出了新的能量,进一步为C端的客户也提供了更为便捷、高效的金融服务。

  (品钛首席科学家任然)

|数据“蓝领”多年在数十个场景中打磨,熟能生巧

我主要负责数据模型,很多人觉得机器学习是很高尚很高大上的事情,但其实实操过程挺“蓝领”的。

我一直比喻模型团队就和做厨师研发菜谱一样,不同的业务场景有参考价值高的数据,也有扰乱决策的信息,怎么样去选变量、使用变量是非常重要的环节。这就像每天去市场上寻菜,寻数据源,这家有什么菜,哪个好哪个不好;买回来了,是小炒还是红烧等等。我们做了很多事情是在找寻,在挑选,在处理,这些看似“蓝领”的工作其实非常重要。甚至可以说算法训练模型其实只是最后的10~20%的工作,80%以上的工作都是在做变量处理,有时候做了很多很多工作,到最后放到模型却看不出效果,但在一次次试错中持续地去做,才能显现出价值。

有一个几年前的例子,当时我们给一家金融机构做反欺诈和线上流程优化。我们很诧异地发现,一些信贷申请者虽然留了手机,但回拨过去却是空号——理论上来说每个用户申请的时候手机号都是正常使用状态,也是通过运营商验证的。但为什么打电话回访的时候,金融机构却说变成空号了呢?我们后来发现原因很有意思。很多客户是多次申请贷款的“老手”,他开启了一个功能:非通讯录的人拒接或自动转移到空号上。在申请阶段,他可以收到验证短信完成申请,但等金融机构回拨时,由于金融机构的电话不在他们的通讯录里,就自动转移到一个假号码,比如说9999999之类的电话上。他的手机有在网记录,有通话,有短信,每个月也都正常的消费,是一个看似“没问题”的用户,从常规层面也很难排查。

我们怎么样去识别他们,又不错伤大量正常客户?基于此我们做了大量的延伸,我们后来发现这些用户有一个特点:他的这个号码并不是他的常用号码,他用这个号码只是来申请贷款,注册各种平台,收验证码,但是他很少用它打电话。单单从通话时间这个变量是无法定位这样人群的,因为有的正常客户也很少打电话,我们当时做了很多测试,最后发现一个很好用的变量:就是把他发短信的数量除以他打电话的分钟数,这个比例非常有效。如果这个比例非常高,则表示他用来打电话的频率远远低于他发短信,这个是不正常的。

其实这些工作没有什么原理或者什么技术能够解决,也不是说什么算法高级,就能够解决所有棘手问题,最终还是要有业务场景业务支持。

回到本质上说,其实做模型很多时候是十分重复性的、枯燥的工作,但是我们必须要做,因为这些东西没有捷径,长远积累就会成为别人不可超越的门槛。市场上数据源其实就这么多,就像菜市场的菜一样,大家买来买去、接来接去也就这么多。但是怎么样在这个数据源体系里面去做的更精细、模型效果更好,就得靠我们多年从数十个场景中不断实战经验中得来的优势。

  (“智能风控:管理与创新”圆桌论坛)

|技术不是万能的,风控必须与业务结合

在智能信贷时代不能够单一的去看业务,也不能单一去看风控。风控不应该是一个后台的环节,而应该打通前后端,走到前台来多参与业务。

其实从算法层面来说,包括大数据、人工智能等高科技的词汇都不是算法优劣的标尺。我赞同刚才周行(注:江苏银行副行长周凯)所说的“只有合适或不合适,而没有最好”。我们做模型也不一定坚持每一个模型都要运用高级的机器学习算法,同样的,运用了机器学习的模型也不一定就要摒弃逻辑回归等基础算法。高级算法不是模型优劣的标尺,适配业务场景的模型才是最重要的,因此怎么把技术最好的应用在业务场景中是我们更关注的一点。

比如说从小微企业风控角度来说,小微企业的智能信贷第一个难点在于获客,有线上的、线下的,有经营类的、税务的等等。第二个在于他们的数据离散。消费金融领域发展的比较好,是因为个人有基本的三要素信息,通过身份证、电话这些基本信息就能够有一个较好的判断,但是小微企业并没有能够覆盖90%的某个数据源。所以品钛跟很多小微商户流量平台,税务平台,支付平台都有合作比如百望、拉卡拉、哆啦宝等等。

一个模型是无法精准描述不同场景的客户的,有的小微企业主要业务在线下,那么线上的模型不一定实用,模型的分布、PS也会偏得很厉害。品钛的合作不仅仅是流量层面,更战略性的是我们共同去做数据的集成输出,希望能够针对不同的场景做的更加精细和精准。集中在线下的小微企业客户,就必须要用线下场景训练模型效果,同时还要进行风控前置,从营销端就做到精准获客。

第二,其实金融机构的痛点不完全是算法层面,而是实践层面。以品钛自身来做例子,我们是国内做最早期开始做开放市场的,也是大数据领域比较前沿的公司,我们也曾经碰到很多问题。那时候我们做模型,做出来的模型效果测试非常好,但是却各种原因导致无法上线——有时候可能它是非线性的模型,有时候是用到数据源比较多等等各种各样的情况让它落地困难。在这么多年的训练、测试、数据积累后,我们明白,在给金融机构服务的过程中,有时候交付的不只是一个优秀的模型,而是帮他们完成快速模型部署、快速上线和监控系统。

实践落地好像听起来不太高大上,但它就像决策发动机的一个“外挂”,可以挂在大部分金融机构上。很多时候金融机构都会有自己的决策发动机,已经不需要我们再去提供品钛的决策发动机,但我们可以在外面做一个外挂,这部分品钛已经做得很成熟,上线可以在一天之内完成。