量化金融信⽤与⻛控分析回顾1

2019/06/18
  • 信用的量化

    • ⽤户⾦融属性的量化

    • 信⽤评估标准的量化

    • 信⽤数据的分析建模

  • 欺诈的防范

    • 欺诈的黑色产业链

    • 异常场景的量化分析

    • 图谱式的欺诈检测

因为担任 O’Reilly AI 大会的助教,决定再回顾一遍之前量化金融信⽤与⻛控分析课的内容

信用的量化

用户金融属性的量化

	个人设备信息的八个维度
	
	个人线上线下行为信息
	
	身份鉴别+还款能力
	
信用评估标准的量化

	美国信用评分
	
		FICO
		
			用户分组
			
			最大值/最小值
			
			坏账率
			
			重要行业评估标准:KS/IV
			
			好坏比
			
			考虑的五类维度
			
	中国信用评分
	
		PBOC 信用报告
		
		芝麻信用分
		
			考虑的五个维度
			
信用数据的分析模型

	数据源
	
		获取方法
		
			用户填写
			
			APP获取
			
			三方数据抓取
			
			三方数据购买
			
		选择
		
	特征挖掘
	
		统计
		
			简单统计
			
			复杂统计
			
			分类统计
			
			聚类统计
			
		图谱分析
		
		特征组合
		
			cosin similarity
			
		迁移学习
		
		主动学习
		
		表征学习
		
	特征评估
	
		有效性评估
		
			KS/IV
			
		稳定性评估
		
			交叉验证
			
			PSI
			
	应用
	
		知识图谱?
		
		设备指纹?

欺诈的防范

欺诈的黑色产业链

	欺诈类别
	
	黑产个人数据价值链
	
	反欺诈和用户体验的博弈
	
		评估欺诈成本
		
		提升欺诈成本
		
	异常检测技术
	
		长期用户行为检测
		
			社交网络算法
			
异常场景的量化分析

	构建用户模型
	
		数据:用户信息和行为数据
		
		挑战和解决方案
		
			海量数据
			
				大数据系统
				
				分布式机器学习
				
					parameter server
					
			标签少或有噪声
			
				active learning
				
				human in the loop
				
			数据异构
			
				模型融合
				
				特征工程
				
					目标
					
						非数值转成数值
						
						高保真
						
						计算快
						
						易于存储
						
					例子
					
						time series
						
						text mining
						
							bag of words
							
							n-gram
							
							word2vec
							
						image processing
						
						graph mining
						
图谱式的欺诈检测

	以图结构为基础的检测算法
	
		图上的 Random Walk
		
		基于 PageRank 的假账号检测算法
		
			SybilRank

金融基础

信任和信用

金融行业的传统功能

	存
	
	贷
	
	汇
	
信⽤贷款行业分层

信用贷款业务流程

	客户获取
	
	信用评估
	
	交易促成
	
	客户服务
	
金融机构面对的风险

	流动性风险
	
	盈利性风险
	
	信用风险
	
	操作风险
	
	政策风险
	
风控术语

	逾期期数
	
	逾期天数
	
	核销
	
	贷款余额
	
	回收
	
	净坏账

Post Directory