-
信用的量化
-
⽤户⾦融属性的量化
-
信⽤评估标准的量化
-
信⽤数据的分析建模
-
-
欺诈的防范
-
欺诈的黑色产业链
-
异常场景的量化分析
-
图谱式的欺诈检测
-
因为担任 O’Reilly AI 大会的助教,决定再回顾一遍之前量化金融信⽤与⻛控分析课的内容
信用的量化
用户金融属性的量化
个人设备信息的八个维度
个人线上线下行为信息
身份鉴别+还款能力
信用评估标准的量化
美国信用评分
FICO
用户分组
最大值/最小值
坏账率
重要行业评估标准:KS/IV
好坏比
考虑的五类维度
中国信用评分
PBOC 信用报告
芝麻信用分
考虑的五个维度
信用数据的分析模型
数据源
获取方法
用户填写
APP获取
三方数据抓取
三方数据购买
选择
特征挖掘
统计
简单统计
复杂统计
分类统计
聚类统计
图谱分析
特征组合
cosin similarity
迁移学习
主动学习
表征学习
特征评估
有效性评估
KS/IV
稳定性评估
交叉验证
PSI
应用
知识图谱?
设备指纹?
欺诈的防范
欺诈的黑色产业链
欺诈类别
黑产个人数据价值链
反欺诈和用户体验的博弈
评估欺诈成本
提升欺诈成本
异常检测技术
长期用户行为检测
社交网络算法
异常场景的量化分析
构建用户模型
数据:用户信息和行为数据
挑战和解决方案
海量数据
大数据系统
分布式机器学习
parameter server
标签少或有噪声
active learning
human in the loop
数据异构
模型融合
特征工程
目标
非数值转成数值
高保真
计算快
易于存储
例子
time series
text mining
bag of words
n-gram
word2vec
image processing
graph mining
图谱式的欺诈检测
以图结构为基础的检测算法
图上的 Random Walk
基于 PageRank 的假账号检测算法
SybilRank
金融基础
信任和信用
金融行业的传统功能
存
贷
汇
信⽤贷款行业分层
信用贷款业务流程
客户获取
信用评估
交易促成
客户服务
金融机构面对的风险
流动性风险
盈利性风险
信用风险
操作风险
政策风险
风控术语
逾期期数
逾期天数
核销
贷款余额
回收
净坏账