为什么GNN不适合用于金融反欺诈
问题不是 GNN 不强,而是“假设全错”。
GNN 的核心假设有 4 个,在 DGraph 中几乎全被打破。
1️⃣ 同质性假设被严重破坏
GNN 默认相信“相连的节点更可能属于同一类”。这在社交网络、引用网络里成立。
而金融欺诈图中实际是 欺诈节点 ≠ 喜欢连欺诈节点。反而是:“欺诈 → 大量正常用户” “欺诈 → 垃圾账号 / 背景节点” “欺诈 → 临时壳节点”,结果message passing = 风险被正常节点“稀释”。越聚合邻居,欺诈信号越弱。
2️⃣ 异质性极强,但 GNN 处理不好
DGraph 的是多类型、有方向、有语义(转账 / 担保 / 登录 / 设备)
普通 GCN / GAT:把邻居一股脑平均、type / direction 只当弱特征
结果结构存在,但语义被抹平。
而风控里,恰恰是某一类边、某一个方向、某一个时间段最重要。
3️⃣ 极端不平衡 + 平滑效应 = 灾难
DGraph 的现实是正样本 < 1%。多 hop 后:fraud signal → 被 99% 正常节点淹没
GNN 的机制是多层聚合、embedding 趋同
结果导致模型越深,越“看不见欺诈”。
4️⃣ 时间被“平均掉”了
标准 GNN本质是静态聚合,时间只是一个附加特征。
而 DGraph 的风险信号是突然爆发、短期异常、时序模式
GNN 的 message passing把昨天 + 上个月 + 去年一起平均,时间方向性直接消失。
