MKG-FENN

一、基础信息
- 论文标题:MKG-FENN: A Multimodal Knowledge Graph Fused End-to-End Neural Network for Accurate Drug–Drug Interaction Prediction
- 发表会议:AAAI 2024(CCF-A类人工智能顶会)
- 核心任务:药物-药物相互作用(DDI)预测(65种交互类型多分类)
- 代码地址:https://github.com/wudi1989/MKG-FENN
二、论文解决的问题
- 联合用药易产生有害DDI,需精准预测。
- 现有方法缺陷:
- 只利用部分药物信息,未全面融合多维度关联。
- 采用非端到端框架,特征提取与融合不充分。
- 未充分利用药物、靶点、酶、分子结构等复杂关联。
三、整体思路
构建4个多模态药物知识图谱 → 用四通道GNN分别提取特征 → 拼接融合 → 端到端MLP预测DDI。
四、模型方法
1. Multimodal Knowledge Graph
(1)构建4个知识图谱(全部基于公开数据,转为三元组)
- 药物-化学实体
- 来源:DrugBank
- 实体:靶点、酶、转运体、蛋白
- 三元组:<药物,功能关系,化学实体>
- 药物-子结构
- 来源:SMILES序列
- 实体:分子子结构
- 三元组:<药物,包含,子结构>
- 药物-药物
- 来源:DDI交互矩阵
- 实体:另一种药物
- 三元组:<药物A,交互类型,药物B>
- 药物-MACCS分子结构
- 来源:MACCS分子指纹
- 实体:分子结构特征
- 三元组:<药物,数量,分子特征>
(2)四通道GNN特征提取
- 每个图谱独立走一个GNN通道。
- 初始向量:实体ID随机初始化。
- GNN作用:让节点吸收邻居与关系信息,更新得到更有意义的向量。
- 输出:一个药物 → 4个不同维度的特征向量。
2. Fused End-to-End Neural Network(FENN,端到端融合网络)
(1)多模态特征融合
- 操作:直接拼接4个通道的药物向量。
- 公式:$\hat{E}_d = E_d^1 \oplus E_d^2 \oplus E_d^3 \oplus E_d^4$
- 结果:得到单一综合药物向量。
(2)MLP预测DDI
- 拼接待预测的两个药物综合向量。
- 送入多层MLP,输出65类DDI的概率。
- 取最大概率类别为预测结果。
(3)训练配置
- 损失函数:交叉熵损失(多分类标准)
- 优化器:Adam
- 防过拟合:Dropout、Batch Norm、L2正则
- 超参:嵌入维度128,邻域采样数6,学习率0.01
五、实验结论
- 在已知药物、已知+新药、全新药三个任务上,全面优于SOTA模型。
- 消融实验证明:4个通道融合效果最好,单通道/少通道性能下降。