多层次注意力机制编码工具用于处理多模态数据,如基因表达、临床特征和文本描述等。该工具利用注意力机制捕捉不同模态数据内部和跨模态之间的复杂关系,提高多模态融合的效果。
主要特点包括:
上传数据并运行分析后,结果将显示在这里
您的多模态数据已经成功通过多层次注意力机制进行编码和分析。模型准确率达到89%,生成了详细的注意力权重和特征重要性分析。
样本数量 | 15 |
---|---|
模态数量 | 3 |
基因特征数 | 10 |
临床特征数 | 6 |
文本处理 | BERT编码 |
注意力头数 | 8 |
跨模态注意力 | 已启用 |
融合方法 | 加权求和 |
多层次注意力网络架构示意图
样本ID | 预测类别 | 置信度 | 基因贡献 | 临床贡献 | 文本贡献 | 关键特征 |
---|---|---|---|---|---|---|
SAMPLE001 | Malignant | 0.87 | 42% | 23% | 35% | gene3, age, "占位性病变" |
SAMPLE002 | Malignant | 0.91 | 38% | 27% | 35% | gene5, smoking, "咯血" |
SAMPLE003 | Benign | 0.78 | 45% | 32% | 23% | gene8, age, "结节" |
SAMPLE004 | Malignant | 0.89 | 41% | 21% | 38% | gene2, age, "胸痛" |
SAMPLE005 | Malignant | 0.82 | 39% | 28% | 33% | gene1, smoking, "毛刺征" |
上图展示了多模态特征之间的注意力权重。颜色越深表示注意力权重越高,即特征间关联性越强。左上角和右下角的方块分别表示基因特征和临床特征内部的自注意力权重,而左下角和右上角则表示不同模态之间的跨模态注意力权重。
特征重要性分析显示了各个特征对模型预测的贡献度。从图中可以看出,文本中的症状描述、肿瘤大小和位置是最重要的文本特征;在临床特征中,年龄和吸烟状态影响较大;基因特征中,Gene 3和Gene 5的表达水平对预测结果有较大影响。
文本注意力可视化展示了模型如何关注临床文本描述中的关键信息。红色条表示高注意力权重的关键医学术语,如"胸闷"、"气短"、"占位性病变"和"边界不规则"等。这些术语对模型判断病变性质起到关键作用。
该图展示了不同模态对各样本预测的贡献百分比。从整体来看,基因表达数据对预测结果的贡献最大(平均约40%),其次是文本描述数据(约33%)和临床特征数据(约27%)。绿色表示正确预测的样本,红色表示错误预测的样本。
基因表达 | 临床特征 | 文本描述 | |
---|---|---|---|
基因表达 | 1.00 | 0.38 | 0.45 |
临床特征 | 0.38 | 1.00 | 0.57 |
文本描述 | 0.45 | 0.57 | 1.00 |
*模态间关联性通过计算注意力权重的余弦相似度得到
注意到良性与恶性肿瘤样本的模态贡献存在显著差异:良性样本中基因表达贡献更大,而恶性样本中文本描述的贡献明显提高。
主要发现:
该图展示了不同模型架构的性能比较。多模态注意力网络在所有评估指标上均优于其他方法,特别是在AUC值上达到了0.91。相比之下,单模态方法和简单拼接的多模态方法性能较差,说明注意力机制在模态融合中的重要性。
训练过程图展示了模型在训练和验证集上的损失和准确率变化。模型在约65个epoch后达到最佳性能并触发早停机制。训练曲线平滑,无明显过拟合现象,说明模型具有良好的泛化能力。
精确率 | 召回率 | F1分数 | 支持数 | |
---|---|---|---|---|
良性 | 0.86 | 0.85 | 0.85 | 6 |
恶性 | 0.89 | 0.90 | 0.89 | 9 |
宏平均 | 0.87 | 0.88 | 0.87 | 15 |
加权平均 | 0.88 | 0.89 | 0.88 | 15 |
预测良性 | 预测恶性 | |
---|---|---|
实际良性 | 5 | 1 |
实际恶性 | 1 | 8 |
其他指标: