基于k-mer的图卷积网络编码

工具说明

基于k-mer的图卷积网络(GCN)编码是一种先进的序列编码方法,它结合了k-mer表示和图神经网络的优势。 此方法首先将序列分解为k-mer,然后构建k-mer之间的关系图,最后使用图卷积神经网络学习这些关系的嵌入表示。

与传统的k-mer向量编码相比,GCN编码能够:

  • 捕获k-mer之间的复杂交互关系
  • 学习更紧凑、更有信息量的嵌入表示
  • 更好地处理长序列和不同长度的序列
  • 提供更高维的特征表示,增强下游任务性能

该工具支持FASTA格式的序列文件,可以配置k值、嵌入维度和图构建方法等参数。

数据上传与参数设置
拖放文件到这里或点击上传

支持的格式: FASTA, TXT

已选择文件:
文件大小限制: 10MB。每行一条序列或标准FASTA格式。
k-mer参数
k-mer的长度,影响图的节点数量
定义k-mer之间连接关系的方法
0 0.5 1
图中边的权重阈值,低于此值的边将被剪枝
GCN模型参数
GCN生成的嵌入向量维度
图卷积神经网络的层数
将节点特征聚合为序列表示的方法
输出设置
是否保存构建的k-mer图结构
是否输出GCN各层的中间表示
编码结果

上传序列数据并运行编码后,结果将显示在这里