基于k-mer的图卷积网络(GCN)编码是一种先进的序列编码方法,它结合了k-mer表示和图神经网络的优势。 此方法首先将序列分解为k-mer,然后构建k-mer之间的关系图,最后使用图卷积神经网络学习这些关系的嵌入表示。
与传统的k-mer向量编码相比,GCN编码能够:
该工具支持FASTA格式的序列文件,可以配置k值、嵌入维度和图构建方法等参数。
上传序列数据并运行编码后,结果将显示在这里
您的序列数据已成功通过基于k-mer的图卷积网络进行编码。
处理序列数 | 5 |
---|---|
序列平均长度 | 108 bp |
k值 | 3 |
图节点数 | 64 |
图边数 | 178 |
嵌入维度 | 64 |
处理时间 | 8.45 秒 |
序列/维度 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
seq1 | 0.674 | -0.485 | 0.099 | 0.196 | 0.065 | 0.105 | 0.194 | 0.195 | 0.028 | 0.248 | 0.086 | -0.167 | 0.143 | -0.193 | 0.022 | 0.190 |
seq2 | 0.592 | -0.374 | 0.123 | 0.223 | 0.078 | 0.093 | 0.217 | 0.176 | 0.035 | 0.229 | 0.094 | -0.145 | 0.156 | -0.185 | 0.031 | 0.204 |
seq3 | 0.087 | 0.174 | 0.573 | 0.031 | 0.025 | 0.187 | 0.082 | 0.035 | 0.584 | 0.046 | 0.562 | 0.023 | 0.047 | 0.042 | 0.578 | 0.055 |
seq4 | 0.094 | 0.161 | 0.537 | 0.043 | 0.019 | 0.194 | 0.097 | 0.042 | 0.548 | 0.041 | 0.547 | 0.033 | 0.051 | 0.037 | 0.539 | 0.052 |
seq5 | 0.146 | 0.087 | 0.042 | 0.198 | 0.503 | 0.031 | 0.049 | 0.516 | 0.055 | 0.041 | 0.028 | 0.525 | 0.036 | 0.502 | 0.037 | 0.047 |