第一个结构1tce -alphafold3蛋白质和小肽相互作用json模板
(原创,转载请注明出处)
第一个结构-蛋白质和小肽
1TCE:
一、json结构的准备
1、从pdb获取fasta结构
2、从实验(测序)获取fasta文件
3、从ncbi获取fasta文件
4、生成json文件
将上述获取的fasta文件,复制到下面文件序列部分
(AF3) [chenfj@s61b04n01 testaf3]$ cat 1tce.json
{
"name": "1tce",
"modelSeeds": [1, 22, 333, 4444, 66666],
"sequences": [
{"protein": {
"id": "A",
"sequence": "AEQLRGEPWFHGKLSRREAEALLQLNGDFLVRESTTTPGQYVLTGSQSGQPKHLLLVDPEGVVRTKDHRFESVSHLISYHMDNHLPIISAGSELCLQQPVERKLLEH"
}
},
{"protein": {
"id": "B",
"sequence": "GHDGLYQGLSTATK"
}
}
],
"dialect": "alphafold3",
"version": 1
}
"modelSeeds": [1, 22, 333, 4444, 66666],为种子数,每个有5个结构
5、检验json文件,复制到vscode检验,右键格式化文档,或者直接在vscode里编辑,下图红色报错,明显少了右边花括号
二、提交任务
1、提交去l40
执行命令:
pkurun-l40 1 1 AF3RUN.sh 1tce.json
pkurun-l40 1 1 AF3RUN.sh 1tce.json
[chenfj@login28 testaf3-0]$ pkurun-l40 1 1 AF3RUN.sh 1tce.json
生成的文件:其中AF3073650_24377011.err为af3输出、AF3073650_24377011.out为集群run的过程输出
job.srp开头的为提交脚本
[chenfj@login28 testaf3-0]$ ll
total 36
-rw-r--r-- 1 chenfj chenfj 397 Nov 18 01:39 1tce.json
-rw-rw-r-- 1 chenfj chenfj 2865 Nov 19 07:36 AF3073650_24377011.err
-rw-rw-r-- 1 chenfj chenfj 19148 Nov 19 07:36 AF3073650_24377011.out
drwxrwxr-x 8 chenfj chenfj 4096 Nov 19 07:36 alphafold3
-rwx------ 1 chenfj chenfj 276 Nov 19 07:36 job.srp073650
查看生成的脚本,后期可以直接修改脚本 sbatch job.srp073650 提交就可以
[chenfj@login28 testaf3-0]$ cat job.srp073650
#!/bin/bash
#SBATCH -J AF3073650
#SBATCH -p gpu_l40
#SBATCH -N 1
#SBATCH -o AF3073650_%j.out
#SBATCH -e AF3073650_%j.err
#SBATCH --no-requeue
#SBATCH -A chenfj_g1
#SBATCH --qos=chenfjl40
#SBATCH --gres=gpu:1
#SBATCH --overcommit
#SBATCH --mincpus=7
pkurun AF3RUN.sh 1tce.json
[chenfj@login28 testaf3-0]$
2、提交去其他GPU分区
pkurun-l40 1 1 AF3RUN.sh 1tce.json
pkurun-h800 1 1 AF3RUN.sh 1tce.json
pkurun-a800 1 1 AF3RUN.sh 1tce.json (需要预约)
gpu_4l和gpu_2l 为V100均不支持,会爆炸结构
三、生成的结果
参考文献
https://www.jianshu.com/p/53927176c618
https://zhuanlan.zhihu.com/p/716050328
下图青色的PDB库的核磁结构,绿色为计算的结构,loop比较多,所以 "fraction_disordered": 0.12,叠合的RMSD为0.98