分析梳理--蛋白质修复缺失残基

张开发
2026/4/16 17:08:19 15 分钟阅读

分享文章

分析梳理--蛋白质修复缺失残基
作者Evil Genius我知道很多人员尤其医生、医学生等都很忙对科研都想跳过学习的阶段直接拿到结果但是实际是不现实的。请人做良莠不齐而且现在风气很不好社会上的人员都是按照标准化的模式分析数据且一个人负责好几个甚至十几个项目平均到每个项目用到的精力都很有限所以结果大概率不尽人意结果对不对谁也不知道。蛋白质三维结构的确定可以通过各种方法例如X射线衍射技术、冷冻电镜术、核磁共振波谱学和预测技术。准确预测三维蛋白质结构已经成为药物设计领域的关键方面在近年来受到广泛关注。理解蛋白质的三维结构对阐明药物结合机制和促进设计亲和力和特异性增强的化合物至关重要。值得注意的是随着计算技术的显著进步药物发现领域发生了革命性的变化这促进了对蛋白质结构的预测与极高精度。我们在进行分子对接和分子动力学模拟的时候选择蛋白质的结晶分子或者同源建模需要有一定的要求如下1.选择与研究对象种属一致来源的蛋白结构、2.选择活性位点完整的晶体结构3.选择含共结晶配体的结构(辅酶等)4.选择共晶配体相似的晶体结构5.选择分辨率高(数值低)的晶体结构获得蛋白质PDB文件后一定要仔细从头看一遍REMARK段落其中记录了许多信息。尤其注意都说“MISSING”寻找记录了结构缺失的信息如下图所示REMARK 465 MISSING RESIDUESREMARK 465 THE FOLLOWING RESIDUES WERE NOT LOCATED IN THEREMARK 465 EXPERIMENT. (MMODEL NUMBER: RESRESIDUE NAME; CCHAINREMARK 465 IDENTIFIER; SSSEQSEQUENCE NUMBER; IINSERTION CODE.)REMARK 465我们以一个蛋白质PDB文件为例,有残基缺失。用pymol看一下存在残基缺失我们来量化一下具体还是比较远为什么PDB分子有一定的残基缺失呢蛋白质结构的缺失往往pdb里的结构不是完整的一种常见情况是因为部区城柔性过大等原因而本身无法测定那些区城的结构。如果缺失的是蛋白末端或者靠体系边缘、与感兴趣区城远的残基通常没什么影响可以无视。而对于涉及到重要区城会影响到蛋白质功能或者结构特征时如少数几个可以尝试自行用结构绘制工具手动修补如果缺失一大段则需要用同源模建方法补全。我们今天就来实现这部分首先看一下实际的PDB文件缺失缺失的残基比较多,缺失的部分在我们来修复一下F链首先写出蛋白序列from modeller import * protein 8PSI_F.pdb e Environ() m Model(e,file protein) aln Alignment(e) aln.append_model(m,align_codes protein) aln.write(file 8PSI_F.seq)写出来的文件P1;8PSI_F.pdb structureX:8PSI_E.pdb:331:F:194:F:::-1.00:-1.00 NITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGD DVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRLFRKSKLKPFERDISTEIYQAGNKPC NGVAGPNCYSPLQSYGFRPTYGVGHQPYRVVVLSFEAPATVCGP*将seq做修改为.ali文件源文件里的缺失残基改为-下面的fill为全序列.当然我们主要修复核心的残基C端和N端的一般不需要修复。P1;8PSI_F structureX:8PSI_E.pdb:331:F:194:F:::-1.00:-1.00 NITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGD DVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRLFRKSKLKPFERDISTEIYQAGNKPC NGVAGPNCYSPLQSYGFRPTYGVGHQPYRVVVLSFE---APATVCGP* P1;8PSI_F_fill sequence::::::::: NITNLCPFGEVFNATKFPSVYAWERKKISNCVADYSVLYNSTFFSTFKCYGVSATKLNDLCFSNVYADSFVVKGD DVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNYNYKYRLFRKSKLKPFERDISTEIYQAGNKPC NGVAGPNCYSPLQSYGFRPTYGVGHQPYRVVVLSFELLNAPATVCGP*然后运行脚本from modeller import * from modeller.automodel import * log.verbose() env Environ() env.io.atom_files_directory [., ../atom_files] class MyModel (AutoModel): def select_atoms (self): return Selection(self.residue_range(191:L, 191:L),self.residue_range(192:L, 192:L),self.residue_range(193:N, 193:N)) a MyModel(env,alnfile 8PSI_F.aln,knowns 8PSI_F,sequence 8PSI_F_fill) a.starting_model 1 a.ending_model 1 a.make()看一下修补后的文件已经修补好了。生活很好有你更好

更多文章