欢迎访问 生活随笔!

生活随笔

当前位置: 首页 >

python 化学_rdkit 化学反应分子式高级功能

发布时间:2023/12/20 42 豆豆
生活随笔 收集整理的这篇文章主要介绍了 python 化学_rdkit 化学反应分子式高级功能 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

一、引入所需库

#! /usr/bin/python

# coding: utf-8

from rdkit import Chem

from rdkit.Chem import AllChem

from rdkit.Chem import Draw

from rdkit.Chem import Recap

from rdkit.Chem import BRICS

二、保护原子

以酰胺反应为例 , 反应物分子1中含有一个 - COOH , 另一个分子中含有两个 - NH 。 之后定义反应模板 , 然后让其反应 。

acid = Chem.MolFromSmiles('CC(=O)O')

base = Chem.MolFromSmiles('CC(=O)NCCN')

mols = [acid, base]

img = Draw.MolsToGridImage(

mols,

molsPerRow=2,

subImgSize=(200, 200),

legends=['acid', 'base']

)

img.save('/Users/zeoy/st/drug_development/st_rdcit/img/mol33.jpg')

反应物如下图所示:

rxn = AllChem.ReactionFromSmarts('')

rxn = AllChem.ReactionFromRxnFile(

'/Users/zeoy/st/drug_development/st_rdcit/2d.rxn')

ps = rxn.RunReactants(acid, base)

print('the num of reactions', len(ps))

for reaction in ps:

reactions_smi = Chem.MolToSimiles(reaction)

print('this reaction is', reactions_smi)

三、把分子切成片段

3.1 Recap方法

Recap方法通过模拟实验室中常用的化学反应,将反应分子分解成功合理的片段

Recap 方法返回的是类似于node tree结构的数据。

注:分子片段的Smiles前面通常会加一个* 如 ‘*c1ccccc1’

m = Chem.MolFromSmiles('c1ccccc1OCCOC(=O)CC')

hierarch = Recap.RecapDecompose(m)

type(hierarch)

# 层次结构的原始分子

print('smi=', hierarch.smiles) # smi= CCC(=O)OCCOc1ccccc1

# 每个节点使用smiles键控的字典跟踪其子节点

ks = hierarch.children.keys()

print(sorted(ks))

# ['*C(=O)CC', '*CCOC(=O)CC', '*CCOc1ccccc1', '*OCCOc1ccccc1', '*c1ccccc1']

3.2 BRICS方法

RDKit 还提供了另一种把分子切成片段的方法——BRICS方法。 BRICS方法主要是根据可合成的的键对分子进行切断,因此其返回的数据结构是来自于该分子的不同分子片段, 虚拟原子(*)是告诉我们是如何切断的。

对下图中的分子进行BRICS分解

smi = 'C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N'

m = Chem.MolFromSmiles(smi)

Draw.MolToImageFile(

m,

"/Users/zeoy/st/drug_development/st_rdcit/img/mol34.jpg",

size=(600, 400),

legend='zanubrutinib(C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N)'

)

frags = (BRICS.BRICSDecompose(m))

print(frags)

mols = []

for fsmi in frags:

mols.append(Chem.MolFromSmiles(fsmi))

img = Draw.MolsToGridImage(

mols,

molsPerRow=3,

subImgSize=(200, 200),

legends=['' for x in mols]

)

img.save('/Users/zeoy/st/drug_development/st_rdcit/img/mol35.jpg')

四、组合分子片段–BRICS方法

以上述片段进行BRICS组合产生分子

newms = BRICS.BRICSBuild(mols)

newms = list(newms)

print('新分子数:', len(newms)) # 新分子数: 76(含少量化学结构不合理的结构)

mols = [newms[0], newms[1], newms[2]]

img = Draw.MolsToGridImage(

mols,

molsPerRow=3,

subImgSize=(200, 200),

legends=['' for x in mols]

)

可视化前3个结构

img.save('/Users/zeoy/st/drug_development/st_rdcit/img/mol36.jpg')

五、自定义片段生成方法

除了上面提到的自动片段分解方法,RDKit提供了更灵活的函数可根据用户定义的键进行切断产生片段。

比如对所有环上的原子和非环上的原子组成的键进行进行切断。

smi = 'C=CC(=O)N1CCC(CC1)C2CCNC3=C(C(=NN23)C4=CC=C(C=C4)OC5=CC=CC=C5)C(=O)N'

m = Chem.MolFromSmiles(smi)

submol = m.GetSubstructMatches(Chem.MolFromSmarts('[!R][R]'))

print(submol) # ((2, 4), (25, 22), (25, 26), (32, 15))

bonds_id = [m.GetBondBetweenAtoms(x, y).GetIdx() for x, y in submol]

frags = Chem.FragmentOnBonds(m, bonds_id)

print('type=', type(frags)) # type=

Draw.MolToImageFile(

m,

"/Users/zeoy/st/drug_development/st_rdcit/img/mol36.jpg",

)

smis = Chem.MolToSmiles(frags)

smis = smis.split('.')

mols = []

for smi in smis:

mols.append(Chem.MolFromSmiles(smi))

img = Draw.MolsToGridImage(

mols,

molsPerRow=3,

subImgSize=(200, 200),

legends=['' for x in mols]

)

img.save("/Users/zeoy/st/drug_development/st_rdcit/img/mol37.jpg")

本文地址:https://blog.csdn.net/qq_36801966/article/details/107053474

如您对本文有疑问或者有任何想说的,请点击进行留言回复,万千网友为您解惑!

总结

以上是生活随笔为你收集整理的python 化学_rdkit 化学反应分子式高级功能的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。