본문 바로가기
Drug

Molecule design using Deep generative models

by wycho 2022. 1. 4.

강화학습

- 시나리오 1 : 분자생성 (agent) -> 물성개성 -> reward (environment) -> 동일한 상황에서 agent는 같은 분자를 만들어낼 확률이 높아짐.

- 시나리오 2 : 분자생성 (agent) -> 물성 악화 -> penalty (environment) -> 동일한 상황에서 agent는 같은 분자를 만들어낼 확률이 낮아짐.

 

- Deep reinforcement learning for de novo drug design, https://doi.org/10.1126/sciadv.aap7885

  > Tanh activation 값을 통해서 해석 가능성을 보여줌. (chemically sensible groups, syntactic groups)

 

 

화학반응기반 분자 생성 모델

- 분자생성 모델을 통해 생성한 분자들이 종종 합성이 불가능.

- 분자를 사전에 정의된 reactant_reaction으로 봄.

- 이를 통해 분자를 합성 가능한 space에서 탐색하게 됨.

 

- Learning To Navigate The Synthetically Accessible Chemical Space Using Reinforcement Learning, https://arxiv.org/abs/2004.12485

- Reactant 개수가 매우 많음. (~수십만)

  > 선택된 template이 적용 가능한 reactant만을 선별

  > Agent의 action의 k-nearest reactant를 선정.

- 처음에는 invalid한 template만 선택되어 화학반응이 진행되지 않음.

  > template에 masking을 해서 유효한 template만 선택되도록 함.

- 15개의 uni+82개의 bi molecule reaction template를 사용.

  > Uni의 경우 reactant partner를 선택하지 않음.

 

 

 

GENTRL

- Generative Tensorial Reinforcement Learning (GENTRL), https://github.com/insilicomedicine/GENTRL

- Deep learning enables rapid identification of potent DDR1 kinase inhibitors, https://doi.org/10.1038/s41587-019-0224-x

- Variational autoencoder를 이용해서 latent space를 생성.

 

- 분자생성 및 filtering 과정.

1) 30만개 분자 생성.

2) 12,147개 분자 선별.

3) MW, LogP, TPSA등의 descriptor로 선별.

4) 150개 in-house MCF를 이용해서 filtering.

5) 남은 분자 7912개.

6) Clustering.

7) 3개 SOM으로 filtering.

8) Pharmacophore analysis.

9) Sammon mapping을 통한 분자선별.

10) 최종 40개 분자 합성.

 

- 실험과정

1) In vitro activity assay

2) Cell-culture activity assay

3) Cell-culture fibrosis assay

4) Cytochrome inhibition

5) Microsomal stability

6) Buffer stability

7) Phamacokinetic studies

 

- 결과

https://doi.org/10.1038/s41587-019-0224-x

1) 1,2번이 좋은 potency와 selectivity를 보임.

2) 추가 실험결과 1번이 보다 적합한 것을 확인.

 

Limitation

- 인공지능을 통해 도출한 화합물이 학습에 사용한 약물(Ponatinib)와 구조적으로 매우 유사.

- Novel target에 대한 신규약물 발굴의 어려움.

- 이유로는 학습한 데이터가 많지 않기 때문에 유사한 구조가 생성되는 문제가 있음.

- 순수 데이터 방법만으로는 해결하기 쉽지 않은 문제.

- Biological test는 학습단계에서 고려되지 않음. 해당 과정 통과는 AI로 인한 효과가 아님.

 

 

 

Reference

- The applications of deep generative modelsㅣ임재창, https://youtu.be/vGojaIKA7V4

 

 

 

'Drug' 카테고리의 다른 글

ZINC database  (0) 2022.01.10
Molecule design using Graph model 2  (0) 2022.01.04
Molecule design using Graph model 1  (0) 2022.01.04
Molecule design using SMILES  (0) 2022.01.04
[Company] Standigm  (0) 2021.12.30

댓글