본문 바로가기
Drug

Molecule design using SMILES

by wycho 2022. 1. 4.

Inverse molecular design using machine learning: Generative models for matter engineering, https://doi.org/10.1126/science.aat2663

 

Language model using SMILES

- Validity by using RDKit

- Uniqueness

- Novelty, not included in training set

 

Pros

- 구현이 쉬움. (library가 잘 구축되어 있음)

- 학습이 쉬움.

 

Cons

- Latent space 분석이 불가능. (laternt vector modification이 안됨)

 

 

(Conditional) Variational autoencoder

Pros

- 구현하기가 상대적으로 수월함.

- 난이도 대비 상대적으로 우수한 결과를 보여줌.

- Latent space analysis (or optimization)가 가능.

 

Cons

- Prior assumption이 큰 restriction으로 작용함.

- Language modeling (smile)에서 최적의 모델은 아님.

 

 

Generative adversarial network

https://github.com/chennnnnyize/Generative-Molecules

- 이미지 생성에서 최고의 성능을 보이는 GAN.

- GAN은  continuous한 object 생성에 좋은 성능을 보여줌. Language, 분자와 같이 discrete한 object를 생성하기 위해서는 적합하지 않음.

- 때문에 분자 생성연구에서 GAN은 많이 사용되지 않으며, 주로 작은 분자 생성에 사용됨.

- Reinforcement Learning 기법과 GAN을 결합하여 이러한 한계를 극복하려는 시도들이 있음.

 

- MolGAN: An implicit generative model for small molecular graphs, https://arxiv.org/abs/1805.11973

 

 

Adversarially regularized autoencoder

- VAE와 GAN의 장점을 취합하여 만든 모델

  > VAE의 prior를 GAN의 adversarial training 으로 대체하여 VAE의 단점 보완.

  > Adversarial training을 latent space ( continuous )에 적용ㅎ여 GAN의 단점 보완.

- Molecular Generative Model Based on an Adversarially Regularized Autoencoder, https://doi.org/10.1021/acs.jcim.9b00694

 

 

 

Reference

- Smiles기반 deep generative model을 이용한 분자 디자인ㅣ임재창, https://youtu.be/rvfDtNrTzpc

 

'Drug' 카테고리의 다른 글

Molecule design using Graph model 2  (0) 2022.01.04
Molecule design using Graph model 1  (0) 2022.01.04
[Company] Standigm  (0) 2021.12.30
[DRUG] Reference  (0) 2021.12.13
Open target platform  (0) 2021.12.13

댓글