Language model using SMILES
- Validity by using RDKit
- Uniqueness
- Novelty, not included in training set
Pros
- 구현이 쉬움. (library가 잘 구축되어 있음)
- 학습이 쉬움.
Cons
- Latent space 분석이 불가능. (laternt vector modification이 안됨)
(Conditional) Variational autoencoder
Pros
- 구현하기가 상대적으로 수월함.
- 난이도 대비 상대적으로 우수한 결과를 보여줌.
- Latent space analysis (or optimization)가 가능.
Cons
- Prior assumption이 큰 restriction으로 작용함.
- Language modeling (smile)에서 최적의 모델은 아님.
Generative adversarial network
- 이미지 생성에서 최고의 성능을 보이는 GAN.
- GAN은 continuous한 object 생성에 좋은 성능을 보여줌. Language, 분자와 같이 discrete한 object를 생성하기 위해서는 적합하지 않음.
- 때문에 분자 생성연구에서 GAN은 많이 사용되지 않으며, 주로 작은 분자 생성에 사용됨.
- Reinforcement Learning 기법과 GAN을 결합하여 이러한 한계를 극복하려는 시도들이 있음.
- MolGAN: An implicit generative model for small molecular graphs, https://arxiv.org/abs/1805.11973
Adversarially regularized autoencoder
- VAE와 GAN의 장점을 취합하여 만든 모델
> VAE의 prior를 GAN의 adversarial training 으로 대체하여 VAE의 단점 보완.
> Adversarial training을 latent space ( continuous )에 적용ㅎ여 GAN의 단점 보완.
- Molecular Generative Model Based on an Adversarially Regularized Autoencoder, https://doi.org/10.1021/acs.jcim.9b00694
Reference
- Smiles기반 deep generative model을 이용한 분자 디자인ㅣ임재창, https://youtu.be/rvfDtNrTzpc
'Drug' 카테고리의 다른 글
Molecule design using Graph model 2 (0) | 2022.01.04 |
---|---|
Molecule design using Graph model 1 (0) | 2022.01.04 |
[Company] Standigm (0) | 2021.12.30 |
[DRUG] Reference (0) | 2021.12.13 |
Open target platform (0) | 2021.12.13 |
댓글