🔬 Анализ невалентных взаимодействий – это не только DORI/IRI (качественное описание) и даже не всегда Local Energy Decomposition (LED) (количественное). Иногда, особенно когда катализатор разросся до внушительных размеров, используют метод усечения структур (от англ. Truncated, подробнее в тексте тут). Это, по сути, аналог LED, но более дружелюбный, особенно если ты юзаешь ORCA, где LED возможен только с DLPNO-CCSD(T). А вот этот метод можно применять на любом уровне теории – бери хоть Hartree Hell😢, хоть что угодно (но в оригинале брали wB97X-D).
🔍 Краткая инструкция для самых маленьких
Представим, у нас есть переходное состояние (ПС) (смотри картинки), ведущее к главному продукту. Смотрим на картинку и видим, что структуру можно разложить на три димера:
1. Dimer1 – водородное связывание субстрат-катализатор.
2. Dimer2 – за π-стекинг.
3. Dimer3 – за CH-π-взаимодействие.
📊 Чёрная магия квантовой химии
1. Dimer1: энергия взаимодействия субстрат-катализатор
✅ Убираем "антраценовые крылья" из катализатора, заменяем их водородами.
✅ Фиксируем атомы, в орке это реализовано при помощи Constraints {C X:Y C} end (от атома X до атома Y фиксируем положения атомов в пространстве), но новые атомы водорода не фиксируем.
✅ Оптимизируем структуру с этим констрейном.
✅ Разделяем полученный комплекс на два: субстрат и катализатор.
✅ Считаем Single Point энергии этих двух структур по отдельности (должно получиться два расчета).
✅ Из энергии комплекса dimer1 вычитаем сумму энергий субстрата и катализатора: dE(H-связывание) = -107.1 ккал/моль.
2. Dimer2: энергия π-стекинга
✅ Убираем всё, кроме одного крыла (который отвечает за π-стекинг) и активного центра катализатора.
✅ Оптимизируем структуру с констрейном по схеме из пункта 1.
✅ Разделяем полученный комплекс на два XYZ файла: антрацен и (субстрат связанный с активным центром).
✅ Считаем Single Point по схеме выше (тоже должно быть два расчёта) .
✅ Из энергии комплекса dimer2 вычитаем сумму энергий антрацена и (субстрата, связанного с активным центром): dE(π-стекинга) = -9.8 ккал/моль.
3. Dimer3: CH-π-взаимодействие
✅ Аналогично с dimer2, но с другой стороны молекулы: dE(CH-π) = -15.7 ккал/моль.
✨ Итог
Делаем то же самое для ПС минорного продукта иприменяем чёрную магию 🧙♂️, а именно вычитаем из первого (лучшего ПС) второе (худшего ПС) в каждом случае. И вуаля, у нас есть разница энергий (ddE), отвечающая тем самым взаимодействиям!
⚠️ Главное не забыть про оптимизацию атомов водорода, которыми замещаем открытые валентности после разрыва связей.
📌 Математическая магия правильного сложения и вычитания, а также немногохимического шаманства с капелькой чёрной магии 🪄 – и можно наглядно показать, какие интересующие нас невалентные взаимодействия влияют на селективность больше всего 🤓.
🔍 Краткая инструкция для самых маленьких
Представим, у нас есть переходное состояние (ПС) (смотри картинки), ведущее к главному продукту. Смотрим на картинку и видим, что структуру можно разложить на три димера:
1. Dimer1 – водородное связывание субстрат-катализатор.
2. Dimer2 – за π-стекинг.
3. Dimer3 – за CH-π-взаимодействие.
📊 Чёрная магия квантовой химии
1. Dimer1: энергия взаимодействия субстрат-катализатор
✅ Убираем "антраценовые крылья" из катализатора, заменяем их водородами.
✅ Фиксируем атомы, в орке это реализовано при помощи Constraints {C X:Y C} end (от атома X до атома Y фиксируем положения атомов в пространстве), но новые атомы водорода не фиксируем.
✅ Оптимизируем структуру с этим констрейном.
✅ Разделяем полученный комплекс на два: субстрат и катализатор.
✅ Считаем Single Point энергии этих двух структур по отдельности (должно получиться два расчета).
✅ Из энергии комплекса dimer1 вычитаем сумму энергий субстрата и катализатора: dE(H-связывание) = -107.1 ккал/моль.
2. Dimer2: энергия π-стекинга
✅ Убираем всё, кроме одного крыла (который отвечает за π-стекинг) и активного центра катализатора.
✅ Оптимизируем структуру с констрейном по схеме из пункта 1.
✅ Разделяем полученный комплекс на два XYZ файла: антрацен и (субстрат связанный с активным центром).
✅ Считаем Single Point по схеме выше (тоже должно быть два расчёта) .
✅ Из энергии комплекса dimer2 вычитаем сумму энергий антрацена и (субстрата, связанного с активным центром): dE(π-стекинга) = -9.8 ккал/моль.
3. Dimer3: CH-π-взаимодействие
✅ Аналогично с dimer2, но с другой стороны молекулы: dE(CH-π) = -15.7 ккал/моль.
✨ Итог
Делаем то же самое для ПС минорного продукта и
⚠️ Главное не забыть про оптимизацию атомов водорода, которыми замещаем открытые валентности после разрыва связей.
📌 Математическая магия правильного сложения и вычитания, а также немного
👍3🔥2
An article from 2007 in PNAS showing the importance of entropic penalty in small molecules binding to proteins. Long story short, if your molecule is too flexible, it will be very unlikely to adopt a conformation required for binding in the protein active site, even if such a conformation exists. So if you designing a pharmaceutical molecule, which should go into a protein target, make sure that it is not too flexible
https://www.pnas.org/doi/full/10.1073/pnas.0610494104
https://www.pnas.org/doi/full/10.1073/pnas.0610494104
PNAS
Ligand configurational entropy and protein binding | PNAS
The restriction of a small molecule's motion on binding to a protein causes a loss
of configurational entropy, and thus a penalty in binding affini...
of configurational entropy, and thus a penalty in binding affini...
👍3🔥3
Just a bit of interesting knowledge:
Peptide Science 2020: https://onlinelibrary.wiley.com/doi/full/10.1002/pep2.24145
short peptides rarely fold into a defined helical secondary structure because the entropic cost of nucleating a turn of the α-helix is not compensated by the free energy gained from main chain hydrogen bonding and various side chain interactions until the peptide length reaches 15 to 20 residues
Peptide Science 2020: https://onlinelibrary.wiley.com/doi/full/10.1002/pep2.24145
👍2🔥1🤔1
In a new arXiv preprint published on April 21st, 2025, machine learning (ML) is used to correct a density functional approximation (DFA, DFT). Not for the first time, and surely not for the last one.
This one is interesting because the authors say that their correction eliminates the need for error cancellation, on which all functionals users rely in order to obtain sensible energies. Error cancellation can be easily visualized by comparing DFT errors in relative energies of conformers, which are usually of order 0.1-0.4 kcal/mol, with DFT errors in atomization energies, which are usually 3-15 kcal/mol. Clearly, when computing relative energies of different conformers, functional's errors in energies of every bond or angle bend stay very similar for each conformer and thus cancel out from relative energies - this is what is called error cancellation.
And eliminating the reliance on error cancellation is just another way of saying that they get rid of the systematic error of DFT. Which is very interesting, if they actually did it.
#DFT
Xiao Zheng, GuanHua Chen
This one is interesting because the authors say that their correction eliminates the need for error cancellation, on which all functionals users rely in order to obtain sensible energies. Error cancellation can be easily visualized by comparing DFT errors in relative energies of conformers, which are usually of order 0.1-0.4 kcal/mol, with DFT errors in atomization energies, which are usually 3-15 kcal/mol. Clearly, when computing relative energies of different conformers, functional's errors in energies of every bond or angle bend stay very similar for each conformer and thus cancel out from relative energies - this is what is called error cancellation.
And eliminating the reliance on error cancellation is just another way of saying that they get rid of the systematic error of DFT. Which is very interesting, if they actually did it.
#DFT
Xiao Zheng, GuanHua Chen
❤1
AIQM2 method: a neural-network-based (NN) semi-empirical method devised by Pavlo O. Dral and (according to its authors) having accuracy of a DFT method when it comes to chemical reactions and a capability to estimate its uncertainty in the predicted energies (!) .
AIQM2 is based on Grimme's GFN2-xTB with the following alterations:
— the original D4 dispersion correction is removed;
+ the D4 dispersion correction designed for wB97X functional is added;
+ correction predicted by an ensemble of 8 ANI NN force fields (FFs) is added: these ANIs use GELU activation function (see below) and a cutoff of 4 Angstom.
Use of an ensemble of 8 ANIs allows AIQM2 to predict uncertainty in its predictions. This uncertainty is computed as a standard deviation (SD) of the predictions of these ANIs; however I could not find a proof in the article that this SD actually correlates with the method's error.
AIQM2 is already available in MLatom program package and in UAIQM library.
As an interesting side note, from this article I have learned that ANI NN FF with GELU activation function [Dral and others, preprint] has shown much better performance for vibrational frequencies (and higher-order derivatives) than the original one [Tretiak, Isaev, Roitberg, etc.] with CELU activation function. Citing the preprint:
#MLFF #AI #ML #FF
AIQM2 is based on Grimme's GFN2-xTB with the following alterations:
— the original D4 dispersion correction is removed;
+ the D4 dispersion correction designed for wB97X functional is added;
+ correction predicted by an ensemble of 8 ANI NN force fields (FFs) is added: these ANIs use GELU activation function (see below) and a cutoff of 4 Angstom.
Use of an ensemble of 8 ANIs allows AIQM2 to predict uncertainty in its predictions. This uncertainty is computed as a standard deviation (SD) of the predictions of these ANIs; however I could not find a proof in the article that this SD actually correlates with the method's error.
AIQM2 is already available in MLatom program package and in UAIQM library.
As an interesting side note, from this article I have learned that ANI NN FF with GELU activation function [Dral and others, preprint] has shown much better performance for vibrational frequencies (and higher-order derivatives) than the original one [Tretiak, Isaev, Roitberg, etc.] with CELU activation function. Citing the preprint:
We <...> perform the VPT2 calculations with the ANI-1ccx for the HCOOH molecule (see Methods). Surprisingly, the errors in anharmonic frequencies compared to the experiment are huge: mean absolute error (MAE) is ca.1500 cm−1 with many negative frequencies (Table 1).
<...>
We trace the underlying issue to the inappropriate choice of the activation function which leads to numerical instabilities for higher-order derivatives required for VPT2 anharmonic frequencies. The possible solution is then to employ another activation function. Indeed, when
we replace CELU with the GELU activation function and recalculate the anharmonic frequencies with the resulting ANI-1ccx (GELU) variant, the unphysical negative frequencies disappear and the MAE drops to ca. 680 cm−1 (Table 1).
#MLFF #AI #ML #FF
👍1
It is widely known that experiment is the criterion of success of any theory.
Still, theoretical chemistry is usually applied after the experiment. And since not everyone (actually, quite a few ones, but we are among them) design computational research in a way that allows it to contradict the experiment, it is hard to say if the theoretical chemistry is actually that good, or it just rarely gets a real quest.
In this review preprint Mario Barbatti has collected the cases from years 2010-2025 when theoretical chemistry actually made predictions before they were confirmed with experiments.
#compchem
Still, theoretical chemistry is usually applied after the experiment. And since not everyone (actually, quite a few ones, but we are among them) design computational research in a way that allows it to contradict the experiment, it is hard to say if the theoretical chemistry is actually that good, or it just rarely gets a real quest.
In this review preprint Mario Barbatti has collected the cases from years 2010-2025 when theoretical chemistry actually made predictions before they were confirmed with experiments.
#compchem
ChemRxiv
When Theory Came First: A Review of Theoretical Chemical Predictions Ahead of Experiments
For decades, computational theoretical chemistry has provided critical insights into molecular behavior, often anticipating experimental discoveries. This review surveys twenty notable examples from the past fifteen years in which computational chemistry…
👍2🔥2
Not explicitly theoretical chemisty, but large language models (LLMs) are currently theoretical everything :)
A YouTube chanel with extremely valuable content on concurrent LLMs, launched just 2 months ago by a former Google Research engineer.
Thanks to it, I have finally grasped several important LLM concepts, including DPO, GRPO, and the difference between distillation and behavioral cloning
A YouTube chanel with extremely valuable content on concurrent LLMs, launched just 2 months ago by a former Google Research engineer.
Thanks to it, I have finally grasped several important LLM concepts, including DPO, GRPO, and the difference between distillation and behavioral cloning
YouTube
Julia Turc
AI explainer videos from a former Google Research engineer, now startup founder. Expect American optimism with a solid dose of Eastern European cynicism.
Find (free) supplemental materials (slide decks, paper reading lists, Colab notebooks) on Patreon 👉…
Find (free) supplemental materials (slide decks, paper reading lists, Colab notebooks) on Patreon 👉…
Informing molecular graph neural networks about stereoelectronic interactions — stereoelectronics-infused molecular graphs (SIMG):
https://www.nature.com/articles/s42256-025-01031-9
https://phys.org/news/2025-06-molecular-machine-quantum-chemical-insight.html
By Gabe Gomes and Daniil Boyko
https://www.nature.com/articles/s42256-025-01031-9
https://phys.org/news/2025-06-molecular-machine-quantum-chemical-insight.html
By Gabe Gomes and Daniil Boyko
🔥4🤔1
If anything, this should be here: https://computationaldrugdesigning.blogspot.com/2009/07/scrolling-history-of-computational.html
#History
#History
Blogspot
A Scrolling History of Computational Chemistry
A Scrolling History of Computational Chemistry Allen B. Richon Introduction W hile there were several papers detailing the use of computers ...
🔥2🤩1
Forwarded from Прежде думай (Михаил Медведев) (Michael Medvedev)
Пресс-релиз по нашей статье в JCIM, где мы предложили первый в своём роде метод дополнения конформационных ансамблей, опубликован в Коммерсантъ.
Название и саммари с нами не согласовывали, так что они могут немного запутать. Но технически их можно натянуть на то, что на самом деле было сделано: мы ищем потерянные конформации (не фрагменты), обращая внимание на то, какие геометрии фрагментов не представлены в текущем ансамбле.
Текст с нами согласовывали, там всё сильно лучше. Это мой первый опыт подготовки пресс-релизов с пресс-службой РНФ, так что в данном случае спасибо РНФ и за финансирование проекта и за очень эффективную работу их пресс-службы.
Название и саммари с нами не согласовывали, так что они могут немного запутать. Но технически их можно натянуть на то, что на самом деле было сделано: мы ищем потерянные конформации (не фрагменты), обращая внимание на то, какие геометрии фрагментов не представлены в текущем ансамбле.
Текст с нами согласовывали, там всё сильно лучше. Это мой первый опыт подготовки пресс-релизов с пресс-службой РНФ, так что в данном случае спасибо РНФ и за финансирование проекта и за очень эффективную работу их пресс-службы.
Коммерсантъ
От слепых пятен к точности
Новый метод на основе ИИ позволил находить «потерянные» фрагменты молекул
🔥5
Global Optimization Algorithm (GOAT) for molecules and clusters of atoms and show how it can find the global energy minima for both systems without resorting to molecular dynamics (MD). This avoids the potential millions of time-consuming gradient calculations required by a long MD run. Because of that, it can be used with any regular quantum chemical method, even with the costlier hybrid DFT.
Comparison of the energies of the minimum conformers found by the conformational search algorithm CREST and GOAT (as implemented in ORCA 6). (Fig. 1)
Even after taking the ensemble up to 6 kcal/mol from the minimum found from the GFN2-xTB search and reoptimizing all structures with r 2 SCAN-3c, we do not get the same minimum as the one obtained from a GOAT search done at the DFT PES, as can be seen by the overlay on Figure 7c. The same is true if the conformational search is done using GFN2-xTB with CREST and all structures are reoptimized using r 2 SCAN-3c afterwards. M. Bursch and coworkers have already shown that, for similar cases, when comparing conformational energies of metal complexes, there is not always a direct correlation between the DFT and GFN2-xTB PESs, and a sampling only based on semiempirics might lead to wrong results. (Fig. 2)
PDF in the comments.
🔥2
Janus kinases (JAKs) are a family of non-receptor tyrosine kinases. In mammals, four members of this family are known: Jak1, Jak2, Jak3, and tyrosine kinase 2 (Tyk2). Each of these proteins contains a kinase domain, a catalytically inactive pseudokinase domain, and amino-terminal FERM domains that bind to cytokine receptors. Cytokines that use JAKs for intracellular signaling act as key communication tools of the immune system. They are critically important for many biological processes and immune response formation. Disruption of cytokine production or their biological activity leads to immune system dysfunction, contributing to the development of various pathologies such as autoimmune and inflammatory diseases.
Consequently, recent research has focused on developing selective JAK inhibitors, as this approach can reduce the severity of side effects in the treatment of a number of related diseases, such as cancer, type 1 diabetes, and asthma. However, the key challenge is achieving inhibitory selectivity given the exceptionally high homology of the ATP-binding pockets in the JAK kinase domain. Developing an inhibitor that targets only one enzyme isoform requires precise consideration of compensatory mechanisms and minimal structural differences.
The review discusses various inhibitor options, among which abrocitinib is one of the most effective due to its unique mechanism of action that provides high selectivity. Unlike ATP-competitive drugs, it binds allosterically to the inactive conformation of the kinase domain, blocking the activation of the signaling pathway without competing for the ATP catalytic binding site.
Source: https://www.mdpi.com/1999-4923/14/5/1001
Created by @kapi_mom
Consequently, recent research has focused on developing selective JAK inhibitors, as this approach can reduce the severity of side effects in the treatment of a number of related diseases, such as cancer, type 1 diabetes, and asthma. However, the key challenge is achieving inhibitory selectivity given the exceptionally high homology of the ATP-binding pockets in the JAK kinase domain. Developing an inhibitor that targets only one enzyme isoform requires precise consideration of compensatory mechanisms and minimal structural differences.
The review discusses various inhibitor options, among which abrocitinib is one of the most effective due to its unique mechanism of action that provides high selectivity. Unlike ATP-competitive drugs, it binds allosterically to the inactive conformation of the kinase domain, blocking the activation of the signaling pathway without competing for the ATP catalytic binding site.
Source: https://www.mdpi.com/1999-4923/14/5/1001
Created by @kapi_mom
MDPI
A Comprehensive Overview of Globally Approved JAK Inhibitors
Janus kinase (JAK) is a family of cytoplasmic non-receptor tyrosine kinases that includes four members, namely JAK1, JAK2, JAK3, and TYK2. The JAKs transduce cytokine signaling through the JAK-STAT pathway, which regulates the transcription of several genes…
🔥4🤩1
Придумали новый потенциал, но лень писать код, чтобы его обучить? Хотите сделать своё собственное силовое поле, потенциалы в котором будут понатыканы из разных подходов? Возможно вам стоит почитать эту статью
В ней рассказывается про Alexandria Chemistry Toolkit (ACT). Эта программа позволяет подбирать параметры силовых полей с использованием генетического алгоритма и метода Монте-Карло на основании квантовохимических и иных данных.
В ACT реализовано стандартное разбиение энергии на отдельные вклады (Ван-дер-Ваальс, электростатика, валентные взаимодействия), причём для каждого из вкладов можно выбирать между различными функциональными формами, в том числе с учётом поляризуемости, ангармонических потенциалов для валентных взаимодействий и даже внеатомных зарядов (положения выбираются по геометрическим соображениям)
Сама программа может использоваться для проведения различных вычислений (энергий взаимодействия, термохимии и так далее), а полученные с её помощью силовые поля можно использовать в OpenMM
Авторы проверяют способность модели воспроизвести параметры из OPLS2020 для спиртов, алканов и воды, получив практически такие же параметры
Из минусов — программа привязывается к атомным типам наподобие GAFF вместо более современной параметризации по SMIRKS, хотя и позволяет пользователю самостоятельно задать отдельные типы вручную
Препринт статьи доступен на ChemRxiv, а сама статья опубликована в Digital Discovery
В ней рассказывается про Alexandria Chemistry Toolkit (ACT). Эта программа позволяет подбирать параметры силовых полей с использованием генетического алгоритма и метода Монте-Карло на основании квантовохимических и иных данных.
В ACT реализовано стандартное разбиение энергии на отдельные вклады (Ван-дер-Ваальс, электростатика, валентные взаимодействия), причём для каждого из вкладов можно выбирать между различными функциональными формами, в том числе с учётом поляризуемости, ангармонических потенциалов для валентных взаимодействий и даже внеатомных зарядов (положения выбираются по геометрическим соображениям)
Сама программа может использоваться для проведения различных вычислений (энергий взаимодействия, термохимии и так далее), а полученные с её помощью силовые поля можно использовать в OpenMM
Авторы проверяют способность модели воспроизвести параметры из OPLS2020 для спиртов, алканов и воды, получив практически такие же параметры
Из минусов — программа привязывается к атомным типам наподобие GAFF вместо более современной параметризации по SMIRKS, хотя и позволяет пользователю самостоятельно задать отдельные типы вручную
Препринт статьи доступен на ChemRxiv, а сама статья опубликована в Digital Discovery
pubs.rsc.org
Evolutionary machine learning of physics-based force fields in high-dimensional parameter-space
This work presents the Alexandria Chemistry Toolkit (ACT), an open-source software for machine learning of physics-based force fields (FFs) from scratch, based on user-specified potential functions. In this approach, a set of FF parameters for molecular simulation…
❤5
В статье представлено новое машинно-обучаемое силовое поле Grappa — эволюция более раннего подхода Espaloma.
Обе системы используют графовые нейронные сети для предсказания параметров молекулярной механики непосредственно из молекулярного графа. Однако Grappa отказывается от ручных химических признаков, таких как гибридизация или формальный заряд, используя лишь атомные номера и топологию графа. Это повышает обобщающую способность и упрощает расширение на нерассмотренные области химического пространства, например, пептидные радикалы.
Grappa демонстрирует более высокую точность в воспроизведении свободной энергии сворачивания белков (obtain a calculated folding free energy of −3.0 kT, which is closer to the experimental reference than the value of −4.0 kT reported for Amber ff99SB with the same water model) и констант спин-спинового взаимодействия* (Amber ff14SB RMSE 0.63 Hz; Espaloma-0.3 RMSE 0.50 Hz; Grappa RMSE 0.46 Hz). Она также более эффективно использует данные, требуя меньше тренировочных примеров для достижения высокой точности (Grappa also outperforms the baselines if only trained on a fraction of Espaloma's training set, indicating high data efficiency), и сохраняет стабильность в симуляциях крупных биомолекул — от белков до вирусных частиц.
Grappa совместима с GROMACS и OpenMM. Она совместима с частичными зарядами от Amber ff99SB и CHARMM36
*they can be calculated from the statistics of dihedral angles obtained in MD simulation via the Karplus equation
Обе системы используют графовые нейронные сети для предсказания параметров молекулярной механики непосредственно из молекулярного графа. Однако Grappa отказывается от ручных химических признаков, таких как гибридизация или формальный заряд, используя лишь атомные номера и топологию графа. Это повышает обобщающую способность и упрощает расширение на нерассмотренные области химического пространства, например, пептидные радикалы.
Grappa демонстрирует более высокую точность в воспроизведении свободной энергии сворачивания белков (obtain a calculated folding free energy of −3.0 kT, which is closer to the experimental reference than the value of −4.0 kT reported for Amber ff99SB with the same water model) и констант спин-спинового взаимодействия* (Amber ff14SB RMSE 0.63 Hz; Espaloma-0.3 RMSE 0.50 Hz; Grappa RMSE 0.46 Hz). Она также более эффективно использует данные, требуя меньше тренировочных примеров для достижения высокой точности (Grappa also outperforms the baselines if only trained on a fraction of Espaloma's training set, indicating high data efficiency), и сохраняет стабильность в симуляциях крупных биомолекул — от белков до вирусных частиц.
Grappa совместима с GROMACS и OpenMM. Она совместима с частичными зарядами от Amber ff99SB и CHARMM36
*they can be calculated from the statistics of dihedral angles obtained in MD simulation via the Karplus equation
pubs.rsc.org
Grappa – a machine learned molecular mechanics force field
Simulating large molecular systems over long timescales requires force fields that are both accurate and efficient. In recent years, E(3) equivariant neural networks have lifted the tension between computational efficiency and accuracy of force fields, but…