Tworzenie bloków Gutenberg z użyciem ChatGPT.

Zobacz kurs

Podstawy AWS.

Automatyzacja procesów z Make.com

Nowy plugin Secure Custom Fields i konflikt na horyzoncie

Nowy plugin Secure Custom Fields i konflikt na horyzoncie

Przyszłość projektowania w WordPressie: Blokowe rewolucje i wizje Franka Kleina

Przyszłość projektowania w WordPressie: Blokowe rewolucje i wizje Franka Kleina

Optymalizacja obrazów w WordPress: jak przyspieszyć witrynę i poprawić jakość?

Optymalizacja obrazów w WordPress: jak przyspieszyć witrynę i poprawić jakość?

Najlepsze wtyczki do sprzedaży biletów na WordPressie

Najlepsze wtyczki do sprzedaży biletów na WordPressie

Odkryj Interactivity API w WordPressie

Odkryj Interactivity API w WordPressie

Zobacz więcej
Bielik – Polski Model AI: Wszystko, Co Musisz Wiedzieć

Bielik – Polski Model AI: Wszystko, Co Musisz Wiedzieć

Deepseek R1 – Fakty i mity. Recenzja i analiza chińskiego modelu.

Deepseek R1 – Fakty i mity. Recenzja i analiza chińskiego modelu.

DeepSeek-R1 – Komentarz techniczny

DeepSeek-R1 – Komentarz techniczny

Anatomia Agenta AI – Kompletny przewodnik techniczny

Anatomia Agenta AI – Kompletny przewodnik techniczny

Agent AI – Kompleksowy przewodnik

Agent AI – Kompleksowy przewodnik

Zobacz więcej

Rewolucja w odkrywaniu leków dzięki zaawansowanemu uczeniu maszynowemu

Artykuł źródłowy pochodzi z portalu PubMed. Oryginalny tytuł to:

Artykuł opisuje zastosowanie systemów uczenia maszynowego (ML) do modelowania związków struktura-własność (QSPR) i struktura-aktywność (QSAR) w celu przewidywania własności nowych cząsteczek, co ma przyspieszyć odkrywanie nowych leków. Autorzy wskazują na problem z generalizacją modeli ze względu na ograniczony zakres danych treningowych, co może prowadzić do generowania cząsteczek nie spełniających oczekiwanych właściwości. Proponują adaptacyjne podejście łączące…

Zobacz Abstrakt

J Cheminform. 2024 Dec 9;16(1):138. doi: 10.1186/s13321-024-00924-y.

ABSTRACT

Machine learning (ML) systems have enabled the modelling of quantitative structure-property relationships (QSPR) and structure-activity relationships (QSAR) using existing experimental data to predict target properties for new molecules. These property predictors hold significant potential in accelerating drug discovery by guiding generative artificial intelligence (AI) agents to explore desired chemical spaces. However, they often struggle to generalize due to the limited scope of the training data. When optimized by generative agents, this limitation can result in the generation of molecules with artificially high predicted probabilities of satisfying target properties, which subsequently fail experimental validation. To address this challenge, we propose an adaptive approach that integrates active learning (AL) and iterative feedback to refine property predictors, thereby improving the outcomes of their optimization by generative AI agents. Our method leverages the Expected Predictive Information Gain (EPIG) criterion to select additional molecules for evaluation by an oracle. This process aims to provide the greatest reduction in predictive uncertainty, enabling more accurate model evaluations of subsequently generated molecules. Recognizing the impracticality of immediate wet-lab or physics-based experiments due to time and logistical constraints, we propose leveraging human experts for their cost-effectiveness and domain knowledge to effectively augment property predictors, bridging gaps in the limited training data. Empirical evaluations through both simulated and real human-in-the-loop experiments demonstrate that our approach refines property predictors to better align with oracle assessments. Additionally, we observe improved accuracy of predicted properties as well as improved drug-likeness among the top-ranking generated molecules. SCIENTIFIC CONTRIBUTION: We present an adaptable framework that integrates AL and human expertise to refine property predictors for goal-oriented molecule generation. This approach is robust to noise in human feedback and ensures that navigating chemical space with human-refined predictors leverages human insights to identify molecules that not only satisfy predicted property profiles but also score highly on oracle models. Additionally, it prioritizes practical characteristics such as drug-likeness, synthetic accessibility, and a favorable balance between exploring diverse chemical space and exploiting similarity to existing training data.

PMID:39654043 [https://pubmed.ncbi.nlm.nih.gov/39654043/?utm_source=Other&utm_medium=rss&utm_campaign=pubmed-2&utm_content=18Cx71VHHP3XUFm_UtwWKCRHiwab6gnVsoJL5Op9oVpDIYQURc&fc=20241127081157&ff=20241210020505&v=2.18.0.post9+e462414] | DOI:10.1186/s13321-024-00924-y [https://doi.org/10.1186/s13321-024-00924-y]

Wprowadzenie

Współczesne odkrywanie leków przeszło długą drogę od czasów, gdy opierało się głównie na próbach i błędach oraz intuicji badaczy. Dzisiejszy świat stawia na znacznie bardziej precyzyjne podejścia, w których kluczową rolę odgrywa uczenie maszynowe. Uczenie maszynowe w odkrywaniu leków to nie tylko trendy, ale konieczność, aby sprostać rosnącym wymaganiom rynku farmaceutycznego oraz oczekiwaniom pacjentów na całym świecie. Dzięki zaawansowanym algorytmom i zdolności do przetwarzania ogromnych zbiorów danych, uczenie maszynowe (ML) staje się nieocenionym narzędziem w rękach naukowców.

Uczenie maszynowe i przewidywanie właściwości

Wśród innowacyjnych zastosowań uczenia maszynowego w odkrywaniu leków wyróżniają się modele QSPR (Quantitative Structure-Property Relationships) i QSAR (Quantitative Structure-Activity Relationships). QSPR i QSAR to zaawansowane techniki modelowania, które umożliwiają przewidywanie właściwości fizykochemicznych i biologicznych nowych związków chemicznych. Dzieje się to poprzez dokładną analizę struktury molekularnej oraz jej wpływu na określone cechy i aktywności.

Wyzwania związane z danymi treningowymi

Mimo ogromnego potencjału uczenia maszynowego, kluczowym wyzwaniem pozostaje dostępność i jakość danych treningowych. Ograniczenia wynikające z małej ilości danych są jednym z głównych problemów, z którymi muszą zmierzyć się naukowcy. Modele ML wymagają dużej ilości danych, aby móc dokładnie określać właściwości nowych związków chemicznych. Bez tego istnieje ryzyko, że modele nie będą w stanie się generalizować i będą działać tylko w wąskim zakresie warunków.

Nowa propozycja: adaptacyjne podejście

Aby sprostać wymienionym wyzwaniom, proponowana jest nowa metodologia oparta na adaptacyjnym podejściu, integrującym aktywne uczenie (Active Learning, AL) i informacje zwrotne, które różnicują pod względem wartości nowych danych wejściowych. Aktywne uczenie pozwala na selektywne wybieranie najbardziej wartościowych próbek do uczenia modeli, co z kolei redukuje potrzebę posiadania ogromnych zbiorów danych.

Rola ekspertów w procesie

Mimo że uczenie maszynowe oferuje potężne narzędzia, rola ekspertów nadal pozostaje kluczowa w całym procesie. Ekspertyza ludzka może wspierać modele ML, czyniąc je bardziej dokładnymi i skutecznymi. Ludzie eksperci mogą wspomagać interpretację danych, które są zdobywane przez modele ML, i dostarczać kontekstu, który maszynom może umknąć.

Przykłady zastosowań i wyniki badań

Praktyczne zastosowanie opisanego podejścia zostało potwierdzone w serii badań empirycznych. Wyniki tych badań wskazują na poprawę dokładności modeli w przewidywaniu właściwości i cech leków przy jednoczesnym zmniejszeniu zapotrzebowania na duże ilości danych treningowych. Modele, które korzystały z EPIG oraz integracji aktywnego uczenia, wykazywały wyraźnie wyższe zdolności przewidywania w porównaniu do tradycyjnych modeli ML.

Zakończenie

Wprowadzenie adaptacyjnego podejścia do uczenia maszynowego w odkrywaniu leków ma potencjał, by zrewolucjonizować sposób, w jaki nowe farmaceutyki są odkrywane i rozwijane. Integracja aktywnego uczenia z wiedzą ludzką oraz zastosowanie zaawansowanych kryteriów, takich jak EPIG, mogą znacznie zwiększyć dokładność i efektywność tego procesu. Takie podejście nie tylko skraca czas odkrycia nowych leków, ale również zmniejsza koszty związane z ich opracowaniem, co czyni ten proces bardziej zrównoważonym i dostępnym dla większej liczby instytucji badawczych i firm farmaceutycznych.