MOL-Instincts
Największa i najdokładniejsza na świecie baza danych chemicznych
- Pierwsza baza oparta o mechanikę kwantową
- Pierwsza baza oparta o metody statystyczne QSPR
- Zastosowanie 41 patentów technologicznych
- Przetestowana na danych eksperymentalnych
- Ponad 2,85 miliona związków chemicznych
- Ponad 2100 danych odnośnie każdego ze związków
- Zbiór ponad 10 milardów danych i informacji
|
|
|
|
Co to jest MOL-Instincts?
- MOL-Instincts jest bazą zawierającą dane nt. związków chemicznych występujących w różnych aplikacjach przemysłowych. Dane te mogą być zastosowane w wielu obszarach naukowych i badawczych, zarówno w nauce jak i inżynierii.
- Baza zawiera informacje dotyczące właściwości termodynamicznych, fizykochemicznych, transportowych, kwantowych, deskryptorów molekularnych, właściwości lekotwórczych związków, widm, optymalizacji struktur 3D oraz orbitali.
- Wszystkie informacje powstały z użyciem modeli estymacji i obliczeń kwantowo-mechanicznych, a także zastosowaniem najnowszych modeli teoretycznych. Prace trwały ponad pięć lat i polegały nie tylko na obliczeniach ale też weryfikacji wyników z użyciem danych eksperymentalnych.
- Obecnie w bazie znajduje się ponad 2,85 miliona związków chemicznych oraz ponad 2100 cech i informacji dotyczących każdego ze związków.
- MOL-Instincts został zaprojektowany z myślą o zastosowaniach w nauce jak i inżynierii aby eliminować niepewność w pracach wytwórczych i badaniach i R&D.
- Nazwa MOL-Instincts oznacza instynkt cząsteczek, w odniesieniu do ich podstawowego charakteru.
Dlaczego MOL-Instincts?
- Naukowcy i inżynierowie potrzebują sprawdzonych danych i informacji nt. molekuł już we wczesnych stadiach prac badawczych i przemysłowych, w poszczególnych obszarach ich działalności. Informacje te są jak pewnego rodzaj fundament podczas budowy domu, który jest niezbędny dla stabilności całego przedsięwzięcia.
Istnieje około 40 różnych termo-fizyko-chemicznych cech oraz tysiące danych odnośnie cząsteczek dla każdego związku chemicznego które są wymagane w różnych obszarach naukowych i inżynieryjnych.
Jak do tej pory, dane te były dostępne dla jedynie 30 do 40 tysięcy związków, podczas gdy liczba związków chemicznych zarejestrowanych w Amerykańskim Towarzystwie Chemicznym (CAS) wynosi ponad 106 milionów. To mniej niż 0,1% całkowitej liczby związków. - Te 30 – 40 tysięcy związków, które są dostępne, również nie są w całości opisane. Istnieją związki które posiadają jedynie jedną lub dwie dane cechy stowarzyszone ze związkiem. Zwykle, jedynie tysiące związków dostępne są w odniesieniu do cechy. Dodatkowo często zdarza się, że istniejące dane są niedokładne lub obarczone błędem.
- Dlaczego brakuje opisu dla 99,9% związków? Ponieważ najczęściej dane związku można określić jedynie w czasochłonnej, eksperymentalnej i finalnie kosztownej drodze. Nawet w przypadku tych 0,1% opisanych związków nie wykonano eksperymentów. Niektóre krytyczne dane zostały wyznaczone na drodze niedokładnych metod estymacyjnych.
- Dlaczego zatem MOL-Instincts? Ponieważ zawarte w niej dane są pewne i pochodzą z technik estymacji uzupełnionych weryfikacją przez człowieka. Informacje są obszerne – zawierają opis ponad 2,85 miliona związków, oraz ponad 2100 właściwości dla każdego ze związków. Praca z MOL-Instincts jest szybka i łatwa. Nie ma potrzeby uczenia się lub stosowania programów obliczeniowych. Wystarczy kilka kliknięć aby otrzymać dokładne dane których potrzebujemy.
Jak powstała baza danych MOL-Instincts?
-
Na początku zostały zbadane podstawowe właściwości czystych związków z użyciem obliczeń kwantowych
- wykonanie prawidłowych obliczeń kwantowych wymaga posiadania prawidłowej struktury cząsteczek, więc opracowany został proces analizy konformerów w celu wygenerowania odpowiedniej struktury wejściowej,
- następnie ponieważ enancjomery posiadają identyczne wartości swoich cech należało stworzyć proces ich odfiltrowania,
- istnieje ponad tysiąc różnych kombinacji poziomów dokładności, co powodowało konieczność zbadania i przetestowania bardzo dużo ilości z tych kombinacji w celu określenia standardowego procesu generowania wyników w zadowalającej jakości.
- Obliczenia kwantowe nie generując bezpośrednio własności termo-fizyko-chemicznych. Otrzymane wyniki tych obliczeń zostały połączone z danymi pochodzącymi z wielu tradycyjnych fundamentalnych teorii z zakresu termodynamiki i chemii kwantowej np. termodynamiki statystycznej.
- Nawet połączenie obliczeń kwantowych z tradycyjnymi modelami nie daje zadowalających wyników, dlatego w następnym kroku użyte zostały nowe koncepcje modelowania, publikowane w specjalistycznych periodykach jak np. SVRC (Scaled Variable Reduced Coordinates).
- Dodatkowo użyte zostały metody statystyczne QSPR (Quantitative Structure-Property Relationship) oraz sztucznej inteligencji ANN (Artificial Neural Network), z naciskiem na ich korzyści w zakresie dopasowania, a finalnie opracowany został algorytm zapobiegający nadmiernemu dopasowaniu.
-
Ponad pięć lat weryfikacji, użycia milionów danych eksperymentalnych przez ponad trzydziestu naukowców zaowocowało finalnym wynikiem jakim było:
- zgromadzenie danych eksperymentalnych z wielu różnych możliwych źródeł, w tym czasopism specjalistycznych, opracowań naukowych, internetu i komercyjnych baz danych,
- usunięcie nieakceptowalnych błędów i szumów ze zgromadzonych danych,
- wykorzystanie danych eksperymentalnych w celu weryfikacji dokładności danych estymowanych, w tym wygenerowanie tysięcy wykresów w celu manualnego sprawdzenia poprawności obliczeń,
- opracowanie systematycznego procesu opartego na teoriach analizy chemicznej, np. analizie podobieństwa, w celu jego użycia do weryfikacji dokładności wyników.
Obszary zastosowań MOL-Instincts
- Projektowanie, utrzymanie i optymalizacja procesów chemicznych
- Poprawa efektywności energetycznej
- Alternatywne źródła energii
- Zielona chemia, ochrona środowiska i badania nad zdrowiem
- Produkcja chemikaliów na podstawie nowych rozporządzeń, np. dotyczących środowiska (REACH)
- Symulacja procesów chemicznych
- Inżynieria reakcji
- Projektowanie, konserwacja i optymalizacja urządzeń do zastosowań przemysłowych
- Rozwój nowych leków
- Projektowanie nowych związków chemicznych, kosmetyków, aromatów i zapachów
- Chemii obliczeniowa
- Chemia fizyczna i analityczna