Hemometrija
Hemometrija je nauka o ekstrahovanju informacija iz hemijskih sistema podataka. Hemometrija je inherentno interdisciplinarna, koristeći metode koje se često koriste u osnovnim disciplinama analize podataka kao što su multivarijantna statistika, primenjena matematika i računarstvo, kako bi se tretirali problemi u hemiji, biohemiji, medicini, biologiji i hemijskom inženjerstvu. Na ovaj način odražava druge interdisciplinarne oblasti, kao što su psihometrija i ekonometrija.
Pozadina
[уреди | уреди извор]Hemometrija se primenjuje za rešavanje deskriptivnih i prediktivnih problema u eksperimentalnim prirodnim naukama, posebno u hemiji. U deskriptivnim primenama, svojstva hemijskih sistema se modeluju sa namerom da se nauče osnovni odnosi i struktura sistema (tj. razumevanje i identifikacija modela). U prediktivnim primenama, svojstva hemijskih sistema se modeluju sa namerom da se predvide nova svojstva ili ponašanje od interesa. U oba slučaja, skupovi podataka mogu biti mali, ali su često veliki i složeni, uključujući stotine do hiljade varijabli, i stotine do hiljade slučajeva ili zapažanja.
Hemometrijske tehnike se posebno koriste u analitičkoj hemiji i metabolomici, a razvoj poboljšanih hemometrijskih metoda analize takođe nastavlja da unapređuje stanje tehnike u analitičkoj instrumentaciji i metodologiji. To je disciplina vođena primenom, i stoga, dok se standardne hemometrijske metodologije veoma široko koriste u industriji, akademske grupe su posvećene kontinuiranom razvoju hemometrijske teorije, metoda i aplikacionom razvoju.
Poreklo
[уреди | уреди извор]Iako bi se moglo tvrditi da su čak i najraniji analitički eksperimenti u hemiji uključivali oblik hemometrije, opšte je poznato da se ovo polje pojavilo tokom 1970-ih kada su računari postali sve više eksploatisani za naučna istraživanja. Termin 'hemometrija' je skovao Svante Vold u aplikaciji za grant iz 1971. godine,[1] a Međunarodno društvo za hemometriju su ubrzo nakon toga formirali Svante Vold i Brus Kovalski, dva pionira u ovoj oblasti. Vold je bio profesor organske hemije na Univerzitetu Umeo u Švedskoj, a Kovalski je bio profesor analitičke hemije na Univerzitetu Vašington, Sijetl.[2]
Mnoge rane primene uključivale su multivarijantnu klasifikaciju, usledile su brojne kvantitativne prediktivne aplikacije, a do kasnih 1970-ih i ranih 1980-ih pojavio se širok spektar hemijskih analiza vođenih podacima i kompjuterima.
Multivarijantna analiza je bila kritičan aspekt čak i u najranijim primenama hemometrije. Podaci iz infracrvene i UV/vidljive spektroskopije se često broje u hiljadama merenja po uzorku. Masena spektrometrija, nuklearna magnetna rezonanca, atomska emisija/apsorpcija i hromatografski eksperimenti su takođe po prirodi veoma multivarijantni. Utvrđeno je da je struktura ovih podataka pogodna za korišćenje tehnika kao što su analiza glavnih komponenti (PCA), parcijalni najmanji kvadrati (PLS), ortogonalni delimični najmanji kvadrati (OPLS) i dvosmerni ortogonalni delimični najmanji kvadrati (O2PLS).[3] Ovo je prvenstveno zato što, iako skupovi podataka mogu biti veoma multivarijantni, postoji jaka i često linearna struktura niskog ranga. PCA i PLS su se vremenom pokazali veoma efikasnim u empirijskom modelovanju hemijski interesantnije strukture niskog ranga, iskorišćavajući međusobne veze ili 'latentne varijable' u podacima i obezbeđujući alternativne kompaktne koordinatne sisteme za dalju numeričku analizu kao što su regresija, klasterovanje, i prepoznavanje obrazaca. Parcijalni najmanji kvadrati posebno su se intenzivno koristili u hemometrijskim aplikacijama mnogo godina pre nego što su počeli da nalaze redovnu primenu u drugim oblastima.
Tokom 1980-ih pojavila su se tri namenska časopisa u ovom polju: Journal of Chemometrics, Chemometrics and Intelligent Laboratory Systems, i Journal of Chemical Information and Modeling. Ovi časopisi nastavljaju da pokrivaju fundamentalna i metodološka istraživanja u hemometriji. Trenutno se većina rutinskih primena postojećih hemometrijskih metoda obično objavljuje u časopisima orijentisanim na primenu (npr. Applied Spectroscopy, Analytical Chemistry, Analytica Chimica Acta, Talanta). Nekoliko važnih knjiga/monografija o hemometriji je takođe prvi put objavljeno tokom 1980-ih, uključujući prvo izdanje Malinovskove Faktorske analize u hemiji,[4] Šaraf, Ilman i Kovalskijeve Hemometrije,[5] Masart et al. Hemometrija: udžbenik,[6] i Multivarijatna kalibracija Martensa i Naesa.[7]
Neke velike oblasti hemometrijske primene su nastavile da predstavljaju nove domene, kao što su molekularno modelovanje i QSAR, heminformatika, '-omike' polja genomike, proteomike, metabonomike i metabolomike, modelovanje procesa i analitička tehnologija procesa.
Izveštaj o ranoj istoriji hemometrije objavljen je kao serija intervjua Geladija i Esbensena.[8][9]
Tehnike
[уреди | уреди извор]Multivarijantna kalibracija
[уреди | уреди извор]Mnogi hemijski problemi i primena hemometrije obuhvataju kalibraciju. Cilj je da se razviju modeli koji se mogu koristiti za predviđanje osobina od interesa na osnovu izmerenih osobina hemijskog sistema, kao što su pritisak, protok, temperatura, infracrveni, Ramanovi,[10] NMR spektri i maseni spektri. Primeri uključuju razvoj multivarijantnih modela koji se odnose na 1) spektralni odgovor sa više talasnih dužina na koncentraciju analita, 2) molekularne deskriptore na biološku aktivnost, 3) multivarijantne uslove/stanja procesa sa atributima konačnog proizvoda. Proces zahteva skup podataka za kalibraciju ili obuku, koji uključuje referentne vrednosti za svojstva od interesa za predviđanje, i izmerene atribute za koje se veruje da odgovaraju ovim svojstvima. Za slučaj 1), na primer, mogu se prikupiti podaci iz većeg broja uzoraka, uključujući koncentracije za analit od interesa za svaki uzorak (referenca) i odgovarajući infracrveni spektar tog uzorka. Multivarijantne tehnike kalibracije kao što je parcijalna regresija najmanjih kvadrata ili regresija glavnih komponenti (i skoro bezbroj drugih metoda) se zatim koriste za konstruisanje matematičkog modela koji povezuje multivarijantni odgovor (spektar) sa koncentracijom analita od interesa, i takav model se može koristiti za efikasno predviđanje koncentracija novih uzoraka.
Tehnike u multivarijantnoj kalibraciji se često široko kategorišu kao klasične ili inverzne metode.[7][11] Osnovna razlika između ovih pristupa je u tome što se u klasičnoj kalibraciji modeli rešavaju tako da su optimalni za opisivanje izmerenih analitičkih odgovora (npr. spektra) i stoga se mogu smatrati optimalnim deskriptorima, dok se u inverznim metodama modeli rešavaju tako da budu optimalni u predviđanju svojstava od interesa (npr. koncentracije, optimalni prediktori).[12] Inverzne metode obično zahtevaju manje fizičkog znanja o hemijskom sistemu, i barem u teoriji daju superiorna predviđanja u smislu srednje kvadratne greške,[13][14][15] i stoga inverzni pristupi imaju tendenciju da se češće primenjuju u savremenoj multivarijantnoj kalibraciji.
Glavne prednosti upotrebe multivarijantnih tehnika kalibracije su da se brza, jeftina ili nedestruktivna analitička merenja (kao što je optička spektroskopija) mogu koristiti za procenu svojstava uzorka koja bi inače zahtevala dugotrajno, skupo ili destruktivno ispitivanje (kao npr. LC-MS). Jednako je važno da multivarijantna kalibracija omogućava preciznu kvantitativnu analizu u prisustvu jakih smetnji od strane drugih analita. Selektivnost analitičke metode je obezbeđena koliko matematičkom kalibracijom, tako i analitičkim modalitetima merenja. Na primer, blisko infracrveni spektri, koji su izuzetno široki i neselektivni u poređenju sa drugim analitičkim tehnikama (kao što su infracrveni ili Raman spektri), često se mogu uspešno koristiti u kombinaciji sa pažljivo razvijenim multivarijantnim metodama kalibracije za predviđanje koncentracija analita u veoma složene matrice.
Klasifikacija, prepoznavanje paterna, klasterovanje
[уреди | уреди извор]Nadzirane tehnike multivarijantne klasifikacije su usko povezane sa tehnikama multivarijantne kalibracije u tome što se kalibracioni ili trening set koristi za razvoj matematičkog modela koji može da klasifikuje buduće uzorke. Tehnike koje se koriste u hemometriji su slične onima koje se koriste u drugim oblastima – multivarijantna diskriminantna analiza, logistička regresija, neuronske mreže, stabla regresije/klasifikacije. Upotreba tehnika smanjenja ranga u kombinaciji sa ovim konvencionalnim metodama klasifikacije je rutinska u hemometriji, na primer diskriminantna analiza na glavnim komponentama ili skorovi parcijalnih najmanjih kvadrata.
Porodica tehnika, koje se nazivaju modelovanje klasa ili jednoklasni klasifikatori, može da izgradi modele za pojedinačnu klasu od interesa.[16] Takve metode su posebno korisne u slučaju kontrole kvaliteta i provere autentičnosti proizvoda.
Nenadgledana klasifikacija (takođe zvana klasterska analiza) se takođe široko koristi za otkrivanje paterna u složenim skupovima podataka, a opet mnoge od osnovnih tehnika koje se koriste u hemometriji su zajedničke drugim oblastima kao što su mašinsko učenje i statističko učenje.
Multivarijantna rezolucija krive
[уреди | уреди извор]U hemometrijskom žargonu, rezolucija multivarijantne krive nastoji da dekonstruiše skupove podataka sa ograničenim ili odsutim referentnim informacijama i znanjem o sistemu. Neke od najranijih radova na ovim tehnikama su obavili Loton i Silvestre tokom ranih 1970-ih.[17][18] Ovi pristupi se takođe nazivaju samomodelujuća analiza smeše, slepo razdvajanje izvora/signala i spektralno razdvajanje. Na primer, iz skupa podataka koji sadrži spektre fluorescencije iz serije uzoraka od kojih svaki sadrži višestruke fluorofore, metode rezolucije multivarijantne krive mogu se koristiti za izdvajanje spektra fluorescencije pojedinačnih fluorofora, zajedno sa njihovim relativnim koncentracijama u svakom od uzoraka, esencijalno razdvajajući ukupni spektar fluorescencije u doprinose pojedinačnih komponenti. Problem je obično loše određen zbog rotacione dvosmislenosti (mnoga moguća rešenja mogu ekvivalentno da predstavljaju izmerene podatke), te je primena dodatnih ograničenja uobičajena, kao što su nenegativnost, unimodalnost ili poznati međusobni odnosi između pojedinačnih komponenti (npr. kinetička ograničenja ili ograničenja ravnoteže mase).[19][20]
Druge tehnike
[уреди | уреди извор]Dizajn eksperimenta ostaje ključna oblast proučavanja hemometrije i nekoliko monografija je posebno posvećeno eksperimentalnom dizajnu u hemijskim primenama.[21][22] Značajni principi eksperimentalnog dizajna su široko prihvaćeni u hemometrijskoj zajednici, iako su mnogi složeni eksperimenti čisto opservacioni i može biti malo kontrole nad svojstvima i međusobnim odnosima uzoraka i svojstava uzorka.
Obrada signala je takođe kritična komponenta skoro svih hemometrijskih aplikacija, posebno upotrebe predtretmana signala za kondicioniranje podataka pre kalibracije ili klasifikacije. Tehnike koje se obično koriste u hemometriji često su usko povezane sa onima koje se koriste u srodnim oblastima.[23] Prethodna obrada signala može uticati na način na koji se mogu tumačiti rezultati konačne obrade podataka.[24]
Karakterizacija performansi i zasluge Kao i većina oblasti u fizičkim naukama, hemometrija je kvantitativno orijentisana, tako da je značajan naglasak stavljen na karakterizaciju performansi, izbor modela, verifikaciju i validaciju i vrednosti zasluga. Performanse kvantitativnih modela se obično specificiraju pomoću srednje kvadratne greške u predviđanju atributa od interesa i performansi klasifikatora kao parova pravih pozitivnih stopa/lažno pozitivnih stopa (ili pune ROC krive). Nedavni izveštaj Olivijerija i dr. pruža sveobuhvatan pregled vrednosti i procene nesigurnosti u multivarijantnoj kalibraciji, uključujući multivarijantne definicije selektivnosti, osetljivosti, SNR i procene intervala predviđanja.[25] Odabir hemometrijskog modela obično uključuje upotrebu alata kao što je ponovno uzorkovanje (uključujući butstrap, permutaciju, unakrsnu validaciju).
Multivarijantna statistička kontrola procesa (MSPC), modelovanje i optimizacija predstavljaju značajan udeo istorijskog razvoja hemometrije.[26][27][28] Spektroskopija se uspešno koristi za onlajn praćenje proizvodnih procesa već 30–40 godina, a ovi podaci procesa su veoma podložni hemometrijskom modelovanju. Konkretno u smislu MSPC, višesmerno modelovanje šaržnih i kontinuiranih procesa je sve češće u industriji i ostaje aktivna oblast istraživanja u hemometriji i hemijskom inženjerstvu. Procesna analitička hemija kako je prvobitno nazvana,[29] ili noviji termin procesna analitička tehnologija nastavlja da se u velikoj meri oslanja na hemometrijske metode i MSPC.
Višesmerne metode se u velikoj meri koriste u hemometrijskim primenama.[30][31] Ovo su proširenja više korišćenih metoda višeg reda. Na primer, dok je analiza tabele (matrice ili niza drugog reda) podataka rutinska u nekoliko polja, višesmerne metode se primenjuju na skupove podataka koji uključuju treći, četvrti ili više redove. Podaci ovog tipa su veoma česti u hemiji, na primer sistem tečne hromatografije/masene spektrometrije (LC-MS) generiše veliku matricu podataka (vreme elucije u odnosu na m/z) za svaki analizirani uzorak. Podaci u više uzoraka stoga sadrže kocku podataka. Modelovanje serijskog procesa uključuje skupove podataka koji imaju vreme u odnosu na promenljive procesa u odnosu na broj serije. Višesmerne matematičke metode koje se primenjuju na ove vrste problema uključuju PARAFAC, trilinearnu dekompoziciju i višesmernu PLS i PCA.
Reference
[уреди | уреди извор]- ^ As recounted in Wold, S. (1995). „Chemometrics; what do we mean with it, and what do we want from it?”. Chemometrics and Intelligent Laboratory Systems. 30 (1): 109—115. doi:10.1016/0169-7439(95)00042-9.
- ^ Kowalski, Bruce R. (1975). „Chemometrics: Views and Propositions”. J. Chem. Inf. Comput. Sci. 15 (4): 201—203. doi:10.1021/ci60004a002.
- ^ Trygg, J.; Wold, S. (2003). „O2-PLS, a two-block (X–Y) latent variable regression (LVR) method with an integral OSC filter”. Journal of Chemometrics (на језику: енглески). 17: 53—64. S2CID 123071521. doi:10.1002/cem.775.
- ^ Malinowski, E. R.; Howery, D. G. (1980). Factor Analysis in Chemistry. New York: Wiley. ISBN 978-0471058816. (other editions followed in 1989, 1991 and 2002).
- ^ Sharaf, M. A.; Illman, D. L.; Kowalski, B. R., ур. (1986). Chemometrics. New York: Wiley. ISBN 978-0471831068.
- ^ Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: a textbook. Amsterdam: Elsevier. ISBN 978-0444426604.
- ^ а б Martens, H.; Naes, T. (1989). Multivariate Calibration. New York: Wiley. ISBN 978-0471909798.
- ^ Geladi, P.; Esbensen, K. (2005). „The Start and Early History of Chemometrics: Selected Interviews. Part 1”. J. Chemometrics. 4 (5): 337—354. S2CID 120490459. doi:10.1002/cem.1180040503.
- ^ Esbensen, K.; Geladi, P. (2005). „The Start and Early History of Chemometrics: Selected Interviews. Part 2”. J. Chemometrics. 4 (6): 389—412. S2CID 221546473. doi:10.1002/cem.1180040604.
- ^ Barton, Bastian; Thomson, James; Lozano Diz, Enrique; Portela, Raquel (септембар 2022). „Chemometrics for Raman Spectroscopy Harmonization”. Applied Spectroscopy (на језику: енглески). 76 (9): 1021—1041. Bibcode:2022ApSpe..76.1021B. ISSN 0003-7028. PMID 35622984. S2CID 249129065. doi:10.1177/00037028221094070.
- ^ Franke, J. (2002). „Inverse Least Squares and Classical Least Squares Methods for Quantitative Vibrational Spectroscopy”. Ур.: Chalmers, John M. Handbook of Vibrational Spectroscopy. New York: Wiley. ISBN 978-0471988472. doi:10.1002/0470027320.s4603.
- ^ Brown, C. D. (2004). „Discordance between Net Analyte Signal Theory and Practical Multivariate Calibration”. Analytical Chemistry. 76 (15): 4364—4373. PMID 15283574. doi:10.1021/ac049953w.
- ^ Krutchkoff, R. G. (1969). „Classical and inverse regression methods of calibration in extrapolation”. Technometrics. 11 (3): 11—15. doi:10.1080/00401706.1969.10490714.
- ^ Hunter, W. G. (1984). „Statistics and chemistry, and the linear calibration problem”. Ур.: Kowalski, B. R. Chemometrics: mathematics and statistics in chemistry. Boston: Riedel. ISBN 978-9027718464.
- ^ Tellinghuisen, J. (2000). „Inverse vs. classical calibration for small data sets”. Fresenius' J. Anal. Chem. 368 (6): 585—588. PMID 11228707. S2CID 21166415. doi:10.1007/s002160000556.
- ^ Oliveri, Paolo (2017). „Class-modelling in food analytical chemistry: Development, sampling, optimisation and validation issues – A tutorial”. Analytica Chimica Acta (на језику: енглески). 982: 9—19. Bibcode:2017AcAC..982....9O. PMID 28734370. S2CID 10119515. doi:10.1016/j.aca.2017.05.013. hdl:11567/881059 .
- ^ Lawton, W. H.; Sylvestre, E. A. (1971). „Self Modeling Curve Resolution”. Technometrics. 13 (3): 617—633. doi:10.1080/00401706.1971.10488823.
- ^ Sylvestre, E. A.; Lawton, W. H.; Maggio, M. S. (1974). „Curve Resolution Using a Postulated Chemical Reaction”. Technometrics. 16 (3): 353—368. doi:10.1080/00401706.1974.10489204.
- ^ de Juan, A.; Tauler, R. (2003). „Chemometrics Applied to Unravel Multicomponent Processes and Mixtures. Revisiting Latest Trends in Multivariate Resolution”. Analytica Chimica Acta. 500 (1–2): 195—210. Bibcode:2003AcAC..500..195D. doi:10.1016/S0003-2670(03)00724-4.
- ^ de Juan, A.; Tauler, R. (2006). „Multivariate Curve Resolution (MCR) from 2000: Progress in Concepts and Applications”. Critical Reviews in Analytical Chemistry. 36 (3–4): 163—176. S2CID 95309963. doi:10.1080/10408340600970005.
- ^ Deming, S. N.; Morgan, S. L. (1987). Experimental design: a chemometric approach. Elsevier. ISBN 978-0444427342.
- ^ Bruns, R. E.; Scarminio, I. S.; de Barros Neto, B. (2006). Statistical design – chemometrics. Amsterdam: Elsevier. ISBN 978-0444521811.
- ^ Wentzell, P. D.; Brown, C. D. (2000). „Signal Processing in Analytical Chemistry”. Ур.: Meyers, R. A. Encyclopedia of Analytical Chemistry. Wiley. стр. 9764—9800.
- ^ Oliveri, Paolo; Malegori, Cristina; Simonetti, Remo; Casale, Monica (2019). „The impact of signal pre-processing on the final interpretation of analytical outcomes – A tutorial”. Analytica Chimica Acta (на језику: енглески). 1058: 9—17. Bibcode:2019AcAC.1058....9O. PMID 30851858. S2CID 73727614. doi:10.1016/j.aca.2018.10.055.
- ^ Olivieri, A. C.; Faber, N. M.; Ferre, J.; Boque, R.; Kalivas, J. H.; Mark, H. (2006). „Guidelines for calibration in analytical chemistry Part 3. Uncertainty estimation and figures of merit for multivariate calibration”. Pure and Applied Chemistry. 78 (3): 633—650. S2CID 50546210. doi:10.1351/pac200678030633 .
- ^ Illman, D. L.; Callis, J. B.; Kowalski, B. R. (1986). „Process Analytical Chemistry: a new paradigm for analytical chemists”. American Laboratory. 18: 8—10.
- ^ MacGregor, J. F.; Kourti, T. (1995). „Statistical control of multivariate processes”. Control Engineering Practice. 3 (3): 403—414. doi:10.1016/0967-0661(95)00014-L.
- ^ Martin, E. B.; Morris, A. J. (1996). „An overview of multivariate statistical process control in continuous and batch process performance monitoring”. Transactions of the Institute of Measurement & Control. 18 (1): 51—60. Bibcode:1996TIMC...18...51M. S2CID 120516715. doi:10.1177/014233129601800107.
- ^ Hirschfeld, T.; Callis, J. B.; Kowalski, B. R. (1984). „Chemical sensing in process analysis”. Science. 226 (4672): 312—318. Bibcode:1984Sci...226..312H. PMID 17749872. S2CID 38093353. doi:10.1126/science.226.4672.312.
- ^ Smilde, A. K.; Bro, R.; Geladi, P. (2004). Multi-way analysis with applications in the chemical sciences. Wiley.
- ^ Bro, R.; Workman, J. J.; Mobley, P. R.; Kowalski, B. R. (1997). „Overview of chemometrics applied to spectroscopy: 1985–95, Part 3—Multiway analysis”. Applied Spectroscopy Reviews. 32 (3): 237—261. Bibcode:1997ApSRv..32..237B. doi:10.1080/05704929708003315.
Literatura
[уреди | уреди извор]- Beebe, K. R.; Pell, R. J.; Seasholtz, M. B. (1998). Chemometrics: A Practical Guide. Wiley.
- Brereton, R. G. (2007). Applied Chemometrics for Scientists. Wiley.
- Brown, S. D.; Tauler, R.; Walczak, B., ур. (2009). Comprehensive Chemometrics: Chemical and Biochemical Data Analysis. 4 volume set. Elsevier.
- Gemperline, P. J., ур. (2006). Practical Guide to Chemometrics (2nd изд.). CRC Press.
- Kramer, R. (1998). Chemometric Techniques for Quantitative Analysis. CRC Press.
- Maeder, M.; Neuhold, Y.-M. (2007). Practical Data Analysis in Chemistry. Elsevier.
- Mark, H.; Workman, J. (2007). Chemometrics in Spectroscopy. Academic Press-Elsevier.
- Martens, H.; Naes, T. (1989). Multivariate Calibration. Wiley.
- Massart, D. L.; Vandeginste, B. G. M.; Deming, S. M.; Michotte, Y.; Kaufman, L. (1988). Chemometrics: A Textbook. Elsevier.
- Otto, M. (2007). Chemometrics: Statistics and Computer Application in Analytical Chemistry (2nd изд.). Wiley-VCH.
- Vandeginste, B. G. M.; Massart, D. L.; Buydens, L. M. C.; De Jong, S.; Lewi, P. J.; Smeyers-Verbeke, J. (1998). Hand book of Chemometrics and Qualimetrics: Part A & Part B. Elsevier.
Spoljašnje veze
[уреди | уреди извор]- An Introduction to Chemometrics (archived website)
- IUPAC Glossary for Chemometrics
- Homepage of Chemometrics, Sweden Архивирано 2016-01-20 на сајту Wayback Machine
- Homepage of Chemometrics (a starting point)
- Chemometric Analysis for Spectroscopy
- General resource on advanced chemometric methods and recent developments Архивирано 2017-09-22 на сајту Wayback Machine