KEMOMETRIK Prof Dr Ir Latifah K Darusman, MS
Mayoritas materi kuliah kali ini disadur dari oleh Richard G Introduction to Chemome Chemometrics trics oleh Brereton, Centre for Chemometrics University of Bristol United Kingdom
Sejarah Aplikasi Hubungan
Kemometrik dengan Disiplin Ilmu lainnya
Hirarki Pemakai Empat
building blocks
o Metode •
Desain eksperimen
•
Pengenalan pola
•
Kalibrasi
o Peranti lunak o Instrumentasi o Aplikasi Apa itu
Kemometrik
SEJARAH
•
Nama diusulkan pertama kali di awal tahun 1970an oleh kimiawan organik Swedia Svante Wold.
•
International Chemometrics Society – 1970an
•
Pertemuan internasional - Cosenza 1983
•
•
•
Jurnal : 1986 (Chemometrics and Intelligent Laboratory Systems) dan 1987 (J Chemometrics) Buku : pertengahan 1980an Courses : mainly at continuing professional development level in late 1980s.
DEFINISI •
Tidak ada definisi yang universal
•
Wold & Kowalski (1972) disiplin ilmu kimia yang menggunakan pendekatan matematika, statistika, dan metode lainnya dari logika formal untuk: - mendesain atau menyeleksi prosedur optimum untuk pengukuran dan percobaan - memperoleh informasi yang relevant secara maksimum dengan menganalisis data kimiawi
•
Saat ini definisi kemometrik beragam tergantung kelompok keilmuan yang mendalami
Chemometrics •
"Chemometrics has been defined as the application of mathematical and statistical methods to chemical measurements. " B. Kowalski, Anal. Chem. 1980, 52, 112R-122R.
•
"Chemometrics is the chemical discipline that uses mathematical and statistical methods for the obtention in the optimal way of relevant information on material systems." I. Frank and B. Kowalski, Anal. Chem.,1982, 54, 232R-243R.
Chemometrics •
•
"Chemometrics developments and the accompanying realization of these developments as computer software provide the means to convert raw data into information, information into knowledge and finally knowledge into intelligence." M. Delaney, Anal. Chem. 1984, 261R-277R. ...research in chemometrics will contribute to the design of new types of instruments, generate optimal experiments that yield maximum information, and catalog and solve calibration and signal resolution problems. All this while quantitatively specifying the limitations of each instrument as well as the quality of the data it generates." L. S. Ramos et al., Anal. Chem. 1986, 58, 294R-315R.
Chemometrics •
•
"Chemometrics, the application of statistical and mathematical methods to chemistry..." S. Brown, Anal. Chem., 1986, 60, 252R273R. "Chemometrics is the discipline concerned with the application of statistics and mathematical methods, as well as those methods based on mathematical logic, to chemistry." S. Brown, Anal. Chem. 1990, 62, 84R-101R.
Chemometric s •
•
•
•
"Chemometrics is the use of mathematical and statistical methods for handling, interpreting, and predicting chemical data." Malinowski, E.R.. (1991) F actor Analysis in Chemistry, Second E dition, page 1. "Chemometrics is the discipline concerned with the application of statistical and mathematical methods, as well as those methods based on mathematical logic, to chemistry." S. Brown et al., Anal. Chem. 1992, 64,22R49R.
Chemometrics •
•
"Chemometrics can generally be described as the application of mathematical and statistical methods to 1) improve chemical measurement processes, and 2) extract more useful information from chemical and physical measurement data." J. Workman, P. Mobley, B. Kowalski, R. Bro, Appl. Spectrosc. Revs. 1996, 31, 73-124. "Chemometrics is an approach to analytical and measurement science based on the idea of indirect observation. Measurements related to the chemical composition of a substance are taken, and the value of a property of interest is inferred from them through some mathematical relation." B.Lavine, Anal. Chem. 1998, 70, 209R-228R.
Chemometrics •
"Chemometrics is a chemical discipline that uses mathematics, statistics and formal logic (a) to design or select optimal experimental procedures; (b) to provide maximum relevant chemical information by analyzing chemical data; and (c) to obtain knowledge about chemical systems." Massart, D.L., et al.. (1997) Data H andling in Science and
Technology 20A: H andbook of Chemometrics and Qualimetrics Part A, page 1.
"The entire process whereby data (e.g., numbers in a table) are transformed into information used for decision making." Beebe, K. R., Pell, R. J., and M. B. Seasholtz. (1998) Chemometrics: A Practical Guide, page 1.
Chemometrics •
“Chemometrics (this is an international definition) is the chemical discipline that uses mathematical and statistical methods, (a) to design or select optimal measurement procedures and experiments; and (b) to provide maximum chemical information by analyzing chemical data.” Bruce Kowalski, in a formal CPAC presentation, December 1997
APLIKASI Selama ± 42 tahun, kemometrik telah banyak digunakan di Industri dalam proses analisis PAT
Process of Analytical Technology Pendekatan baru untuk mempertahankan kualitas menggunakan analisis multivariat (multirespon) on-line terhadap pengamatan percobaan
Digunakan secara rutin untuk proses dan kontrol kualitas
APLIKASI Untuk Kimia Analitik
kualitas dalam pengukuran respon kimiawi Banyak prosedur formal mencirikan kualitas
scientific approach
Spektrokopi
UV
reabilitas data
teori UV instrumentasi
Apakah betul reliable ? Kemometrik
limit deteksi
harus dibuktikan
pendekatan ilmu kimia tidak cukup
pendekatan statistika, matematika, logika formal
Banyak Grup dan Filosofi •
•
•
•
Sebagai bantuan untuk NIR. Sebagai subyek relevan yang luas untuk biologi, kimia, geologi, teknik dsb Sebagai bantuan untuk kimia analitis kuantitatif (kromatografi dan spektroskopi) As an throughout chemistry e.g. QSAR, molecular mechanics, spectroscopy.
•
Kimiawan Analitik
•
Statistikawan
•
Kimiawan Teknik
Perkembangan yang pesat
Ilmu Forensik
•
Biologi – metabolomik dsb
•
Ilmu klinis – diagnosis penyakit
•
Karakterisasi material
•
Pemantauan lingkungan
•
Teknologi fermentasi
•
Pemantauan reaksi
•
Optimisasi sintesis
•
Kimia analitis
•
BAGAIMANA KEMOMETRIK BERHUBUNGAN DENGAN DISIPLIN ILMU LAINNYA
Tema umum
Komputerisasi instrumen Kuantitas yang besar dari data yang tersedia, jutaan informasi dalam setiap hari Bagaimana mengatasinya? Menggunakan metode statistika dan komputasi
Computing
Analytical CHEMOMETRICS
Chemistry
Industrial
Applications among others
KIMIA ANALITIK berasas pengetahuan subyek – keterampilan dasar tertentu dan kemudian meningkatkan pengetahuan KEMOMETRIK LEBIH KEPADA SUBYEK BERBASIS KETERAMPILAN – tidak terlalu memerlukan pengetahuan yang sangat luas (metode), beberapa prinsip dasar yang umum saja akan tetapi harus memiliki pengalaman untuk meningkatkan kemampuan memecahkan masalah
SETIAP GRUP RISET MEMILIKI LATAR BELAKANG YANG BERBEDA DAN EKSPEKTASI BAGAIMANA KEMOMETRIK AKAN DIGUNAKAN ATAU DIPERKENALKAN Statistikawan memulainya dengan distribusi, uji hipotesis, dsb lalu mengembangkannya dari hal-hal tersebut. Mereka akan tidak puas jika matematika tak dapat menjelaskan Kimiawan teknik lebih suka mengawali dengan aljabar linear seperti matriks, dan pendekatan matematika lainnya tetapi tidak berminat terhadap distribusi dll
Ilmuwan komputer secara umum lebih tertarik pada algoritma
Kimiawan analitis mengetahui sedikit tentang statistika tetapi tidak terlalu perlu pemahaman mendalam pada matematika dan algoritma statistika kimia analitis. Difficult group karena kemampuan dalam menjalankan instrumen tidak harus sejajar dengan kemampuan matematika dan komputasinya Kimiawan organik tidak terlalu menyukai matematika dan sering menginginkan kemasan terautomasi yang langsung dapat digunakan. They often require elaborate courses that avoid matrices. The course an organic chemist would regard is good is one a statistician would regard as bad.
Hirarki Pengguna Mathematical sophistication
Theoretical statisticians.
First applications to chemical systems.
Applying and modifying methods, developing software.
Environmental, clinical, food, industrial, biological, physical, organic chemistry etc. etc.
Applications
Statisticians and Computer scientists
Chemical and Process engineers
Analytical, organic, environmental, biological, physical, industrial, archaeological, process etc.chemists
EMPAT BUI LDI NG BLOCKS 1. Metode 2. Peranti lunak 3. Teknik instrumental 4. Aplikasi
METODE Desain eksperimen (Experimental design ) Pengenalan pola (Pattern recognition ) Kalibrasi (Calibration )
MOTIVASI DALAM MENDESAIN Penapisan ( screening )
•
Menghemat waktu ( saving time)
•
Pemodelan kuantitatif (quantitative modelling )
•
Optimisasi
•
MENGAPA DESAIN EKSPERIMEN? Contoh: Optimisasi suatu reaksi melalui pH dan suhu Dapatkah kita menemukan kombinasi pH dan suhu yang memberikan hasil terbaik?
IMAGINARY RESPONSE SURFACE
•
Kita ingin menemukan kondisi optimum
•
Respon permukaan unknown
•
•
•
Mathematical Mathematical model may not be of o f interest interest in its own right Not necessarily interested in underlying molecular mechanism Reproducibility Reproducibility and flat optimum
One factor at a time strategy : may miss optima
KESULITAN Interaksi – respon tipa faktor tidak independen Suhu optimum pada pH 5 berbeda dengan pada pH 6
How to be on the safe side? Mencari kisi. 10 nilai pH, 10 nilai suhu, 100 eksperiment Kisi yang besar lalu ke yang lebih kecil
MASALAH
•
•
•
Menghabiskan banyak waktu dan mahal Many experiments we are almost certain are not near at optimum so are obviously a waste of time Reprodusibilitas dan galat eksperimental
KEMOMETRIK: DESAIN EKSPERIMEN & ANALISIS KOMPONEN UTAMA Prof Dr Ir Latifah K Darusman, MS
© 2008 BAGIAN KIMIA ANALITIK
Desain Eksperimen Desain eksperimen (rancangan percobaan) dapat digunakan untuk: • menentukan derajat interaksi diantara peubah dalam percobaan optimisasi percobaan • membangun model prediksi • merancang model kalibrasi multivariat
Desain Eksperimen Penggunaan di dalam ilmu kimia • Penapisan (screening ) - rancangan faktorial - faktorial parsial & rancangan PlackettBurman • Pemodelan (modelling ) & Optimisasi - rancangan permukaan respons - rancangan campuran
Desain Eksperimen Istilah • Peubah di dalam suatu percobaan secara umum di sebut faktor • Hasil atau nilai dari suatu percobaan disebut respons • Jadi rancangan percobaan akan meliputi:
metode
untuk menyelidiki pengaruh dari faktor yang berbeda terhadap respon dalam suatu percobaan
contoh: optimisasi univariat satu faktor tidak ada interaksi
misal: suhu kec reaksi
kuantitas pereaksi kemurnian produk
Desain Eksperimen
Desain Eksperimen
Desain Eksperimen
Desain Eksperimen Contoh: Untuk perancangan percobaan 1 faktor
2 level faktorial sempurna
Rancangan matriks:
Contoh perlakuan
faktor
Desain Eksperimen 2 faktor
2 level faktorial sempurna
Rancangan matriks:
Contoh perlakuan
faktor
Desain Eksperimen 3 faktor
2 level faktorial sempurna
Rancangan matriks:
Contoh perlakuan
faktor
Desain Eksperimen 2 faktor
3 level faktorial sempurna
Rancangan matriks:
Contoh perlakuan
faktor
Desain Eksperimen Contoh: rancangan percobaan untuk penentuan nitrogen total dari contoh tanah dengan metode Kjeldahl Peubah: asam/campuran asam yang digunakan katalis yang digunakan suhu destruksi waktu destruksi
Jadi 4 faktor, bila masing-masing 2 level N = 24 = 16 satuan percobaan Bila membuat rancangan sederhana: 2 faktor (suhu dan katalis) & 2 level
Desain Eksperimen Hasil Set 1
% total N
katalis A katalis B Set 2
suhu (0C) 230 260 3,5 3,0 2,5 2,0
% total N
katalis A katalis B
suhu (0C) 230 260 4,0 3,0 2,0 4,0
Desain Eksperimen Set 1:
efek katalis ? = -1,0% total N efek suhu ? = -0,5% total N
Set 2: efek interaksi suhu 1% A 2% B
katalis 1,5% total N
efek interaksi > efek utama Perlu rancangan lebih baik dalam menentukan level
input
pengetahuan kimia
perubahan rancangan univariat multivariat
FACTORIAL DESIGN Digunakan
untuk menentukan faktor (x) yang paling berpengaruh terhadap respon atau hasil (y) Menggunakan 2 level untuk setiap faktor (namun dapat dikembangkan menjadi lebih dari 2) Level diberi simbol -1 (level bawah) dan +1 (level atas) Jumlah eksperimen (N) = lf l adalah jumlah level dan f adalah jumlah faktor Eksperimen
Faktor 1
Faktor 2
Faktor 3
1
-1
-1
-1
2
+1
-1
-1
3
-1
+1
-1
4
+1
+1
-1
5
-1
-1
+1
6
+1
-1
+1
7
-1
+1
+1
8
+1
+1
+1
Respon
FULL FACTORIAL DESIGN Contoh Evaluasi pengaruh suhu, waktu ekstraksi, dan pH terhadap rendemen ekstraksi kafein dari oba sakit kepala Jumlah faktor 3 faktor ᵒC Level suhu 30 dan 45 waktu 30 dan 60 menit pH 5 dan 7
Jumlah eksperimen (N) = (2) 3 =8
Eksperimen
suhu
waktu
pH
1
-1
-1
-1
2
+1
-1
-1
3
-1
+1
-1
4
+1
+1
-1
5
-1
-1
+1
6
+1
-1
+1
7
-1
+1
+1
8
+1
+1
+1
FACTORIAL DESIGN
Kelemahan: Jumlah eksperimen besar Jika faktor 10, N =210 = 1024
Fractional factorial design
Respon
fAK Eksperimen
suhu
waktu
pH
1
30
30
5
2
45
30
5
3
30
60
5
4
45
60
5
5
30
30
7
6
45
30
7
7
30
60
7
Respon
Desain Eksperimen Faktorial fraksional mengurangi ukuran satuan percobaan tanpa mengurangi kebaikan respon banyak metode antara lain metode Yates
X
Jadi
X
rancangan perlu ditentukan sebelum bekerja/ melangsungkan percobaan/penelitian dipilih: - univariat - multivariat
FRACTIONAL FACTORIAL DESIGN Mengurangi
jumlah eksperimen pada factorial design Pengurangan jumlah eksperimen ½, ¼, 1/8 dari jumlah eksperimen pada fractional design FACTORIAL DESIGN FRACTIONAL FACTORIAL
Eksperimen
Faktor 1
Faktor 2
Faktor 3
1
+1
+1
+1
DESIGN
2
+1
+1
-1
Eksperimen
Faktor 1
Faktor 2
Faktor 3
3
+1
-1
-1
1
+1
+1
+1
4
+1
-1
-1
2
+1
-1
-1
5
-1
+1
+1
3
-1
-1
+1
6
-1
+1
-1
4
-1
+1
-1
7
-1
-1
+1
8
-1
-1
-1
FRACTIONAL FACTORIAL DESIGN Contoh Evaluasi pengaruh suhu, waktu ekstraksi, dan pH terhadap rendemen ekstraksi kafein dari oba sakit kepala Jumlah faktor 3 faktor ᵒC Level suhu 30 dan 45 waktu 30 dan 60 menit pH 5 dan 7
Jumlah eksperimen factorial design (N) = (2) 3 = 8 Jumlah eksperimen fractional factorial design =1/2 X 8 = 4 Eksperimen
Suhu
Waktu
pH
1
45
60
7
2
45
30
5
3
30
30
7
4
30
60
5
MIXTURE DESIGN Digunakan
saat jumlah seluruh faktor (campuran faktor) konstan (100%) Biasa digunakan untuk design campuran pelarut ekstraksi, fase gerak kromatografi, atau campuran komponen
2 faktor
3 faktor
4 faktor
MIXTURE DESIGN Saat digunakan 3 faktor, design dapat mengikuti bentuk: Simplex centroid Simplex lattice Simplex centroid with axial design
Simplex centroid design
MIXTURE DESIGN Contoh
Ekstraksi asiaticosida dari pegagan dilakukan dengan menggunakan campuran 3 pelarut, yaitu metanol, air, butanol. Campuran palarut yang paling optimal
mixture
design
Jika digunakan simplex centroid design, kombinasi pelarut sbb:
metanol
metanol
butanol
air
Contoh
Ekstraksi asiaticosida dari pegagan dilakukan dengan menggunakan campuran 3 pelarut, yaitu metanol, air, butanol. Jika digunakan simplex lattice design, kombinasi pelarut sbb:
Contoh
Ekstraksi asiaticosida dari pegagan dilakukan dengan menggunakan campuran 3 pelarut, yaitu metanol, air, butanol. Jika digunakan simplex centroid with axial design, kombinasi pelarut sbb: Metanol
Air
Experiment
Butanol
Metanol
Air
Butanol
1
1
0
0
2
0
1
0
3
0
0
1
4
1/2
1/2
0
5
1/2
0
1/2
6
0
1/2
1/2
7
1/3
1/3
1/3
8
1/6
2/3
1/6
9
1/6
1/6
2/3
10
2/3
1/6
1/6
Desain Eksperimen - univariat
Statistika
- multivariat
Kimia
karakter respon pereaksi multirespon unirespon
suhu dll instrumen: UV?, IR?, NMR?, HPLC?, CE?, LC-MS?, GC-MS?
Kalibrasi: univariat
multivariat Pengenalan pola (pattern recognition)
Konsep Statistika Konsep statistika yang penting untuk kimiawan • statistika deskriptif
dari suatu pengukuran dapat dijelaskan secara numerik kita mencatat absorbans dari contoh dapat dikemukakan trend utama rerata standar deviasi dibuat grafik dst
• distribusi
normal binomial
Konsep Statistika • uji hipotesis uji t dan F • batas kepercayaan dapat dipercaya: 99%, 95%, ……..dst • pencilan diluar kisaran data yang diterima teknik ? uji Q untuk rerata • kontrol kualitas aplikasi statistika pada suatu proses • galat
- galat acak dan sistematiik - jenis galat proses a.l galat sampling sumber-sumber galat!
• derau pada instrumen - secara statistika tipe galat - kimiawan harus tahu instrumen yang dipakai
Pengenalan Pola • Publikasi kemometrik pertama & paling banyak • Pada dasarnya kimiawan mengetahui respons suatu percobaan dengan mengamati dan menentukan pola • Contoh: dapatkan spektrum IR mengklasifikasikan senyawa: keton? ester? dapat
dapatkah golongan flavonoid?
apakah gugus fungsinya? khas? hanya satu?
- struktur umum? - struktur kimia?
Pengenalan Pola dapatkah
kromatogram digunakan untuk menentukan asal-usul temulawak? Sukabumi? Semarang? secara kimiawi
? – senyawa ? – standar ?
Pertanyaan
dijawab secara kimia tidak dapat langsung kemometrik
Pengenalan Pola Metode yang digunakan untuk pengenalan pola kimia EDA (Exploratory Data Analysis)
- teknik PCA (P rincipal C omponent Analysis) – AKU ( Analisis Komponen Utama) - teknik FA (F actor Analysis) – AF ( Analisis Faktor) Statistika mulai berkembang dari Biologi dan Psikologi
metabolomik genomik proteomik
Psikometrik
Pengenalan Pola Kimia data yang digunakan data kasar: spektroskopi/kromatografi Contoh: untuk mengetahui senyawa yang berperan dalam komunikasi antar hewan dapat dilihat dari urin senyawa
kimia
?? Banyak hewan
standar ? berapa banyak ? kalau jumlah kecil ?? standar adisi ??
EDA dari kromatogram sampel urin perbedaan jenis: jantan/betina senyawa utama
dll
Pengenalan Pola Unsupervised Pattern Reconition
metode formalnya cluster analysis (analisis gerombol) bedanya dengan EDA tujuan metode adalah mendeteksi kemiripan ( similarity ) sedangkan EDA tidak memihak eksplorasi data
bisa mirip, beda, sama Supervised Pattern Recognition
umumnya ditujukan untuk klasifikasi
Apakah Spektroskopi IR dapat menentukan suatu sampel suatu jaringan terdapat sel kanker atau tidaknya?
Pengenalan Pola Pengembangan metode membuat spektrum IR dari 2 grup yang terdapat sel kanker dan tidak
diolah dengan model matematika prediksi sampel unknown
Teknik supervised
memerlukan set training
dapat menggunakan respon kimia: spektrum/kromatogram
Pengenalan Pola Tujuan PCA • Mendeskripsikan set data menggunakan beberapa variabel laten daripada variabel seluruh pengukuran • Variabel pengukuran → pH, absorbans pada panjang gelombang tertentu, suhu, dsb • Variabel laten (komponen utama/ principal components) mewakili struktur dasar pada data
Pengenalan Pola Kegunaan PCA • Klasifikasi sampel sampel menjadi grup yang umum • Deteksi ouliers pada set data • Pemodelan data • Seleksi variabel baik untuk klasifikasi maupun pemodelan
Pengenalan Pola Representasi geometri data
Dengan variabel pengukuran K memerlukan dimensi sebanyak sebanyak K K
Pengenalan Pola Sampel dengan variabel dua dimensi (dua variabel pengukuran)
Dua kelompok sampel 1, 2, 3 4, 5, 6 O merepresentasikan merepresentasikan sentroid dari data nilai tengah tiap variabel
Pengenalan Pola Memproyeksikan data pada “sumbu yang baru”
Pengenalan Pola Data diproyeksikan pada PC1 dan PC2
• pengelompokan data terlihat pada PC1, tidak pada PC2 • semua informasi dalam representasi dua dimensi ada dalam PC1 • panjang PC1 >> panjang PC2
Pengenalan Pola Bagimana memilih PC1?
Pengenalan Pola Ukuran variasi
Ukuran variasi dari proyeksi data pada sumbu yangbaru
Ukuran variasi residual data
Memilih PC1 agar memaksimalkan istilah ini, untuk memaksimalkan variasi data yang terproyeksi pada sumbu yang baru Ingat: sumbu yang baru kemudian dipilih dari distribusi sampel dalam variable space
Pengenalan Pola Bagaimana memilih sumbu subsekuen, PC2 • Sumbu subsekuen (PC2) dipilih: – memaksimalkan variasi residual variasi yang tertinggal dalam data setelah menghitung PC1 – sumbu ini terletak pada sudut kanan (orthogonal) terhadap PC1
Set data dengan lebih dari 2 variabel • Komponen utama (PC) yang pertama terpilih untuk memaksimalkan variasi dalam data • PC subsekuen terpilih – memaksimalkan variasi residual – be orthogonal to all other PC’s
Pengenalan Pola PCA dengan tiga variabel
Pengenalan Pola Hubungan antara komponen utama dan pengukuran variabel (2-dimensi)
Pengenalan Pola Hubungan antara komponen utama dan pengukuran variabel (3-dimensi)
Secara umum dapat ditulis
dengan nilai c a,k disebut LOADING
Pengenalan Pola Komponen Utama (PC) • Tiap komponen utama menggambarkan arah dalam ruang dalam pengukuran variabel • PC dihasilkan dari distribusi sampel di dalam variable space • Tiap PC merupakan kombinasi linear dari seluruh variabel pengukuran: loading • Semua PC adalah orthogonal. • Tiap PC menggambarkan variasi yang lebih kecil dari PC sebelumnya • Maksimum K PC’s untuk setiap set data
Pengenalan Pola Deskripsi matematika PCA
Pengenalan Pola PCA X = T⋅PT + E X : matriks data (N × K) T : matriks skor (N × A) PT : matriks loading ( A × K ) E : matriks residual (N × K ) dengan A merupakan jumlah PC yang digunakan untuk membuat model
Pengenalan Pola Jika kita mengamati X dapat menduga C & S E 0
skor loading
Pengenalan Pola Loading
loading menunjukkan hubungan antara komponen utama dan variabel pengukuran asli loading dapat digunakan untuk menentukan hubungan yang ada di antara variabel pengukuran
Pengenalan Pola Skor (Scores)
Scores are the values that a particular sample has for a given PC Scores show the relationships between samples
Pengenalan Pola Eigenanalysis Vektor loading (komponen utama dan baris PT pada matriks) merupakan eigenvectors dari matriks XT·X, yang berhubungan dengan eigenvalues ( ) ditunjukkan oleh pa Nilai eigen (eigenvalues) berhubungan dengan komponen utamanya yang proporsional dengan varians yang terhitung oleh komponen utama, i.e., 1 > 2 > ….> k Vektor skor (kolom dari matriks T) adalah eigenvectors matriks X ·XT ditunjukkan oleh ta
Pengenalan Pola Contoh kerja: suatu matriks data kasar
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola
Pengenalan Pola Leverage Sampel dengan leverage yang tinggi mempunyai efek tak semestinya pada model PCA yang dihasilkan. Leverage dihitung untuk semua sampel dan tiap PC Possibly due to being an outlier. Jika sampel mempunyai leverage dan varians residual sampel yang tinggi maka dapat dianggap outlier Leverage, hn, bervariasi dari 0 (tidak ada efek pada model) sampai 1 (mempengaruhi secara total model yang dihasilkan)
Pengenalan Pola
Pengenalan Pola Simpulan PCA • Principal components represent new axes in the space of the measurement variables. • As PC’s are determined from the distribution of the samples in the variable space, they reflect the underlying structure of the data. • Usually, many fewer PC’s than variables are required to model the Data • Loadings:- represent the relationship between the measurement variables and the PC’s • Scores:- values that the samples take on using the PC’s as the new “variables”. • Eigenvalue:- a number, associated with a PC, that is proportional to the variance in the data described by that PC.
KALIBRASI Prof Dr Ir Latifah K Darusman, MS
© 2008 BAGIAN KIMIA ANALITIK
Pendahuluan • Kimia Analitik
menentukan kadar gula dalam darah spektroskopi A [ ] pada maks y = a + bx A
Teknik
[ ]
kalibrasi satu titik kalibrasi multititik
univariat
• Contoh lain Kimia Fisik membuat model dari suatu reaksi sebagai fungsi suhu menentukan laju reaksi kalibrasi mencari hubungan faktor & respon yang sesuai orde 0, 1, 2, dst
Pendahuluan Univariat dan Multivariat Univariat: penentuan pigmen klorofil dengan detektor UV pada KCKT Multivariat: penentuan suatu ekstrak flavonoid (multikomponen dengan multistandar) pada KCKT UV, diode array
Kalibrasi Univariat • Kalibrasi klasik x = bc atau x = b0 + b1c • Kalibrasi terbalik
c = ax atau c = a0 + a1x
Kalibrasi Univariat Hubungan antara kalibrasi klasik dan kalibrasi terbalik Bila tidak ada pencilan harus sejalan
Persamaan Kalibrasi Dapat lebih mudah dimengerti bila disajikan dalam bentuk matriks
a = konstanta atau skalar c = vektor konsentrasi x = vektor pengukuran (A)
Kalibrasi Multivariat • Banyak digunakan terutama: untuk menganalisis campuran dengan teknik spektroskopi • Pada dasarnya dalam Kimia The Chemistry of mixture merupakan hal yang penting & paling banyak dihadapi • Contoh: - Farmasi mensintesis obat sulit 100% murni (ada 1% isomer dll) - mendeteksi? - efek? - Lingkungan komposisi udara di dalam pabrik tercemar? mendeteksi? efek? - Deteksi konvensional --- OK --- lama & mahal
campuran?
Kalibrasi Multivariat Contoh: Analisis campuran bahan (3 bahan dalam contoh) dengan spektroskopi UV
Kalibrasi Multivariat
Kalibrasi Multivariat Problem istilah vektor X C1S1 + C2S2 + C3S3
X = campuran spektrum vektor masing-masing C1 = konsentrasi 1 dst
S1 = spektrumnya X S.C
menentukannya??
seperti univariat, tetapi diukur pada berbagai teknik analitiknya ada syaratnya Digunakan pada pengukuran
pengukuran simultan
Kalibrasi Multivariat Multiple Linear Regression (MLR) MLR
CLS: Classical Least Square ILS: Inverse Least Square
Contoh: pada spektroskopi analisis campuran suatu seri dari campuran spektrum Dicirikan: (a) spektrum masing-masing komponen X C.S + E
(b) konsentrasi masing-masing komponen (c) derau (galat eksperimental)
matriks X misalkan terdiri dari 30 spektrum UV dari reaksi A B + C
model kalibrasi:
C X reaksi. S
Kalibrasi Multivariat Principle Component Regression (PCR) PCR dalam analisis campuran digunakan untuk mengidentifikasi beberapa komponen dalam campuran Contoh: menentukan kadar senyawa karsinogenik di dalam air laut, tetapi tidak ada data atau tidak ingin diketahui data tentang identitas senyawa dan konsentrasi masing-masing Cara: Tahap 1
memperoleh seri spektrum (set kalibrasi/set training) spektrum UV dari 20 sampel discanning pada 200
matrik = X = 20 x 200
Kalibrasi Multivariat Tahap 2
menjalankan PCA terhadap spektrum
diperoleh matrik skor dan loading T & P menentukan jumlah PC?
dibantu dengan perkiraan jumlah senyawa dalam campuran bila diduga 10 10 PC/AKU ukuran matrik T 20 x 10
P 10 x 200 secara statistika leave one out (LOO) cross validation
Kalibrasi Multivariat Tahap 3
tahap regressi, transformasi atau rotasi dalam hal kalibrasi menentukan hubungan antara skor dengan konsentrasi yang sebenarnya dari masing senyawa
C=Tr ada 10 PC C = t1r 1 + t2r 2 + ……+ t10r 10 C & T diketahui r = T+. C
Bila senyawa banyak C C (dalam matrik) C = T.R
Kalibrasi Multivariat
Kalibrasi Multivariat Partial Least Square (PLS) PCR KU dihitung pada blok matrik X dan tidak ikut diperhitungkan pada blok matrik C PLS komponen diperoleh dengan menggunakan blok data matrik X dan C secara simultan dengan harapan dapat memaksimumkan covariance diantara dua blok
Pada PCA memaksimumkan variance pada blok matrik X PLS bertujuan untuk menemukan suatu variabel yang dapat memaksimumkan XC berasumsi bahwa terdapat galat pada kedua blok matrik yang keduanya sama penting
Kalibrasi Multivariat Sebagai contoh: bila kita mengkalibrasi galat dapat ada pada konsentrasi juga pada absorbans/spektrum Persamaan PLS dua persamaan:
X = T.P + E C = T.q + f
T skor orthogonal P loading orthogonal dinormalkan
Kalibrasi Multivariat Kualitas model ditentukan: ukuran galat (jumlah kuadrat C dan f) PLS dimungkinkan untuk menentukan kebaikan model dari data yang dimodelkan baik menggunakan matrik blok C atau X
Galat pada C biasanya yang lebih diperhatikan
Kalibrasi Multivariat PLS1 PLS2 matrik blok C terdiri lebih dari satu variabel
campuran 3 komponen C matrik dengan 3 kolom
persamaan pada blok C C = T.Q + F untuk analitik begitu baik, tetapi pada QSAR akan lebih menguntungkan
Kalibrasi Multivariat PLS2 dapat digunakan dengan variabel C yang banyak satu model
PLS1 harus masing-masing variabel C PLS dapat digunakan juga dari pengenalan pola terawasi ( supervised pattern recognition) Bagaimanakah mengukur kebaikan kalibrasi model yang tepat • autoprediksi • cross-validation • test-sets • bootstrap
Rudi Heryanto
The use of FT-IR technique in herbal medicine quality control: A tutorial
Kimia Analitik FMIPA IPB
Segments of quality Control – Identification of adulterants – Differentiation of herbal medicines with multiple sources – Determination of the best harvesting time – Confirmation of collection sites – Assessment of processing methods – Quality evaluation of herbal parts – Identification and quantitative determination of proprietary products – Stability test of proprietary products – Diagnosis of herbal intoxication
Chemometrics … Fingerprint 0,35 0,3 IVNF1-1 0,25
K32I10
s n a 0,2 b r o s b
LC17-2 PS1-4
0,15
PS4-16
A
SLW8-1
0,1
U22-2 0,05 0 3996 3659 3321 2984 2646 2309 1971 1634 1296
Bilangan Gelombang
959
621
Information
Spektroskopi FTIR • Spektra FTIR Representasi khas dari suatu sistem kimia • Cepat • Nondestructive • Reagentless • High-throughput analysis of a diverse range of sample types
FTIR for QC : The strategy Dendrogram with Complete Linkage and Euclidean Distance 0.00
y 33.33 t i r a l i m i S 66.67
100.00
1 4 3 4 7 4 8 6 7 3 5 4 9 6 9 3 7 4 2 5 0 3 6 4 5 6 8 4 4 4 6 5 L_ G_ L H_ L H_ N P_ K _ K _ G_ R _ G_ J K _ D R _ N_ M P_ N_ L H_ K P M T G S M C S M S M _ S _ T J _ M N G D T G _ T _ D_ N _ R _ R _ G_ D R _ G S N G M D_ R D G_ _ _ _ A R A W S B G N G K R S M N G K D B G K D P N S M K R P N P N B G R W W Observations
Sample preparation
Spectra collection and Prepocessing
Validation
Data analysis : Classification and Discrimination
FTIR for QC : The Procedure
• Collect specimens – Number of specimens : ~ 15 per specimen or more
• Measure corresponding IR spectra – ATR, Drift : raw material or extracts – Abs FTIR : extracts
FTIR for QC : The Procedure
Raw material
Ethanol extract
The detail of FTIR absorption spectra of ethanol extract (C urcuma long a) was better than FTIR spectra from powder of raw material
FTIR for QC : The Procedure
a
b
c Optimisation for IR spectra collection IR IR spectra of ethanol extract (a) resolution 4 cm -1, scanning rate 32 (b) resolution 8 cm -1, scanning rate 32, (c) resolution16 cm -1, scanning rate 32.
FTIR for QC : The Procedure • Designate two-thirds of the total number of spectra as the calibration set and the remaining one-third of spectra as the validation set • Preprocess spectra – Baseline correction: to flatten the baseline (or the baseplane) and make it equal to zero – Normalization : to bring their peaks to comparable heights – Smoothing – Derivative
FTIR for QC : The Procedure
Original Spectra
After Baseline correction and Normalization
FTIR for QC : The Procedure • Choose modeling method (e.g. PCA, PLS-DA, SIMCA) • Generate models ranging in complexity from a very few variables (wavelength terms for MLR; factors for PLS-DA, PCA) to many variables • Identify outliers and correct or remove as appropriate • Recalibrate models with outliers removed • Evaluate standard errors of calibration and cross-validation for each model and plot as a function of the number of variables in the model
FTIR for QC : The Procedure
UNSCRAMBLER from CAMO
Example … • Differentiation of C urcuma long onga a, C urc urcum uma a x ant nthorr horrhiza hiza and Zin Zingg i ber ca c as s umun umuna ar by Fourier-Transform Infrared Spectroscopy • Researchers : M. Rafi, E. Rohaeti, UD Syafitri, LK Darusman • Problems : Curcuma longa, longa, Curcuma xanthorrhiza, xanthorrhiza, and Zingiber cassumunar are are belong to the family of Zingiberaceae and therefore contain some common bioactive chemical compounds such as curcuminoids. Traditionally, authentication or differentiation of these herbs mainly depends on smell, taste and appearance of the plants. If they are pulverized as powder or cut into slice, the differentiation becomes more difficult • Objectives : to develop a rapid analytical method using Fourier transform infrared spectroscopy to differentiate of these herbs
Example … Z. cassumunar
C. longa
C. xanthorrhiza
Wave number
~3400 cm-1 3000 cm-1 1740 – –1680 1680 cm-1 1600 dan 1475 cm-1 1260 – –1000 1000 cm-1
OH C-H C=O C=C C-O
Example …
Cluster analysis for Z. cass ummunar , C. long a, dan C. xanthorrhiza
Example …
Plot PCA (▲) Bangle ( ) kunyit (■) temulawak PC1 = 60% dan PC2 = 15%
Example …
Canonic plot from PLS-DA result Z. cas s ummunar , C. long a, dan C. xanthorrhiza
Example … 7.5 K
K K
5.0
2.5
C _K
2 N A C
C _T
0.0 B
C _B
B
T
-2.5
B T
T T
-5.0 -15
-10
-5
0
5
10
CAN1
Canonic plot from PLS-DA validation Z. cas s ummunar (B ) , C. long a (K ) , dan C. xanthorrhiza (T)