Sabtu, 11 Februari 2012

Analisis Diskriminan

Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi (contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dalam kasus lain, lebih dari dua kelompok yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis diskriminan mampu menangani baik dua kelompok atau beberapa kelompok (tiga atau lebih). Ketika dua klasifikasi yang terlibat, teknik ini disebut sebagai dua kelompok analisis diskriminan. Ketika tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut sebagai analisis diskriminan ganda (MDA).
Analisis diskriminan melibatkan menurunkan suatu variat. Diskriminan variat adalah kombinasi linear dari variabel independen dua (atau lebih) yang akan membedakan terbaik antara obyek (orang, perusahaan, dll) dalam kelompok didefinisikan suatu priori. Diskriminasi dicapai dengan menghitung bobot untuk masing-masing variate variabel independen untuk memaksimalkan perbedaan antara kelompok (yaitu varians antara kelompok relatif terhadap varians dalam kelompok). Para variate untuk analisis diskriminan, juga dikenal sebagai fungsi diskriminan, berasal dari persamaan seperti yang terlihat pada regresi berganda. Dibutuhkan bentuk sebagai berikut:
Z_jk=a+W_1 X_1k+W_2 X_2k+ … +W_n X_nk
dimana
Z_jk = diskriminan Z skor diskriminan j fungsi untuk objek k
a = intercept
W_i = bobot diskriminan untuk variabel independen i
X_i = variabel independen i untuk objek k

Analisis diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis bahwa kelompok berarti satu set variabel independen untuk dua atau lebih kelompok yang sama. Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok tertentu, kita sampai pada kelompok rata-rata. Kelompok rata-rata ini disebut sebagai suatu titik berat. Ketika analisis melibatkan dua kelompok ada dua centroid, dengan tiga kelompok ada tiga centroid, dan sebagainya. Para centroid menunjukkan letak paling khas dari setiap anggota dari kelompok tertentu, dan perbandingan dari centroid kelompok menunjukkan seberapa jauh kelompok-kelompok yang dalam bentuk adalah fungsi diskriminan.
Uji untuk signifikansi statistik dari fungsi diskriminan adalah ukuran umum dari jarak antara centroid kelompok, dihitung dengan membandingkan distribusi dari skor diskriminan untuk kelompok. Jika tumpang tindih cukup besar, fungsi adalah diskriminator yang buruk antara kelompok-kelompok. Dua distribusi skor diskriminan ditunjukkan pada gambar 1 lebih menggambarkan konsep ini. Diagram atas mewakili distribusi skor diskriminan untuk fungsi yang memisahkan kelompok-kelompok dengan baik, menunjukkan tumpang tindih minim (daerah yang diarsir) antara kelompok. Diagram bawah menunjukkan distribusi skor diskriminan pada fungsi diskriminan yang merupakan diskriminator relatif miskin antara kelompok A dan B. daerah yang diarsir tumpang tindih merupakan contoh di mana misclassifying objek dari grup A ke kelompok B dan sebaliknya dapat terjadi.


2.2 HAL-HAL POKOK TENTANG ANALISIS DISKRIMINAN
Tujuan Analisis Diskriminan
Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah :
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen, atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan anggota grup 2.
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
Melakukan klasifikasi terhadap objek (dalam teminologi SPSS disebut baris), apakah suatu objek (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk grup 1 atau grup 2, atau lainnya.
Syarat-Syarat yang harus Dipenuhi untuk Menggunakan Teknik Analisis Diskriminan
Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus kategorikal dan berskala nominal.
Variabel bebas terdiri lebih dari dua variabel dan berskala interval.
Semua variabel prediktor sebaiknya mempunyai distribusi normal multivariat, dan matrices variance-covariance dalam kelompok harus sama untuk semua kelompok
Keanggotaan kelompok diasumsikan ekseklusif, maksudnya tidak satupun kasus yang termasuk dalam kelompok lebih dari satu. dan exhaustive secara kolektif, maksudnya semua kasus merupakan anggota satu kelompok
Tidak ada korelasi antar variabel independen. Jika dua variabel independen mempunyai korelasi yang kuat, dikatakan terjadi multikolinieritas.
Multivariate normality, atau variabel independen seharusnya berditribusi normal. Jika tidak berdistribusi normal, hal ini akan menyebabkan masalah pada ketetapan fungsi (model) diskriminan. Regresi Logistik (Logistc Regression) bisa dijadikan alternative metode jika memang data tidak berdistribusi normal.
Matriks kovarians dari semua variabel independen seharusnya sama (equal.)
Tidak adanya data yang sangat ekstrem (outlier) pada variabel independen. Jika ada data outlier yang tetap diproses, Hal ini bisa berakibat berkurangnya ketetapan klasifikasi dari fungsi diskriminan.
Proses Dasar dari Diskriminan Analisis
Proses dasar analisis diskriminan meliputi :
Memisah variabel-variabel menjadi variabel dependen dan variabel independen.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua metode dasar untuk itu, yaitu:
SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara bersama-sama kemudian dilakukan proses diskriminan.
STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model, dan ada kemungkinan satu atau lebih variabel independen yang ‘dibuang’ dari model.
Menguji signifikasi dari fungsi diskriminan yang telah terbentuk, menggunakan Wilk’s Lambda, Pilai, F-test dan lainnya.
Menguji ketetapan klasifikasi dari fungsi diskriminan, termasuk mengetahui ketepatan klasifikasi secara individual dengan Casewise Diagnotics.
Melakukan interpretasi terhadap fungsi diskrimminan tersebut.
Melekukan uji validasi fungsi diskriminan.
Jumlah Sampel pada Analisis Diskriminan
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam variabel independen, seharusnya minimal ada 6x5=30 sampel.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni analysis sampel yang digunakan untuk Fungsi Diskriminan, serta holdout sample (split sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70 sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analisis sample dibandingkan dengan hasil fungsi diskriminan dari holdout sample, apakah terjadi perbedaan yang besar atau tidak. Jika ketetapan klasifikasi kedua sampel hampir sama besar, dikatakn fungsi diskriminan dari analisis sampel sudah valid. Inillah yang disebut proses validasi silang (Cross Validation) dari fungsi diskriminan.
Model dari Analisis Diskriminan
Analisis diskriminan termasuk dalam multivariate dependence method, dengan model :
Y1 = X1+X2+…..+Xn
Non metriks Metrik
Keterangan :
Variabel Independen (X1 dan Seterusnya) adalah data metrik, yakni data berjenis interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat besi dalam tubuh, dan seterusnya.
Variabel Dependen (Y1) adalah data kategorikal atau nominal, seperti golongan miskin (kode 1), golongan menengah (kode 2), golongan kaya (kode 3) dan sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (missal kode 1 untuk daerah banjir dan kode 2 untuk daerah non banjir), maka model bisa disebut Two-Group Discriminant Analysis. Sedang jika kode lebih dari dua kategori disebut dengan Multiple Discriminant Analysis.
Dari keterangan di atas, perhatikan adanya perbedaan dalam penempatan data yang sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara langsung sekian tahun (17 tahun, 32 tahun dan sebagainya), maka data tersebut adalah rasio dan otomatis diperlakukan sebagai variabel independen. Namun, jika usia seseorang dilakukan penggolongan, dan dimasukkan dalam kategori-kategori tertentu, seperti jika usia seseorang antara 15-20 tahun, ia digolongkan Remaja, di atas 20 tahun digolongkan dewasa, maka data seseorang yang berusia 17 tahun tidak ditulis ‘17’, namun akan ditulis Remaja. Data hasil kategorisasi ini adalah data nominal dan termasuk variabel dependen.
Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau independen tergantung bagaimana data tersebut akan diperlakukan, langsung diinput apa adanya atau dilakukan penggolongan.
2.3 PROSES PENGAMBILAN KEPUTUSAN UNTUK ANALISIS DISKRIMINAN
Tahap 1 Tujuan dari Analisis Diskriminan
Kajian dari tujuan untuk menerapkan analisis diskriminan lebih lanjut harus mengklarifikasi sifatnya. Analisis diskriminan dapat mengatasi salah satu tujuan penelitian sebagai berikut
menentukan apakah ada perbedaan statistik yang signifikan antara profil rata skor pada satu himpunan variabel untuk dua (atau lebih) kelompok didefinisikan priori.
menentukan yang mana dari perhitungan variabel independen yang paling terjadinya perbedaan dalam profil skor rata-rata dua atau lebih kelompok.
menetapkan jumlah dan komposisi dimensi diskriminasi antara kelompok-kelompok yang terbentuk dari himpunan variabel independen
menetapkan prosedur untuk mengklasifikasikan objek (individu, perusahaan, produk, dll) ke dalam kelompok berdasarkan skor mereka pada sekumpulan variabel independen
Tahap 2 Desain Penelitian untuk Analisis Diskriminan
memilih variabel dependen dan independen
ukuran sampel
pembagian sampel
Tahap 3 Asumsi Analisis Diskriminan
dampak pada estimasi dan klasifikasi
dampak pada interpretasi
Tahap 4 Estimasi dari Model Diskriminan serta Menilai Kesesuaian secara Keseluruhan
memilih metode estimasi
signifikansi statistik
menilai secara keseluruhan sesuai dengan model
casewise diagonistic
Tahap 5 Interpretasi Hasil
bobot diskriminan
diskriminan beban
parsial nilai F
interpretasi dari dua atau lebih fungsi
metode interpretatif yang digunakan
Tahap 6 Validasi Hasil
validasi prosedur
membuat profil perbedaan kelompok

2.4 APLIKASI DALAM MENGANALISIS MODEL DISKRIMINAN
Perumusan masalah
Rumuskan permasalah yang akan dianalisis meliputi penentuan variabel independen dan variabel dependen.
Uji variabel
Menguji apakah ada variabel yang berbeda secara nyata antara satu variabel dengan variabel lain. Menentukan variabel independen mana yang mempengaruhi variabel dependen. Menguji varians dari setiap variabel.
Melakukan analisis diskriminan
Menentukan model diskriminan dari permasalahan yang ada. Menguji ketepatan pengklasifikasian model.
Contoh kegunaan Fungsi Diskriminan




Tidak ada komentar:

Posting Komentar