Statistical Process Control using Support Vector Machines: A Case Study Stephanie Mayang P. 3333091115
ABSTRAK Pengendalian batas dalam tradisional Multivariate Quality Control Charts (MQCC), seperti diagram kontrol T2 Hotelling', Multivariate Cumulative Sum (MCUSUM) dan Multivariate Exponentially-Weighted Moving Average (MEWMA) merupakan peta kendali yang . didasarkan pada asumsi normal multivariat. Asumsi ini biasanya tidak puas, terutama dalam aplikasi kehidupan nyata. Tujuan dari bagan tertimbang Moving Control berdasarkan Support Vector Machine (SVM) dapat mengurangi ketergantungan peta kendali multivariat untuk asumsi normalitas, dan menyediakan efisien Statistical Process Control (SPC) tool, dengan kemampuan yang tinggi untuk menangani masalah data nyata. Akibatnya, Sun dan Tsung (2003) mengusulkan suatu "peta kendali kernel berdasarkan jarak", juga dikenal sebagai "bagan-k". Jadi, k-chart, yang diambil dari Statistik Teori Belajar, bisa dilihat sebagai suatu pendekatan baru dalam SPC. Makalah ini berfokus pada penerapan bagan-k ke proses industri. Penilaian dari bagan-k dianalisis dengan membandingkannya dengan peta kendali T2. Perbandingan ini didasarkan pada kriteria Average Run Length (ARL).
Dalam beberapa tahun terakhir, kontrol kualitas menjadi tugas yang penting dalam industri manufaktur, karena pentingnya konsep kualitas untuk para prodeusen dan konsumen. SPC dan terutama Control Chart adalah salah satu alat yang paling diterapkan dalam Quality Control. Dalam industri manufaktur, beberapa variabel kualitas dapat dikendalikan secara bersamaan dan MQCC yang paling tepat untuk situasi seperti itu. Bahkan MQCC tradisional, seperti peta kendali T2, diagram kontrol MCSUM dan grafik kontrol MEWMA, mengharuskan karakteristik kualitas yang mengikuti distribusi normal multivariat. Namun, hal ini mungkin tidak masuk akal dalam aplikasi kehidupan nyata banyak, dimana proses distribusi tidak diketahui. Berikut, Polansky (2001), dalam banyak proses distribusi variabel kualitas tidak diketahui dan tidak mudah diperkirakan secara akurat, terutama ketika jumlah sampel tidak cukup besar.
SVM untuk kelas biner SVM adalah algoritma pembelajaran terawasi statistik. Semua pada dasarnya adalah penggolong biner, yang dirancang untuk memisahkan dua kelas dari satu sama lain dan dapat digeneralisasi untuk masalah multi- class. SVM mempunyai kelas pengklasifikasi margin maksimum. Mereka melakukan pengenalan pola antara dua kelas dengan mencari permukaan keputusan yang memiliki jarak maksimum ke titik-titik terdekat pada training set, yang disebut Support Vector (SV). oleh Belajar Statistik Teori, teori belajar memberikan bataskesalahan generalisasi untuk model dipelajari. Se bagai Scholkopf (1998)dilambangkan, metode SVM san gat berguna dengan dua hal. Pertama, mereka cukup memuaskan
Konsep SVM terinspirasi Teori Statistik, teori belajar memberikan batas kesalahan generalisasi untuk model yang dipelajari. Menurut Scholkopf (1998), metode SVM sangat berguna dengan dua hal. Pertama, mereka cukup memuaskan dari sudut pandang teoritis. Kedua, mereka dapat menyebabkan kinerja yang tinggi dalam aplikasi praktis. Dengan demikian, SVM telah digunakan untuk menyelesaikan berbagai ,asalah, termasuk klasifikasi, pengenalan pola, regresi dan tugas peramalan time series.
Karakteristik SVM SVM menunjukkan ciri-ciri menarik yang membuat pemetaan data metode sukses. Dengan demikian, pemrograman kuadratik terdiri dari latar belakang matematika yang kuat untuk SVM. Dengan menggunakan beberapa prinsip seperti konvektivitas dan optimalitas dualitas, SVM memberikan solusi yang kompetitif. Selain itu, penggunaan metode kernel memungkinkan SVM menjadi teknik yang tepat untuk menangani dengan data nyata. Dengan demikian, fleksibilitas fungsi kernel memungkinkan SVM untuk mencari berbagai ruang hipotesis. Akibatnya, SVM menjadi metode praktis lebih banyak domain dan mereka tampil baik di aplikasi kehidupan nyata.
Konsep SVM Konsep SVM saham karakteristik penting yang sama dengan peta kendali. Ini adalah: • SVM adalah classifier biner yang memisahkan data k e dalam dua kelas: kelaspositif dan negatif. Juga, diagram kontrol membedakan antara dua kelas: di- kontrolkelas dan luar kelas-kontrol. • Diagram kontrol menentukan batas kendali memisahkan kedua negara (kelas in-control/out-of- control). Dengan demikian, kontrol batas di SVM, ditentukan oleh vektor dukungan (positif / kelas negatif). • Baik diagram kontrol dan SVM biasanya didasarkan pada fungsi keputusan dengan menggunakan prinsip statistik, minimalisasi risiko struktural di SVM dan batas kendali statistik dalam peta kendali.
Kontrol grafik berdasarkan pada SVM Sekilas dari bagan-k: Bagan kontrol berdasarkan SVM adalah peta kendali nonparametrik karena tidak memerlukan asumsi tentang proses distribusi. Bagan ini menggunakan pengertian tentang klasifikasi satu-kelas berdasarkan prinsip SVM. Dalam klasifikasi satu kelas, satu kelas data yang disebut kelas target menggambarkan dan mencirikan data, sedangkan kelas lainnya tidak. Menurut Tax dan Duin (2004), Support Vector Data Description (SVDD) sebagai pengklasifikasi satu-kelas berdasarkan prinsip SVM. Gagasan utama SVDD adalah untuk menyelubungi sampel oleh bola yang berisi maksimal data dengan volume terkecil.
Kontrol grafik berdasarkan pada SVM (lanjutan) Sun dan Tsung (2003) menggunakan teknik SVDD untuk mengajukan peta kendali berdasarkan SVM disebut: "kernel-jarak jauh berbasis peta kendali multivariat", juga dikenal sebagai "bagan-k". Ide-k chart mirip dengan peta kendali T2 untuk memantau dua variabel kualitas. Ketika pemantauan dua variabel independen menyusul distribusi normal bivariat, batas kendali berbentuk sebagai elips dengan sumbu vertikal atau horizontal (Minggu dan Tsung, 2003). Umumnya, dalam masalah kehidupan nyata, batas kendali mungkin tidak wajib elips, tetapi dapat disesuaikan dengan data nyata, memberikan bentuk yang lebih fleksibel disesuaikan dengan situasi apa pun. Berdasarkan ide ini, k-chart dapat memanfaatkan prinsip SVM, dengan menggunakan vektor dukungan untuk membangun batas kontrol. Hal ini tergantung pada sifat data riil menggunakan metode kernel daripada distribusi variabel.
Skema k-chart Pada tahap I, set data digunakan sebagai pelatihan ditetapkan untuk menentukan jarak kernel dan mendeteksi outlier, untuk membangun batas yang menyelubungi data target. Estimasi parameter adalah hasil dari solusi pemrograman kuadratik.Pada tahap I, praktisi harus memastikan bahwa data independen dan terdistribusi identik asumsi dasar untuk SVM. Pada tahap II, k-chart menentukan, jika sampel baru dalam pengendalian atau out-of-kontrol dengan membandingkan jarak masing-masing sampel dengan jarak kernel.Setiap sampel yang memiliki jarak yang lebih besar dari jarak kernel akan dianggap sebagai luar negara-kontrol dan sebaliknya.
Dalam literatur SPC, dua langkah yang paling penting dalam proses pemantauan kecenderungan proses pusat dan proses dispersi. Mean sampel adalah ukuran banyak digunakan untuk tendensi sentral, sedangkan parameter statistik yang menggambarkan keragaman dalam data yang diamati adalah rentang sampel dan deviasi standar sampel. Seperti metode SPC multivariat, kecenderungan k-chart tindakan dibahas pusat maupun dispersi dalam sebuah ruang yang multidimensional menggunakan kernel mengukur jarak. Mengingat bahwa transaksi k-chart dengan proses univariat dan multivariat dan bersama- sama memantau tindakan lokasi dan dispersi, yang k- chart dianggap sebagai alat baru yang bermanfaat bagi SPC.
Menurut definisi, k-chart memberikan volume tertutup batas minimum bola di sekitar data proses di-kontrol. Itu mengukur jarak antara pusat Kernel dan sampel baru yang masuk yang akan dimonitor, yang dapat dihitung dengan menggunakan vektor mendukung metode. K-chart menggunakan SVDD metode untuk membangun sebuah bola yang berisi data maksimum. Setiap titik di luar bola dianggap sebagai out of control. Aplikasi industri ini menunjukkan cara untuk merancang k-chart menggunakan data nyata. Fakta bahwa batas kontrol berdasarkan vektor dukungan, ini membuatnya lebih fleksibel untuk data yang nyata dan lebih sensitif terhadap perubahan kecil di vektor berarti seperti ditunjukkan dalam studi kasus.
Keuntungan K-Chart Pada kenyataannya, pameran k-chart beberapa keuntungan penting. Yang pertama adalah bahwa k-chart tidak membuat asumsi tentang distribusi data, yang merupakan pembatasan mendasar untuk grafik lainnya. Fitur yang kedua dari bagan-k adalah kemampuannya untuk menangani sejumlah besar variabel tanpa kehilangan efektivitas.
CONCLUSION K-chart adalah peta kendali nonparametrik menunjukkan keuntungan penting. Bahkan, k-chart adalah peta kendali yang sesuai untuk aplikasi data yang nyata. Dengan menggunakan vektor dukungan, penentuan batas kontrol dapat menjadi mungkin dengan proses distribusi dikenal dan tidak dikenal. Selain itu, transaksi k-chart dengan tingginya jumlah variabel menggunakan fungsi kernel. Selanjutnya, studi kasus nyata kami menunjukkan bahwa k-chart lebih sensitif terhadap perubahan kecil di vektor mean dari peta kendali T2. Fakta bahwa k-chart didasarkan pada jarak kernel meningkat kepekaannya. Namun, kelemahan utama dengan k-chart adalah penentuan negara di-kontrol untuk Tahap I. Dengan demikian, penentuan kelas satu yang optimal, yang merupakan dasar untuk k-chart, membuatnya sulit untuk menentukan sampel berada di kontrol. Bahkan, deskripsi data yang baik untuk pengklasifikasi SVDD memerlukan sejumlah besar sampel, yang dapat meningkatkan kemungkinan untuk mendapatkan sampel out-of-kontrol di Tahap I. Meskipun keuntungan dari bagan-k sebagai peta kendali termotivasi oleh mesin diawasi belajar, k-chart memerlukan penelitian lebih lanjut terutama penentuan kelas satu yang optimal dibutuhkan untuk pembangunan batas kendali.