4- Classification: Logistic Regression 9 September 2015 Intro to Logistic Regression.

Slides:



Advertisements
Presentasi serupa
Pengujian Hipotesis.
Advertisements

EXODUS 6:6-8 6 THEREFORE SAY TO THE CHILDREN OF ISRAEL: ‘I AM THE LORD; I WILL BRING YOU OUT FROM UNDER THE BURDENS OF THE EGYPTIANS, I WILL RESCUE YOU.
Review : Invers Matriks
Materi 7 ARRAY Processing
PERSAMAAN DIFERENSIAL (DIFFERENTIAL EQUATION)
KUSWANTO, SUB POKOK BAHASAN Mata kuliah dan SKS Manfaat Deskripsi Tujuan instruksional umum Pokok bahasan.
Delivery/Inform/Convey Information with Facebook An Introduction of Information and Communication Technology.
BAB. 3 Analisis Laporan Keuangan
Korelasi Linier KUSWANTO Korelasi Keeratan hubungan antara 2 variabel yang saling bebas Walaupun dilambangkan dengan X dan Y namun keduanya diasumsikan.
(Rancangan Petak Terbagi)
Proses Stokastik Semester Ganjil 2013/2014
Presented By : Group 2. A solution of an equation in two variables of the form. Ax + By = C and Ax + By + C = 0 A and B are not both zero, is an ordered.
Menulis Kolom  Kolom adalah opini atau artikel. Tidak seperti editorial, kolom memiliki byline.  Kolom Biasanya ditulis reguler. Biasanya mingguan atau.
MENGOLAH DATA MENGGUNAKAN SPSS
Pendugaan Parameter Proporsi dan Varians (Ragam) Pertemuan 14 Matakuliah: L0104 / Statistika Psikologi Tahun : 2008.
Manajemen Pembiayaan Bank Syariah
Psikologi Konsumen. Perilaku konsumen Adalah studi tentang konsumen, mengenai mempertukarkan sesuatu yang bernilai dengan produk atau jasa yang memuaskan.
Pertemuan 07 Peluang Beberapa Sebaran Khusus Peubah Acak Kontinu
HAMPIRAN NUMERIK SOLUSI PERSAMAAN NIRLANJAR Pertemuan 3
Simple Regression ©. Null Hypothesis The analysis of business and economic processes makes extensive use of relationships between variables.
1 Pertemuan 11 OPTIMASI KINERJA Matakuliah: H0434/Jaringan Syaraf Tiruan Tahun: 2005 Versi: 1.
REGRESI LINIER SEDERHANA (SIMPLE LINEAR REGRESSION)
1 HAMPIRAN NUMERIK SOLUSI PERSAMAAN LANJAR Pertemuan 5 Matakuliah: K0342 / Metode Numerik I Tahun: 2006 TIK:Mahasiswa dapat meghitung nilai hampiran numerik.
Expectation Maximization. Coin flipping experiment  Diberikan koin A dan B dengan nilai bias A dan B yang belum diketahui  Koin A akan memunculkan head.
-Do you have a close friend? Does she/he have a problem? -What do you say when she/he tells her/his problem? - Did you ever come to your friend house?
Penyelidikan Operasi Pemrograman Dinamik Stokastik.
LOGISTIC REGRESSION Logistic regression adalah regressi dengan binary untuk variabel dependen. Variabel dependen bersifat dikotomi dengan mengambil nilai.
Jartel, Sukiswo Sukiswo
Aplikasi Rekursif.
Portofolio Capm.
ANALISIS DATA KATEGORIK
Cartesian coordinates in two dimensions
Cartesian coordinates in two dimensions
Statistika Chapter 4 Probability.
PENDIDIKAN KARAKTER DALAM MATA PELAJARAN FISIKA SMA
Matakuliah : I0014 / Biostatistika Tahun : 2005 Versi : V1 / R1
Content Structure.
Presentasi Statistika Dasar
Parabola Parabola.
Review Operasi Matriks
Portofolio Campuran.
PENDUGAAN PARAMETER Pertemuan 8
Pemrograman Berorientasi Objek
FISIKA DASAR By: Mohammad Faizun, S.T., M.Eng.
Pendugaan Parameter (II) Pertemuan 10
REGRESI LOGISTIK BINER (DICHOTOMOUS INDEPENDENT VARIABLE)
Manajemen Pembiayaan Bank Syariah
PERSAMAAN DIFERENSIAL (DIFFERENTIAL EQUATION)
REGRESI LINIER SEDERHANA (SIMPLE LINEAR REGRESSION)
Fungsi Kepekatan Peluang Khusus Pertemuan 10
Manajemen Proyek Perangkat Lunak (MPPL)
PENGUKURAN RISIKO PENYAKIT
Pertemuan 4 CLASS DIAGRAM.
Analisis Korelasi dan Regresi Berganda Manajemen Informasi Kesehatan
DATA MINING with W E K A.
Pertemuan 21 dan 22 Analisis Regresi dan Korelasi Sederhana
Ukuran Akurasi Model Deret Waktu Manajemen Informasi Kesehatan
Welcome 8clicks Pte Ltd. About us  8CLICKS PTE LTD is best web Development Company in Singapore. It is famous for their web designing services. 8CLICKS.
Things You Need to Know Before Running on the Beach.
Don’t Forget to Avail the Timely Offers with Uber
Story of Successful Events, How Visions Becomes Reality.
Suhandi Wiratama. Before I begin this presentation, I want to thank Mr. Abe first. He taught me many things about CorelDRAW. He also guided me when I.
Simultaneous Linear Equations
REGRESI LINIER SEDERHANA (SIMPLE LINEAR REGRESSION)
Right, indonesia is a wonderful country who rich in power energy not only in term of number but also diversity. Energy needs in indonesia are increasingly.
Al Muizzuddin F Matematika Ekonomi Lanjutan 2013
Vector. A VECTOR can describe anything that has both MAGNITUDE and DIRECTION The MAGNITUDE describes the size of the vector. The DIRECTION tells you where.
"More Than Words" Saying I love you, Is not the words, I want to hear from you, It's not that I want you, Not to say but if you only knew, How easy, it.
WINTER Template COLOUR CARD 01 Template. PowerPoint chart object 02.
Wednesday/ September,  There are lots of problems with trade ◦ There may be some ways that some governments can make things better by intervening.
Transcript presentasi:

4- Classification: Logistic Regression 9 September 2015 Intro to Logistic Regression

From linear to logistic regression

Introduction to Logistic Regression

BUILDING A LINEAR MODEL FOR BINARY RESPONSE DATA

The LOGISTIC MODEL

Logistic Regression Approach Learning 1. Transform initial input probabilities into log odds (logit) 2. Do a standard linear regression on the logit values This effectively fits a logistic curve to the data, while still just doing a linear regression with the transformed input (ala quadric machine, etc.) Generalization 1. Find the value for the new input on the logit line 2. Transform that logit value back into a probability

Logistic Regression Approach Could use linear regression with the probability points, but that would not extrapolate well Logistic version is better but how do we get it? We do a non-linear pre-process of the input and then do linear regression on the transformed values – do a linear regression on the log odds prob. Cured prob. Cured 0 1

Non-Linear Pre-Process to Logit (Log Odds) Medication Dosage #CuredTotal Patients Probability: # Cured/Total Patients DosageCured 20yes 20no 20no 20no 20no 30yes 30yes 30no 30no 30no 30no 40yes 40yes 40yes 40yes 40no 40no 50yes 50yes 50yes 50yes 50yes 50yes 50no

Non-Linear Pre-Process to Logit (Log Odds) Medication Dosage # Cured Total Patients Probability: # Cured/Total Patients Odds: p/(1-p) = # cured/ # not cured Logit: ln(Odds) Cured Not Cured prob. Cured

Regression of Log Odds Medicatio n Dosage # Cured Total Patients Probability: # Cured/Total Patients Odds: p/(1-p) = # cured/ # not cured Log Odds: ln(Odds) y =.11x – Logit (linear)regression equation Now we have a regression line for log odds (logit) To generalize, we interpolate the log odds value for the new data point Then we transform that log odds point to a probability: p = e logit(x) /(1+e logit(x) ) = 1/(1+e -logit(x) ) For example assume we want p for dosage = 10 Logit(10) =.11(10) – 3.8 = -2.7  p(10) = e -2.7 /(1+e -2.7 ) = 0.06 [note that we just work backwards from logit to p] These p values make up the sigmoidal regression curve prob. Cured

ESTIMATION IN R

Error Rate

Error Type Generalization

ROC Curve receiver operating characteristics

Kuis3-College.csv 1. Ikuti langkah (a), (b), (c) dalam ISLR chp. 2 exercise Buat sebuah variabel college2, yang berisi kopian data dari college. 3. Gunakan fungsi cor() untuk melihat kaitan antar semua atribut numerik dalam dataset tsb 1. Atribut apa sajakah yang memiliki korelasi kuat dengan atribut ‘Apps’ dan ‘PhD’. Berikan alasan. 2. Apakah kedua atribut tersebut saling mempengaruhi? Berikan alasan. 4. Gunakan regresi linear untuk menebak bagaimana ‘Apps’ mempengaruhi ‘PhD’. Berikan komentar. 5. Analisis dengan menggunakan regresi linear dan plot(): 1. Kaitan antara ‘Outstate’ dan ‘Grad.Rate’ 2. Kaitan antara ‘Accept’ dan ‘S.F.Ratio’ 3. Kaitan antara ‘Top10perc’ dan ‘Grad.Rate’

Tugas2: Aplikasi dengan R-API & Logistic Regression (Kumpul 23 September 2015) 1. Buatlah rancangan fungsionalitas dan tampilan untuk aplikasi Anda, bisa dimulai dengan: 1. Analisis data : summary, tipe data 2. Regresi linear : kaitan antar atribut, probabilitas dan interval keyakinan 3. Regresi logistik: prediksi kelas 2. Contohkan bagaimana R dapat digunakan dari aplikasi yang dikembangkan dengan bahasa pemrograman tingkat tinggi, seperti Java/C# 1. Bagaimana koneksi dilakukan? 2. Bagaimana fungsi R dipanggil? 3. Bagaimana hasil ditampilkan?

Tugas2 PasienEmosiTerapiSerangan Buat tabel logit terhadap atribut Terapi. 2.Bentuklah regresi linear dari hasil logit tersebut. Tuliskan persamaan linear yang dihasilkan! 3.Bentuklah model logistik dengan data. Apakah persamaan logit yang dihasilkan bersesuaian dengan nomor 2? 4.Model linear atau logistik-kah yang lebih baik, mengapa? Berikan contoh! 5.Berapakah nilai Odds Ratio yang terbentuk untuk atribut Terapi tersebut? Menurut Anda, apakah arti (bukan definisinya, lho!) dari Odds Ratio yang terbentuk tersebut terhadap data? 6.Coba dengan menyertakan atribut Emosi. Bagaimanakah efeknya terhadap model yang dihasilkan? Apakah memiliki akurasi yang lebih baik dibanding no. 3? Mengapa?

Logistic Regression Practical Work The Stock Market Data Logistic Regression Model glm() Held out train-test Confusion matrix