Penggunaan Statistik Dalam BIS Konsep Dasar Penggambaran Data Mengukur Hubungan Covariance dan Correlation Optimasi
Konsep Dasar Analisis Data Data, Informasi, dan Knowledge Populasi dan Sampel Variabel dan Observasi Tipe Data (Value): Categorical and Numerical (event): Cross Sectional dan Time Ordered (Series)
Data, Informasi, dan Knowledge Data are building blocks of information. These are observations on entities (observation units). Variables are used to measure observations. Information is processed data (organized, summarized, analyzed and filtered) that are made meaningful and relevant to the situation/phenomenon being understood. Knowledge is the ability to apply/use information to decision situations. Meaning associated with information is knowledge …. Actionable Information! Proses Analisis Laporan Aplikasi Meaning Relevance
Statistical Inference Populasi dan Sampel Statistical Inference Sample: Subset of collection of all possible entities (observation units) Data on sample is what is available. KNOWN Statistik digunakan untuk mendeskripsikan sampel. Sampelnya bisa bervariasi. Population: Collection of all possible entities (observation units) Data on the whole population is usually not available. UNKNOWN Parameter digunakan untuk mendeskripsikan populasi. These are constants for a population. Statistical Inference is the art and science of drawing inferences/ conclusions about a population of interest. Statistical Inference is the process by which a characteristics/aspects of a population are understood (known). Conclusions about the population are drawn (inferred) based in the knowledge gained from the sample. A sample should be a good representation of the population.
Variabel dan Observasi Entitas tinggi (inche) berat (kg) usia (tahun) Sex (kategori) Person 1 Person 2 Person 3 * 67 61 72 170 120 220 33 38 62 Male Female O B S E R V A S I Variables are characteristics (aspects) of entities that are different for different entities. Observations on an entity are values of these characteristics that have been measured. So, a dataset is a collection of observations on a group (sample) of entities. Each row is an observation on a particular entity. Each column is an aspect or characteristic of individual entities (measured as variables). Pengukur
Tipe Data: Categorical dan Numerical We can do arithmetic on numerical data (age and salary). These data are actual measurements. Categorical data is qualitative. Sometimes qualitative data is coded. For example, opinion can be coded 1-5 and arithmetic (calculations) can be performed. Such data is ordinal (has implied order). State is a categorical variable and cannot be used for calculations. Such data are nominal. Numerical Categorical
Cross-sectional and Time Ordered
Tabel Frekuensi Tabel Frekuensi yang menunjukkan klasifikasi umur pengunjung suatu event. Class Frequency 10 but under 20 3 .15 15 20 but under 30 6 .30 30 30 but under 40 5 .25 25 40 but under 50 4 .20 20 50 but under 60 2 .10 10 Total 20 1 100 Relative Frequency Percentage Class is a range for the values of a variable. Frequency is the number of observations associated with a class. Relative Frequency is the proportion of observations (frequency) associated with a class.
Histogram Distribusi Frekuensi
Langkah Membuat Frequency Tables and Histograms Urutkan Data secara Ascending : 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Cari Range : 58 - 12 = 46 Tentukan jumlah kelas : 5 (biasanya 5 - 15) Hitung kelas interval (width): 10 (range/kelas = 46/5, dibulatkan) Tetapkan batasan kelas : 10, 20, 30, 40, 50 Cari Nilai tengah kelas: 15, 25, 35, 45, 55 Hitung observasi yang sesuai/berada dalam kelas
Scatter Plot for bivariate numerical data Menunjukkan relasi antara 2 variabel. Dapatkah yg satu digunakan untuk memprediksi yang lain ? Time-Series dan Analisis Regresi digunakan untuk memprediksi suatu nilai variabel berdasar variabel yang lain. Analisis Korelasi digunakan untuk mengukur kekuatan hubungan linear antar dua variabel.
Penggambaran Data: Summary Measures Mengukur Central Tendency (CT) Mean, Median, Mode Mengukur Variasi Range, Varian dan Standar Deviasi
Mean = x x + x + · · · + x = n Nilai rata-rata secara aritmatik : å x Ukuran CT yang paling banyak digunakan Dipengaruhi nilai Extreme (Outliers) x + x + · · · + n x x = å x = i 2 n i Sample Mean i = 1 n n 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Mean = 5 Mean = 6
Median Ukuran penting dari Central Tendency Nilai tengah dari n data yang diurutkan, If n is odd, the median is the middle number. If n is even, the median is the average of the 2 middle numbers. Tidak dipengaruhi Extreme Values 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14 Median = 5 Median = 5
Mode Mengukur Central Tendency Nilai yang paling banyak terjadi Tdak dipengaruhi Extreme Values Sesuai untuk data numerik maupun katori 0 1 2 3 4 5 6 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 No Mode Mode = 9
Mengukur Variasi Variasi Variance Standard Deviation Coefficient of Variation Range Population Variance Population Standard Deviation Sample Variance Sample Standard Deviation
Range Menentukan Variasi Beda antara observasi paling besar & paling kecil : Range = Abaikan bagaimana sebaran datanya : x - x La rgest Smallest Range = 12 - 7 = 5 Range = 12 - 7 = 5 7 8 9 10 11 12 7 8 9 10 11 12
Variance ) ( ) Pentingnya menentikan Variasi Shows Variation About the Mean: Untuk Populasi : Untuk Sample: ) 2 å (X - m s 2 = i N ( ) 2 å - X X s 2 = i n - 1 Untuk Populasi : gunakan N dalam denominator. Untuk Sample : gunakan n - 1 dalam denominator.
Standard Deviasi ( ) Paling penting menentukan Variasi Tunjukkan Variasi tentang Mean: Untuk Populasi: Untuk Sample: ( ) å X - m 2 s = i N ( ) å X - 2 X s = i n - 1 Untuk Populasi: gunakan N dalam denominator. Untuk Sample : gunakan n - 1 dalam denominator.
Sample Standard Deviation ( ) 2 For the Sample : use n - 1 in the denominator. - s å X X = i n - 1 Data: 10 12 14 15 17 18 18 24 n = 8 Mean =16 s = Sample Standard Deviation= 4.2426
Comparing Standard Deviations Data A Mean = 15.5 s = 3.338 11 12 13 14 15 16 17 18 19 20 21 Data B Mean = 15.5 s = .9258 11 12 13 14 15 16 17 18 19 20 21 Data C Mean = 15.5 s = 4.57 11 12 13 14 15 16 17 18 19 20 21
Coefficient of Variation Measure of Relative Variation Always a % Shows Variation Relative to Mean Used to Compare 2 or More Groups Formula ( for Sample):
Comparing Coefficient of Variation Stock A: Average Price last year = $50 Standard Deviation = $5 Stock B: Average Price last year = $100 Coefficient of Variation: Stock A: CV = 10% Stock B: CV = 5%
Shape Menggambarkan bagaimana data berdistribusi Mengukur kelancipan : Symmetric or skewed Left-Skewed Symmetric Right-Skewed Mean Median Mode Mean = Median = Mode Mode Median Mean
Mengukur Hubungan - Regresi
Least Squares Estimation Untuk mengetahui hubungan linier antara 2 variabel dapat dilakukan dengan menggambarkan garis lurus yang mendekati titik-titik pasangan nilai ke dua variabel tersebut. Membutuhkan proses secara sistematis dan tidak hanya garis random. Harus dipilih garis dimana jarak vertikal antara garis dan titik (residual) seminimal mungkin. Perlu dipilih garis yang memenuhi smallest sum of the squared residuals. Garis tersebut disebut least squares line.
Regression Dependent variable Independent variable (x)
Simple Linear Regression y’ = b0 + b1X ± є є Dependent variable (y) B1 = slope = ∆y/ ∆x b0 (y intercept) Independent variable (x)
Simple Linear Regression Prediction error: ε Observation: y ^ Prediction: y Zero For each observation, the variation can be described as: y = y + ε Actual = Explained + Error ^
Garis terbaik adalah garis dimana jumlah kuadrat dari residu ε adalah minimal
Regression Output Table
The Regression Output Persamaan Regresi Predicated Sales = 25.1264 + 0.7623Promote Interpretasi : Koefisien / slope 0.7623 menunjukkan bahwa index Sales akan cenderung meningkat sebesar 0,76 untuk setiap penambahan satu unit index pengeluaran promosi. Intercept tidak terlalu penting dalam analisis, nilai tersebut menunjukkan pengaruh diluar variabel promosi.
Multiple Regression Predicted Overhead = 3997 + 43.45MachHrs + 883.62ProdRuns
Interpretasi Persamaan Interpretasi dari persamaan tersebut adalah pada sejumlah produksi konstan maka overhead cost diperkirakan bertambah sebesar $43.54 untuk setiap penambahan 1jam extra machine; dan jika machine hours tetap, overhead diperkirakan meningkat $883.62 untuk setiap extra production run. Manajer dapat menintepretasikan $3997 sebagai componen tetap overhead diluar MachHrs and ProdRuns.
MODEL OPTIMASI EXTERNAL INPUTS OUTPUT MODEL DECISION INPUTS Model optimasi menjawab pertanyaan, “Nilai keputusan apa yang memberikan output terbaik?”
Optimasi muncul karena sumber daya yang terbatas. SCARCITY DECISION INPUTS CONSTRAINTS Optimasi muncul karena sumber daya yang terbatas.
LINEAR PROGRAMMING MODEL (objective function) 10x + 18y DECISION INPUTS CONSTRAINTS OUTPUT 2x + 6y < 150 x x + .8y < 40 x + 1.5y < 50 y Linear programming adalah contoh model optimasi dengan batasan persamaan linier dan memecahkan secara simultan untuk memaksimumkan atau meminimumkan fungsi tujuan.
EXAMPLE 1: BOB’S MUFFLER SHOP Bob memproduksi 2 jenis muffler, keluarga dan olahraga. Setiap muffler keluarga memberi keuntungan $ 10 dan setiap muffler olahraga $ 18. Angka-angka ini dikenal sebagai 'margin kontribusi' produk '. Keuntungannya ditentukan oleh 18s fungsi $ 10f + $, di mana f dan s adalah jumlah total dari setiap jenis knalpot dijual. Ini adalah fungsi tujuannya. Variabel keputusannya adalah berapa jumlah muffler keluarga dan olahraga untuk diproduksi setiap bulan. Dalam situasi tak terbatas, ia ingin menjual muffler olahraga sebanyak-banyaknya karena kontribusi mereka lebih tinggi. Namun ...
EXAMPLE 1: BACKGROUND Dalam rangka untuk menciptakan sebuah knalpot, Bob harus menggunakan braket, tukang, dan aluminium. Sumber daya yang dibutuhkan untuk masing-masing jenis: Family Sports Brackets 2.00 6.00 Labor hours 1.00 0.80 Max Alloy 1 1.5 Dalam hitungan bulan ia mengalam keterbatasan dalam sumber daya: Quantity Brackets 150 Labor hours 40 Max Alloy 50 Ini masalah konstrain.
EXAMPLE 1: Memodelkan konstrain sebagai Persamaan Linear Konstrain dapat dimodelkan sebagai persamaan linear: 2f + 6s ≤ 150 (brackets) f + .8s ≤ 40 (labor) 50f + 33.33s ≤ 50 (alloy) Bob juga memiliki kontrak yang luar biasa yang memaksa dia untuk memproduksi 5 muffler bergaya sport setiap bulan dan tahu, dari historis kinerja, bahwa permintaan muffler keluarga pada bulan tertentu tidak akan melebihi 35. Kendala ini dapat dimodelkan sebagai: f ≤ 35 (maximum demand) s ≥ 5 (contractual obligation) Fungsi obyektif (profit) adalah : 10f + 18s
EXAMPLE 1: GRAPHING A CONSTRAINT Situasi ini dapat direpresentasikan secara grafis. Pertimbangkan kendala yang dikenakan oleh kurung: 2f + 6s ≤ 150. Jika memproduksi nol muffler keluarga , perubahan persamaan untuk (0) f + 6s ≤ 150, yang mengurangi ke s ≤ 25. Jadi maksimal 25 muffler sporty dapat dibuat jika tidak ada muffler keluarga yang diuat. Demikian pula, 75 muffler keluarga dapat dibuat jika tidak ada muffler sporty diproduksi. Representasi grafis dari masalah diatas.
EXAMPLE 1: RANGE OF FEASIBILITY Titik dalam garis adalah scenario jika semua bracket digunakan. Area dibawah garis disebut Range of Feasibility karena mampu mengcover semua product mixs yang saling terkait. Sembarang titik yang diatas garis tidak fisibel karena Bob tidak mempunyai cukup bracket untuk membuat kombinasi muffler. Infeasible Point: (30 sport, 40 family) Range of Feasibility
EXAMPLE 1: GRAPHING ALL CONSTRAINTS Konstrain yang lain dapat ditambahkan dengan cara yang sama. 2f + 6s ≤ 150 (brackets) f + .8s ≤ 40 (labor) f + 1.5s ≤ 50 (alloy) f ≤ 35 (maximum demand) s ≥ 5 (contractual obligation)
EXAMPLE 1: THE COMPOSITE RANGE OF FEASIBILITY Range feasibility adalah area yang dikelilingi garis. 2f + 6s ≤ 150 (brackets) f + .8s ≤ 40 (labor) f + 1.5s ≤ 50 (alloy) f ≤ 35 (maximum demand) s ≥ 5 (contractual obligation) Range of Feasibility
EXAMPLE 1: POTENTIAL PROFIT LINES Fungsi laba akan membentuk garis dengan kemiringan -5 / 9, rasio kontribusi margin muffler keluarga untuk muffler olahraga. Setiap baris berhubungan dengan tingkat tertentu dari total keuntungan. Semakin jauh keluar garis, semakin besar jumlah laba. Total Profit: $100 $190 $280 $370 $460 $550
EXAMPLE 1: FEASIBLE PROFIT LINES Dengan menggabungkan garis keuntungan dengan kisaran kelayakan, Anda dapat mengidentifikasi garis laba tertinggi yang menyentuh titik layak.
EXAMPLE 1: OPTIMAL SOLUTION VIA GRAPHICAL METHOD The optimal point is a mix of 25 family mufflers and 16.67 sport mufflers. This combination will net Bob $550. Optimal point