A. AWAL MULA ISTILAH STATISTIKA
Istilah “statistika” sebenarnya berasal dari bahasa
Latin modern, statisticum collegium, yang berarti “dewan negara”, dan
dari bahasa Italia, statista, yang berarti “negarawan” atau “politikus”.
Gottfried Achenwall yang
disebut-sebut sebagai orang pertama yang menggunakan istilah tersebut. Ia, pada
tahun 1749, menggunakan istilah “Statistik” dalam bahasa Jerman dalam
tulisannya yang berjudul Staatsverfassung der heutigen vornehmsten
Europäischen Reiche und Völker im Grundrisse. Dalam tulisannya tersebut ia
memberi nama “Statistik” sebagai nama bagi kegiatan analisis data kenegaraan,
dengan mengartikannya sebagai “ilmu tentang negara (state)”. Para ekonom
Jerman menyebut dia sebagai “Bapak Statistika”. Namun para penulis Inggris
tidak setuju dengan hal ini. Di Inggris sendiri, terdapat Sir John Sinclair yang
merupakan orang pertama yang menggunakan istilah “Statistics” dalam bahasa
Inggris. Ia memperkenalkan istilah “Statistics” dalam tulisannya, Statistical
Account of Scotland, yang diterbitkan dalam 21 volume (1791-1799). Pada
volume XX, halaman xiii, Sir John Sinclair menulis,
“Many people were at first surprised at my using
the words “statistical” and “statistics”, as it was supposed that some in our
own language might have expressed the same meaning. But in the course of a very
extensive tour through the northern parts of Europe, which I happened to take
in 1786, I found that in Germany they were engaged in a species of political
enquiry to which they had given the name “statistics,” and though I apply a
different meaning to that word—for by “statistical” is meant in Germany an
inquiry for the purposes of ascertaining the political strength of a country or
questions respecting matters of state—whereas the idea I annex to the term is
an inquiry into the state of a country, for the purpose of ascertaining the
quantum of happiness enjoyed by its inhabitants, and the means of its future
improvement; but as I thought that a new word might attract more public
attention, I resolved on adopting it, and I hope it is now completely
naturalised and incorporated with our language.”
Dari tulisannya tersebut, terbukti kalau Sir John
Sinclair mengadopsi kata “Statistics” yang dia ketahui ketika melakukan
perjalanan ke Jerman. Namun terdapat perbedaan antara keduanya. Di Jerman,
istilah itu merujuk kepada suatu metode yang digunakan dalam hal politik dan
kenegaraan, seperti misalnya untuk mengukur kekuatan politik dan menganalisis
data-data kenegaraan. Sir John Sinclair menggunakan istilah ini (statistics)
sebagai suatu metode untuk mengumpulkan data atau fakta di lapangan yang
bersifat numerik.
Jadi awalnya, statistika digunakan dalam ranah
perpolitikan untuk menganalisis data kenegaraan dan menjadi bergeser artinya
sebagai metode untuk mengumpulkan data lapangan yang bersifat numerik.
B. AWAL MULA PERKEMBANGAN STATISTIKA
Perkembangan statistika diawali sebagai suatu ilmu yang membahas
cara-cara mengumpulkan angka sebagai hasil pengamatan menjadi bentuk yang lebih
mudah dipahami. Contoh tertua mengenai hal ini dapat diambil dari zaman
Kaisar Agustus yang membuat pernyataan bahwa seluruh dunia harus dikenai pajak,
sehingga setiap orang harus melapor kepada statistikawan terdekat, yang saat
itu disebut sebagai pengumpul pajak. Peristiwa lain di dalam sejarah yang
dapat dikemukakan ialah sewaktu William I dari Inggris memerintahkan mengadakan
pencacahan jiwa dan kekayaan di seluruh wilayah Inggris dan Wales untuk
pengumpulan pajak dan tugas militer. Semua pengamatan dicatat di dalam
sebuah buku yang dikenal dengan Domesday Book.
Dari keperluan semacam ini timbullah teknik pencatatan angka-angka
pengamatan dalam bentuk daftar dan grafik. Bagian statistika yang membicarakan
cara mengumpulkan dan menyederhanakan angka-angka pengamatan ini dikenal
sebagai statistika deskriptif. Statistika deskriptif dapat berkembang tanpa
memerlukan dasar matematika yang kuat, selain kecermatan dalam teknik
berhitun
Sejak tahun 1700-an analisis data yang dilakukan secara deskriptif
berdasarkan tabel-tabel frekuensi, rataan, dan ragam untuk sampel (contoh)
ukuran besar. Kemudian pada tahun 1800-an merupakan awal penggunaan
grafik-grafik untuk penyajian data, seperti histogram, sejalan dengan penemuan
sebaran (kurva) Normal. Florence
Nightingale adalah seorang perawat yang terkenal dengan inovasi di
bidang ilmu keperawatan dan merupakan pelopor dalam penyajian data secara
grafik. Selama perang Krimea, Nightingale
mengumpulkan data dan membuat sistem pencatatan. Dari data tersebut dapat
ditentukan tingkat mortalitas yang dapat menunjukkan hasil perbaikan kondisi
kesehatan yang cenderung menurunkan tingkat kematian. Selanjutnya data-data
tersebut disajikan dalam bentuk grafik yang merupakan suatu inovasi statistika (deskriptif)
di masa tersebut.
Dalam statistika deskriptif tidak ada perbedaan antara data yang diperoleh
dari sampel dengan populasinya, kemudian apa yang dihitung dari sampel
digunakan untuk menandai populasi. Pada taraf selanjutnya orang tidak puas hanya
mengumpulkan angka-angka pengamatan saja. Mereka juga tidak puas bahwa yang
diperoleh dari sampel digunakan untuk mencirikan populasi. Timbullah
usaha-usaha untuk memperbaiki kesimpulan dalam melakukan ramalan-ramalan
populasi berdasarkan angka-angka statistik yang dikumpulkan dari sampel
tersebut. Bagian ilmu yang membahas cara-cara mengambil kesimpulan berdasarkan
angka-angka pengamatan dinamakan statistik induktif.
C. SEJARAH PERKEMBANGAN STATISTIKA INDUKTIF
Awal perkembangan statistik induktif terjadi pada
peralihan abad ke 19 ke abad 20 dengan Karl Pearson (1857 – 1936) sebagai
pelopornya. Masa ini merupakan titik awal perkembangan statistika modern. Pada
abad ke 19 Karl Pearson menerapkan statistika pada biologi yang diterbitkan
dalam jurnal Biometrika. Dari tahun 1893 sampai 1912 Karl Pearson telah
menulis 18 paper yang berjudul konstribusi matematika ke teori evolusi yang
berbasiskan analisis regresi dan koefisien korelasi. Pearson menciptakan
istilah standard deviation (simpangan baku) pada tahun 1893. Dalam
statistika deskriptif Pearson juga memperkenalkan ukuran penyimpangan terhadap
distribusi data yang simetrik yang disebut koefisien kemiringan dan kurtosis.
Pada tahun 1900 Karl Pearson menemukan uji Khi-Kuadrat untuk tabel kontigensi 2
arah. Dalam menarik kesimpulan tentang korelasi dan uji khi-kuadrat. Pearson
menggunakan sampel besar (n>1000). Analisis data yang digunakan Pearson
mengasumsikan data menyebar Normal. Sehingga pada Biometrika vol. 1 yang terbit
tahun 1901 sebagian besar penelitiannya menggunakan ukuran contoh besar.
Sebelum tahun 1912 sedikit sekali penemuan dibidang
pengujian hipotesis sampai akhirnya W.S. Gosset (1876 – 1937) memperkenalkan
uji t-student untuk sampel kecil. Gosset adalah seorang mahasiswa dari Karl
Pearson pada awalnya adalah seorang ahli kimia yang bekerja di perusahaan bir Guinness
di Dublin. Gosset menemukan uji-t untuk menangani sampel-sampel kecil untuk
quality control di perusahaan bir tersebut. Dia menerbitkan papernya dengan
nama student pada jurnak Biometrika 1908 untuk menghindari larangan dari
perusahaan bagi karyawannya yang menulis didalam sebuah jurnal. Bentuk sebaran
secara matematis yang digunakan Gosset tersebut sebenarnya telah ditemukan oleh
astronom Jerman Jakob Luroth pada tahun 1875. Gosset menggunakan data hasil
pengukuran terhadap tinggi dan jari tengah tangan kiri 3000 narapidana yang
dipublikasikan pada volume pertama Biometrika. Dengan metode Monte carlo
dipilih 750 sampel yang berukuran 4 dan diperoleh distribusi data yang
mendekati distribusi teotriknya. Sebaran t-student banyak dipakai sebagai acuan
dalam menduga parameter rataan ukuran contoh kecil (n < 30).
Metode estimasi parameter
populasi yang digunakan sebelum tahun 1912 adalah metode kuadrat
terkecil yang dikemukakan oleh Gauss dan metode deviasi mutlak terkecil yang
dikemukakan Laplace. Kedua metode ini digunakan untuk mengestimasi parameter
dalam model linier. Kemudian karl Pearson memperkenalkan metode momen untuk
estimasi parameter pada tabel frekuensi.
Statistik induktif mulai berkembang pesat setelah R.A
Fisher (1890 – 1962) menulis paper yang sangat terkenal pada tahun 1922 yaitu
On the Mathematical Foundation of theoritical Statistics (Mallows, 1998).
Fisher memperkenalkan istilah specification untuk mengidentifikasi 3 problem
yang muncul pada reduksi data, yaitu:
- Spesifikasi dari jenis populasi, yaitu bentuk matematis dari populasi yang mencakup parameter yang tidak diketahuii
- Estimasi, yaitu pemilihan metode statistik untuk mengestimasi parameter dari populasi, dan
- Sebaran, yaitu sebaran statistik dari contoh atau sampel.
Tulisan tersebut memperkenalkan suatu metode yang tekenal
dengan nama Maximum Likelihood yang digunakan untuk estimasi dan
pengujian hipotesis.
Pada tahun 1925 terbit buku Statistical methods for
Research Workers karangan Fisher yang berisi rancangan percobaan dan
anilisis varians di bidang biologi. Fisher yang cara berfikirnya dipengaruhi
aliran statistika yang dianut Karl Pearson, yaitu penarikan kesimpulan
didasarkan pada model peluang (model-driven) merupakan promotor penggunaan
cara-cara statistika di dalam bidang-bidang ilmu pertanian, biologi dan
genetika. Untuk jasanya ini Fisher dianugerahi gelar Baronet oleh Ratu
Inggris, sehingga ia berhak menggunakan nama Sir Ronald Fisher. Konstribusi
Fisher membuat cakupan metode pengembangan yang sesuai untuk sampel kecil,
seperti Gosset, penemuan presisi sebaran dari beberapa statistik sampel dan
penemuan analisis varians. Fisher merekomendasikan maksimun likelihood,
yang digunakan untuk estimasi dan pengujian hipotesis. Fisher dianggap penemu
statistika modern karena konstribusinya yang sangat penting dan dianggap
sebagai pemikir ulung tempaaan abad kedua puluh.
Para era Fisher, seorang pemikir Rusia Jerzy Neyman (1894
– 1981) juga dipandang sebagai penemu besar dari statistika modern karena
konstribusinya dalam mengembangkan teori peluang, uji hipotesis, selang
kepercayaan, dan matematika statistik. Neyman bekerjasama dengan Egon Pearson
(anak Karl Pearson) mengembangkan teori-teorinya yang terkenal adalah Teorema
Neyman-Pearson (1936). Selain itu Neyman juga mengembangkan teori sampling
survey pada tahun 1934.
Pada tulisan Fisher (1915) mengemukakan representasi
geometrik data peubah-ganda dua (bivariat) untuk menurunkan distribusi sampling
bersama dari penduga matriks varians-kovarians. Pada tahun 1928 Wishart
menggunakan metode yang sama untuk menurunkan distribusi bersama dari penduga
matriks varians-kovarians untuk sebaran normal ganda (Multivariat Normal) yang
akhirnya populer dengan distribusi Wishart.
Pada tahun 1836, Fisher membuka area baru penelitian yang
disebut fungsi diskriminan yang pada awalnya untuk menjawab pertanyaan yang
diajukan oleh ahli antropologi yaitu untuk menentukan jenis kelamin dari
pemilik tengkorak yang mempunyai ukuran-ukuran tertentu. Fungsi diskriminan
untuk membedakan kedua jenis kelamin ini populer dengan nama fungsi linear
diskriminan Fisher (LDF) untuk 2 grup dan merupakan salah satu metode pada
analisis peubah ganda.
Calyampudi Radhakrishnan Rao (1920 - ) adalah mahasiswa bimbingan dari Fisher.
Rao bekerja di mesium antropolgi sambil menyelesaikan Ph.D tahun 1948. Tahun
1946 Rao mengembangkan fungsi diskriminan linear Fisher untuk klasifikasi
dengan banyak grup. Selain itu Rao juga berkonstribusi dalam mengembangkan matematika
statistik dengan teorinya yang terkenal pertidaksamaan Rao-Cramer dan teorema
Rao-Blackwell yang dikemukakan secara terpisah oleh Rao pada tahun 1945 dan
Blackwell pada tahun 1947. Salah satu buku karangan Rao yang tekenal adalah
Linear Statistical Inference yang telah diterjemahkan ke dalam 6 bahasa.
Prasantha Chandra Mahalanobis (1893 – 1972)
berkonstribusi dalam mengembangkan analisis peubah-ganda. Salah satu
kontribusinya yang besar adalah jarak Mahalanobis (D-statistik) yang
merupakan ukuran jarak untuk data dengan variabel banyak yang digunakan dalam
analisis klasifikasi. Mahalanobis juga pendiri jurnal statistik India yang
sangat terkenal bernama Sankya. Pada tahun 1931 Mahalanobis mendirikan
Indian Statistical India dengan salah satu divisinya bernama National Sample
Survey (NSS) yang bertugas mengumpulkan data sosioekonomik dan demografi di
seluruh India. Divisi ini membuat Mahalanobis mempunyai peranan penting dalam
perencanaan ekonomi di India dan akhirnya NSS sekarang berfungsi sebagai bagian
penting dari Ministry of Planing.
Pada tahun 1931 Hoteling memperkenalkan statistik T2
yang merupakan generalisasi dari statistik t-student untuk menguji hipotesis
nilai tengah pada data peubah-ganda. Distribusi tak nol dari T2 adalah
sama dengan Mahalanobis-Distance yang mempunyai tujuan berbeda ditemukan
oleh Bose dan Roy pada tahun 1938.
Seperti telah disebutkan bahwa aliran yang dianut Karl
Pearson, Gosset dan R.A Fisher mendasarkan kesimpulan pada jenis sebaran
populasi tidak dipenuhi maka perlu dilakukan transformasi data, salah satunya
adalah transformasi pangkat yang ditemukan oleh Box dan Cox tahun 1964, sehingga
dikenal dengan nama transformasi Box-Cox. Dilain pihak pada tahun 1945 Frank
Wilcoxon memperkenalkan metode statistik non parametrik yang bebas dari sebaran
populasi yang sekarang dikenal dengan Uji Tanda Peringkat. Seperti tahun 1952
W.H. Kruskal dan W.A Wallis memperkenalkan uji non parametrik yang berpadanan
dengan uji kesamaan mean pada analisis varians yang dikenal dengan nama Uji
Kruskal-Wallis. Pada tahun 1958 Kaplan menggunakan metode non parametrik untuk
pendugaan sekuensial.
Pada akhirnya dengan adanya perkembangan teknologi komputer
metode eksplorasi data berkembang pesat sekitar tahun 1970. J.W. Tukey (1915
- ) mempunyai konstribusi besar dalam
pengembangan metode eksplorasi baik secara grafis maupun numerik. Beberapa penemuannya
adalah diagram dahan-daun dan diagram kotak garis.
Pada pertengahan 1970 Elfron memperkenalkan Metode
Bootstrap untuk menduga parameter dari sebaran yang tidak diketahui
bentuknya. Bootstrafing ini merupakan teknik modifikasi dari Jacknife yang
diperkenalkan oleh Queneuille pada tahun 1948. Berhubung metode ini pada
awalnya tidak membobotkan model peluang, tetapi berbasis pada data, bootstrap
dikenal sebagai data driven approach. Pada dekade 80-an perkembangan
metode non parametrik mulai sering digunakan seperti pada regresi non
paramametrik, estimasi distribusi dengan kernel, dan neural network.
D. PERKEMBANGAN STATISTIKA DI ABAD 21
Karl Pearson, Fisher, Neyman dan Wald selama setengah
abad telah meletakkan dasar statistika yang berbasis matematika, sehingga
penelitian-penelitian dan kuliah-kuliah statistika di Perguruan Tinggi umumnya
didasarkan pada beberapa pedoman atau dasar yang ditemukan oleh tokoh-tokoh
tersebut. Penggunaan statistika secara luas, terkadang timbul kontroversi
diantara para ahli tentang pemilihan model data, penggunakan prior
probability dan interpretasi hasil. Hasil analisis terhadap data yang sama
dengan lain konsultan statistika dimungkinkan terjadi perbedaan kesimpulan. Statistika
induktif dapat dipakai untuk menangani masalah dimana perolehan data dirasakan
perlu efesiensi atau perlu biaya mahal., sehingga umumnya dapat diatasi dengan
analisis dengan sampel-sampel ukuran kecil.
Di era millenium dengan dominasi teknologi informasi,
data base yang besar, interaksi dengan komputer dan informasi yang kompleks,
maka menurut C.R. rao dalam tulisannya 14 Nopember 2001 (berjudul Has
Statistics a future? If So in What Form?) statistika yang didasarkan pada
model-model probabilistik tidak mencukupi, sehingga metode-metode yang akan
muncul diarahkan untuk menjawab tantangan zaman yang diberi nama data mining. Istilah
data mining (penambangan data) ini menurut Nasoetion (2002) awalnya berasal
dari para ahli ilmu komputer yang dalam sehari-harinya bekerja dalam dunia
kecerdasan buatan. Untuk pekerjaan ini mereka membangkitkan dan mengumpulkan
data dalam ukuran sangat besar dan mencoba menemukan pola-pola keteraturan data
yang dapat diterangkan.
Pada abad 21 diperkirakan metode data mining merupakan
metode yang akan banyak digunakan dalam berbagai bidang terapan. Pada metode data
mining spesifikasi permasalahan didasarkan pada bidang ilmunya lebih diutamakan
daripada pendugaan parameter sehingga masalah tersebut dapat diformulasikan
dengan benar untuk memperoleh solusi yang tepat melalui eksplorasi data. Hal ini
berbeda dengan periode Fisher yang lebih mementingkan mencari metode pendugaan
dan pendekatan sebaran yang tepat, sehingga spesifikasi permasalahan lebih
diutamakan pada pendugaan parameter dan asumsi sebaran. Jadi Fisherian
Statistic itu sebenarnya model driven yang agak beda dengan data mining yang
lebih bersifat data driven. Akan tetapi pada pelaksanaannya, kedua “driven”
tersebut harus dikuasai ini akan berpengaruh terhadap model pendidikan dan
pengajaran statistika dewasa ini. Emanuel Parzen (Departement of statistics
Texas A & M University College) baru-baru ini menulis tentang “Data Mining,
Statistical Methods Mining and History of Statistics”. Dalam tulisannya
tersebut dibahas juga masalah pendidikan statistika menghadapi masa depan
dimana data mining akan berkembang, seperti bagaimana cara mengajar matematik
statistik untuk non matematik statistik, materi yang berhubungan dengan
komputer seperti teknik simulasi, analisis numerik, analisis data struktur data
perlu ditingkatkan bagi para mahasiswa.
Belum adanya standard analisis untuk eksplorasi data
dalam data ukuran besar inilah diperkirakan, metode data mining akan banyak
dikembangkan dan diteliti oleh para pakar statistika.
E. SEJARAH STATISTIK DI INDONESIA
Gottfried Achenwall (1749) menggunakan Statistik
dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis
data kenegaraan, dengan mengartikannya sebagai “ilmu tentang negara (state)”.
Pada awal abad ke-19 telah terjadi pergeseran arti menjadi “ilmu mengenai
pengumpulan dan klasifikasi data”. Sir John Sinclair memperkenalkan nama
(Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika
secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga
administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya
melalui sensus yang dilakukan secara teratur untuk memberi informasi
kependudukan yang berubah setiap saat
Di Indonesia statistic lahir sejak zamna
penjajahan. Sesuai dengan tujuannya pada zaman penjajahan statistic di
Indonesia di arahkan untuk perdagangan denga tujuan untuk mencari keuntungan
yang sebesar-besar nya bagi penjajah. Keberadaan VOC di Indonsia boleh di
anggap sebagai printis statistic colonial yang selanjutnya diteruskan oleh
Belanda. Pada tahun 1864 pemerintahan Belanda mendirikan kantor statistic yang
pertama di Indonesia . kantor ini adalah bagian dari kantor Algemene Secretarie
yang berpusat di Nederland. Selanjutnya pada tahun 1870 , bagian tersebut
dipindahkan pada Dapartemen Algemeen Beustuur. Pengumuman – pengumuman
statistic dimuat dalam buku tahunan ketatanegaraan dan perekonomian yang
dikeluarkan oleh Lembaga Statistik di Belanda.
Pada tahun 1920 berdirilah kantor cacah jiwa.
Kantor ini bertugas menghitung jumlah warga (sensus). Bersamaan dengan itu pula
berdirilah kantor statistic pertanian , kerajinan dan perdagangan termasuk
dalam statistic ekspor dan impor. Kantor statistic pertanian , perdagangan ,
dan kerajinan berdiri di Bogor , namun pada tahun 1925 dupindahkan ke Jakarta.
Sejak saat itu resmi menjadi Kantor Pusat Statistikdan sampai sekarang disebut
Badan Pusat Statistik. Distikan dengan penyempurnaan pada perstatistik yang sudah
ada , system prastatistikan di Indonesia saat ini disusun berdasarkan
Undang-Undang Statistik No. 7 Tahun 1960 , dari Peraturan Pemerintah Republik
Indonesia No. 6 tahun 1980 tentang organisasi Biro Pusat Statistik.
Tidak ada komentar:
Posting Komentar