Beberapa Distribusi Penting
Tujuan Umum
Setelah mempelajari materi ini mahasiswa diharapkan dapat
memahami distribusi-distribusi penting dari percobaan Bernoulli,
distribusi Poisson, serta beberapa distribusi kontinu, serta dapat
menggunakan distribusi tersebut untuk menyelesaikan masalah
yang terkait.
Tujuan Khusus
Setelah mempelajari materi ini mahasiswa secara khusus
diharapkan dapat:
menyebutkan definisi dan memverifikasi Distribusi Binomial;
menyebutkan definisi dan memverifikasi Distribusi Geometrik;
menyebutkan definisi Binomial Negatif;
menyebutkan definisi Distribusi Hipergeometrik;
menyebutkan definisi dan memverifikasi Distribusi Poisson;
menyebutkan definisi dan memverifikasi Distribusi Uniform;
menyebutkan definisi dan memverifikasi Distribusi
Eksponensial;
menyelesaikan soal-soal yang berkaitan dengan aplikasi
distribusi di atas.
Materi
Distribusi Binomial
Distribusi Geometrik
Distribusi Binomial Negatif
Distribusi Hipergeometrik
Distribusi Poisson
Distribusi Uniform
Distribusi Eksponensial
Pada dasarnya semua fungsi diskrit $p(.)$
yang memenuhi syarat $p(x) \ge 0 $ untuk semua $x$ dan $\sum
p(x)=1,$ memenuhi syarat sebagai fungsi peluang diskrit. Demikian
juga semua fungsi kontinu $f(.)$ pada $X$, yang menuhi syarat
nonnegatif dan membentuk luas satu unit dapat dijadikan fungsi
kepadatan peluang suatu peubah acak. Namun, ada beberapa
distribusi diskrit dan kontinu yang penting yang akan dibahas, diantaranya untuk distribusi diskrit adalah distribusi
yang berasal dari percobaan Bernoulli (Binomial, Negatif Binomial,
Geometrik ), distribusi Poisson. Untuk distribusi kontinu disampaikan
distribusi uniform, distribusi
eksponensia, Normal dan Gamma.
Distribusi Diskrit
Sebagaimana sudah
dibicarakan sebelumnya, bahwa peubah acak diskrit adalah peubah
acak yang ruang rentangnya merupakan himpunan yang berhingga (
finite) atau tak berhingga tapi terhitung (
denumerable/countably infinite). Beberapa distribusi diskrit
penting akan dibicarakan dalam subbab ini.
Distribusi Binomial
Misalkan pada percobaan Bernouli
pengamatan difokuskan pada banyaknya sukses yang terjadi ketika
percobaan Bernoulli itu diulang sebanyak $n$ kali. Dicari fungsi
kepadatan peluang dari peubah acak yang menggambarkan banyaknya
sukses yang terjadi.
Dari sebanyak $n$ ulangan percobaan Bernoulli, jelaslah bahwa
banyaknya sukses berkisar dari 0 (tidak ada sama sekali), sampai
maksimum $n$ (semuanya sukses). Akan dicari berapa peluang untuk
masing masing nilai tersebut. Misalkan banyaknya sukses adalah
$x$, maka pada kondisi ini berlaku:
mungkin tidak ada sukses (0), tetapi paling banyak ada $n$ sukses. Jadi
$x\in R_X=\{0,1,2,\cdots,n\}$
banyaknya sukses, $\#(s)=x$ dan banyaknya gagal, $\#(g)=n-x$, dengan salah
satu susunan yang paling sederhana adalah:
\begin{equation}
\underbrace{s\;s\;s\;\cdots\;s}_x\;\underbrace{g\;g\;g\;\cdots\;g}_{n-x};
\label{s:binom}
\end{equation}
susunan seperti di atas, hanyalah salah satu
dari sekian kemungkinan. Secara keseluruhan susunan sukses($s$)
dan gagal adalah membentuk permutasi $n$ unsur dimana hanya ada
dua jenis yaitu unsur $s$ sebanyak $x$ dan unsur $g$ sebanyak
$n-x$, sehingga secara keseluruhan membentuk
\begin{equation}
\frac{n!}{x!(n-x)!}=\left(\begin{array}{cc}
n \\
x \end{array}\right).
\end{equation}
Karena keseluruhan $n$ percobaan saling bebas, maka peluang
seluruhnya merupakan hasil kali peluang masing-masing, $x$ sukses
dan $n-x$ gagal, yaitu $p^x(1-p)^{n-x}$; dengan demikian secara
keseluruhan peluang terjadinya $x$ sukses dari $n$ ulangan adalah
$$
P(x)=\left(\begin{array}{cc}
n \\
x
\end{array}\right)p^x(1-p)^{n-x},\;x=0,1,2,\cdots,n.
$$
Peubah acak yang mempunyai sifat- sifat di atas dikatakan
bersistribusi Binomial dengan parameter $n$ dan $p$, yang secara
formal dapat didefinisikan seperti berikut ini.
Definisi:
Peubah acak X dikatakan berdistribusi
Binomial dengan parameter n dan p,
dinotasikan dengan Bin(n,p), jika memiliki fungsi kepadatan
peluang
\begin{equation}
P(X=x)=\begin{cases} \left(\begin{array}{cc}
n \\
x
\end{array}\right)p^x(1-p)^{n-x},& \text{ untuk } x=0,1,2,\cdots,n
\\ 0 & \text{ untuk yang lain.}
\end{cases}
\end{equation}
Verifikasi terhadap bentuk fungsi kepadatan peluang dari
distribusi binomial adalah dengan menggunakan persamaan bahwa
$$(a+b)^n=\sum_{x=0}^n \binom{n}{x}a^{n-x}b^{x}.$$
Untuk distribusi binomial,
\begin{align*}
\sum_{R_X} p(x) &= \sum_{x=0}^n \binom{n}{x} p^x(1-p)^{n-x} \\
&= (p+(1-p))^n = 1.
\end{align*}
Jika $X$ peubah acak berdistribusi Bin(n,p),
maka meandan varians
$X$ adalah
\begin{align}
\mu_X&= np,\\
\sigma^2_X &= np(1-p)=npq,
\end{align}
Distribusi Geometrik
Adakalanya dalam percobaan
Bernoulli, yang diamati adalah benyaknya percobaan yang terjadi
sampai muncul satu (1) $s$. Tentu saja percobaan yang dilakukan
menggunakan asumsi bahwa dia diulang secara saling bebas. Misalkan
untuk munculnya 1 $s$ diperlukan sebanyak $x$ percobaan, maka pada
konsisi ini:
paling tidak diperlukan 1 percobaan, tetapi tidak ada batasan
maksimum banyaknya percobaan yang akan menghasilkan 1 $s$. Jadi $x
\in R_x=\{1,2,\cdots\};$
hasil terakhir adalah $s$, sedangkan hasil sebelumnya adalah
$g$, sehingga dapat digambarkan sebagai
\begin{equation}
\underbrace{g\;g\;g\;\cdots\;g}_{x-1}\;s; \label{s:geom}
\end{equation}
total peluang pada saat itu adalah $p(1-p)^{x-1}=pq^{x-1}$.
Peubah acak yang memenuhi kondisi di atas dikatakan berdistribusi
Geometrik dengan parameter $p$. Secara formal distribusi Geometrik
dapat didefinisikan seperti berikut ini.
Peubah acak X dikatakan berdistribusi
Geometrik dengan parameter p,
dinotasikan dengan Geo(p), jika memiliki fungsi kepadatan peluang
\begin{equation}
P(X=x)=\begin{cases} p(1-p)^{x-1}& \text{ untuk } x=1,2,3,\cdots,
\\ 0 & \text{ untuk yang lain.}
\end{cases}
\end{equation}
Verifikasi terhadap fungsi kepadatan peluang geometrik adalah dengan menggunakan
jumlah deret ukur turun tak hingga dengan suku awal $p$ dan rasio
$q=(1-p)$.
Mean dan varians dari $X$ yang berdistribusi $Geo(p)$ adalah
seperti pada teorema berikut.
$X$ berdistribusi geometrik,
maka
\[\mu_X=\frac{1}{p} \text{ dan } \sigma^2_X=\frac{q}{p^2}=\frac{1-p}{p^2}.\]
Distribusi Binomial Negatif
Sebagai generalisasi dari
distribusi Geometrik, ada kalanya yang ingin diamati adalah
banyaknya ulangan sampai munculnya $r \ge 1$ sukses. Misalkan
untuk menghasilkan $r$ sukses diperlukan $x$ ulangan, maka pada
kondisi ini berlaku:
paling tidak diperlukan $r$ ulangan, tetapi tidak ada
batas maksimum; Jadi $x\in R_x=\{r,r+1,r+2,\cdots\}$;
pada saat itu hasil terakhir adalah $s$, tetapi pada ulangan
sebelumnya (sebanyak $x-1$) ada sebanyak $r-1$ sukses ($s$) dan
sisanya adalah $g$. Jadi peluangnya adalah $$p
p^{r-1}q^{x-1-(r-1)}=p^r q^{x-r}; $$
sukses dan gagal pada $x-1$ ulangan sebelumnya menyebar mengikuti
prinsip permutasi dengan jumlah $x-1$ unsur, terdiri atas dua
jenis, masing- masing sebanyak $r-1$ unsur $s$ dan $x-r$ unsur
$g$; jadi ada $\displaystyle\left(\begin{array}{cc}
x-1 \\
r-1
\end{array}\right)$
macam susunan $s$ dan $g.$
Deninisi:
Peubah acak $X$ dikatakan berdistribusi
Binomial Negatif, jika
mempunyai fungsi kepadatan peluang
\begin{equation}
P(X=x)=\begin{cases} \left(\begin{array}{cc}
x-1 \\
r-1
\end{array}\right)p^{r}q^{x-r} & \text{ untuk
} x=r,r+1,r+2,\cdots \\
0 &\text{ untuk yang lain.}
\end{cases}
\end{equation}
Distribusi Poisson
Penurunan definisi distribusi Poisson melalui proses Poisson dapat
dilihat pada Meyer, namun di sini akan diberikan
definisi secara aksiomatik dengan menggunakan ekspansi deret dari
eksponensial. Dengan sedikit modifikasi, kita
tahu bahwa
$$
e^\lambda =\sum_{x=0}^\infty \frac{\lambda^x}{x!}$$ yang ekuivalen
dengan $$1 = \sum_{x=0}^\infty \frac{e^{-\lambda}\lambda^x}{x!}.
$$
Jumlah 1 menunjukkan bahwa bentuk $\displaystyle
\frac{e^{-\lambda}\lambda^x}{x!}$ yang nonnegatif dapat dijadikan
fungsi kepadatan peluang. Peubah acak yang memiliki fungsi peluang
ini yang dikatakan memiliki distribusi Poisson.
Peubah acak $X$ dikatakan berdistribusi
Poissondengan parameter $\lambda$,
dinotasikan $Poisson(\lambda)$, jika mempunyai fungsi kepadatan peluang
berikut
\begin{equation}
P(X=x)=p(x)=\left\{\begin{array}{cl}
\frac{e^{-\lambda}\lambda^x}{x!}
& \text{untuk } x=0,1,2,... \\
0 & \mbox{untuk yang lain} \end{array}\right.
\end{equation}
Jika $X$ berdistribusi Poisson dengan
parameter $\lambda$, maka
$\mu_X=\sigma^2_X=\lambda.$
Hubungan distribusi Poisson dengan binomial
Dalam kondisi tertentu, distribusi binomial dapat didekati dengan
distribusi Poisson.
Distribusi binomial akan bisa didekati dengan
distribusi Poisson jika:
$n$ pada distribusi binomial relatif besar, yaitu $n\to \infty$ dan
$p$ relatif kecil (berarti $1-p\approx 1$), sehingga $np$ relatif
konstan dan $np \approx np(1-p)$. Jadi mean relatif sama dengan
varians dan $\lambda=np$ atau $p=\lambda/n$.
Selanjutnya secara matematika dapat ditunjukkan bahwa peluang
pertama pada distribusi binomial (untuk $x=0$) dapat dituliskan
sebagai
\begin{align*}
P(X=0)&=(1-p)^n \\
&= \left(1-\frac{\lambda}{n}\right)^n\\
&= e^{-\lambda.}
\end{align*}
selanjutnya dapat ditunjukkan bahwa
\begin{align*}
P(X=x)=B(x)&\approx
\frac{\lambda^x}{x!} e^{-\lambda} \\
&\approx P(x)
\end{align*}
Secara formal dapat dinyatakan dengan teorema berikut.
Jika $X$
berdistribusi $Bin(n,p)$ dengan $n\to \infty$ dan $p\to 0$, maka
$X$ mendekati berdistribusi Poisson dengan parameter
$\lambda=np.$
Secara
emperik pendekatan ini dapat diilustrasikan dengan menggunakan
simulasi, untuk kedua jenis distribusi.
Distribusi kontinu
Distribusi Uniform
Bentuk fungsi kepadatan peluang kontinu yang paling sederhana adalah
fungsi kepadatan peluang yang bernilai konstan pada seluruh daerah
rentangnya. Peubah acak yang memounyai fungsi kepadatan peluang
demikian dikatakan berdistribusi uniform.
Peubah acak $X$ dikatakan berdistribusi uniform
jika fungsi kepadatan peluangnya konstan pada seluruh $x$.
Misalnya, jika $X$ berdistribusi uniform pada interval
$[a,b]$,dinotasikan $X~U(a,b),$ fungsi kepadatannya adalah
$$f(x) = \left\{
\begin{array}{cl}
\displaystyle\frac{1}{b-a} & \text{ untuk } a< x < b \\
0 &\text{ untuk yang lain.}
\end{array}
\right.
$$
Jika
$X~U(a,b)$ maka $\displaystyle E(X)=\frac{a+b}{2} $ dan
$\displaystyle V(X)=\frac{(b-a)^2}{12}.$
Distribusi Eksponensial
Peubah acak $X$ dikatakan berdistribusi
Eksponensial dengan parameter $\alpha$ jika mempunyai fungsi
kepadatan yang dinyatakan oleh
\begin{equation} f(x)=
\left\{
\begin{array}{cl}
\alpha e^{-\alpha x} &\text{ untuk } \alpha > 0, x \ge 0 \\
0 &\text{ untuk yang lain. }
\end{array}
\right.
\end{equation}
Jika
$X$ berdistribusi Eksponensial dengan parameter $\alpha$, maka
$\displaystyle \mu_X = \frac{1}{\alpha}$ dan $\displaystyle
\sigma^2_X = \frac{1}{\alpha^2}.$
Selain distribusi yang kontinu yang telah disebutkan di atas,
ada beberapa distribusi kontinu lain yang sangat penting yaitu
distribusi normal dan distribusi gamma.
Distribusi normal mempunyai dua parameter yaitu mean ($\mu$) dan
varians ($\sigma^2$) dan mempunyai bentuk umum fungsi kepadatan
$$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left[-\frac{1}{2}
\left(\frac{x-\mu}{\sigma}\right)^2\right],\quad -\infty < x
<\infty.$$
Distribusi gamma adalah distribusi kontinu yang mempunyai daerah
rentang untuk bilangan riil positif dengan dua parameter $\alpha$
dan $\beta$ dan memiliki bentuk umum fungsi kepadatan
$$ f(x)=\frac{1}{\Gamma(\alpha)\beta^\alpha}x^{\alpha-1}e^{-x/\beta},
\quad 0 < x
<\infty$$
Jika $\beta=1$ maka dikatakan sebagai distribusi Gamma standar, sedangkan jika $\alpha=1$
identik dengan distribusi eksponensial.
Membangkitkan Data dan meghitung peluang distribusi dengan R
Ada 4 fungsi penting terkait distribusi (D) yaitu
-
dD untuk menghitung nilai densitas distribusi pada nilai $x=x_1$ yang tidak lain dari $f(x_1)$ dengan $f$ adalah fungsi kepadatan distribusi.
-
pD untuk menghitung nilai peluang kumulatif distribusi pada nilai $x=x_1$ yang tidak lain dari $F(x_1)$ dengan $F$ adalah fungsi kumulatif distribusi.
-
qD untuk menghitung nilai kuantil $x=x_1$ pada saat dikatehui nilai fungsi kunulatif $F(x_1)=p$.
-
rD untuk membangkitkan sejumlah data dari distribusi D .
Dengan D(...) adalah
norm untuk distribusi normal atau Gaussian
t untuk distribusi T
pois untuk distribusi Poisson
binom untuk distribusi Poisson
Eksplorasi Simulasi
Bahan Bacaan
Pembahasan tentang
distribusi diskrit dan kontinu yang penting, dapat dilihat pada
beberapa pustaka. Pendekatan lebih matematis dapat dilihat pada
Hogg & Craig (1995) dan Freund &
Walpole(1980). Aplikasi komputer dengan menggunakan
S-Plus atau R dapat dilihat pada Tirta (2003).