Beberapa Distribusi Penting

Tujuan Umum

Setelah mempelajari materi ini mahasiswa diharapkan dapat memahami distribusi-distribusi penting dari percobaan Bernoulli, distribusi Poisson, serta beberapa distribusi kontinu, serta dapat menggunakan distribusi tersebut untuk menyelesaikan masalah yang terkait.

Tujuan Khusus

Setelah mempelajari materi ini mahasiswa secara khusus diharapkan dapat:
    menyebutkan definisi dan memverifikasi Distribusi Binomial;
    menyebutkan definisi dan memverifikasi Distribusi Geometrik;
    menyebutkan definisi Binomial Negatif;
    menyebutkan definisi Distribusi Hipergeometrik;
    menyebutkan definisi dan memverifikasi Distribusi Poisson;
    menyebutkan definisi dan memverifikasi Distribusi Uniform;
    menyebutkan definisi dan memverifikasi Distribusi Eksponensial;
    menyelesaikan soal-soal yang berkaitan dengan aplikasi distribusi di atas.

Materi

    Distribusi Binomial
    Distribusi Geometrik
    Distribusi Binomial Negatif
    Distribusi Hipergeometrik
    Distribusi Poisson
    Distribusi Uniform
    Distribusi Eksponensial
Pada dasarnya semua fungsi diskrit $p(.)$ yang memenuhi syarat $p(x) \ge 0 $ untuk semua $x$ dan $\sum p(x)=1,$ memenuhi syarat sebagai fungsi peluang diskrit. Demikian juga semua fungsi kontinu $f(.)$ pada $X$, yang menuhi syarat nonnegatif dan membentuk luas satu unit dapat dijadikan fungsi kepadatan peluang suatu peubah acak. Namun, ada beberapa distribusi diskrit dan kontinu yang penting yang akan dibahas, diantaranya untuk distribusi diskrit adalah distribusi yang berasal dari percobaan Bernoulli (Binomial, Negatif Binomial, Geometrik ), distribusi Poisson. Untuk distribusi kontinu disampaikan distribusi uniform, distribusi eksponensia, Normal dan Gamma.

Distribusi Diskrit

Sebagaimana sudah dibicarakan sebelumnya, bahwa peubah acak diskrit adalah peubah acak yang ruang rentangnya merupakan himpunan yang berhingga ( finite) atau tak berhingga tapi terhitung ( denumerable/countably infinite). Beberapa distribusi diskrit penting akan dibicarakan dalam subbab ini.

Distribusi Binomial

Misalkan pada percobaan Bernouli pengamatan difokuskan pada banyaknya sukses yang terjadi ketika percobaan Bernoulli itu diulang sebanyak $n$ kali. Dicari fungsi kepadatan peluang dari peubah acak yang menggambarkan banyaknya sukses yang terjadi. Dari sebanyak $n$ ulangan percobaan Bernoulli, jelaslah bahwa banyaknya sukses berkisar dari 0 (tidak ada sama sekali), sampai maksimum $n$ (semuanya sukses). Akan dicari berapa peluang untuk masing masing nilai tersebut. Misalkan banyaknya sukses adalah $x$, maka pada kondisi ini berlaku: mungkin tidak ada sukses (0), tetapi paling banyak ada $n$ sukses. Jadi $x\in R_X=\{0,1,2,\cdots,n\}$
    banyaknya sukses, $\#(s)=x$ dan banyaknya gagal, $\#(g)=n-x$, dengan salah satu susunan yang paling sederhana adalah: \begin{equation} \underbrace{s\;s\;s\;\cdots\;s}_x\;\underbrace{g\;g\;g\;\cdots\;g}_{n-x}; \label{s:binom} \end{equation}
    susunan seperti di atas, hanyalah salah satu dari sekian kemungkinan. Secara keseluruhan susunan sukses($s$) dan gagal adalah membentuk permutasi $n$ unsur dimana hanya ada dua jenis yaitu unsur $s$ sebanyak $x$ dan unsur $g$ sebanyak $n-x$, sehingga secara keseluruhan membentuk \begin{equation} \frac{n!}{x!(n-x)!}=\left(\begin{array}{cc} n \\ x \end{array}\right). \end{equation}
Karena keseluruhan $n$ percobaan saling bebas, maka peluang seluruhnya merupakan hasil kali peluang masing-masing, $x$ sukses dan $n-x$ gagal, yaitu $p^x(1-p)^{n-x}$; dengan demikian secara keseluruhan peluang terjadinya $x$ sukses dari $n$ ulangan adalah $$ P(x)=\left(\begin{array}{cc} n \\ x \end{array}\right)p^x(1-p)^{n-x},\;x=0,1,2,\cdots,n. $$ Peubah acak yang mempunyai sifat- sifat di atas dikatakan bersistribusi Binomial dengan parameter $n$ dan $p$, yang secara formal dapat didefinisikan seperti berikut ini.

Definisi: Peubah acak X dikatakan berdistribusi Binomial dengan parameter n dan p, dinotasikan dengan Bin(n,p), jika memiliki fungsi kepadatan peluang \begin{equation} P(X=x)=\begin{cases} \left(\begin{array}{cc} n \\ x \end{array}\right)p^x(1-p)^{n-x},& \text{ untuk } x=0,1,2,\cdots,n \\ 0 & \text{ untuk yang lain.} \end{cases} \end{equation} Verifikasi terhadap bentuk fungsi kepadatan peluang dari distribusi binomial adalah dengan menggunakan persamaan bahwa $$(a+b)^n=\sum_{x=0}^n \binom{n}{x}a^{n-x}b^{x}.$$ Untuk distribusi binomial, \begin{align*} \sum_{R_X} p(x) &= \sum_{x=0}^n \binom{n}{x} p^x(1-p)^{n-x} \\ &= (p+(1-p))^n = 1. \end{align*} Jika $X$ peubah acak berdistribusi Bin(n,p), maka meandan varians $X$ adalah \begin{align} \mu_X&= np,\\ \sigma^2_X &= np(1-p)=npq, \end{align}

Distribusi Geometrik

Adakalanya dalam percobaan Bernoulli, yang diamati adalah benyaknya percobaan yang terjadi sampai muncul satu (1) $s$. Tentu saja percobaan yang dilakukan menggunakan asumsi bahwa dia diulang secara saling bebas. Misalkan untuk munculnya 1 $s$ diperlukan sebanyak $x$ percobaan, maka pada konsisi ini:
    paling tidak diperlukan 1 percobaan, tetapi tidak ada batasan maksimum banyaknya percobaan yang akan menghasilkan 1 $s$. Jadi $x \in R_x=\{1,2,\cdots\};$
    hasil terakhir adalah $s$, sedangkan hasil sebelumnya adalah $g$, sehingga dapat digambarkan sebagai \begin{equation} \underbrace{g\;g\;g\;\cdots\;g}_{x-1}\;s; \label{s:geom} \end{equation}
    total peluang pada saat itu adalah $p(1-p)^{x-1}=pq^{x-1}$.
Peubah acak yang memenuhi kondisi di atas dikatakan berdistribusi Geometrik dengan parameter $p$. Secara formal distribusi Geometrik dapat didefinisikan seperti berikut ini.

Peubah acak X dikatakan berdistribusi Geometrik dengan parameter p, dinotasikan dengan Geo(p), jika memiliki fungsi kepadatan peluang \begin{equation} P(X=x)=\begin{cases} p(1-p)^{x-1}& \text{ untuk } x=1,2,3,\cdots, \\ 0 & \text{ untuk yang lain.} \end{cases} \end{equation}

Verifikasi terhadap fungsi kepadatan peluang geometrik adalah dengan menggunakan jumlah deret ukur turun tak hingga dengan suku awal $p$ dan rasio $q=(1-p)$. Mean dan varians dari $X$ yang berdistribusi $Geo(p)$ adalah seperti pada teorema berikut.

$X$ berdistribusi geometrik, maka \[\mu_X=\frac{1}{p} \text{ dan } \sigma^2_X=\frac{q}{p^2}=\frac{1-p}{p^2}.\]

Distribusi Binomial Negatif

Sebagai generalisasi dari distribusi Geometrik, ada kalanya yang ingin diamati adalah banyaknya ulangan sampai munculnya $r \ge 1$ sukses. Misalkan untuk menghasilkan $r$ sukses diperlukan $x$ ulangan, maka pada kondisi ini berlaku:
    paling tidak diperlukan $r$ ulangan, tetapi tidak ada batas maksimum; Jadi $x\in R_x=\{r,r+1,r+2,\cdots\}$;
    pada saat itu hasil terakhir adalah $s$, tetapi pada ulangan sebelumnya (sebanyak $x-1$) ada sebanyak $r-1$ sukses ($s$) dan sisanya adalah $g$. Jadi peluangnya adalah $$p p^{r-1}q^{x-1-(r-1)}=p^r q^{x-r}; $$
sukses dan gagal pada $x-1$ ulangan sebelumnya menyebar mengikuti prinsip permutasi dengan jumlah $x-1$ unsur, terdiri atas dua jenis, masing- masing sebanyak $r-1$ unsur $s$ dan $x-r$ unsur $g$; jadi ada $\displaystyle\left(\begin{array}{cc} x-1 \\ r-1 \end{array}\right)$ macam susunan $s$ dan $g.$

Deninisi: Peubah acak $X$ dikatakan berdistribusi Binomial Negatif, jika mempunyai fungsi kepadatan peluang \begin{equation} P(X=x)=\begin{cases} \left(\begin{array}{cc} x-1 \\ r-1 \end{array}\right)p^{r}q^{x-r} & \text{ untuk } x=r,r+1,r+2,\cdots \\ 0 &\text{ untuk yang lain.} \end{cases} \end{equation}

Distribusi Poisson

Penurunan definisi distribusi Poisson melalui proses Poisson dapat dilihat pada Meyer, namun di sini akan diberikan definisi secara aksiomatik dengan menggunakan ekspansi deret dari eksponensial. Dengan sedikit modifikasi, kita tahu bahwa $$ e^\lambda =\sum_{x=0}^\infty \frac{\lambda^x}{x!}$$ yang ekuivalen dengan $$1 = \sum_{x=0}^\infty \frac{e^{-\lambda}\lambda^x}{x!}. $$ Jumlah 1 menunjukkan bahwa bentuk $\displaystyle \frac{e^{-\lambda}\lambda^x}{x!}$ yang nonnegatif dapat dijadikan fungsi kepadatan peluang. Peubah acak yang memiliki fungsi peluang ini yang dikatakan memiliki distribusi Poisson.

Peubah acak $X$ dikatakan berdistribusi Poissondengan parameter $\lambda$, dinotasikan $Poisson(\lambda)$, jika mempunyai fungsi kepadatan peluang berikut \begin{equation} P(X=x)=p(x)=\left\{\begin{array}{cl} \frac{e^{-\lambda}\lambda^x}{x!} & \text{untuk } x=0,1,2,... \\ 0 & \mbox{untuk yang lain} \end{array}\right. \end{equation}

Jika $X$ berdistribusi Poisson dengan parameter $\lambda$, maka $\mu_X=\sigma^2_X=\lambda.$

Hubungan distribusi Poisson dengan binomial

Dalam kondisi tertentu, distribusi binomial dapat didekati dengan distribusi Poisson. Distribusi binomial akan bisa didekati dengan distribusi Poisson jika: $n$ pada distribusi binomial relatif besar, yaitu $n\to \infty$ dan $p$ relatif kecil (berarti $1-p\approx 1$), sehingga $np$ relatif konstan dan $np \approx np(1-p)$. Jadi mean relatif sama dengan varians dan $\lambda=np$ atau $p=\lambda/n$.
    Selanjutnya secara matematika dapat ditunjukkan bahwa peluang pertama pada distribusi binomial (untuk $x=0$) dapat dituliskan sebagai \begin{align*} P(X=0)&=(1-p)^n \\ &= \left(1-\frac{\lambda}{n}\right)^n\\ &= e^{-\lambda.} \end{align*} selanjutnya dapat ditunjukkan bahwa \begin{align*} P(X=x)=B(x)&\approx \frac{\lambda^x}{x!} e^{-\lambda} \\ &\approx P(x) \end{align*} Secara formal dapat dinyatakan dengan teorema berikut.

    Jika $X$ berdistribusi $Bin(n,p)$ dengan $n\to \infty$ dan $p\to 0$, maka $X$ mendekati berdistribusi Poisson dengan parameter $\lambda=np.$

    Secara emperik pendekatan ini dapat diilustrasikan dengan menggunakan simulasi, untuk kedua jenis distribusi.

    Distribusi kontinu

    Distribusi Uniform

    Bentuk fungsi kepadatan peluang kontinu yang paling sederhana adalah fungsi kepadatan peluang yang bernilai konstan pada seluruh daerah rentangnya. Peubah acak yang memounyai fungsi kepadatan peluang demikian dikatakan berdistribusi uniform.

    Peubah acak $X$ dikatakan berdistribusi uniform jika fungsi kepadatan peluangnya konstan pada seluruh $x$. Misalnya, jika $X$ berdistribusi uniform pada interval $[a,b]$,dinotasikan $X~U(a,b),$ fungsi kepadatannya adalah $$f(x) = \left\{ \begin{array}{cl} \displaystyle\frac{1}{b-a} & \text{ untuk } a< x < b \\ 0 &\text{ untuk yang lain.} \end{array} \right. $$

    Jika $X~U(a,b)$ maka $\displaystyle E(X)=\frac{a+b}{2} $ dan $\displaystyle V(X)=\frac{(b-a)^2}{12}.$

    Distribusi Eksponensial

    Peubah acak $X$ dikatakan berdistribusi Eksponensial dengan parameter $\alpha$ jika mempunyai fungsi kepadatan yang dinyatakan oleh \begin{equation} f(x)= \left\{ \begin{array}{cl} \alpha e^{-\alpha x} &\text{ untuk } \alpha > 0, x \ge 0 \\ 0 &\text{ untuk yang lain. } \end{array} \right. \end{equation}

    Jika $X$ berdistribusi Eksponensial dengan parameter $\alpha$, maka $\displaystyle \mu_X = \frac{1}{\alpha}$ dan $\displaystyle \sigma^2_X = \frac{1}{\alpha^2}.$

    Selain distribusi yang kontinu yang telah disebutkan di atas, ada beberapa distribusi kontinu lain yang sangat penting yaitu distribusi normal dan distribusi gamma. Distribusi normal mempunyai dua parameter yaitu mean ($\mu$) dan varians ($\sigma^2$) dan mempunyai bentuk umum fungsi kepadatan $$f(x)=\frac{1}{\sqrt{2\pi}\sigma}\exp\left[-\frac{1}{2} \left(\frac{x-\mu}{\sigma}\right)^2\right],\quad -\infty < x <\infty.$$ Distribusi gamma adalah distribusi kontinu yang mempunyai daerah rentang untuk bilangan riil positif dengan dua parameter $\alpha$ dan $\beta$ dan memiliki bentuk umum fungsi kepadatan $$ f(x)=\frac{1}{\Gamma(\alpha)\beta^\alpha}x^{\alpha-1}e^{-x/\beta}, \quad 0 < x <\infty$$ Jika $\beta=1$ maka dikatakan sebagai distribusi Gamma standar, sedangkan jika $\alpha=1$ identik dengan distribusi eksponensial.

    Membangkitkan Data dan meghitung peluang distribusi dengan R

    Ada 4 fungsi penting terkait distribusi (D) yaitu
  1. dD untuk menghitung nilai densitas distribusi pada nilai $x=x_1$ yang tidak lain dari $f(x_1)$ dengan $f$ adalah fungsi kepadatan distribusi.
  2. pD untuk menghitung nilai peluang kumulatif distribusi pada nilai $x=x_1$ yang tidak lain dari $F(x_1)$ dengan $F$ adalah fungsi kumulatif distribusi.
  3. qD untuk menghitung nilai kuantil $x=x_1$ pada saat dikatehui nilai fungsi kunulatif $F(x_1)=p$.
  4. rD untuk membangkitkan sejumlah data dari distribusi D .
  5. Dengan D(...) adalah
      norm untuk distribusi normal atau Gaussian
      t untuk distribusi T
      pois untuk distribusi Poisson
      binom untuk distribusi Poisson

    Eksplorasi Simulasi

    Bahan Bacaan

    Pembahasan tentang distribusi diskrit dan kontinu yang penting, dapat dilihat pada beberapa pustaka. Pendekatan lebih matematis dapat dilihat pada Hogg & Craig (1995) dan Freund & Walpole(1980). Aplikasi komputer dengan menggunakan S-Plus atau R dapat dilihat pada Tirta (2003).