UNEJ VSL
Laboratorium Statistika, Keris Data Sains dan Statistika, FMIPA Universitas Jember
Modul CB-SEM dan Path Analysis dengan Lavaan R
Oleh: I Made Tirta, Mohamat Fatekurohman (2024)
Latar belakang
Data penelitian ada kalanya melibatkan banyak peubah teramati (misalnya $x_1,x_2,...,y_1,y_2,...,z_1,z_2, ...)$. Peubah teramati tersebut
mungkin dianggap merupakan indikator dari peubah/ faktor laten yang tidak terukur langsung. Selain itu
mungkin ada sekelompok peubah disatu sisi dipengaruhi (menjadi peubah terikat) dari peubah lain, sedangkan
berikutnya, dia menjadi peubah bebas yang mempengaruhi peubah yang lainnya.
Dalam suatu situasi misalkan
$x_1,x_2,...,$
merupakan indikator
dari peubah/faktor laten $X$, demikian juga $y_1,y_2,...$, adalah indikator
dari peubah/faktor laten $Y$ dan seterusnya, Sementara disatu sisi $X$ mempengaruhi $Y$ dan $Z$ sedangkan disisi lain
$Y$ juga mempengaruhi $Z$. Hubungan seperti ini tidak bisa diselesaikan atau dimodelkan dengan regresi biasa.
Analisis atau model statistika yang secara simultan mempelajari, memodelkan dan mengestimasi hubungan terstruktur seperti ini
dikenal dengan Structural Equation Model (SEM).
Dalam situasi lain misalkan
$x_1,x_2,...,$ demikian juga $y_1,y_2,...$, merupakan variabel teramati seperti biasanya dan mungkin $x_i$ mempengaruhi $x_j$ maupun $y_i$ dan $z_i$
sedangkan di sisi lain
$y_i$ juga mempengaruhi $y_j$, maupun $z_i$ (sebagai variabel mediator atau moderasi). Hubungan seperti ini pun tidak bisa diselesaikan atau dimodelkan dengan regresi biasa.
Analisis atau model statistika yang secara simultan mempelajari, memodelkan dan mengestimasi hubungan terstruktur seperti ini (tanpa peubah laten)
dikenal dengan Path Analysis (PA).
Mengingat pemodelan SEM maupun PA, beserta estimasinya, cukup kompleks diyakini mahasiswa/ pengguna membutuhkan modul yang sekaligus secara dinamik
fleksibel mengakomodasi berbagai data dan model yang bisa berinteraksi dengan pengguna. Atau sebaliknya
diperlukan analisis data yang sekaligus menyatu secara dinamik dengan penjelasan tahapan analisis SEM. Bagi mahasisewa/ pengguna yang sudah memahami teori dan ingin langsung
menganalisis data riil disarankan untuk membuka laman Analisis SEM dan PA dengan Lavaan
ILustrasi
Tujuan
Dalam SEM maupun PA pada umumnya model muncul dari kajian teori, sehingga analisis SEM dan PA umumnya bersifat
model konfirmatori (menguji model yang ditetapkan secara teoritis) dan bukan model eksploratori (mencoba-coba model dari data).
Tujuan dari analisis SEM dan PA, terutama terkait pemanfaatan modul ini, diharapkan pembaca/pengguna dapat melakukan kegiatan berikut ini. Dimungkinkan juga model SEM dan PA
merupakan model eksploratori, tetapi dibutuhkan perlakuan khusus yang tidak dibahas dalam modul ini
Tujuan untuk Model SEM agar pengguna dapat:
memodelkan, mengestimasi dan sekaligus menguji koefisien indikator yang sekaligus berarti memeriksa validitas dan reliabilitas dari
indikator-indikator penyusun laten;
memodelkan, mengestimasi dan sekaligus menguji koefisien struktural antar laten yang ada;
menguji kecocokan seluruh model (kesesuaian antara model teori dengan data yang ada);
menguji adanya perbedaan (heterogenitas) model dilihat dari kelompok yang ada, baik yang teramati maupun yang laten (klaster).
Sementara itu tujuan untuk Model PA agar pengguna dapat:
memodelkan, mengestimasi dan sekaligus menguji koefisien jalur antar indikator yang ada;
menguji kecocokan seluruh model (kesesuaian antara model teori dengan data yang ada).
Bagi mahasisewa/ pengguna yang ingin langsung menganalisis data riil disarankan untuk membuka laman
https://statslab-rshiny.fmipa.unej.ac.id/RProg/LatentAn/
I. CB-SEM
Faktor/ variabel laten ini adalah sesuatu kondisi yang tidak terlihat yang dipercaya
mengakibatkan/mendorong munculnya sifat-sifat yang teramati melalui indikator. Sebagai contoh
sifat laten cerdas yang dimiliki anak akan muncul dalam beberapa indikator yang bisa terukur, misalnya
kemampuan berhitung, kemampuan logika, kemampuan berbahasa dan sebagainya. Indikator semacam ini disebut indikator
reflektif.
Dalam konteks ilustrasi ini $X$ disebut sebagai 'konstruk/ laten Eksogen'
sedangkan $Y$ dan $Z$ disebut konstruk/laten Endogen
Model yang menjelaskan Laten dengan indikatornya (hubungan antara $X$ dengan $x_i$, $Y$ dengan $y_i$ dan seterusnya
disebut Model Pengukuran (Measurement Models), baik untuk
pengukuran eksogen maupun endogen. Model yang menggambarkan hubungan antara laten
eksogen dengan endogen atau antar laten endogen disebut Model Structural (Structural Model)
Asumsi Penting
Analisis SEM yang dibahas pada modul ini mensyaratkan beberapa asumsi penting yaitu:
skala indikator adalah interval dan mengikuti sebaran Gaussian (Normal);
semua indikator bersifat reflektif (yaitu sebagai indikator adanya faktor laten yang terkait), bukan sebaliknya merupakan komponen pembentuk dari suatu indeks.
SEM yang mensyaratkan asumsi di atas, dapat dianalisis langsung dari data aslinya, atau cukup dari matriks variansi dan kovariansinya
(asal ukuran sampel yang menghasilkan matriks tersebut diketahui). SEM ini sering disebut sebagai CB-SEM (Covariance Based-Structural
Equation Model).
Koreksi Penyimpangan Terhadap Asumsi
Tidak jarang terjadi, bahwa asumsi kenormalan tidak bisa dipenuhi (terutama jika jumlah sampel
tidak cukup besar). Agar tetap mendapat hasil pengepasan yang baik
ada beberapa koreksi yang bisa dilakukan diantaranya:
menghitung kesalahan baku (SE) dengan metode bootstrap atau robus ;
menggunakan alternatif uji seperti Satorra-Bentler, Yuan-Bentler, bootstrap Bollen-Stein
Pilihan-pilihan di atas telah tersedia sebagai opsi analisis SEM dengan menggunakan R dan
paket/library utama lavaan() (Rossel, 2014).
Ukuran Sample
Jenis Data Sampel
R bisa juga menerima matriks variansi-kovariansi. Untuk input kovariansi perlu diinformasikan besarnya sampel yang menghasilkan kovariansi
dimaksud . Untuk data simulasi, ukuran sampel (sebaiknya kelipatan 10)
Luaran 1.
Termasuk info grup latent jika ada.
Eksplorasi Data
Pemilihan peubah Indikator dan Grup/Kelompok
Dengan memeriksa boxplot seluruh variabel indikator (numerik).
Pilih semua peubah indikator yang ada Pilih hanya peubah indikator numerik dan sisihkan peubah kelompok.
Hasil Plot terkait korelasi ataupun boxplot indikator terpilih disajikan pada Gambar 1.
Indikator (Interval). Di sini hanya pilih indikator numerik
Grup (Nominal)
Di sini hanya pilih indikator kelompok (jika ada)
Gambar 1. Plot
dari Indikator Terpilih
Reliabilitas dengan Alpha Cronbach
Nilai Alpha Cronbach dari indikator terpilih adalah seperti berikut ini.
Selanjutnya, dari informasi data yang ada kita bisa menentukan modelnya.
Mendefinisikan Laten/Faktor dan indikatornya (model Pengukuran);
Mendefinisikan hubungan antar Laten/Faktor (model Struktural);
Mengekstrak Matriks Pengukuran dan Strutural dari R;
Mengeksplorasi klaster
Ilustrasi dengan Lavaan R
Pendefinisian model dan hasil pemodelannya, secara grafik dapat dilihat pada Gambar 2. Anda dapat
mencoba barbagai model sebagai latihan
, selanjutnya bisa dilakukan pemeriksaan konvergensi dan GOF (Goodnes of Fit) nya
Model simulasi Populasi dibangkitkan dengan hubungan berikut
Beberapa data simulasi yang tersedia dibangkitkan dengan hubungan berikut (sebagai pedoman dalam menguji model data)
Data1
Z~X+Y+V
Y~X
Data2-4
Z~X+Y
Y~X
Model Yang di Uji
Kita bisa memasukkan formula model baik untuk model pengukuran maupun model struktural melalui kotak formula di bawah ini. Sebagai latihan kita bisa mendefinisikan model
sesuai informasi simulasi atau berbeda dan membandingkan hasil keduanya (yang susuai dan tidak sesuai simulasi)
Penggunaan notasi pada formula SEM adalah seperti berikut ini.
"=~" untuk mendefinisikan laten dengan indikatornya
"~" untuk mendefinisikan hubungan struktural antar laten
":=" untuk efek suatu laten ke laten yang lain
Model dasar pengukuran
Bagian ini mendefinisikan Laten dengan indikatornya sesuai data dan teori yang dimiliki. Dalam hal latihan di sini Laten didefinisikan dengan menggunakan huruf
besar dan indikatornya diambil dari variabel sejens dengan huruf-huruf kecil, menggunakan notasi "=~" seperti contoh berikut.
Laten untuk model struktural diambil sesuai yang telah didefinisikan pada model pengukuran. Secara umum model struktural didefinisikan seperti berikut (sesuai hubungan yang
ingin diuji).
Z~X+Y+V
Y~X
Model untuk menghitung efek struktural melalui Lavaan
Sebenarnya efek dari suatu laten ke laten yang lain dapat dihitung secara manual dengan memperhatikan jalur yang melewati Laten dengan memperhatikan koefisiannya.
Jika kita ingin langsung menghitung efek suatu laten ke laten lain dengan komputer, maka parameter koefisien regresi/ struktural harus diberi nama/kode.
Selanjutnya efek dihitung dengan menghitung efek langsung dan tak langsung (mengalikan koefisien-koefisien yang dilalui). Perhitungan efek dilakakukan menggunakan
notasi ":=".
Z~a1*X+a2*Y+a3*V
Y~b1*X
#Efek langsung X ke Z
el.XZ:=a1
#Efek tak langsung X ke Z melalui Y
etl.XYZ:=a2*b1
#Efek Total adalah jumlah efek langsung dan semua efek tak langsung
ettXY:=a1+a2*b1
Lihat lebih detal pada Gana dan Broc (2019, Tabel 2.2).
Bagan dari formula yang dibentuk, disajikan pada Gambar 2. Sementara itu matriks yang dihasilkan disajikan pada Tabel 1. Kita akan melihat kode parameter pada bagan jika kode parameternya di definisikan.
Hal ini akan memudahkan kita dalam menghitung efek satu laten ke laten lain (baik efek langsung, tak langsung dan total)pada bagian struktural (regresi).
Area menulis/ mendefinisikan Formula ambil dari nama-nama variabel berikut ini.
Gambar 2. Plot Model Awal Pengukuran dan Struktural
Secara keseluruhan model matriks dari data adalah seperti berikut ini.
$$
\mathbf{Y}= \mathbf{BY}+\boldsymbol{\Gamma}\mathbf{x}+\boldsymbol{\zeta}
$$
dengan $\mathbf{Y}$ adalah matriks laten, $\mathbf{B}$ matriks koefisien struktural, $\mathbf{X}$ adalah matriks indikator,
$\boldsymbol{\Gamma}$ matriks koefisien pengukuran dan $\boldsymbol{\zeta}$ adalah matriks galat. Secara lengkap dapat ditulis
$$\begin{bmatrix}
y_1\\y_2\\y_3\\\vdots\\y_p
\end{bmatrix}
=
\begin{bmatrix}
0&\beta_{12}&\beta_{13}&...&\beta_{1p} \\
\beta_{21}&0&\beta_{23}&...&\beta_{2p}\\
\beta_{31}&\beta_{32}&0&...&\beta_{3p}\\
\vdots &\vdots&\vdots&\ddots&\vdots\\
\beta_{p1}&\beta_{p2}&\beta_{p3}&...&0\\
\end{bmatrix}
\begin{bmatrix}
y_1\\y_2\\y_3\\ \vdots\\y_p
\end{bmatrix} +
\begin{bmatrix}
\gamma_{11}&\gamma_{12}&\gamma_{13}&...&\gamma_{1q} \\
\gamma_{21}&\gamma_{22}&\gamma_{23}&...&\gamma_{2q}\\
\gamma_{31}&\gamma_{32}&\gamma_{33}&...&\gamma_{3q}\\
\vdots &\vdots&\vdots&\ddots&\vdots\\
\gamma_{p1}&\gamma_{p2}&\gamma_{p3}&...&\gamma_{pq}\\
\end{bmatrix}
\begin{bmatrix}
x_1\\x_2\\x_3\\\vdots\\x_q
\end{bmatrix}+
\begin{bmatrix}
\zeta_1\\ \zeta_2\\ \zeta_3\\ \vdots\\ \zeta_p
\end{bmatrix}
$$
(Lihat Bab 10, Hofacker 2007)
Tabel 1. Matriks Pengukuran dan Struktural
Matriks Pengukuran (Indikator dengan Laten)
Matriks Struktural (antar Laten)
Perkiraan konvergensi
Bentuk Umum Matriks
$$ \boldsymbol{\Gamma}=\begin{pmatrix}
\gamma_{x_1}&0&0&0\\
\vdots&\vdots&\vdots&\vdots\\
\gamma_{x_{n_x}}&0&0&0\\
0&\gamma_{y_1}&0&0\\
\vdots&\vdots&\vdots&\vdots\\
0&\gamma_{y_{n_y}}&0&0\\
0&0&\gamma_{z_1}&0\\
\vdots&\vdots&\vdots&\vdots\\
0&0&\gamma_{z_{n_z}}&0\\
0&0&0&\gamma_{v_1}\\
\vdots&\vdots&\vdots&\vdots\\
0&0&0&\gamma_{v_{n_V}}\\
\end{pmatrix},$$ Nilai koefisien loading antara
indikator $x_i$ dengan Laten $L_j,\;(\gamma_{x_il_j})=0 \Leftrightarrow x_i$ bukan indikator
dari $L_j$
$$ \boldsymbol{\beta}=
\begin{pmatrix}
0&0&0&0\\
\beta_{YX}&0&0&\beta_{YV}\\
\beta_{ZX}&\beta_{ZY}&0&\beta_{ZV}\\
0&0&0&0\\
\end{pmatrix},$$
Secara khusus, nilai koefisien regresi antara Laten $i$ dengan Laten $j,\; (\beta_{l_il_j})= 0 \Leftrightarrow L_i$ tidak terhubung dengan $L_j$.
Dengan kata lain, unsur matriks $\mathbf B$ atau $\boldsymbol \beta$ sama dengan 0 jika tidak ada hubungan pengaruh dari laten yang bersesuaian.
Matriks Luaran R
Jika diperlukan, kita bisa melakukan analisis klaster sederhana untuk melihat perlu tidaknya membedakan model berdasarkan klaster atau kelompok yang ada.
Eksplorasi Klaster (bermakna hanya untuk input data asli (mentah), bukan korelasi
Gambar 3. Tampilan Grup Laten dengan Cluster. Dari dendogram, pengguna secara intuitif dapat memilih jumlah klaster diinginkan
Ukuran klaster Ukuran klaster
(diperlukan untuk data mentah)
Tes Lavaan
Dengan paket lavaan () kita dapat melakukan analisis CFA dan SEM, dengan beberapa cara perhitungan standard error, beberapa cara perhitungan estimasi koefisien
jalur, dan beberapa uji signifikansi. Penggunaan Uji Storra-Bentler, Yuan-Bentler, dll, untuk data yang tidak memenuhi asumsi distribusi normal (ukuran sampel
relatif kecil), silakan baca referensi terkait. Namun
beberapa pilihan hanya dapat berpasangan dengan pilihan lain tertentu.
Berikut adalah pilihan-pilihan yang bisa anda coba, sesuaikan dengan kondisi data.
dengan
,
dan
Output Analisis
Jenis luaran
Luaran analisis diberikan berikut ini, anda bisa memperhatikan perbedaan label dan hasil
tergantung pergedaan pilihan yang anda lakukan.
Tes anova dengan metode Scaled atau unscaled akan terpilih secara otomatis sesuai dengan besarnya scaled correction.
Uji Invarian dengan Grup
Model configural invariance. The same factor structure is imposed on all groups
Model weak invariance (loadings). The factor loadings are constrained to be equal across groups.
Model strong invariance (intercepts) . The factor loadings and intercepts are constrained to be equal across groups.
Model strict invariance (residual )* The factor loadings, intercepts and residual variances are constrained to be equal across groups.
Model (means) The factor loadings, intercepts, residual variances and means are constrained to be equal across groups.
Graf Jalur SEM
Selain hasil analisis, paket lavaan () juga menyediakan visualisasi jalur (path diagram dengan
beberapa opsi tampilan (baik isi maupun layout).
Selanjutnya luaran grafik jalur dapat dilihat berikut ini
Gambar 4. Tampilan Diagram Jalur Analisis SEM dengan paket lavaan ()
II. Analisis Jalur (Path Analysis ) dengan Lavaan R
Pada analisis jalur yang dipelajari adalah pengaruh langsung suatu indikator ke indikator lain tanpa perlu membentuk variabel laten.
Sebenarnya PA dapat dilakukan melalui menu sebelumnya hanya dengan mendefinisikan model regresinya (~) antar indikator dan tanpa perlu mendefinisikan model pengukuran (=~).
Hanya untuk tampilan grafiknya diperlukan library khusus.
Dari data yang dipilih sebelumnya kita bisa mendefinisikan formulanya melalui kotak formula berikut ini
Pembentukan Model
Hasil Analisis PA
Model yang dihasilkan oleh formua di atas selanjutnya dapat diplot dengan bervariasi tampilan.
Plot Model
Model dan Analisis PA dapat diatur seperti berikut ini.
Kita dapat melakukan pilihan variasi (jenis nilai yag ditapilkan, lay out grafik, dll) untuk mendapat tampilan grafik yang terbaik.
Menghitung Pengaruh Langsung dan Taklangsung)
Pengaruh indikator satu ke lainnya dilakukan sebagai berikut ini:
Sebaiknya semua hubungan yang didefinisikan diberi notasi parameter (seperti $a, b, c, p$). Misalnya
sebelumnya $y1\sim x1+x2+x3$ dan $y2 \sim y1+x1+x2$ lalu masing-masing diubah menjadi $y1\sim a1*x1+a2*x2+a3*x3$ dan $y2\sim b1*y1+b2*x1+b3*x2$
Dalam hubungan di atas. $x1$ mempengaruhi $y2$ secara langsung sebesar $b2$ dan tidak langsung melalui $y1$ sebesar $b1\times a1$. Maka efek langsung dan tidak langsung dari $x1$ ke $y2$.
Pengaruh Langsung (L) dan tak langsung (TL) dan Total (TT). Untuk latihan lainnya perhatikan semua jalur yang menghubungkan dua variabel berdasarkan arah pengaruh
#Langsung x1 ke y2
L_x1y2:=b2
#Tidak langsung hanya melalui y1
TL_x1y2:=a1*b1
#Total
TT_x1y2:=b2+a1*b1
Selanjutnya kita bisa memodifikasi formula di atas menjadi seperti berikut ini.
Selanjutnya anda bisa copy & paste skrip tersebut ke jendela formula. Ata anda bisa mendefinisikan sendiri yang anda perlukan.
,
dan
Jenis luaran
Rangkuman
CB-SEM merupakan model konfirmatif, bukan eksploratif, artinya sebelum menggunakan CB-SEM kita harus memiliki dasar teori yang kuat
terkait laten dan indikatornya serta hubungan antara laten. CB-SEM lalu mengkonfirmasi model teori tersebut. Bukan mencoba-coba atau mengeksplorasi model berdasarkan data.
Selain mengolah data mentah (asli), CB-SEM mampu menganalisis model hanya bermodal masukan matriks variansi-kovariansi.
CB-SEM mensyaratkan bahwa indikator memenuhi asumsi bersebaran Normal/ Gaussian
CB-SEM dibedakan menjadi beberapa jenis diantaranya
Analisis Faktor jika hanya menganalisis hasil pemodelan pengukuran
Model Hibrid/ Lengkap Jika sekaligus memodelkan pengukuran dan struktural.
CB-SEM juga bisa mempertimbangkan adanya kelompok dalam data dan memeriksa apakah kelompok berpengaruh terhadap model. Dengan kata lain apakah masing-masing kelompok memiliki
model yang berbeda secara signifikan
Permasalahan Terbuka
Apakah perbedaan cara menghitung SE dan melakukan tes (termasuk adanya koreksi), akan menghasilkan hasil estimasi yang berbeda secara signifikan
(misalnya dari signifikan menjadi tidak signifikan atau sebaliknya)
Bagaimana hasil di atas jika dikaitkan dengan ukuran sampel (kecil <30, 30 < sedang <150, dan besar > 150)
Sumber Bacaan Teori:
Berikut adalah beberapa referensi yang bisa dieksplorasi untuk lebih memehami SEM dan PA. Tidak tertutup kemungkinan seiring berjalan waktu, ada referensi online
yang lebih baru.
A. I. Almira, I M. Tirta, D. Anggraeni. 2014.
Robust Standard Errors Dengan Satorra-Bentler Scaled Test Statistic Untuk Mengatasi Nonnormalitas Dalam Analisis Structural Equation Modeling
Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014
Vol 1, No 1: 22-34
J. Bean. 2021. Using R in Social Work Research [Chapter 4-5]https://bookdown.org/bean_jerry/bookdown_r_for_social_workers/
K Gana & K Broc. 2019. Structural Equation Modeling with lavaan . Wiley
J. D. Holster. 2022. Introduction to R for Data Science: A LISA 2020 Guidebook [Chapter 6] https://bookdown.org/jdholster1/idsr/
C.F. Hofacker. 2007. Mathematical Marketing New South Network Services.
G. Jang. R Cookbook for Structural Equation Modeling https://gabriellajg.github.io/EPSY-579-R-Cookbook-for-SEM/ [Diakses 5 Nopember 2024]