UNEJ UNEJ VSL
Laboratorium Statistika, Keris Data Sains dan Statistika, FMIPA Universitas Jember

Modul CB-SEM dan Path Analysis dengan Lavaan R

Oleh: I Made Tirta, Mohamat Fatekurohman (2024)

Latar belakang

  1. Data penelitian ada kalanya melibatkan banyak peubah teramati (misalnya $x_1,x_2,...,y_1,y_2,...,z_1,z_2, ...)$. Peubah teramati tersebut mungkin dianggap merupakan indikator dari peubah/ faktor laten yang tidak terukur langsung. Selain itu mungkin ada sekelompok peubah disatu sisi dipengaruhi (menjadi peubah terikat) dari peubah lain, sedangkan berikutnya, dia menjadi peubah bebas yang mempengaruhi peubah yang lainnya.
  2. Dalam suatu situasi misalkan $x_1,x_2,...,$ merupakan indikator dari peubah/faktor laten $X$, demikian juga $y_1,y_2,...$, adalah indikator dari peubah/faktor laten $Y$ dan seterusnya, Sementara disatu sisi $X$ mempengaruhi $Y$ dan $Z$ sedangkan disisi lain $Y$ juga mempengaruhi $Z$. Hubungan seperti ini tidak bisa diselesaikan atau dimodelkan dengan regresi biasa. Analisis atau model statistika yang secara simultan mempelajari, memodelkan dan mengestimasi hubungan terstruktur seperti ini dikenal dengan Structural Equation Model (SEM).
  3. Dalam situasi lain misalkan $x_1,x_2,...,$ demikian juga $y_1,y_2,...$, merupakan variabel teramati seperti biasanya dan mungkin $x_i$ mempengaruhi $x_j$ maupun $y_i$ dan $z_i$ sedangkan di sisi lain $y_i$ juga mempengaruhi $y_j$, maupun $z_i$ (sebagai variabel mediator atau moderasi). Hubungan seperti ini pun tidak bisa diselesaikan atau dimodelkan dengan regresi biasa. Analisis atau model statistika yang secara simultan mempelajari, memodelkan dan mengestimasi hubungan terstruktur seperti ini (tanpa peubah laten) dikenal dengan Path Analysis (PA).
  4. Mengingat pemodelan SEM maupun PA, beserta estimasinya, cukup kompleks diyakini mahasiswa/ pengguna membutuhkan modul yang sekaligus secara dinamik fleksibel mengakomodasi berbagai data dan model yang bisa berinteraksi dengan pengguna. Atau sebaliknya diperlukan analisis data yang sekaligus menyatu secara dinamik dengan penjelasan tahapan analisis SEM. Bagi mahasisewa/ pengguna yang sudah memahami teori dan ingin langsung menganalisis data riil disarankan untuk membuka laman Analisis SEM dan PA dengan Lavaan

    ILustrasi

Tujuan

Dalam SEM maupun PA pada umumnya model muncul dari kajian teori, sehingga analisis SEM dan PA umumnya bersifat model konfirmatori (menguji model yang ditetapkan secara teoritis) dan bukan model eksploratori (mencoba-coba model dari data). Tujuan dari analisis SEM dan PA, terutama terkait pemanfaatan modul ini, diharapkan pembaca/pengguna dapat melakukan kegiatan berikut ini. Dimungkinkan juga model SEM dan PA merupakan model eksploratori, tetapi dibutuhkan perlakuan khusus yang tidak dibahas dalam modul ini
    Tujuan untuk Model SEM agar pengguna dapat:
  1. memodelkan, mengestimasi dan sekaligus menguji koefisien indikator yang sekaligus berarti memeriksa validitas dan reliabilitas dari indikator-indikator penyusun laten;
  2. memodelkan, mengestimasi dan sekaligus menguji koefisien struktural antar laten yang ada;
  3. menguji kecocokan seluruh model (kesesuaian antara model teori dengan data yang ada);
  4. menguji adanya perbedaan (heterogenitas) model dilihat dari kelompok yang ada, baik yang teramati maupun yang laten (klaster).
  5. Sementara itu tujuan untuk Model PA agar pengguna dapat:
  6. memodelkan, mengestimasi dan sekaligus menguji koefisien jalur antar indikator yang ada;
  7. menguji kecocokan seluruh model (kesesuaian antara model teori dengan data yang ada).
Bagi mahasisewa/ pengguna yang ingin langsung menganalisis data riil disarankan untuk membuka laman
https://statslab-rshiny.fmipa.unej.ac.id/RProg/LatentAn/

I. CB-SEM

Faktor/ variabel laten ini adalah sesuatu kondisi yang tidak terlihat yang dipercaya mengakibatkan/mendorong munculnya sifat-sifat yang teramati melalui indikator. Sebagai contoh sifat laten cerdas yang dimiliki anak akan muncul dalam beberapa indikator yang bisa terukur, misalnya kemampuan berhitung, kemampuan logika, kemampuan berbahasa dan sebagainya. Indikator semacam ini disebut indikator reflektif.
  1. Dalam konteks ilustrasi ini $X$ disebut sebagai 'konstruk/ laten Eksogen' sedangkan $Y$ dan $Z$ disebut konstruk/laten Endogen
  2. Model yang menjelaskan Laten dengan indikatornya (hubungan antara $X$ dengan $x_i$, $Y$ dengan $y_i$ dan seterusnya disebut Model Pengukuran (Measurement Models), baik untuk pengukuran eksogen maupun endogen. Model yang menggambarkan hubungan antara laten eksogen dengan endogen atau antar laten endogen disebut Model Structural (Structural Model)

Asumsi Penting

Analisis SEM yang dibahas pada modul ini mensyaratkan beberapa asumsi penting yaitu:
  1. skala indikator adalah interval dan mengikuti sebaran Gaussian (Normal);
  2. semua indikator bersifat reflektif (yaitu sebagai indikator adanya faktor laten yang terkait), bukan sebaliknya merupakan komponen pembentuk dari suatu indeks.

SEM yang mensyaratkan asumsi di atas, dapat dianalisis langsung dari data aslinya, atau cukup dari matriks variansi dan kovariansinya (asal ukuran sampel yang menghasilkan matriks tersebut diketahui). SEM ini sering disebut sebagai CB-SEM (Covariance Based-Structural Equation Model).

Koreksi Penyimpangan Terhadap Asumsi

Tidak jarang terjadi, bahwa asumsi kenormalan tidak bisa dipenuhi (terutama jika jumlah sampel tidak cukup besar). Agar tetap mendapat hasil pengepasan yang baik ada beberapa koreksi yang bisa dilakukan diantaranya:
  1. menghitung kesalahan baku (SE) dengan metode bootstrap atau robus ;
  2. menggunakan alternatif uji seperti Satorra-Bentler, Yuan-Bentler, bootstrap Bollen-Stein
Pilihan-pilihan di atas telah tersedia sebagai opsi analisis SEM dengan menggunakan R dan paket/library utama lavaan() (Rossel, 2014).

CB-SEM dengan R dan Paket Lavaan

Medote

Untuk informasi lebih detail tentang pengguaan paket Lavaan untuk Analisisi SEM silakan buka Tutorial Teori SEM dengan Lavaan

ILustrasi

Ukuran Sample
Jenis Data Sampel
R bisa juga menerima matriks variansi-kovariansi. Untuk input kovariansi perlu diinformasikan besarnya sampel yang menghasilkan kovariansi dimaksud . Untuk data simulasi, ukuran sampel (sebaiknya kelipatan 10)


Luaran 1.
Termasuk info grup latent jika ada.

  

Eksplorasi Data

Pemilihan peubah Indikator dan Grup/Kelompok
Dengan memeriksa boxplot seluruh variabel indikator (numerik). Pilih semua peubah indikator yang ada Pilih hanya peubah indikator numerik dan sisihkan peubah kelompok. Hasil Plot terkait korelasi ataupun boxplot indikator terpilih disajikan pada Gambar 1.
Indikator (Interval).
Di sini hanya pilih indikator numerik
Grup (Nominal)
Di sini hanya pilih indikator kelompok (jika ada)

Gambar 1. Plot dari Indikator Terpilih

Reliabilitas dengan Alpha Cronbach

Nilai Alpha Cronbach dari indikator terpilih adalah seperti berikut ini.

Selanjutnya, dari informasi data yang ada kita bisa menentukan modelnya. 
  1. Mendefinisikan Laten/Faktor dan indikatornya (model Pengukuran);
  2. Mendefinisikan hubungan antar Laten/Faktor (model Struktural);
  3. Mengekstrak Matriks Pengukuran dan Strutural dari R;
  4. Mengeksplorasi klaster

Ilustrasi dengan Lavaan R

Pendefinisian model dan hasil pemodelannya, secara grafik dapat dilihat pada Gambar 2. Anda dapat mencoba barbagai model sebagai latihan , selanjutnya bisa dilakukan pemeriksaan konvergensi dan GOF (Goodnes of Fit) nya

Model simulasi Populasi dibangkitkan dengan hubungan berikut
Beberapa data simulasi yang tersedia dibangkitkan dengan hubungan berikut (sebagai pedoman dalam menguji model data)
   Data1
     Z~X+Y+V
     Y~X

   Data2-4
   Z~X+Y
   Y~X
 
Model Yang di Uji
Kita bisa memasukkan formula model baik untuk model pengukuran maupun model struktural melalui kotak formula di bawah ini. Sebagai latihan kita bisa mendefinisikan model sesuai informasi simulasi atau berbeda dan membandingkan hasil keduanya (yang susuai dan tidak sesuai simulasi)
Penggunaan notasi pada formula SEM adalah seperti berikut ini.
  1. "=~" untuk mendefinisikan laten dengan indikatornya
  2. "~" untuk mendefinisikan hubungan struktural antar laten
  3. ":=" untuk efek suatu laten ke laten yang lain

Model dasar pengukuran

Bagian ini mendefinisikan Laten dengan indikatornya sesuai data dan teori yang dimiliki. Dalam hal latihan di sini Laten didefinisikan dengan menggunakan huruf besar dan indikatornya diambil dari variabel sejens dengan huruf-huruf kecil, menggunakan notasi "=~" seperti contoh berikut.
X=~x1+x2+x3
Y=~y1+y2+y3
Z=~X=~x1+x2+x3
V=~v1+v2+v3

Model dasar struktural

Laten untuk model struktural diambil sesuai yang telah didefinisikan pada model pengukuran. Secara umum model struktural didefinisikan seperti berikut (sesuai hubungan yang ingin diuji).
Z~X+Y+V
Y~X

Model untuk menghitung efek struktural melalui Lavaan

Sebenarnya efek dari suatu laten ke laten yang lain dapat dihitung secara manual dengan memperhatikan jalur yang melewati Laten dengan memperhatikan koefisiannya. Jika kita ingin langsung menghitung efek suatu laten ke laten lain dengan komputer, maka parameter koefisien regresi/ struktural harus diberi nama/kode. Selanjutnya efek dihitung dengan menghitung efek langsung dan tak langsung (mengalikan koefisien-koefisien yang dilalui). Perhitungan efek dilakakukan menggunakan notasi ":=".
Z~a1*X+a2*Y+a3*V
Y~b1*X

#Efek langsung X ke Z
el.XZ:=a1

#Efek tak langsung X ke Z melalui Y
etl.XYZ:=a2*b1

#Efek Total adalah jumlah efek langsung dan semua efek tak langsung
ettXY:=a1+a2*b1
Lihat lebih detal pada Gana dan Broc (2019, Tabel 2.2).
Bagan dari formula yang dibentuk, disajikan pada Gambar 2. Sementara itu matriks yang dihasilkan disajikan pada Tabel 1. Kita akan melihat kode parameter pada bagan jika kode parameternya di definisikan. Hal ini akan memudahkan kita dalam menghitung efek satu laten ke laten lain (baik efek langsung, tak langsung dan total)pada bagian struktural (regresi).

Area menulis/ mendefinisikan Formula ambil dari nama-nama variabel berikut ini.

  


Gambar 2. Plot Model Awal Pengukuran dan Struktural
Secara keseluruhan model matriks dari data adalah seperti berikut ini. $$ \mathbf{Y}= \mathbf{BY}+\boldsymbol{\Gamma}\mathbf{x}+\boldsymbol{\zeta} $$ dengan $\mathbf{Y}$ adalah matriks laten, $\mathbf{B}$ matriks koefisien struktural, $\mathbf{X}$ adalah matriks indikator, $\boldsymbol{\Gamma}$ matriks koefisien pengukuran dan $\boldsymbol{\zeta}$ adalah matriks galat. Secara lengkap dapat ditulis $$\begin{bmatrix} y_1\\y_2\\y_3\\\vdots\\y_p \end{bmatrix} = \begin{bmatrix} 0&\beta_{12}&\beta_{13}&...&\beta_{1p} \\ \beta_{21}&0&\beta_{23}&...&\beta_{2p}\\ \beta_{31}&\beta_{32}&0&...&\beta_{3p}\\ \vdots &\vdots&\vdots&\ddots&\vdots\\ \beta_{p1}&\beta_{p2}&\beta_{p3}&...&0\\ \end{bmatrix} \begin{bmatrix} y_1\\y_2\\y_3\\ \vdots\\y_p \end{bmatrix} + \begin{bmatrix} \gamma_{11}&\gamma_{12}&\gamma_{13}&...&\gamma_{1q} \\ \gamma_{21}&\gamma_{22}&\gamma_{23}&...&\gamma_{2q}\\ \gamma_{31}&\gamma_{32}&\gamma_{33}&...&\gamma_{3q}\\ \vdots &\vdots&\vdots&\ddots&\vdots\\ \gamma_{p1}&\gamma_{p2}&\gamma_{p3}&...&\gamma_{pq}\\ \end{bmatrix} \begin{bmatrix} x_1\\x_2\\x_3\\\vdots\\x_q \end{bmatrix}+ \begin{bmatrix} \zeta_1\\ \zeta_2\\ \zeta_3\\ \vdots\\ \zeta_p \end{bmatrix} $$ (Lihat Bab 10, Hofacker 2007)

Tabel 1. Matriks Pengukuran dan Struktural
Matriks Pengukuran (Indikator dengan Laten) Matriks Struktural (antar Laten) Perkiraan konvergensi
Bentuk Umum Matriks $$ \boldsymbol{\Gamma}=\begin{pmatrix} \gamma_{x_1}&0&0&0\\ \vdots&\vdots&\vdots&\vdots\\ \gamma_{x_{n_x}}&0&0&0\\ 0&\gamma_{y_1}&0&0\\ \vdots&\vdots&\vdots&\vdots\\ 0&\gamma_{y_{n_y}}&0&0\\ 0&0&\gamma_{z_1}&0\\ \vdots&\vdots&\vdots&\vdots\\ 0&0&\gamma_{z_{n_z}}&0\\ 0&0&0&\gamma_{v_1}\\ \vdots&\vdots&\vdots&\vdots\\ 0&0&0&\gamma_{v_{n_V}}\\ \end{pmatrix},$$
Nilai koefisien loading antara indikator $x_i$ dengan Laten $L_j,\;(\gamma_{x_il_j})=0 \Leftrightarrow x_i$ bukan indikator dari $L_j$
$$ \boldsymbol{\beta}= \begin{pmatrix} 0&0&0&0\\ \beta_{YX}&0&0&\beta_{YV}\\ \beta_{ZX}&\beta_{ZY}&0&\beta_{ZV}\\ 0&0&0&0\\ \end{pmatrix},$$
Secara khusus, nilai koefisien regresi antara Laten $i$ dengan Laten $j,\; (\beta_{l_il_j})= 0 \Leftrightarrow L_i$ tidak terhubung dengan $L_j$. Dengan kata lain, unsur matriks $\mathbf B$ atau $\boldsymbol \beta$ sama dengan 0 jika tidak ada hubungan pengaruh dari laten yang bersesuaian.
Matriks Luaran R

 



Jika diperlukan, kita bisa melakukan analisis klaster sederhana untuk melihat perlu tidaknya membedakan model berdasarkan klaster atau kelompok yang ada. Eksplorasi Klaster (bermakna hanya untuk input data asli (mentah), bukan korelasi

Gambar 3. Tampilan Grup Laten dengan Cluster. Dari dendogram, pengguna secara intuitif dapat memilih jumlah klaster diinginkan
Ukuran klaster Ukuran klaster (diperlukan untuk data mentah)

Tes Lavaan

Dengan paket lavaan () kita dapat melakukan analisis CFA dan SEM, dengan beberapa cara perhitungan standard error, beberapa cara perhitungan estimasi koefisien jalur, dan beberapa uji signifikansi. Penggunaan Uji Storra-Bentler, Yuan-Bentler, dll, untuk data yang tidak memenuhi asumsi distribusi normal (ukuran sampel relatif kecil), silakan baca referensi terkait. Namun beberapa pilihan hanya dapat berpasangan dengan pilihan lain tertentu. Berikut adalah pilihan-pilihan yang bisa anda coba, sesuaikan dengan kondisi data.
dengan , dan

Output Analisis

Jenis luaran
Luaran analisis diberikan berikut ini, anda bisa memperhatikan perbedaan label dan hasil tergantung pergedaan pilihan yang anda lakukan.

  


 Tes anova dengan  metode  
 
 
Scaled atau unscaled akan terpilih secara otomatis sesuai dengan besarnya scaled correction.

 
  
 

Uji Invarian dengan Grup

  1. Model configural invariance. The same factor structure is imposed on all groups
  2. Model weak invariance (loadings). The factor loadings are constrained to be equal across groups.
  3. Model strong invariance (intercepts) . The factor loadings and intercepts are constrained to be equal across groups.
  4. Model strict invariance (residual )* The factor loadings, intercepts and residual variances are constrained to be equal across groups.
  5. Model (means) The factor loadings, intercepts, residual variances and means are constrained to be equal across groups.



  

Graf Jalur SEM

Selain hasil analisis, paket lavaan () juga menyediakan visualisasi jalur (path diagram dengan beberapa opsi tampilan (baik isi maupun layout).

Selanjutnya luaran grafik jalur dapat dilihat berikut ini

Gambar 4. Tampilan Diagram Jalur Analisis SEM dengan paket lavaan ()

II. Analisis Jalur (Path Analysis ) dengan Lavaan R

Pada analisis jalur yang dipelajari adalah pengaruh langsung suatu indikator ke indikator lain tanpa perlu membentuk variabel laten. Sebenarnya PA dapat dilakukan melalui menu sebelumnya hanya dengan mendefinisikan model regresinya (~) antar indikator dan tanpa perlu mendefinisikan model pengukuran (=~). Hanya untuk tampilan grafiknya diperlukan library khusus. Dari data yang dipilih sebelumnya kita bisa mendefinisikan formulanya melalui kotak formula berikut ini

Pembentukan Model



Hasil Analisis PA

Model yang dihasilkan oleh formua di atas selanjutnya dapat diplot dengan bervariasi tampilan.

Plot Model

Model dan Analisis PA dapat diatur seperti berikut ini. Kita dapat melakukan pilihan variasi (jenis nilai yag ditapilkan, lay out grafik, dll) untuk mendapat tampilan grafik yang terbaik.

Menghitung Pengaruh Langsung dan Taklangsung)

Pengaruh indikator satu ke lainnya dilakukan sebagai berikut ini:
  1. Sebaiknya semua hubungan yang didefinisikan diberi notasi parameter (seperti $a, b, c, p$). Misalnya sebelumnya $y1\sim x1+x2+x3$ dan $y2 \sim y1+x1+x2$ lalu masing-masing diubah menjadi $y1\sim a1*x1+a2*x2+a3*x3$ dan $y2\sim b1*y1+b2*x1+b3*x2$
  2. Dalam hubungan di atas. $x1$ mempengaruhi $y2$ secara langsung sebesar $b2$ dan tidak langsung melalui $y1$ sebesar $b1\times a1$. Maka efek langsung dan tidak langsung dari $x1$ ke $y2$.
    Pengaruh Langsung (L) dan tak langsung (TL) dan Total (TT). Untuk latihan lainnya perhatikan semua jalur yang menghubungkan dua variabel berdasarkan arah pengaruh
    	#Langsung x1 ke y2
    	L_x1y2:=b2
    	#Tidak langsung hanya melalui y1
    	TL_x1y2:=a1*b1
    	#Total
    	TT_x1y2:=b2+a1*b1
    	
Selanjutnya kita bisa memodifikasi formula di atas menjadi seperti berikut ini.
y1~a1*x1+a2*x2+a3*x3
y2~b1*y1+b2*x1+b3*x2+b4*x3
y3~c1*y2+c2*y1+c3*x1+c4*x2+c5*x3
L_x1y2:=b2
TL_x1y2:=a1*b1
TT_x1y2:=b2+a1*b1
Selanjutnya anda bisa copy & paste skrip tersebut ke jendela formula. Ata anda bisa mendefinisikan sendiri yang anda perlukan. , dan Jenis luaran

  

Rangkuman

  1. CB-SEM merupakan model konfirmatif, bukan eksploratif, artinya sebelum menggunakan CB-SEM kita harus memiliki dasar teori yang kuat terkait laten dan indikatornya serta hubungan antara laten. CB-SEM lalu mengkonfirmasi model teori tersebut. Bukan mencoba-coba atau mengeksplorasi model berdasarkan data.
  2. Selain mengolah data mentah (asli), CB-SEM mampu menganalisis model hanya bermodal masukan matriks variansi-kovariansi.
  3. CB-SEM mensyaratkan bahwa indikator memenuhi asumsi bersebaran Normal/ Gaussian
  4. CB-SEM dibedakan menjadi beberapa jenis diantaranya
  5. CB-SEM juga bisa mempertimbangkan adanya kelompok dalam data dan memeriksa apakah kelompok berpengaruh terhadap model. Dengan kata lain apakah masing-masing kelompok memiliki model yang berbeda secara signifikan

Permasalahan Terbuka

  1. Apakah perbedaan cara menghitung SE dan melakukan tes (termasuk adanya koreksi), akan menghasilkan hasil estimasi yang berbeda secara signifikan (misalnya dari signifikan menjadi tidak signifikan atau sebaliknya)
  2. Bagaimana hasil di atas jika dikaitkan dengan ukuran sampel (kecil <30, 30 < sedang <150, dan besar > 150)

Sumber Bacaan Teori:

Berikut adalah beberapa referensi yang bisa dieksplorasi untuk lebih memehami SEM dan PA. Tidak tertutup kemungkinan seiring berjalan waktu, ada referensi online yang lebih baru.
  1. A. I. Almira, I M. Tirta, D. Anggraeni. 2014. Robust Standard Errors Dengan Satorra-Bentler Scaled Test Statistic Untuk Mengatasi Nonnormalitas Dalam Analisis Structural Equation Modeling Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 Vol 1, No 1: 22-34
  2. J. Bean. 2021. Using R in Social Work Research [Chapter 4-5]https://bookdown.org/bean_jerry/bookdown_r_for_social_workers/
  3. K Gana & K Broc. 2019. Structural Equation Modeling with lavaan . Wiley
  4. J. D. Holster. 2022. Introduction to R for Data Science: A LISA 2020 Guidebook [Chapter 6] https://bookdown.org/jdholster1/idsr/
  5. C.F. Hofacker. 2007. Mathematical Marketing New South Network Services.
  6. G. Jang. R Cookbook for Structural Equation Modeling https://gabriellajg.github.io/EPSY-579-R-Cookbook-for-SEM/ [Diakses 5 Nopember 2024]
  7. Y. Rosseel. 2014. Structual Equation Model with lavaan alamat https://personality-project.org/r/tutorials/summerschool.14/rosseel_sem_intro.pdf [Maret 2017]
  8. Y. Rosseel. 2017. The lavaan tutorial alamat https://personality-project.org/r/tutorials/summerschool.14/rosseel_sem_intro.pdf [Maret 2017]