Melanjutkan postingan sebelumnya mengenai uji t satu sampel, berikut akan dilanjutkan dengan uji T dua Sampel/Variabel yang antar variabelnya Independent. Ada dua tipe kasus untuk uji T dua variabel ini.
Kedua variabel Numeric
Misalkan seorang peneliti ingin membandingkan rata-rata tinggi siswa di SMA1 dan SMA2. Peneliti mengambil sampel 14 siswa tiap SMA-nya. Berikut datanya.
Nah, peneliti bisa memanfaatkan uji T dua sampel numeric independent untuk menjawab tujuan penelitiannya. Dengan memanfaatkan satu baris script R uji T dibawah ini.
## import data
mydata <- read.table(file="mydata.csv",sep=";",header=T)
## Uji T dua sampel(dua variabel) untuk variabel Tinggi di SMA1 dan SMA2 (alpha = 0.05)
## Apakah rata-rata tinggi di dua SMA itu sama saja atau berbeda.
## H0 : MeanSMA1 = MeanSMA2
## H1 : MeanSMA1 != MeanSMA2 (alternative -> non equal)
t.test(x=mydata$tinggiSMA1,y=mydata$tinggiSMA2,alternative="two.sided",conf.level=0.95,var.equal=TRUE)
Script itu mengandung dua variabel tinggi SMA1 dan SMA2 (x dan y) yang ingin dibandingkan. Dengan tingkat kepercayaan 95%, varians-nya diasumsikan sama, uji yang dilakukan two sided (karena ingin melihat sama atau tidaknya rata-rata tinggi kedua sma).
Sehingga dihasilkan output di bawah ini.
Welch Two Sample t-test
data: mydata$tinggiSMA1 and mydata$tinggiSMA2
t = -0.4541, df = 25.997, p-value = 0.6535
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-8.052431 5.138145
sample estimates:
mean of x mean of y
162.3071 163.7643
Dari hasil output, didapat p-value sebesar 0.6535 dan itu jelas lebih besar dari alpha/2 (0.025), sehingga hipotesis Ho diterima. Jadi rata-rata tinggi siswa di SMA 1 dan 2 sama...
Salah satu variabel binary kategorik
Misalkan peneliti ingin melihat rata-rata tinggi siswa Pria dan Wanita di SMA1 apakah ada perbedaan yang nyata. Peneliti mengambil sampel 14 siswa dan 14 siswi untuk diukur tinggi badannya. Berikut data-nya.
Nah, peneliti juga bisa memanfaatkan uji T dua sampel lewat script R yang agak sedikit berbeda dengan sebelumnya.
## Uji T 2 Variabel / 2 Sampel (salah satunya variabel kategorik) Independent
## import data
mydata2 <- read.table(file="mydata2.csv",sep=";",header=T)
## Uji T dua sampel(dua variabel) untuk variabel Tinggi serta gender di SMA1 (alpha = 0.05)
## Apakah rata-rata tinggi antara pria dan wanita di SMA1 sama atau tidak.
## H0 : Mean pria = Mean wanita
## H1 : Mean pria != Mean wanita (alternative -> non equal)
t.test(mydata2$tinggi ~ mydata2$gender,alternative="two.sided",conf.level=0.95,var.equal=TRUE)
Perbedaanya terletak pada penulisan variabelnya yaitu dengan format y ~ x, dimana y adalah variabel numeriknya (tinggi badan) dan x variabel binary kategoriknya (gender).
Dari script R itu akan dihasilkan output sebagai berikut.
Two Sample t-test
data: mydata2$tinggi by mydata2$gender
t = 5.8261, df = 12, p-value = 8.135e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
8.75539 19.21604
sample estimates:
mean in group pria mean in group wanita
169.3000 155.3143
Dari hasil output didapat p-value sebesar 0.0006972. Itu sangat kecil dan jelas lebih kecil daripada alpha/2 (0.025), sehingga hipotesis Ho ditolak. Dengan kata lain kita menerima H1 bahwa tinggi antara Pria dan Wanita berbeda.
Lalu mana yang memiliki rata-rata lebih tinggi?
Hasil uji di atas telah menunjukkan perbedaan rata-rata tinggi yang nyata dengan p-value sangat kecil. Kita secara mudah dapat menentukan mana yang lebih tinggi dengan melihat output bagian akhir yang menunjukkan rata-rata tinggi tiap grup (pria dan wanita). Dari output itu dapat disimpulkan rata-rata tinggi pria lebih besar daripada wanita. Untuk menjawab ini sebenarnya juga bisa dilakukan lewat uji T dengan alternative “less” atau “greater”.
Yah itu tutorial sedikit dari penggunaan uji T dua sampel Independen. Semoga bermanfaat.
1 komentar:
terima kasih ilmunya.. Bermanfaat. (h)
Posting Komentar