PENGGUNAAN PROGRAM R - … dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika pengguna...
Transcript of PENGGUNAAN PROGRAM R - … dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika pengguna...
PENGGUNAAN PROGRAM R 2009
LAPORAN PRAKTIKUM KOMPUTASI STATISTIKAPENGGUNAAN PROGRAM R
DALAM MENYELESESAIKAN PERMASALAHAN STATISTIKA
Oleh :
WIDNU PRAMANA PUTRA BARUS (10835)
GEMPUR SAFAR (10877)
ADHIARSA RAKHMAN (11063)
ARYA ANDIKA DUMANAUW (11093)
Asisten:
JIM OKLAHOMA
MEILIANA BUDI EKAWATI
Dosen Pengampu :
Dr.rer.nat. DEDI ROSADI, S.Si., M.Sc.
LABORATORIUM KOMPUTASI STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2009
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Permasalahan
1. Berikut ini adalah data keuntungan penjualan (Y) suatu produk yang dipengaruhi oleh
jenis promosi :
Penjualan Iklan Koran Iklan TV Iklan Radio Jumlah Outlet215.36 20.98 27.90 13.23 7.00295.15 22.41 32.28 13.44 5.00254.26 22.98 29.49 15.26 10.00452.62 23.21 39.17 18.45 5.00330.92 23.25 34.25 19.58 8.00320.14 23.45 33.63 12.03 8.00254.25 24.86 29.38 13.87 6.00235.26 24.88 29.19 15.69 9.00302.21 25.00 32.82 16.35 9.00312.25 25.12 33.44 12.88 8.00222.32 25.87 29.14 18.97 8.00265.99 25.89 32.09 12.05 11.00300.12 26.23 32.33 12.23 7.00265.21 26.23 30.22 15.87 5.00354.25 26.25 35.42 13.67 6.00323.45 28.94 33.72 18.29 9.00362.02 29.80 35.84 15.26 8.00423.00 32.26 37.12 13.56 5.00400.23 32.79 36.10 18.78 9.00412.60 33.45 36.85 13.02 6.00423.22 33.98 37.44 16.59 7.00400.25 34.55 36.15 14.23 9.00366.25 34.76 35.92 15.26 9.00435.23 35.99 38.20 15.78 8.00430.22 36.21 37.91 13.33 10.00352.16 36.25 34.79 12.89 9.00365.21 36.87 35.91 12.45 8.00415.25 36.99 36.96 19.25 8.00451.29 40.12 38.98 14.32 8.00512.33 44.98 39.33 13.45 8.00
Analisislah data di atas, hingga diperoleh model regresi terbaik, kemudian lakukan
analisis residual pada model yang telah diperoleh!
Ingat, asumsi analisis residual :
• Normalitas
• Homoskedastisitas
• No Autokorelasi
• No Multikolinearitas
(Tidak perlu dilakukan penanganan jika asumsi-asumsi untuk analisis residual tidak
terpenuhi !)
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
2. Tiga galur tikus diteliti di bawah 2 kondisi lingkungan yang berbeda dengan mengukur
unjuk kerjanya dalam suatu test lorong-lorong yang rumit. Skor kesalahan bagi 48
tikus yang dicobakan adalah sebagai berikut:
Lingkungan GalurCerdik Campuran Dungu
Bebas
28 12 33 83 101 9422 23 36 14 33 5625 10 41 76 122 8336 86 22 58 35 23
Terbatas
72 32 60 89 136 12048 93 35 126 38 15325 31 83 110 64 12891 19 99 118 87 140
Diasumsikan data berdistribusi normal dan variansi nya sama. Apakah ada efek
antara lingkungan dan galur dengan unjuk kerja tikus? (Petunjuk : Gunakan Anava 2
arah !)
3. a. Diketahui seseorang berusia 25 tahun , peluang dia tetap hidup sampai 1 tahun
lagi adalah 0.9 , dengan begitu, probabilitasnya dia akan mati sebelum satu tahun
adalah 0.1 .Usia Bambang sekarang 25 tahun. Berapa peluang bambang
meninggal sebelum usia 28? tunjukkan matrix stokastik / matrix transisi n-
langkahnya!
b. Tanpa mengganti probabilitas kematian pada poin a, terdapat tambahan asumsi
dimana peluang seseorang yang sehat berusia 25 tahun menderita suatu penyakit
kronis sebelum 1 thn kedepan adalah 0.2, Dan peluang seseorang dengan umur
yang sama dan telah menderita penyakit tersebut untuk mati sebelum 1 tahun
kedepan adalah 3 kali lipat peluang kematian seseorang yang sehat. Dan
diketahui seseorang yang telah terjang kit penyakit ini tidak mungkin untuk
sembuh. Berapa kemungkinannya Sinta akan bertahan sampai setidaknya 2
tahun dari sekarang? tunjukkan juga matrix stokastiknya!
4.a. Dengan mengunakan operasi matriks di R dan aturan Cramer selesaikan
persamaan berikut:
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
b. Buat fungsi untuk mencari persamaan regresi linear berganda dan harus bisa
digunakan untuk semua data.
5. a. Tulislah fungsi untuk menghitung sudut terkecil yang terbentuk antara jarum
panjang dan jarum pendek saat menunjuk jam tertentu. sebagai contoh jika
pengguna memasukkan jam 3.30 fungsi akan menampilkan output “75 derajat”.
Input dari fungsi ini adalah dua bilangan bulat yang melambangkan jam dan menit.
Output dari fungsi ini adalah sudut terkecil yang dibentuk oleh jam tersebut.
b. Tuliskan fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan
linear berikut: dengan
c. Tulislah fungsi yang meminta masukan dari pengguna berupa koordinat tiga titik.
Fungsi ini harus menuliskan “segitiga” jika titik-titik tersebut dapat membentuk
segitiga dan “bukan segitiga” jika titik-titik tersebut tidak dapat membentuk segitiga.
Sebagai contoh jika pengguna memasukkan tiga titik masing-masing (1,1), (3,3),
dan (5,5) fungsi akan menampilkan “bukan segitiga”. Bila pengguna memasukkan
(1,1), (3,3) dan (5,0) fungsi akan menampilkan “segitiga”. Input dari pengguna
adalah enam bilangan real yang melambangkan nilai x dan y dari tiga koordinat
titik. Output dari fungsi ini adalah “segitiga” atau “bukan segitiga”.
6. Buat fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2
karakter dimana karakternya tidak boleh sama dengan karakter di kanan, kiri, atas
dan bawahnya(selang seling gitu lho!)dengan inputnya adalah tinggi segitiga-nya!
berikut contoh outputnya untuk input 8 dan 15:
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Jawab :
1. Data :
Pemodelan Regresi (menggunakan Rcmdr):
Scatter Diagram : Graph Scatterplot (scatterplot matrix) pilih sumbu x dan y
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Statistics Fit Models Linear Regression
Output :
Dari output tersebut diperoleh bahwa :
R-square = 0.9721 yang berarti bahwa model regresi dengan 4 variabel independet tersebut mampu menjelaskan 97.21% variasi dalam penjualan.
Adjusted R-square = 0.9677
Untuk uji overall test, kita dapat melihat nilai output pada baris terakhir, terlihat bahwa p-value < 2.2e-16 yang dapat disimpulkan bahwa model regresi dengan 4 variabel independen tersebut layak untuk digunakan.
Selanjutnya untuk uji partial kelayakan masing-masing variabel independen, terlihat bahwa ada variabel independen yang tidak signifikan, yaitu Iklan Radio, maka dilakukan regresi ulang tanpa mengikutsertakan variabel ini. Dan diperoleh :
Terlihat semua variabel telah signifikan, sehingg diperoleh model regresi :
Penjualan= - 370.5591+ 2.1453 IklanKoran + 19.9495 IklanTV – 4.0195 JumlahOutlet
Analisis Residual
Models Numerical Diagnostic pilih analisis residual yang ingin dilakukan
Normalitas Residual
Models Graphs Basic Diagnostic Plots
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Dari Normal QQ-Plot tersebut terlihat bahwa nilai observasi (titik-titik) terletak dekat dengan garis diagonal yang menandakan residual berdistribusi normal.
Atau dengan menggunakan uji Shapiro-Wilk karena data berjumlah 30 (<50) dengan terlebih dahulu menyimpan nilai residual dengan cara
Models Add Observation Statistics to Data aktifkan Residual
Setelah itu pilih
Statistics Summaries Shapiro –Wilk test of Normality pilih residual
Terlihat bahwa nilai p-value > alpha 0.05 yang berarti asumsi kenormalan data terpenuhi.
No autokorelasi
Statistics Summaries Durbin Watson Test For autokorelation
Durbin-Watson testdata: Penjualan ~ Iklan.Koran + Iklan.TV + Jumlah.Outlet DW = 1.5966, p-value = 0.1804alternative hypothesis: true autocorelation is not 0
dari output tersebut terlihat bahwa p-value = 0.1804 > alpha 0.05 yang berartoi
bahwa Hipothesis nol tidak ditolak, sehingga dapat disimpulkan bahwa asusmsi
no autokorelasi residual terpenuhi.
Non Multikolinearitas
Untuk mengetahui apakah asumsi no Multikolinieritas terpenuhi, langsung di cek
dengan mengetikkan sintax vif(nama model regresi fit yang diperoleh)
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Dari output terlihat bahwa semua nilai VIF < 10 yang berarti bahwa asumsi no
multikolinearitas terpenuhi
Homoskedastisitas
Terlihat bahwa asumsi homoskedastisitas tidak terpenuhi karena terlihat titik-titik
residual terletak menyebar jauh dari nol. Dan cenderung membentuk pola
kuadratik
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
2. Data
Analisis Variansi 2 Arah :
Statistics means Multi-way ANOVA
Output :
Anova Table (Type II tests)Response: kesalahan Sum Sq Df F value Pr(>F) galur 18154 2 9.0356 0.0005448 ***lingkungan 14876 1 14.8076 0.0003988 ***galur:lingkungan 1235 2 0.6148 0.5455629 Residuals 42193 42 Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dari output tersebut terlihat bahwa efek galur dan efek lingkungan masing-masing
secara terpisah signifikan untuk tingkat signifikansi 5%, sedangkan untuk interaksi
antara galur dan lingkungan tidak signifikan.
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
3. a. Sintax :
Jadi, peluang budi meninggal sebelum usia 28 tahun adalah 0.271
b. syntax
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Jawab :
4.a. Dengan mengunakan operasi matriks di R dan aturan Cramer akan diselesaikan
persamaan berikut:
Script R dan hasil :
a=matrix(c(1,-3,-1,0,4,-2,2,6,3),nrow=3)
b=matrix(c(6,30,8,0,4,-2,2,6,3),nrow=3)
c=matrix(c(1,-3,-1,6,30,8,2,6,3),nrow=3)
d=matrix(c(1,-3,-1,0,4,-2,6,30,8),nrow=3)
x=det(b)/det(a)
y=det(c)/det(a)
z=det(d)/det(a)
{
cat("x1=",x,"\n")
cat("x2=",y,"\n")
cat("x3=",z,"\n")
}
x1= -0.909091
x2= 1.636364
x3= 3.454545
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
b. Fungsi untuk mencari persamaan regresi linear berganda dan bisa digunakan
untuk semua data
Script :
reg.ganda=function(x,y)
{
X=cbind(1,x)
n=length(y)
p=ncol(X)
b=solve(t(X)%*%X)%*%(t(X)%*%y)
dfr=p-1
dfe=n-p
dft=n-1
ssr=round((t(b)%*%(t(X)%*%y)-(sum(y))^2/n)[1],3)
sse=round((t(y)%*%y-t(b)%*%t(X)%*%y)[1],3)
sst=ssr+sse
msr=round(ssr/dfr,3)
mse=round(sse/dfe,3)
fhit=round(msr/mse,3)
p_v=round(pf((fhit),dfr,dfe,lower.tail=FALSE),3)
rsquare=round(ssr/sst,3)
r=round(sqrt(rsquare),3)
adjrsquare=round(rsquare-((p-1)*(1-rsquare)/(n-p)),3)
yhead=X%*%b
ehead=y-yhead
min=round(min(ehead),3)
max=round(max(ehead),3)
q1=round(quantile(ehead)[2],3)
q2=round(quantile(ehead)[3],3)
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
q3=round(quantile(ehead)[4],3)
residual=cbind(min,q1,q2,q3,max)
colnames(residual)=c("Min","1Q","Median","3Q","Max")
rownames(residual)=""
skuadrat=mse*solve(t(X)%*%X)
sb=NULL
for(i in 1:ncol(skuadrat))
{
for(j in 1:nrow(skuadrat))
{
if(i==j)
{
sb[i]=sqrt(skuadrat[i,j])
}
}
}
t_hit=round(b/sb,4)
p_value=round(2*pt(abs(t_hit),dfe,lower.tail=FALSE),4)
beta=NULL
for(i in 1:ncol(X))
{
beta[i]=i-1
}
coefficients=data.frame(Beta=beta,Estimate.Std=b,Std.Error=sb,t_value=t_hit,P_value=p_value)
anova=data.frame(smbr.var=c("Regresi","Sesatan","Total"),db=c(dfr,dfe,dft),SS=c(ssr,sse,sst),MS=c(msr,mse," "),F_hit=c(fhit," "," "),P_value=c(p_v," "," "))
model=data.frame(R=r,R.Square=rsquare,Adj.R.Square=adjrsquare)
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
list(Residuals=residual,Model.Summary=model,ANOVA=anova,Coefficients=coefficients)
}
{
cat("\tANALISIS REGRESI GANDA\n")
cat("usage:\n")
cat("regganda(x,y)\n")
cat("\tx=matrix(x)\n")
cat("\ty=matrix(y)\n")
}
5. a. Fungsi untuk Menghitung Sudut Terkecil yang Terbentuk dari 2 Jarum Jam
Script di R :
Contoh :
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
b. fungsi untuk mencari semua nilai x, y dan z yang memenuhi persamaan linear
berikut: dengan
Script :
Output :
c. Fungsi Untuk menentukan apakah 3 koordinat titik membentuk segitiga atau tidak
Script :
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Contoh :
6. fungsi untuk menampilkan segitiga cantik sama kaki yang mengandung 2 karakter dimana karakternya tidak sama dengan karakter di kanan, kiri, atas dan bawahnya dengan input adalah tinggi segitiga
Script :
w i n d u , g e m p u r , a d h i , a r y a Page 0
PENGGUNAAN PROGRAM R 2009
Contoh (untuk tinggi 10 dan 20)
w i n d u , g e m p u r , a d h i , a r y a Page 0