Tugas Final Probabilitas dan Statistika

64
Tugas Final Probabilitas dan Statistika “R-Graph” Disusun Oleh : Nama : Sherly N. Thahir (11013102) Mariane K. Toar (11013045) JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK 2 0 1 2 UNIVERSITAS KATOLIK DE LA SALLE MANADO

description

IT

Transcript of Tugas Final Probabilitas dan Statistika

Page 1: Tugas Final Probabilitas dan Statistika

Tugas Final Probabilitas

dan Statistika

“R-Graph”

Disusun Oleh :

Nama : Sherly N. Thahir

(11013102)

Mariane K. Toar

(11013045)

JURUSAN TEKNIK INFORMATIKA

FAKULTAS TEKNIK

2

0

1

2

UNIVERSITAS KATOLIK DE LA SALLE

MANADO

Page 2: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

i

DAFTAR ISI

DAFTAR ISI .................................................................... i

BAB I – LANDASAN TEORI ........................................... 1

BAB II – PEMBAHASAN ................................................ 3

BAB II.1 – GRAFIK MENGGUNAKAN

R‐Commander………………………………. 9

BAB III – CODING ........................................................ 27

REFERENSI .................................................................... ii

Page 3: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 1 | 61

BAB I

LANDASAN TEORI

Grafik sering juga disebut sebagai diagram, bagan, maupun

chart. Pada dasarnya grafik berfungsi memberikan penjelasan kepada

para pembaca grafik atau orang yang membutuhkan data. Grafik itu

sendiri bisa memudahkan pembaca untuk mengetahui dan membaca

data tanpa menggunakan kata - kata yang bertele-tele karena grafik

menyajikan data dalam bentuk angka dalam sebuah lembar kerja dalam

bentuk visualisasi grafik.

Berikut ini adalah pengertian dan definisi grafik:

# NANI DARMAYANTI

Grafik adalah gambaran pasang surut suatu keadaan yang dilukiskan

dengan garis atau gambar.

# KARL E. CASE

Grafik adalah penyajian dua dimensi dari suatu kelompok angka atau data

# MURRAY R. SPIEGEL & LARRY J. STEPHENS

Grafik merupakan tampilan gambar dari hubungan di antara variabel -

variabel

# I WAYAN NUARSA

Grafik merupakan penyajian data dalam bentuk gambar atau simbol

# SOEDARSO

Grafik merupakan bentuk penyajian visual yang dipakai untuk

membandingkan jumlah data pada saat - saat yang berbeda

# YUDHY WICAKSONO

Grafik merupakan salah satu model penyajian data dalam bentuk visual

yang banyak digunakan di berbagai bidang profesi

# HERY SONAWAN

Grafik merupakan penggambaran data - data yang di plot dalam sebuah

bidang yang menghubungkan dua variabel atau lebih

Page 4: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 2 | 61

# LILIS ROHAENI & FIKRURRAHMAN

Grafik merupakan sebuah gambar yang terdiri atas garis titik - titik koordinat

# J. SUPRANTO

Grafik merupakan gambar - gambar yang menunjukkan secara visual data

berupa angka (mungkin juga dengan simbol - simbol) yang biasanya juga

berasal dari tabel - tabel yang telah dibuat

# MURRAY

Grafik adalah representasi gambar dari hubungan yang terdapat di antara

variabel - variabel

# KATHLEEN MEEHAN ARIAS

Grafik adalah sebuah metode yang digunakan untuk menyajikan data

kuantitatif secara visual

Dalam pembahasan kali ini akan dibahas beberapa macam grafik dan

menggunakan R-program untuk mempermudah pembuatan grafik

tersebut.

Bahasa R merupakan versi sumber terbuka (open-source) dari

bahasa pemrograman S (Azola dan Harrel, 2006). Versi komersial yang

berbasis bahasa S adalah S plus. Bahasa R memiliki kemampuan yang tidak

kalah dangan paket-paket program pengolahan data komersial bahkan

dalam beberapa hal kemampuannya lebih baik. Perbandingan R

khususnya terhadap SAS dibahas secara rinci oleh Azola dan Harrel (2006).

Bahasa R mendapat sambutan yang baik dari kalangan statistikawan di

seluruh dunia, sayangnya di Indonesia belum banyak dikenal. Tulisan ini

dibuat untuk mengenalkan bahasa R khsusunya kalangan akademisi di

Indonesia, dan untuk mendukung gerakan IGOS (Indonesia Go Open

Source).

Page 5: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 3 | 61

BAB II

PEMBAHASAN

Penjelasan mengenai beberapa jenis grafik/diagram :

Histogram

Dalam ilmu statistik, histogram adalah sebuah representasi grafik yang

menampilkan impresi visual dari distribusi data. Histogram adalah sebuah

estimasi distribusi probabilitas dari variabel kontinyu dan pertama kali

diperkenalkan oleh seorang ahli bernama Karl Pearson. Histogram terdiri dari

frekuensi tabular, ditunjukan sebagai balok yang berdekatan, didirikan

sepanjang interval yang berlainan, dengan luas yang sama dengan

frekuensi dari observasi di dalam interval. Tinggi dari balok juga sama

dengan densitas frekuensi dari intervalyaitu frekuensi yang dibagi oleh lebar

dari interval. Keseluruhan luas atau area dari histogram sama dengan

jumlah data yang ada. histogram juga dapat dinormalisasi dalam

menampilkan frekuensi relative. Hal ini kemudian menunjukkan proporsi dari

beberapa case yang jatuh pada masing-msaing kategori, dengan luas

total yang sama dengan 1. Kategori-kategori ini biasanya dispesifikasi

secara berurutan, tidak ada overlapping interval pada setiap variabel.

Kategori (interval) harus terletak secara berdampingan, dan sering kali

dipilih dalam bentuk yang memiliki ukuran yang sama.

Kata histogram berasal dari bahasa Yunani: histos, dan gramma. Pertama

kali digunakan oleh Karl Pearson pada tahun 1895 untuk memetakan

distribusi frekuensi dengan luasan area grafis batangan menunjukkan

proporsi banyak frekuensi yang terjadi pada tiap kategori.[2] dan

merupakan salah satu dari 7 basic tools of quality control yaitu Diagram

Pareto (Pareto chart), check sheet, diagram kontrol (control chart), Diagram

ishikawa (cause-and-effect diagram), Diagram alir (flowchart), dan scatter

diagram. Laman lain yang menjelaskan konsep histogram termasuk

konstruksi, model diagram dan perubahannya.

Page 6: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 4 | 61

Diagram garis

Ada kalanya data dicatat pada waktu-waktu tertentu secara berurutan.

Dengan menempatkan waktu pada sumbu horizontal dan nilai-nilai data

dicatat pada sumbu vertikal akan diperoleh titik-titik. Jika titik-titik tersebut

dihubungkan oleh garis lurus maka terbentuklah suatu diagram garis seperti

di bawah ini.

Salah satu kelebihan dari diagram garis, perubahan lulusan dari tahun ke

tahun mudah dilihat. Dengan diagram jenis ini, kita juga dapat mengetahui

kecenderungan data yang kita amati. Kemudian kita dapat

memperkirakan waktu selanjutnya, tentunya dengan hati-hati. Ada dua

istilah mengenai perkiraan data menggunakan diagram garis, yaitu:

1. Interpolasi adalah membuat perkiraan nilai data di antara waktu

berurutan yang diketahui. Misalnya kita kehilangan data mengenai

banyaknya lulusan SMA jaya Selalu tahun 2004. Kita bisa

memperkirakan data melalui data tahun 2003 dan 2005.

2. Ekstrapolasi adalah membuat perkiraan nilai data untuk waktu yang

akan datang (di luar waktu-waktu yang diketahui). Misalnya kita

memperkirakan banyaknya lulusan tahun 2008 dengan

menggunakan data tahun 2005 dan 2006. Biasanya kita melakukan

ekstrapolasi dengan memperpanjang diagram tersebut.

Diagram batang

Diagram batang menggunakan persegi panjang (batang) untuk

menyatakan banyaknya data pada kategori tertentu (bisa waktu, tempat,

dan lain-lain). Banyaknya data dinyatakan sebagai tinggi batang

sedangkan lebar dari tiap batang dibuat sama. Letak batang disusun

Page 7: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 5 | 61

berjajar dan diberi jarak antar batang. Untuk lebih jelasnya lihat contoh

berikut:

Diagram lingkaran

Diagram lingkaran adalah diagram yang digunakan untuk menunjukkan

perbandingan (rasio) nilai data tertentu terhadap semua data.

Diagram lingkaran disajikan dengan membagi lingkaran menjadi beberapa

sektor atau juring. Banyaknya sector tergantung dari banyaknya data.

Setiap sector menunjukkan satu datum atau satu jenis data. Besar sector

merupakan prosentase dari nilai datum terhadap keseluruhan nilai data.

Untuk lebih jelasnya silahkan lihat contoh berikut ini:

Gambarkan diagram lingkaran yang menyatakan jumlah siswa yang

bersekolah di SD, SMP, dan SMA dalam Sekolah Jaya Selalu. Diketahui

banyaknya siswa SD 750, siswa SMP 450, siswa SMA 600.

Page 8: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 6 | 61

Diagram kotak-garis

Diagram kotak-garis atau (box-plot) merupakan suatu diagram yang

menggambarkan letak statistika lima serangkai (ukuran terbesar, ukuran

terkecil, media, kuartil atas, kuaartil bawah) dalam bentuk kotak yang

berekor. Untuk lebih jelasnya dapat dilihat pada diagram di bawah ini.

Untuk membuat diagram kotak-garis, kita haya perlu mencari statistika lima

serangkai dari data dan kemudian menempatkannya sesuai dengan

contoh diagram di atas.

Diagram batang-daun

Diagram batang-daun terdiri atas batang-batang dan setiap btang terdiri

dari beberapa daun. Diagram ini dapat digunakan untuk melihat seberapa

jauh nilai median terhadap statistik ekstrim (Xmin atau Xmaks).

Untuk membuat diagram batang-daun, pertama data diurutkan terlebih

dahulu dari kecil ke besar. Kemudian data dibagi atas selang-selang dan

Page 9: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 7 | 61

satu selang dinyatakan sebagai satu batang. Datum yang masuk ke dalam

suatu selang merupakan daun dari selang/batang tersebut.

Contohnya jika kita memiliki data 7, 8, 10, 10, 14, 16, 18, 18, 19, 20, 21, 22, 27,

29, 30; diagram batang-daunnya ialah sebagai berikut

Quantile-Quantile Plots

qqnorm adalah fungsi generik metode standar yang menghasilkan plot QQ

normal dari nilai-nilai di y. qqline menambahkan baris ke plot kuantil-kuantil

normal yang melewati kuartil pertama dan ketiga.

qqplot menghasilkan plot QQ dua dataset.

Parameter grafis dapat diberikan sebagai argumen untuk qqnorm, qqplot

dan qqline.

Generic X-Y Plotting

Fungsi umum untuk memplot objek R.

Scatterplots

Sebuah scatter plot atau scattergraph adalah jenis diagram matematika

menggunakan koordinat Cartesian untuk menampilkan nilai-nilai untuk dua

variabel untuk satu set data.

Data ditampilkan sebagai koleksi poin, masing-masing memiliki nilai dari satu

variabel menentukan posisi pada sumbu horisontal dan nilai dari variabel

lain yang menentukan posisi pada sumbu vertikal. Ini semacam plot juga

disebut grafik scatter, scattergram, scatter diagram atau grafik pencar.

Index Plot

Page 10: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 8 | 61

Plot indeks nilai data adalah plot setiap nilai (Y) terhadap tatanan dalam

kumpulan data (X). Jika data yang dimasukkan ke dalam tabel dalam

urutan di mana mereka dikumpulkan, misalnya, maka plot nilai data

terhadap nomor baris akan menghasilkan plot indeks.

Stripchart

Stripchart memproduksi satu dimensi scatter plot (atau plot dot) dari data

yang diberikan. Plot ini merupakan alternatif yang baik untuk boxplots ketika

ukuran sampel kecil.

Dot Plot

Sebuah grafik dot atau dot plot adalah grafik statistik yang terdiri dari titik

data diplot pada skala yang sederhana, biasanya dengan mengisi

lingkaran. Ada dua umum, namun sangat berbeda, versi dari grafik dot.

Yang pertama digambarkan oleh Wilkinson sebagai grafik yang telah

digunakan di tangan-digambar (pre-komputer era) grafik untuk

menggambarkan distribusi. Versi lain digambarkan oleh Cleveland sebagai

alternatif untuk grafik batang, di mana titik-titik yang digunakan untuk

menggambarkan nilai-nilai kuantitatif (misalnya jumlah) yang berhubungan

dengan variabel kategori.

Page 11: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 9 | 61

BAB II.1

GRAFIK MENGGUNAKAN R‐Commander

Pada bab ini akan dibahas penggunaan R‐Commander

untuk membuat penyajian statistik deskriptif dari suatu kumpulan data.

Fokus utama adalah pembuatan beberapa macam bentuk grafik yang

banyak digunakan dalam analisis data.

Sebagai langkah awal, buka kembali program R dengan

mengklik icon R 2.6.1. Kemudian, ubah direktori dimana file workspace

berada. Misalkan file latihan4.RData (hasil impor data SPSS dengan

nama file WORLD95.SAV) ada di ‘C:\Kerja_R’, maka direktori diubah ke

C:\Kerja_R. Load file workspace tersebut dengan menggunakan menu

File, pilih Load Workspace… seperti pada gambar berikut ini.

Gambar 4.1. Jendela dialog untuk Load Workspace

Setelah diklik Load Workspace… maka jendela R akan memberikan pilihan

direktori dan file workspace mana yang akan ditampilkan, seperti yang

terlihat pada Gambar 4.2. Pilihlah file workspace latihan4.RData yang ada

di direktori C:\Kerja_R.

Page 12: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 10 | 61

Gambar 4.2. Jendela dialog untuk pilihan file workspace yang akan

diaktifkan

Langkah selanjutnya adalah mengaktifkan R‐commander

dengan menggunakan perintah library(Rcmdr). Setelah itu, aktifkan

dataset dengan menggunakan menu Data, klik Dataset aktif, dan Pilih

dataset aktif… seperti yang ditampilkan pada Gambar 4.3.

Gambar 4.3. Jendela dialog untuk memilih dataset yang akan diaktifkan

Dari beberapa pilihan Datasets yang ada, klik latihan4 sebagai file

workspace yang akan diaktifkan, seperti pada Gambar 4.4. Dengan

demikian, proses pengaktifan kembali data latihan4 sudah dilakukan, dan

proses analisis data baik secara statistik deskriptif atau inferens dapat

dilakukan.

Page 13: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 11 | 61

Gambar 4.4. Jendela dialog untuk pilihan dataset yang akan diaktifkan

II.1.1. Grafik dalam R‐GUI

R menyediakan banyak menu pilihan grafik pada R‐Commander,

antara lain Histogram, Diagram Batang dan Daun, Boxplot, dan lain‐lain.

Secara lengkap pilihan grafik yang tersedia dapat dilihat pada gambar

berikut ini.

Gambar 4.5. Jendela dialog untuk pilihan Grafik pada R‐Commander

II.1.2. Grafik Histogram

Menu yang digunakan untuk membuat grafik histogram adalah

Grafik, pilih Histogram… . Misalkan akan dibuat histogram untuk variabel

LIFEEXPF (usia harapan hidup wanita di suatu negara), maka pada jendela

dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.6. Isikan jumlah

interval yang diinginkan pada kolom Banyaknya bin, dan klik OK untuk

menampilkan output histogramnya.

Page 14: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 12 | 61

Gambar 4.5. Jendela dialog pilihan variabel untuk pembuatan histogram

Output histogram untuk data LIFEEXPF yang diperoleh dari perintah di atas

dapat dilihat pada Gambar 4.6. Dalam contoh ini, digunakan metode

auto untuk pemilihan jumlah interval, yaitu metode Sturges dan Cacahan

Frekuensi yang digunakan untuk nilai (Skala Sumbu) yang diplotkan pada

histogram. Selain itu dapat digunakan pilihan Persentase atau Kepadatan

pada Skala Sumbu.

Output histogram ini dapat disimpan dengan menggunakan

menu File, dan pilih Save as dari jendela grafik. Pilihlah output yang sesuai,

misalkan saja dalam format PDF. Maka pilih format PDF dalam daftar

format file output. Selanjutnya, beri nama file output dengan

histogramLIFEEXPF.PDF. Selain itu, output histogram ini dapat pula disimpan

dalam format Metafile, Postcript, Png, Bmp, dan Jpeg.

Jika file histogram ini ingin dikopi untuk di insert kedalam program

lain, misalkan kedalam Microsoft Word, maka dapat digunakan menu File,

pilih Copy to the clipboard, dan pilih as a Bitmap atau Ctrl‐C. Kemudian,

buka program Microsoft Word, maka file grafik dapat di paste kan

menggunakan perintah Ctrl‐V.

Page 15: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 13 | 61

Gambar 4.6. Output histogram pada variabel LIFESXPF

Selain menggunakan menu di R‐Commander, pembuatan

histogram dapat juga dilakukan dengan command line di R‐

Console, yaitu dengan command hist diikuti argumen optional yang

diinginkan. Berikut adalah contoh pembuatan histogram dengan

command line untuk variabel LIFEEXPF dan LIFEEXPM (usia harapan

hidup pria di suatu negara).

> Hist(latihan4$LIFEEXPF, scale="frequency", breaks="Sturges",

col="darkgray") > Hist(latihan4$LIFEEXPF, scale="frequency", breaks=10, col="darkgray") > hist(latihan4$LIFEEXPF) > # lihat perbedaan output histogram yang dihasilkan > Hist(latihan4$LIFEEXPM, scale="frequency", breaks="Sturges",

col="darkgray")

> Hist(latihan4$LIFEEXPM, scale="frequency", breaks=10, col="darkgray")

> hist(latihan4$LIFEEXPM

Page 16: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 14 | 61

II.1.3. Diagram Batang dan Daun (Stem‐and‐Leaf)

Menu yang digunakan untuk membuat diagram batang dan

daun adalah Grafik, pilih Sajian Batang dan Daun… . Misalkan akan dibuat

diagram batang dan daun untuk variabel LIFEEXPF, maka pada jendela

dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.7.

Gambar 4.7. Jendela dialog untuk pembuatan diagram batang dan daun

Isikan argumen optional yang diinginkan pada kolom‐kolom yang tersedia,

dan klik OK untuk menampilkan output diagram batang dan daun. Output

dari diagram ini akan ditampilkan di Jendela Keluaran pada R‐Commander

seperti pada Gambar 4.8.

Output tersebut menjelaskan bahwa bilangan pada daun menunjukkan

nilai‐nilai satuan. Sehingga dapat diinterpretasikan bahwa usia

harapan hidup wanita yang terendah adalah 43 tahun dan yang

tertinggi adalah 82 tahun. Ada 3 (tiga) negara dengan usia harapan

hidup wanitanya sebesar 82 tahun. Dalam contoh ini, pilihan Automatik

menghasilkan diagram batang dan daun dengan jumlah kelas dalam

setiap batang adalah 5 kelas interval.

Page 17: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 15 | 61

> stem.leaf(latihan4$LIFEEXPF)

1 | 2: represents 12 leaf unit: 1

n: 109

LO: 43 44 44 45 45 46 47

9 5* | 00

12 t | 223

15 f | 455

17 s | 77

22 5. | 88889

6* |

23 t | 3

26 f | 455

32 s | 677777

39 6. | 8888899

45 7* | 000001

51 t | 222333

(14) f | 44444555555555

44 s | 66666777777888888888

24 7. | 9999999

17 8* | 00000001111111

3 t | 222

Gambar 4.8. Output diagram batang dan daun pada variabel LIFESXPF

Pembuatan diagram batang dan daun ini dapat juga dilakukan

dengan command line di R‐Console, yaitu dengan command stem.leaf

diikuti argumen optional yang diinginkan. Berikut adalah contoh

pembuatan diagram batang dan daun dengan command line untuk

variabel LIFEEXPF dan LIFEEXPM.

Page 18: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 16 | 61

> stem.leaf(latihan4$LIFEEXPF)

> stem.leaf(latihan4$LIFEEXPF, m=2)

> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)

> # lihat perbedaan output diagram batang dan daun yang dihasilkan

> stem.leaf(latihan4$LIFEEXPM)

> stem.leaf(latihan4$LIFEEXPM, m=3)

> stem.leaf(latihan4$LIFEEXPF, style="bare", unit=1)

II.1.4. Grafik BoxPlot

R menyediakan pilihan Boxplot… pada menu Grafik untuk

membuat tampilan BoxPlot dari suatu data. Misalkan akan dibuat

BoxPlot untuk variabel LIFEEXPF berdasarkan RELIGION (kelompok

agama mayoritas di negara tersebut), maka pada jendela dialog yang

muncul, pilih LIFEEXPF seperti pada Gambar 4.9.

Gambar 4.9. Jendela dialog untuk pilihan variabel dalam pembuatan

Setelah itu, pilih Plot dengan kelompok… sehingga diperoleh tampilan

jendela seperti pada Gambar 4.10. Klik RELIGION sebagai variabel

kelompok, dan kemudian klik OK.

Page 19: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 17 | 61

Gambar 4.10. Jendela dialog untuk pilihan variabel kelompok dalam

Boxplot

Output dari BoxPlot yang diperoleh akan ditampilkan di Jendela

Keluaran pada R‐Commander seperti pada Gambar 4.11. Output

tersebut menjelaskan bahwa usia harapan hidup wanita di negara

dengan mayoritas penduduknya beragama Jewish (Yahudi) dan

Protestan secara rata‐rata adalah paling tinggi dibanding lainnya.

Gambar 4.11. Output BoxPlot pada variabel LIFESXPF berdasarkan

RELIGION

Command line di R‐Console dapat juga digunakan untuk pembuatan

BoxPlot, yaitu dengan command boxplot diikuti argumen optional yang

diinginkan. Berikut adalah contoh pembuatan BoxPlot dengan command

line untuk variabel LIFEEXPF dan LIFEEXPM sendiri‐sendiri dan berdasarkan

variabel RELIGION.

Page 20: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 18 | 61

> boxplot(latihan4$LIFEEXPF)

> boxplot(latihan4$LIFEEXPM)

> boxplot(LIFEEXPF~RELIGION, ylab="LIFEEXPF", xlab="RELIGION",

data=latihan4)

> boxplot(latihan4$LIFEEXPF~latihan4$RELIGION)

> # lihat perbedaan output Box‐Plot yang dihasilkan

II.1.5. Grafik QQ‐Plot

QQ‐Plot merupakan salah satu metode eksplorasi secara grafik

yang dapat digunakan untuk menguji apakah suatu data berdistribusi

normal. Untuk membuat grafik QQ‐Plot, R menyediakan pilihan QQ‐Plot…

pada menu Grafik. Misalkan akan dibuat QQ‐Plot untuk variabel

LIFEEXPF, maka pada jendela dialog yang muncul, pilih LIFEEXPF seperti

pada Gambar 4.12.

Gambar 4.12. Jendela dialog untuk pilihan variabel dalam pembuatan

QQ‐Plot

Kemudian pilih LIFEEXPF dari daftar variabel dan gunakan distribusi

normal sebagai distribusi default pada QQ‐Plot. Klik OK, maka akan

diperoleh grafik seperti berikut.

Page 21: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 19 | 61

Gambar 4.13. Output QQ‐Plot pada variabel LIFESXPF

Berdasarkan output pada Gambar 4.13 dapat dijelaskan bahwa variabel

LIFEEXPF tidak berdistribusi normal dan data cenderung menceng ke

kanan (ekor lebih panjang di bagian kiri). Hal ini terlihat jelas juga dari

grafik histogramnya (lihat Gambar 4.6).

Command line di R‐Console dapat juga digunakan untuk

pembuatan QQ‐Plot, yaitu dengan command boxplot diikuti argumen

optional yang diinginkan. Berikut adalah contoh pembuatan BoxPlot

dengan command line untuk variabel LIFEEXPF dan LIFEEXPM sendiri‐sendiri

dan berdasarkan variabel RELIGION.

> qq.plot(latihan4$LIFEEXPF, dist= "norm", labels=FALSE)

> qq.plot(latihan4$LIFEEXPM, dist= "norm", labels=FALSE)

II.1.6. Grafik Diagram Pencar (ScatterPlot)

R menyediakan pilihan Diagram pencar… pada menu Grafik

untuk membuat tampilan ScatterPlot dari suatu data. Misalkan akan dibuat

ScatterPlot untuk variabel LIFEEXPF sebagai sumbu Y dan variabel

LOGGDP sebagai sumbu X. Gunakan default untuk pilihan yang lain,

seperti pada Gambar 4.14.

Page 22: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 20 | 61

Gambar 4.14. Jendela dialog pilihan variabel dalam pembuatan Diagram

Pencar

Kemudian pilih LOG_GDP pada variabel X dan LIFEEXPF untuk variabel Y,

dan klik OK, sehingga diperoleh output grafik seperti berikut ini.

Gambar 4.15. Output Diagram Pencar antara variabel LOG_GDP dan

LIFESXPF

Pada output Diagram Pencar, diperoleh juga grafik Box‐Plot dari

setiap marginal variabel, dan garis regresi linear dan non‐parametrik terbaik

untuk menggambarkan hubungan antara kedua variabel ini.

Page 23: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 21 | 61

Command line di R‐Console dapat juga digunakan untuk

pembuatan Diagram Pencar di atas, yaitu dengan command

scatterplot diikuti argumen optional yang diinginkan. Berikut adalah

contoh pembuatan Diagram Pencar dengan command line untuk

variabel LIFEEXPF sebagai sumbu Y, dan LOG_GDP sebagai sumbu X,

seperti perintah di R‐Commander di atas.

> scatterplot(LIFEEXPF~LOG_GDP, reg.line=lm, smooth=TRUE, labels=FALSE,

boxplots='xy', span=0.5, data=latihan4)

II.1.7. Grafik Plot Rata‐rata (Mean)

R menyediakan pilihan Plot Rerata… pada menu Grafik

untuk membuat tampilan Plot Rata‐rata dari suatu data. Misalkan akan

dibuat Plot Rata‐rata untuk variabel LIFEEXPF berdasarkan REGION

(kelompok wilayah negara), maka pada jendela dialog yang muncul, pilih

REGION dan LIFEEXPF seperti pada Gambar 4.16. Klik OK, sehingga

diperoleh output seperti pada Gambar 4.17.

Gambar 4.16. Jendela dialog pilihan variabel dalam pembuatan Plot Rata‐

rata

Page 24: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 22 | 61

Gambar 4.17. Output Plot Rata‐rata variabel REGION dan LIFESXPF

Pada output Plot Rata‐rata di atas dapat dilihat bahwa LIFEEXPF (usia

harapan hidup wanita) yang terendah rata‐ratanya adalah pada negara‐

negara di Afrika.

Command line di R‐Console untuk pembuatan Plot Rata‐rata

adalah command plotMeans diikuti argumen optional yang diinginkan.

Berikut adalah contoh pembuatan Plot Rata‐rata dengan command line

untuk variabel LIFEEXPF dan REGION.

> plotMeans(latihan4$LIFEEXPF, latihan4$REGION, error.bars="se")

> plotMeans(latihan4$LIFEEXPF, latihan4$REGION, error.bars="conf.int",

level=0.95)

II.1.8. Diagram Batang (Bar‐Chart)

R menyediakan pilihan Diagram batang… pada menu Grafik

untuk membuat tampilan Diagram Batang dari suatu data. Misalkan akan

dibuat Diagram Batang untuk variabel REGION, maka pada jendela

dialog yang muncul, pilih REGION seperti pada Gambar 4.18 berikut ini.

Page 25: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 23 | 61

Gambar 4.18. Jendela dialog pilihan variabel dalam pembuatan Diagram

Batang

Setelah itu klik OK, dan akan diperoleh output Diagram Batang seperti

pada Gambar 4.19. Pada output tersebut dapat dilihat bahwa ada dua

kelompok REGION terbesar, yaitu negara‐negara yang termasuk di

regional OECP dan Amerika Latin.

Command line di R‐Console dapat juga digunakan untuk

pembuatan Diagram Batang, yaitu dengan command barplot diikuti

argumen optional yang diinginkan. Berikut adalah contoh pembuatan

Diagram Batang dengan command line untuk variabel REGION, seperti

perintah di R‐Commander di atas.

> barplot(table(latihan4$REGION), xlab="REGION", ylab="Frequency")

Gambar 4.19. Output Diagram Batang dari variabel REGION

II.1.9. Diagram Lingkaran (Pie‐Chart)

Page 26: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 24 | 61

Tampilan Diagram Lingkaran pada paket R disediakan melalui

pilihan Diagram lingkaran… pada menu Grafik. Misalkan akan dibuat

Diagram Lingkaran untuk variabel REGION, maka pada jendela dialog

yang muncul, pilih REGION seperti pada Gambar 4.20 berikut ini.

Gambar 4.20. Jendela dialog pilihan variabel dalam pembuatan Diagram

Lingkaran

Kemudian klik OK, dan akan diperoleh output Diagram Lingkaran seperti

yang terlihat pada Gambar 4.21.

Gambar 4.21. Output Diagram Lingkaran dari variabel REGION

Command line di R‐Console yang dapat digunakan untuk

pembuatan Diagram Lingkaran adalah pie diikuti argumen optional

yang diinginkan. Berikut adalah contoh pembuatan Diagram Lingkaran

dengan command line untuk variabel REGION, seperti perintah di R‐

Commander di atas.

> pie(table(latihan4$REGION), labels=levels(latihan4$REGION),

main="REGION", col=rainbow(length(levels(latihan4

Page 27: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 25 | 61

II.1.10. Plot Indeks

Plot Indeks adalah suatu plot dari variabel menurut indeks atau

urutan data. Plot ini dalam analisis data statistik lebih dikenal dengan

Time Series Plot. R menyediakan pilihan Plot Indeks… pada menu

Grafik untuk membuat tampilan Plot Indeks dari suatu data. Pada R‐

Commander ini hanya tersedia dua pilihan tipe dari plot, yaitu Paku dan

Poin. Misalkan akan dibuat Plot Indeks untuk variabel LIFEEXPF, maka pada

jendela dialog yang muncul, pilih LIFEEXPF seperti pada Gambar 4.22.

Dalam hal ini, pilih tipe plot Paku, dan kemudian klik OK, sehingga diperoleh

output Plot Indeks seperti yang terlihat pada Gambar 4.23.

Gambar 4.22. Jendela dialog pilihan variabel dalam pembuatan Plot

Indeks

Gambar 4.23. Output Plot Indeks dari variabel LIFEEXPF

Page 28: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 26 | 61

Command line di R‐Console yang dapat digunakan untuk

pembuatan Plot Indeks adalah plot diikuti argumen optional yang

diinginkan. Jika akan menampilkan plot berupa garis, maka dapat

digunakan pilihan type=”l”, yang berarti line atau garis. Berikut adalah

contoh pembuatan Plot Indeks dengan command line untuk variabel

LIFEEXPF.

> plot(latihan4$LIFEEXPF, type="h")

> plot(latihan4$LIFEEXPF, type="p")

> plot(latihan4$LIFEEXPF, type="l", main="Time Series Plot Data LIFEEXPF")

Berikut ini adalah output Plot Indeks pada variabel LIFEEXPF dengan pilihan

tipe garis (line) yang dinotasikan dengan “l”.

Gambar 4.24. Output Plot Indeks dari variabel LIFEEXPF dengan type=”l”

Page 29: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 27 | 61

BAB III

CODING

Membuat Grafik Sederhana Dengan R

Line Charts/Grafik Garis

Pertama kita akan menghasilkan grafik

yang sangat sederhana dengan

menggunakan nilai-nilai dalam vektor

mobil:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Buatlah grafik untuk vektor mobil dengan

semua setelan menjadi default

plot(cars)

Tambahkan judul, garis untuk

menghubungkan titik-titik, dan beberapa

warna:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Grafik mobil menggunakan titik biru

dilapisi oleh garis

plot(cars, type="o", col="blue")

# Buatlah judul dengan warna merah,

hurufnya dapat di-bold/italic

title(main="Autos", col.main="red",

font.main=4)

Page 30: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 28 | 61

Sekarang mari kita menambahkan garis

merah untuk truk dan menentukan rentang

y-axis secara langsung sehingga akan

cukup luas agar sesuai dengan data truk:

# Tentukan 2 vektor

cars <- c(1, 3, 6, 4, 9)

trucks <- c(2, 5, 4, 5, 12)

# Grafik mobil menggunakan sumbu Y

yang berkisar 0-12

plot(cars, type="o", col="blue",

ylim=c(0,12))

# Grafik truk dengan garis putus-putus

merah dan poin persegi

lines(trucks, type="o", pch=22, lty=2,

col="red")

# Buatlah judul dengan warna merah,

hurufnya dapat di-bold/italic

title(main="Autos", col.main="red",

font.main=4)

Selanjutnya mari kita mengubah label

sumbu untuk mencocokkan data dan

menambahkan legenda. Kita juga akan

menghitung nilai sumbu y menggunakan

fungsi max sehingga setiap perubahan

data akan secara otomatis tercermin

dalam grafik.

# Tentukan 2 vektor

cars <- c(1, 3, 6, 4, 9)

trucks <- c(2, 5, 4, 5, 12)

# Hitung berkisar dari 0 sampai nilai maks

mobil dan truk

g_range <- range(0, cars, trucks)

# Grafik autos menggunakan sumbu y

yang berkisar dari 0 sampai max

# Nilai dalam mobil atau truk vektor.

Nonaktifkan sumbu dan

# Penjelasan (label sumbu) sehingga kita

bisa menetapkannya sendiri

Page 31: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 29 | 61

plot(cars, type="o", col="blue",

ylim=g_range,

axes=FALSE, ann=FALSE)

# Buatlah sumbu x menggunakan label

Mon-Fri

axis(1, at=1:5,

lab=c("Mon","Tue","Wed","Thu","Fri"))

# Buatlah sumbu y dengan label

horizontal yang menampilkan ditandai di

# Setiap 4 tanda. 4*0:g_range[2] adalah

sama dengan c(0,4,8,12).

axis(2, las=1, at=4*0:g_range[2])

# Buat kotak di sekitar plot

box()

# Grafik truk dengan garis putus-putus

merah dan poin persegi

lines(trucks, type="o", pch=22, lty=2,

col="red")

# Buatlah judul dengan warna merah,

hurufnya dapat di-bold/italic

title(main="Autos", col.main="red",

font.main=4)

# Label sumbu x dan y dengan teks hijau

gelap/tua

title(xlab="Days", col.lab=rgb(0,0.5,0))

title(ylab="Total", col.lab=rgb(0,0.5,0))

# Buat legenda di (1, g_range[2]) yang

sedikit lebih kecil

# (cex) dan menggunakan warna baris

yang sama dan poin yang digunakan oleh

# Plot sebenarnya

legend(1, g_range[2], c("cars","trucks"),

cex=0.8,

col=c("blue","red"), pch=21:22, lty=1:2);

Sekarang mari kita membaca data grafik

secara langsung dari file tab-delimited. File

tersebut berisi paket tambahan nilai untuk

Page 32: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 30 | 61

SUV. Kita akan menyimpan file dalam

direktori C :/ R (Anda akan menggunakan

cara yang berbeda jika tidak

menggunakan Windows).

autos.dat

autos.dat

cars trucks suvs

1 2 4

3 5 4

6 4 6

4 5 6

9 12 16

Kita juga akan menggunakan vektor untuk

menyimpan warna yang akan digunakan

dalam grafik, jadi jika kita ingin mengubah

warna nanti, hanya ada satu tempat

dalam file yang perlu dimodifikasi. Akhirnya

kita akan mengirimkan gambar langsung

ke file PNG.

# Baca nilai mobil dan truk dari tab-

delimited autos.dat

autos_data <- read.table("C:/R/autos.dat",

header=T, sep="\t")

# Hitung nilai y terbesar yang digunakan

dalam data (atau kita bisa

# Hanya menggunakan rentang lagi)

max_y <- max(autos_data)

# Tentukan warna yang akan digunakan

untuk mobil, truk, SUV

plot_colors <- c("blue","red","forestgreen")

# Mulai driver perangkat PNG untuk

menyimpan output ke figure.png

png(filename="C:/R/figure.png",

height=295, width=300,

bg="white")

# Grafik autos menggunakan sumbu y

yang berkisar dari 0 sampai max_y.

Page 33: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 31 | 61

# Nonaktifkan sumbu dan penjelasan

(label sumbu) sehingga kita bisa

# Menentukannya sendiri

plot(autos_data$cars, type="o",

col=plot_colors[1],

ylim=c(0,max_y), axes=FALSE,

ann=FALSE)

# Buat sumbu x menggunakan label Mon-

Fri

axis(1, at=1:5, lab=c("Mon", "Tue", "Wed",

"Thu", "Fri"))

# Buatlah sumbu y dengan label

horizontal yang menampilkan ditandai di

# Setiap 4 tanda. 4*0:max_y adalah sama

dengan c(0,4,8,12).

axis(2, las=1, at=4*0:max_y)

# Buat kotak sekitar plot

box()

# Grafik truk dengan garis putus-putus

merah dan poin persegi

lines(autos_data$trucks, type="o", pch=22,

lty=2,

col=plot_colors[2])

# Grafik SUV dengan garis putus-putus

berwarna hijau dan titik berlian

lines(autos_data$suvs, type="o", pch=23,

lty=3,

col=plot_colors[3])

# Buatlah judul dengan warna merah,

hurufnya dapat di-bold/italic

title(main="Autos", col.main="red",

font.main=4)

# Label sumbu x dan y dengan teks hijau

gelap/tua

title(xlab= "Days", col.lab=rgb(0,0.5,0))

title(ylab= "Total", col.lab=rgb(0,0.5,0))

# Buat legenda di (1, max_y) yang sedikit

lebih kecil

Page 34: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 32 | 61

# (cex) dan menggunakan warna baris

yang sama dan poin yang digunakan

oleh

# Plot sebenarnya

legend(1, max_y, names(autos_data),

cex=0.8, col=plot_colors,

pch=21:23, lty=1:3);

# Matikan device driver (untuk output

secara langsung ke png)

dev.off()

Dalam contoh berikut ini, kita akan

menyimpan file ke PDF dan memotong

spasi ekstra sekitar grafik, ini berguna ketika

ingin menggunakan angka di LaTeX. Kami

juga akan meningkatkan lebar garis,

mengecilkan ukuran font sumbu, dan

memiringkan sumbu x label ke 45 derajat.

# Baca nilai mobil dan truk dari tab-

delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Tentukan warna yang akan digunakan

untuk mobil, truk, SUV

plot_colors <- c(rgb(r=0.0,g=0.0,b=0.9),

"red", "forestgreen")

# Mulai driver perangkat PDF untuk

menyimpan output ke figure.pdf

pdf(file="C:/R/figure.pdf", height=3.5,

width=5)

# Memotong ruang marjin berlebih

(bawah, kiri, atas, kanan)

par(mar=c(4.2, 3.8, 0.2, 0.2))

# Grafik autos menggunakan sumbu Y

yang menggunakan berbagai nilai

Page 35: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 33 | 61

# Di autos_data. Label sumbu dengan

font yang lebih kecil dan gunakan lebih

besar

# Lebar garis.

plot(autos_data$cars, type="l",

col=plot_colors[1],

ylim=range(autos_data), axes=F, ann=T,

xlab="Days",

ylab="Total", cex.lab=0.8, lwd=2)

# Membuat tanda centang sumbu x

tanpa label

axis(1, lab=F)

# Plot label sumbu x pada tanda centang

default dengan label di

# Sudut 45 derajat

text(axTicks(1), par("usr")[3] - 2, srt=45,

adj=1,

labels=c("Mon", "Tue", "Wed", "Thu",

"Fri"),

xpd=T, cex=0.8)

# Plot sumbu y horisontal dengan label

yang lebih kecil

axis(2, las=1, cex.axis=0.8)

# Buat kotak sekitar plot

box()

# Grafik truk dengan garis tebal putus-

putus merah

lines(autos_data$trucks, type="l", lty=2,

lwd=2,

col=plot_colors[2])

# Grafik SUV dengan garis tebal putus-

putus berwarna hijau

lines(autos_data$suvs, type="l", lty=3,

lwd=2,

col=plot_colors[3])

# Buat legenda di sudut kiri atas yang

sedikit

# Lebih kecil dan tidak memiliki batas

Page 36: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 34 | 61

legend("topleft", names(autos_data),

cex=0.8, col=plot_colors,

lty=1:3, lwd=2, bty="n");

# Matikan device driver (untuk output

secara langsung ke png)

dev.off()

# Mengembalikan margin standar

par(mar=c(5, 4, 4, 2) + 0.1)

Bar Charts/Grafik Batang

Mari kita mulai dengan bar chart

sederhana grafik vektor mobil:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Grfik mobil

barplot(cars)

Mari kita sekarang membaca data

otomatis dari file data autos.dat,

menambahkan label, perbatasan biru di

sekitar bar, dan garis kepadatan:

# Baca nilai dari tab-delimited autos.dat

autos_data <- read.table("C:/R/autos.dat",

header=T, sep="\t")

# Grafik mobil dengan label tertentu

untuk sumbu. Gunakan batas

# Biru dan garis diagonal di bar.

barplot(autos_data$cars, main="Cars",

xlab="Days",

ylab="Total",

names.arg=c("Mon","Tue","Wed","Thu","Fri")

,

border="blue", density=c(10,20,30,40,50))

Page 37: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 35 | 61

Sekarang mari kita grafik jumlah autos per

hari dengan menggunakan beberapa

warna dan menunjukkan legenda:

# Baca nilai dari tab-delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Grafik autos dengan bar yang

berdekatan menggunakan warna pelangi

barplot(as.matrix(autos_data),

main="Autos", ylab= "Total",

beside=TRUE, col=rainbow(5))

# Tempatkan legenda di sudut kiri atas

dengan tanpa frame

# menggunakan warna pelangi

legend("topleft",

c("Mon","Tue","Wed","Thu","Fri"), cex=0.6,

bty="n", fill=rainbow(5));

Mari kita grafik jumlah autos per hari

menggunakan grafik batang ditumpuk

dan tempat legenda di luar area plot:

# Baca nilai dari tab-delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Memperluas sisi kanan rect kliping untuk

memberikan ruang bagi legenda

par(xpd=T, mar=par()$mar+c(0,0,0,4))

# Grafik autos (transposing matriks)

dengan menggunakan warna panas,

# Menempatkan 10% dari ruang antara

setiap batang, dan membuat label

# Lebih kecil dengan horisontal label

sumbu y

barplot(t(autos_data), main="Autos",

ylab="Total",

col=heat.colors(3), space=0.1,

cex.axis=0.8, las=1,

names.arg=c("Mon","Tue","Wed","Thu","Fri")

, cex=0.8)

Page 38: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 36 | 61

# Tempatkan legenda di (6,30)

menggunakan warna panas

legend(6, 30, names(autos_data), cex=0.8,

fill=heat.colors(3));

# Kembalikan default kliping rect

par(mar=c(5, 4, 4, 2) + 0.1)

Histograms

Mari kita mulai dengan histogram

sederhana grafik distribusi vektor SUV:

# Tentukan vektor SUV dengan nilai 5

suvs <- c(4,4,6,6,16)

# Buat histogram untuk SUV

hist(suvs)

Mari kita sekarang membaca data

otomatis dari file data autos.dat dan plot

histogram dari mobil gabungan, truk, dan

data suv dalam warna.

# Baca nilai dari tab-delimited autos.dat

autos_data <- read.table("C:/R/autos.dat",

header=T, sep="\t")

# Menggabungkan tiga vektor

autos <- c(autos_data$cars,

autos_data$trucks,

autos_data$suvs)

# Buat histogram untuk autos dalam biru

muda dengan sumbu y

# Berkisar dari 0-10

hist(autos, col="lightblue", ylim=c(0,10))

Page 39: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 37 | 61

Sekarang mengubah menjadi pecah

sehingga tak satu pun dari nilai

dikelomokkan bersama dan membalik

label sumbu y secara horisontal.

# Baca nilai dari tab-delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Menggabungkan tiga vektor

autos <- c(autos_data$cars,

autos_data$trucks,

autos_data$suvs)

# Hitung nilai y terbesar digunakan dalam

autos

max_num <- max(autos)

# Buat histogram untuk mobil dengan

warna api, mengatur break

# Jadi setiap nomor berada pada

kelompoknya sendiri, membuat berbagai

sumbu x dari

# 0-max_num, menonaktifkan right-closing

interval sel, mengatur

# Judul, dan membuat label sumbu y

horizontal

hist(autos, col=heat.colors(max_num),

breaks=max_num,

xlim=c(0,max_num), right=F,

main="Autos Histogram", las=1)

Sekarang mari kita membuat pecah

merata dan grafik kepadatan probabilitas.

# Read values from tab-delimited

autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Menggabungkan tiga vektor

autos <- c(autos_data$cars,

autos_data$trucks,

autos_data$suvs)

# Hitung nilai y terbesar digunakan dalam

autos

Page 40: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 38 | 61

max_num <- max(autos)

# Buat pecah merata

brk <- c(0,3,4,5,6,10,16)

# Buat histogram untuk mobil dengan

warna api, mengatur merat

# Pecah, membuat berbagai sumbu x dari

0-MAX_NUM, menonaktifkan right-

# closing Dari interval sel, mengatur judul,

membuat label sumbu y

# Horisontal, membuat label sumbu yang

lebih kecil, membuat daerah masing-

masing

# Sebanding dengan jumlah kolom

hist(autos, col=heat.colors(length(brk)),

breaks=brk,

xlim=c(0,max_num), right=F,

main="Probability Density",

las=1, cex.axis=0.8, freq=F)

Dalam contoh ini kita akan merencanakan

distribusi dari 1000 nilai acak yang memiliki

distribusi log-normal.

# Dapatkan distribusi log-normal acak

r <- rlnorm(1000)

hist(r)

Karena log-normal distribusi normal terlihat

lebih baik daripada sumbu log-log, mari

kita gunakan fungsi plot dengan poin

untuk menunjukkan distribusi.

# Dapatkan distribusi log-normal acak

r <- rlnorm(1000)

# Dapatkan distribusi tanpa

merencanakan menggunakan pecah

yang ketat.

h <- hist(r, plot=F,

breaks=c(seq(0,max(r)+1, .1)))

Page 41: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 39 | 61

# Plot distribusi menggunakan skala log

pada kedua sumbu, dan menggunakan

# Poin biru

plot(h$counts, log="xy", pch=20,

col="blue",

main="Log-normal distribution",

xlab="Value", ylab="Frequency")

Pie Charts/Grafik Kue(Lingkaran)

Mari kita mulai dengan pie chart

sederhana grafik vektor mobil:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Buat pie chart untuk mobil

pie(cars)

Sekarang mari kita menambahkan judul,

mengubah warna, dan menentukan label

kita sendiri:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Buat pie chart dengan judul yang

ditetapkan dan

# Kustom warna dan label

pie(cars, main="Cars",

col=rainbow(length(cars)),

labels=c("Mon","Tue","Wed","Thu","Fri"))

Sekarang mari kita mengubah warna,

label menggunakan persentase, dan

membuat legenda:

# Tentukan vektor mobil dengan nilai 5

cars <- c(1, 3, 6, 4, 9)

# Tentukan beberapa warna yang ideal

untuk cetak hitam & putih

colors <-

c("white","grey70","grey90","grey50","blac

k")

Page 42: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 40 | 61

# Hitung persentase untuk setiap hari,

dibulatkan menjadi satu

# tempat desimal

car_labels <- round(cars/sum(cars) * 100,

1)

# Menyatukan '%' char setelah setiap nilai

car_labels <- paste(car_labels, "%",

sep="")

# Buat pie chart dengan judul yang

ditetapkan dan warna kustom

# and labels

pie(cars, main="Cars", col=colors,

labels=car_labels,

cex=0.8)

# Buat legenda di bagian kanan

legend(1.5, 0.5,

c("Mon","Tue","Wed","Thu","Fri"), cex=0.8,

fill=colors)

Dotcharts/Grafik Titik

Mari kita mulai dengan dotchart

sederhana grafik data autos:

# Baca nilai dari tab-delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Buat dotchart untuk autos

dotchart(t(autos_data))

Page 43: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 41 | 61

Mari kita membuat dotchart yang sedikit

lebih berwarna:

# Baca nilai dari tab-delimited autos.dat

autos_data <-

read.table("C:/R/autos.dat", header=T,

sep="\t")

# Buat dotchart berwarna untuk mobil

dengan label yang lebih kecil

dotchart(t(autos_data),

color=c("red","blue","darkgreen"),

main="Dotchart for Autos", cex=0.8)

Misc/Lain-lain

Contoh ini menunjukkan semua 25 simbol

yang dapat Anda gunakan untuk

menghasilkan poin dalam grafik Anda:

# Membuat tabel kosong

plot(1, 1, xlim=c(1,5.5), ylim=c(0,7),

type="n", ann=FALSE)

# Plot digit 0-4 dengan bertambahnya

ukuran dan warna

text(1:5, rep(6,5), labels=c(0:4), cex=1:5,

col=1:5)

# Plot simbol 0-4 dengan bertambahnya

ukuran dan warna

points(1:5, rep(5,5), cex=1:5, col=1:5,

pch=0:4)

text((1:5)+0.4, rep(5,5), cex=0.6, (0:4))

# Plot simbol 5-9 dengan label

points(1:5, rep(4,5), cex=2, pch=(5:9))

text((1:5)+0.4, rep(4,5), cex=0.6, (5:9))

# Plot simbol 10-14 dengan label

Page 44: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 42 | 61

points(1:5, rep(3,5), cex=2, pch=(10:14))

text((1:5)+0.4, rep(3,5), cex=0.6, (10:14))

# Plot simbol 15-19 dengan label

points(1:5, rep(2,5), cex=2, pch=(15:19))

text((1:5)+0.4, rep(2,5), cex=0.6, (15:19))

# Plot simbol 20-25 dengan label

points((1:6)*0.8+0.2, rep(1,6), cex=2,

pch=(20:25))

text((1:6)*0.8+0.5, rep(1,6), cex=0.6,

(20:25))

Membuat Histogram & Polygon pada R-Programming

- Langkah pertama masukkan nilai mahasiswa dengan data berikut :

> data = c(41, 45, 49, 51, 52, 53, 55, 56, 63, 57, 57, 58, 59, 60, 61, 67, 62, 56,

63, 35, 65, 65, 65, 67, 67, 73, 61, 69, 69, 96, 69, 70, 71, 71, 77, 79, 73, 93, 73,

81, 75, 75, 77, 77, 89, 67, 79, 79, 81, 59, 83, 83, 87, 89, 71, 92, 81, 65, 84, 73)

> data

maka akan keluar

[1] 41 45 49 51 52 53 55 56 63 57 57 58 59 60 61 67 62 56 63 35 65 65 65 67 67

[26] 73 61 69 69 96 69 70 71 71 77 79 73 93 73 81 75 75 77 77 89 67 79 79 81 59

[51] 83 83 87 89 71 92 81 65 84 73

- Kemudian kita urutkan nilai dari urutan terkecil sampai terbesar dengan

menggunakan rumus :

> sort(data)

Outputnya :

[1] 35 41 45 49 51 52 53 55 56 56 57 57 58 59 59 60 61 61 62 63 63 65 65 65 65

[26] 67 67 67 67 69 69 69 70 71 71 71 73 73 73 73 75 75 77 77 77 79 79 79 81 81

[51] 81 83 83 84 87 89 89 92 93 96

- Selanjutnya kita cari nilai terkecil dengan menggunakan rumus :

> min(data)

Outputnya : [1] 35

- Lalu kita cari nilai terbesar dengan menggunakan rumus :

> max(data)

Outputnya : [1] 96

- Bila kita ingin mengetahui jumlah data yang dimasukkan dengan

menggunakan rumus :

> length(data)

Page 45: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 43 | 61

Outputnya : [1] 60

- Kemudian masukkan rumus :

> jmlkls = 1+(3.322*log10(length(data)))

> jmlkls

Outputnya : [1] 6.907018

- Untuk membulatkan nilai hasil dari jmlkls menggunakan rumus :

> round(jmlkls)

Outputnya : [1] 7

- Selanjutnya mencari jangkauan dari data menggunakan rumus :

> jang = max(data) - min(data)

> jang

Outputnya : [1] 61

- Kemudian mencari interval dari data menggunakan rumus :

> int = jang/jmlkls

> int

Outputnya : [1] 8.831596

- Untuk membulatkan nilai hasil dari inteval menggunakan rumus :

> round(int)

Outputnya : [1] 9

Perhatikan gambar dibawah ini :

- Setelah itu kita buat tabel dengan cara masukkan rumus : >

tabel=edit(data.frame())

Kemudian ubahlah nama Var 1 menjadi Kelas dengan type character.

Lihat gambar dibawah :

Page 46: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 44 | 61

- Selanjutnya isi data tabel sesuai kelas-kelas yang di tentukan

Maka akan terlihat seperti gambar dibawah ini :

- Setelah mengisi kelas seperti gambar di atas kemudian close tabel

- Sekarang kita cari frekuensi dengan rumus :

frek = function (x,y,z)

+ {

+ a = 0

+ for (i in 1 : length (x))

+ {

+ if (x[i]>=y && x[i]<=z)

+ {

+ a = a+1

+ }

+ }

+ print (a)

+ }

Lihat gambar dibawah ini :

Page 47: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 45 | 61

- Kemudian kita isi data frekuensi sesuai kelas yang ditentukan dengan

rumus :

> frek (data,35,43)

[1] 2

> frek (data,44,52)

[1] 4

> frek (data,53,61)

[1] 12

> frek (data,62,70)

[1] 15

> frek (data,71,79)

[1] 15

> frek (data,80,88)

[1] 7

> frek (data,89,97)

[1] 5

- Setelah selesai data tadi dimasukkan kedalam data frekuensi dengan

cara menggunakan rumus :

> fr = c (2,4,12,15,15,7,5)

Lalu

> fr

[1] 2 4 12 15 15 7 5

Lihat gambar dibawah ini :

- Jika kita ingin melihat tabel frekuensi kita masukkan rumus :

> tabel $ frekuensi <-fr

> tabel

Maka akan terbentuk tabel seperti dibawah ini :

Page 48: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 46 | 61

- Selanjutnya kia isi data mean sesuai kelas yang ditentukan dengan cara

masukkan rumus :

> mean (35:43)

[1] 39

> mean (44:52)

[1] 48

> mean (53:61)

[1] 57

> mean (62:70)

[1] 66

> mean (71:79)

[1] 75

> mean (80:88)

[1] 84

> mean (89:97)

[1] 93

- Setelah selesai data tadi dimasukkan kedalam data mean dengan cara

menggunakan rumus :

> me = c (39,48,57,66,75,84,93)

Lalu

> me

[1] 39 48 57 66 75 84 93

Lihat gambar dibawah ini :

- Jika kita ingin melihat tabel mean kita masukkan rumus :

> tabel $ mean <-me

> tabel

Maka akan terbentuk tabel seperti dibawah ini :

Page 49: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 47 | 61

- Kemudian kita tampilkan histogram Nilai Mahasiswa dengan cara

masukkan rumus :

> hist (data, main = "Nilai Mahasiswa")

Maka akan seperti gambar dibawah ini :

- Selanjutnya kita tampilkan polygon Nilai Mahasiswa dengan cara

masukkan rumus :

> plot (me, fr, main = "Nilai Mahasiswa")

Maka akan keluar output seperti ini :

- Bila ingin memberikan warna pada polygon masukkan rumus :

> polygon (me, fr, col = "black" , border = "red")

Maka outputnya akan seperti gambar dibawah ini :

Page 50: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 48 | 61

Boxplot

Boxplots dapat dibuat untuk setiap variabel atau variabel oleh kelompok.

Formatnya adalah boxplot (x, data =), di mana x adalah rumus dan data =

menunjukkan frame data menyediakan data. Contoh dari rumus adalah y

~ kelompok dimana boxplot terpisah untuk y variabel numerik yang

dihasilkan untuk setiap nilai kelompok. Tambahkan varwidth = TRUE untuk

membuat lebar boxplot sebanding dengan akar kuadrat dari ukuran

sampel. Tambahkan horisontal = TRUE untuk membalikkan orientasi sumbu.

# Boxplot of MPG by Car Cylinders

boxplot(mpg~cyl,data=mtcars, main="Car Milage Data",

xlab="Number of Cylinders", ylab="Miles Per Gallon")

Page 51: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 49 | 61

# Notched Boxplot of Tooth Growth Against 2 Crossed Factors

# boxes colored for ease of interpretation

boxplot(len~supp*dose, data=ToothGrowth, notch=TRUE,

col=(c("gold","darkgreen")),

main="Tooth Growth", xlab="Suppliment and Dose")

Dalam boxplot berlekuk, jika dua kotak 'notches tidak tumpang tindih ini

adalah' bukti kuat ' median mereka berbeda

Scatterplots

Ada banyak cara untuk membuat scatterplot di R. Fungsi dasar adalah plot

(x, y), di mana x dan y adalah vektor numerik yang menunjukkan (x, y) poin

untuk plot.

Page 52: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 50 | 61

# Simple Scatterplot

attach(mtcars)

plot(wt, mpg, main="Scatterplot Example",

xlab="Car Weight ", ylab="Miles Per Gallon ", pch=19)

# Add fit lines

abline(lm(mpg~wt), col="red") # regression line (y~x)

lines(lowess(wt,mpg), col="blue") # lowess line (x,y)

Page 53: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 51 | 61

The scatterplot () fungsi dalam paket mobil menawarkan fitur yang

disempurnakan, termasuk garis fit, plot kotak marjinal, pengkondisian pada

faktor, dan identifikasi titik interaktif. Masing-masing fitur adalah opsional.

# Enhanced Scatterplot of MPG vs. Weight

# by Number of Car Cylinders

library(car)

scatterplot(mpg ~ wt | cyl, data=mtcars,

xlab="Weight of Car", ylab="Miles Per Gallon",

main="Enhanced Scatter Plot",

labels=row.names(mtcars))

Page 54: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 52 | 61

Generic X-Y Plotting

Contoh :

require(stats)

plot(cars)

lines(lowess(cars))

Page 55: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 53 | 61

plot(sin, -pi, 2*pi) # see ?plot.function

## Discrete Distribution Plot:

plot(table(rpois(100, 5)), type = "h", col = "red", lwd = 10,

main = "rpois(100, lambda = 5)")

Page 56: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 54 | 61

## Simple quantiles/ECDF, see ecdf() {library(stats)} for a better one:

plot(x <- sort(rnorm(47)), type = "s", main = "plot(x, type = \"s\")")

points(x, cex = .5, col = "dark red")

Page 57: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 55 | 61

Stem-and-Leaf chart

Untuk melihat pola data, khususnya untuk data dengan jumlah sedikit biasa

digunakan diagram dahan-dan-daun. Fungsi stem() memperagakan

diagram ini.

Teladan: Data berikut ini adalah lamanya waktu (dalam menit) yang

diperlukan untuk menunggu lift di UBINUS kampus anggrek, sehingga dapat

digunakan.

2 3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5

> lift<-scan()

1: 2 3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5

21:

Read 20 items

Bila lupa nama persisnya dari fungsi stem, maka dapat dicari dengan

menggunakan fungsi apropos().

> apropos("stem")

[1] "stem" "system" "system.file" "system.time"

> stem(lift)

The decimal point is 1 digit(s) to the right of the |

0 | 000222344568

1 | 23446

2 | 38

3 | 1

> stem(lift,scale=2)

The decimal point is 1 digit(s) to the right of the |

0 | 000222344

0 | 568

1 | 2344

1 | 6

2 | 3

2 | 8

3 | 1

Page 58: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 56 | 61

Quantile-Quantile Plots

Contoh :

y <- rt(200, df = 5)

qqnorm(y); qqline(y, col = 2)

qqplot(y, rt(300, df = 5))

Page 59: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 57 | 61

qqnorm(precip, ylab = "Precipitation [in/yr] for 70 US cities")

Stripchart

x <- stats::rnorm(50)

xr <- round(x, 1)

stripchart(x) ; m <- mean(par("usr")[1:2])

Page 60: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 58 | 61

text(m, 1.04, "stripchart(x, \"overplot\")")

stripchart(xr, method = "stack", add = TRUE, at = 1.2)

Page 61: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 59 | 61

text(m, 1.35, "stripchart(round(x,1), \"stack\")")

stripchart(xr, method = "jitter", add = TRUE, at = 0.7)

Page 62: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 60 | 61

text(m, 0.85, "stripchart(round(x,1), \"jitter\")")

stripchart(decrease ~ treatment,

main = "stripchart(OrchardSprays)",

vertical = TRUE, log = "y", data = OrchardSprays)

Page 63: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

H a l a m a n 61 | 61

stripchart(decrease ~ treatment, at = c(1:8)^2,

main = "stripchart(OrchardSprays)",

vertical = TRUE, log = "y", data = OrchardSprays)

Page 64: Tugas Final Probabilitas dan Statistika

R-GRAPH – Probabilitas Dan Statistika

ii

REFERENSI

Wilkinson, Leland (1999). "Dot plots". The American Statistician (American

Statistical Association) 53 (3): 276–281. doi:10.2307/2686111. JSTOR

2686111.

Cleveland, William S. (1993). Visualizing Data. Hobart Press. ISBN 0-9634884-

0-6. hdl:2027/mdp.39015026891187.

Suhartono. 2008. Analisi Data Statik Dengan R. Surabaya : Lab. Statistik

Komputasi ITS. Panduan Praktikum Komputer Statistika. Bogor : Institut

Pertanian Bogor.

http://carapedia.com/pengertian_definisi_grafik_info2124.html 26/12/2012

http://www.harding.edu/fmccown/r/#autosdatafile

http://id.wikipedia.org/wiki/Histogram

http://sixsigmaindonesia.com/sekilas-mengenai-histogram/

http://defri-z.blogspot.com/2011/10/membuat-tabel-frekuensi-mean-

pada-r.html

http://bahasa-r.blogspot.com/2008/12/manipulasi-data-dan-grafik-

menggunakan.html

http://www.statmethods.net/graphs/boxplot.html

http://www.statmethods.net/graphs/scatterplot.html

http://stat.ethz.ch/R-manual/R-devel/library/graphics/html/plot.html

http://en.wikipedia.org/wiki/Scatter_plot

http://bahasa-r.blogspot.com/2009/03/manul-bahasa-r.html “MANUAL-R”

http://astrostatistics.psu.edu/datasets/2006tutorial/html/stats/html/qqnorm.

html

http://stat.ethz.ch/R-manual/R-devel/library/graphics/html/stripchart.html