Post on 31-Oct-2020
i
PREDIKSI KADAR POLUSI CO MENGGUNAKAN
PENDEKATAN REGRESI LINIER SEDERHANA
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Komputer
Program Studi Teknik Informatika
Oleh :
Paulus Edi Gunawan
125314020
PROGRAM STUDI TEKNIK INFORMATIKA
JURUSAN TEKNIK INFORMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ii
CO POLLUTION LEVEL PREDICTIONS USING
A SIMPLE LINEAR REGRESSION APPOACH
A Final Project
Presented as Partial Fulfillment of The Requirements
To Obtain the Sarjana Komputer Degree
In Informatics Engineering Study Program
By :
Paulus Edi Gunawan
125314020
INFORMATICS ENGINEERING STUDY PROGRAM
DEPARTMENT OF INFORMATICS ENGINEERING
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iii
HALAMAN PERSETUJUAN
SKRIPSI
PREDIKSI KADAR POLUSI CO MENGGUNAKAN
PENDEKATAN REGRESI LINIER SEDERHANA
Disusun Oleh :
Paulus Edi Gunawan
125314020
Telah disetujui oleh :
Dosen Pembimbing
Robertus Adi Nugroho, S.T., M.Eng. Tanggal : 26 Juli 2019
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
iv
HALAMAN PENGESAHAN
SKRIPSI
PREDIKSI KADAR POLUSI CO MENGGUNAKAN
PENDEKATAN REGRESI LINEAR SEDERHANA
Dipersiapkan dan disusun oleh :
Nama : Paulus Edi Gunawan
NIM :125314020
Telah dipersiapkan di depan panitia penguji
pada tanggal
dan dinyatakan memenuhi syarat
Susunan panitia penguji :
Nama Lengkap Tanda tangan
Ketua : Eko Hari Parmadi, S.Si., M.Kom.
Sekretaris : Eduardus Hardika Sandy Atmaja, S.Si., M.Cs.
Anggota 1 : Dr. Anastasia Rita Widiarti, M.Kom.
Anggota 2 : Robertus Adi Nugroho, S.T., M.Eng.
Yogyakarta, 02 Agustus 2019
Fakultas Sains dan Teknologi
Universitas Sanata Dharma
Dekan
Sudi Mungkasi, S. Si., M. Math. Sc., Ph. D.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
v
HALAMAN PERSEMBAHAN
Sekalipun aku jatuh, aku akan bangun pula, sekalipun aku
duduk dalam gelap, TUHAN akan menjadi terangku.
(Mikha 7:8)
Karya ini saya persembahkan kepada :
Tuhan Yesus Kristus yang selalu memberikan berkat, rahmat dan terang Roh
Kudus dalam menjalani proses selama ini.
Keluarga Bapak Yohanes Rukidi, Ibu Elisabet Ratmini yang senantiasa selalu
mendoakan dan memberikan semangat serta selalu mendukung setiap keputusan.
Bapak Robertus Adi Nugroho selaku dosen pembimbing skripsi yang dengan
sabar dan selalu ceria dalam memberikan bimbingan dan pengarahan yang terbaik
dalam pengerjaan tugas akhir.
Ibu Dr. Anastasia Rita Widiarti selaku Kaprodi yang selalu memberkan banyak
bantuan dan dengan rela selalu menyediakan waktu dalam membantu proses
sampai ujian akhir
Seluruh teman – teman semua yang telah banyak memberikan motivasi, semangat
dan selalu menemani selama penyelesaian tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vi
PERNYATAAN KEASLIAN KARYA
Saya menyatakan dengan sesungguhnya bahwa skripsi yang saya tulis ini
tidak memuat karya atau bagian karya orang lain, kecuali yang telah disebutkan
dalam kutipan dan daftar pustaka sebagaimana layaknya sebuah karya ilmiah.
Yogyakarta, 31 Juli 2019
Penulis
Paulus Edi Gunawan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
vii
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS
Yang bertanda tangan di bawah ini, saya mahasiswa Universitas Sanata Dharma :
Nama : Paulus Edi Gunawan
NIM : 125314020
PREDIKSI KADAR POLUSI CO MENGGUNAKAN
PENDEKATAN REGRESI LINIER SEDERHANA
Beserta perangkat yang diperlukan (bila ada). Dengan demikian saya
memberikan kepada perpustakaan Universitas Sanata Dharma hak untuk
menyimpan, mengalihkan dalam bentuk media lain, mengelolanya dalam bentuk
pangkalan data, mendistribusikan secara terbatas, dan mempublikasikan di
internet atau media lain untuk kepentingan akademis tanpa perlu meminta ijin dari
saya maupun memberikan royalty kepada saya selama tetap mencantumkan nama
saya sebagai penulis. Demikian pernyataan ini saya buat degan sebenarnya.
Yogyakarta, 31 Juli 2019
Yang menyatakan
Paulus Edi Gunawan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
viii
PREDIKSI KADAR POLUSI CO MENGGUNAKAN
PENDEKATAN REGRESI LINIER SEDERHANA
ABSTRAK
Kesehatan manusia dipengaruhi berbagai faktor, salah satunya kebersihan
udara. Menurut WHO, polusi udara merupakan faktor risiko penting yang dapat
menyebabkan stroke, kanker paru-paru, penyakit jantung dan infeksi pernapasan
seperti pneumonia. Polusi udara adalah penyebab kematian sekitar 7 juta orang di
seluruh dunia setiap tahun, demikian menurut laporan baru yang dirilis oleh
Organisasi Kesehatan Dunia (WHO).
Bukan tidak mungkin seiring berkembangnya zaman, kondisi dan kualitas
udara semakin menurun karena dampak dari polusi. Salah satu metode yang dapat
mengetahui hasil prediksi kadar polusi yang berfokus pada kadar CO agar
kedepannya manusia bisa mengatisipasi tingkat perkembangan kadar polusi CO
adalah dengan penerapan regresi linear, karena data yang diambil berdasarkan
data asli hasil perekaman kadar polusi CO di Madrid dapat digunakan dalam
perhitungan guna mendapatkan prediksi kadar CO pada tahun mendatang.
Hasil akhir perhitungan Prediksi Kadar Polusi CO Menggunakan
Pendekatan Regresi Linier yang menggunakan data selama tiga tahun untuk
memprediksi tahun depannya mempunyai eror rata – rata sebesar 6%. Sedangkan
pada pola turun 2015 untuk memprediksi tahun 2017 mempunyai eror 3%, pola
naik 2015 untuk memprediksi 2017 mempunyai eror 4%, pola turun 2016 untuk
memprediksi tahun 2017 mempunyai eror 4%, dan pola naik 2016 untuk
memprediksi tahun2017 mempunyai eror 4%.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
ix
CO POLLUTION LEVEL PREDICTIONS USING
A SIMPLE LINEAR REGRESSION APPOACH
ABSTRACT
Human health is influenced by various factors, one of which is air
cleanliness. According to WHO, air pollution is an important risk factor that can
cause strokes, lung cancer, heart disease and respiratory infections such as
pneumonia. Air pollution is the cause of the deaths of around 7 million people
worldwide each year, according to a new report released by the World Health
Organization (WHO).
It is not impossible that as time goes by, air condition and quality will
decrease due to the impact of pollution. One method that can find out the
pollution level prediction results that focus on CO levels so that in the future
humans can anticipate the level of development of CO pollution levels is by
applying linear regression, because data taken based on original data from CO
pollution results in Madrid can be used in the calculation get predictions of CO
levels in the coming year.
The final result of the calculation of CO Pollution Level Prediction Using
the Linear Regression Approach that uses data for three years to predict the year
ahead has an average error of 6%. Whereas in the 2015 descending pattern to
predict 2017 has a 3% error, the 2015 rising pattern for predicting 2017 has a 4%
error, the 2016 down pattern for predicting 2017 has a 4% error, and the 2016
rising pattern for 2016 has a 4% error.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
x
KATA PENGANTAR
Puji dan syukur penulis panjatkan kepada Tuhan Yesus Kristus atas segala
berkat dan rahmat yang melimpah sehingga penulis dapat menyelesaikan tugas
akhir yang berjudul “Prediksi Kadar Polusi CO Menggunakan Pendekatan Regresi
Linier Sederhana”, sebagai salah satu syarat memperoleh gelar Sarjana pada
Program Studi Teknik Informatika Sains dan Teknologi Universitas Sanata
Dharma Yogyakarta.
Pada proses penyusunan tugas akhir ini,tidak lupa penulis mengucapkan
terima kasih kepada pihak – pihak yang telah membantu dalam penyelesaian tugas
akhir. Ucapan terima kasih penulis ucapkan kepada :
1. Tuhan Yesus Kristus yang selalu memberikan kesehatan, berkat dan rahmat
serta pencerahan dalam proses pengerjaan tugas akhir.
2. Keluarga Bapak Yohanes Rukidi, Ibuk Elisabet Ratmini yang tidak pernah
lelah dalam mendukung, memotivasi dan mendoakan penulis.
3. Bapak Robertus Adi Nugroho, S.T., M.Eng selaku dosen pembimbing skripsi
yang dengan sabar memberikan bimbingan dan pengarahan yang terbaik
dalam pengerjaan tugas akhir ini.
4. Ibu Dr. Anastasia Rita Widiarti selaku Kepala Program Studi Teknik
Informatika yang baik hati, selalu mendukung penulis dan dengan sabar tetap
memberi arahan kepada penulis.
5. Lensa Ndarupita yang selalu melungkan waktu untuk memberikan motivasi,
semangat, bantuan, dan penghiburan dalam selama ini kepada penulis.
6. Barisan sahabat – sahabat penulis Teknik Informatika angkatan 2012 yang
sudah mendahului lulus dan yang masih berjuang untuk lulus. Alexander Dwi
Ryo, Novian Bany, Alexcius Rico, Pakde Vincent, Santo Julian, Ando yang
memberikan banyak penghiburan selama pengerjaan tugas akhir.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xi
Penulis menyadari masih banyak kekurangan dalam penulisan tugas akhir
ini. Kritik dan saran yang membangun diharapkan untuk perbaikan dimasa
mendatang. Sebagai informasi pada penulis tugas akhir ini bermanfaat bagi para
pembaca.
Yogyakarta, 31 Juli 2019
Penulis,
Paulus Edi Gunawan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xii
DAFTAR ISI
HALAMAN PERSETUJUAN ............................................................................. iii
HALAMAN PENGESAHAN ............................................................................... iv
HALAMAN PERSEMBAHAN ..............................................................................v
PERNYATAAN KEASLIAN KARYA ................................................................ vi
LEMBAR PERNYATAAN PERSETUJUAN PUBLIKASI KARYA ILMIAH
UNTUK KEPENTINGAN AKADEMIS ............................................................. vii
ABSTRAK ........................................................................................................... viii
ABSTRACT ........................................................................................................... ix
KATA PENGANTAR .............................................................................................x
BAB I .......................................................................................................................1
PENDAHULUAN ...................................................................................................1
1.1. Latar Belakang ..........................................................................................1
1.2. Rumusan Masalah .....................................................................................2
1.3. Tujuan Penelitian .......................................................................................2
1.4. Batasan Masalah ........................................................................................2
1.5. Manfaat Penelitian .....................................................................................3
1.6. Metodologi Penelitian ...............................................................................3
1.7. Sistematika Penulisan ................................................................................3
BAB II ......................................................................................................................5
LANDASAN TEORI ...............................................................................................5
2.1. Polusi Udara ..............................................................................................5
2.2. Pemanasan Global .....................................................................................5
2.3. Definisi Metode Regresi Linier (Linear Regression) ................................5
2.4. Regresi Linear Sederhana ..........................................................................6
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiii
BAB III ....................................................................................................................8
ANALISIS DAN DESAIN PENELITIAN ..............................................................8
3.1. Gambaran Umum ......................................................................................8
3.2. Metodologi Penelitian ...............................................................................8
3.2.1. Studi Literatur ....................................................................................9
3.2.2. Prosedur Analisis Data .......................................................................9
3.2.3. Data ....................................................................................................9
BAB 4 ....................................................................................................................12
HASIL DAN PEMBAHASAN ..............................................................................12
4.1. Prediksi Dengan Regresi Linier Sederhana .............................................12
4.1.1. Uji Satu ............................................................................................12
4.1.2. Uji 2 .................................................................................................14
4.1.3. Uji 3 .................................................................................................16
4.1.4. Uji 4 .................................................................................................18
4.1.5. Uji 5 .................................................................................................19
4.1.6. Uji 6 .................................................................................................21
4.1.7. Uji 7 .................................................................................................23
BAB 5 ....................................................................................................................27
KESIMPULAN DAN SARAN ..............................................................................27
5.1. Kesimpulan ..............................................................................................27
5.2. Saran ........................................................................................................27
DAFTAR PUSTAKA ............................................................................................28
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xiv
DAFTAR GAMBAR
Gambar 2.1. Rumus Persaman……………………………………………………6
Gambar 2.2. Rumus Mencari Nilai a dan b……………………………………….7
Gambar 3.1. Alur Pengerjaan……………………………………………………..8
Gambar 3.2. Rincian Data………………………………………………………..11
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
xv
DAFTAR TABEL
Tabel 4.1. Data Kadar Polusi CO tahun 2015…………………………………..12
Tabel 4.2 Data Kadar Polusi CO tahun 2016 bulan Januari – April……………13
Tabel 4.3 Hasil Perhitungan Uji 1………………………………………………13
Tabel 4.4 Data Kadar Polusi CO tahun 2015 – 2016……………………………14
Tabel 4.5 Data Kadar Polusi CO tahun 2017 bulan Januari – April…………….14
Tabel 4.6 Tabel Hasil Perhitungan Uji 2………………………………………...15
Tabel 4.7. Data Kadar Polusi CO tahun 2015 – 2017…………………………...16
Tabel 4.7 Data Kadar Polusi CO tahun 2018 bulan Januari – April…………….16
Tabel 4.8 Tabel hasil Perhitungan Uji 3…………………………………………17
Tabel 4.9 Data Kadar Polusi CO Tahun 2015 bulan Januari – Juni……………..17
Tabel 4.10 Data Kadar Polusi CO Tahun 2017 bulan Januari – Juni……………18
Tabel 4.11 Data Hasil Perhitungan Uji 4………………………………………...18
Tabel 4.12 Data Kadar Polusi CO Tahun 2015 bulan Juli – Desember…………19
Tabel 4.13 Data Kadar Polusi CO Tahun 2017 bulan Juli – Desember………..19
Tabel 4.14 Data Hasil Perhitungan Uji 5………………………………………...20
Tabel 4.15 Data Kadar Polusi CO Tahun 2016 bulan Januari – Juli…………….20
Tabel 4.16 Data Kadar Polusi CO Tahun 2017 bulan Januari – Juli…………….21
Tabel 4.17 Data Hasil Perhitungan Uji 6………………………………………...21
Tabel 4.18 Data Kadar Polusi CO Tahun 2016 bulan Juni – Desember………...22
Tabel 4.19 Data Kadar Polusi CO Tahun 2017 bulan Juni – Desember………...22
Tabel 4.20 Data Hasil Uji 7……………………………………………………...23
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
1
BAB I
PENDAHULUAN
1.1. Latar Belakang
Keadaan bumi saat ini tidak lebih baik dari pada sebelumnya.
Perusaakan terhadap alam berdampak pada ekosistem yang lebih luas.
Data kementrian kehutanan Republik Indonesia menyatakan sedikitnya
satu heltar atau 2% hutan di Indonesia menyusut tiap tahunnya. Hutan di
Indonesia tersisa 130 juta hektar, 42 juta diantaranya habis ditebang.
Eksploitasi ini sangat mengganggu alam, salah satunya terkait tentang
semakin buruknya kualitas udara.
Kesehatan manusia dipengaruhi berbagai faktor, salah satunya
kebersihan udara. Menurut WHO, polusi udara merupakan faktor risiko
penting yang dapat menyebabkan stroke, kanker paru-paru, penyakit
jantung dan infeksi pernapasan seperti pneumonia. Polusi udara adalah
penyebab kematian sekitar 7 juta orang di seluruh dunia setiap tahun,
demikian menurut laporan baru yang dirilis oleh Organisasi Kesehatan
Dunia (WHO).
Istilah untuk menggambarkan fenomena ini dikenal dengan nama
Global Warming atau Pemanasan Global. Apabila kualitas kesehatan
manusia menurun akibat udara yang memburuk, tentu berdampak luas
pada sektor - sektor yang lain, seperti produktivitas kerja manusia.
Contohnya peristiwa yang terjadi pada Agustus 2018 lalu. Kebakaran
hutan dan lahan (karhutla) terus meningkat, termasuk di Kalimantan Barat.
Asap dampak karhutla sangat mengganggu masyarakat.
Berdasarkan dua uraian di atas bahwasanya penelitian mengenai
kualitas udara sangat penting. Dengan semakin majunya teknologi saat ini
sudah tersedia alat untuk mengukur kualitas udara. Penilitan ini akan
mengabil data hasil pengukuran kualitas udara melalui situs
https://www.kaggle.com/decide-soluciones/air-quality-madrid.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
2
Penilitan ini berusaha untuk membuat prediksi mengenai kadar CO.
Karbon monoksida dipilih sebab CO merupakan salah satu polutan yang
berbahaya jika terus meningkat setiap tahunnya.
Untuk memprediksi kadar polusi karbon monoksida peneliti
menggunakan metode Regresi Linier. Dengan digunakannya metode
regresi linier, penulis berharap bisa mendapatkan tingkat perhitungan dan
hasil akurasi yang tinggi.
1.2. Rumusan Masalah
Berdasarkan dari latar belakang di atas, maka dibuat rumusan masalah
sebagai berikut :
a. Berapa akurasi yang diperoleh untuk memprediksi kadar polusi CO
menggunakan metode Regresi Linier?
1.3. Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mengetahui tingkat akurasi
dalam meprediksi kadar polusi udara CO dengan menggunakan metode
Regresi Linier.
1.4. Batasan Masalah
Dalam pengembangan sistem pendukung pengambilan keputusan,
terdapat batasan-batasan masalah antara lain:
a. Data yang digunakan berasal dari data yang diambil di kota Madrid
dari Kaggle
b. Data yang digunakan adalah data polusi CO tahun 2015, 2016, 2017,
dan ditahun 2018 hanya sampai bulan April pada sensor ukur
28079004.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
3
1.5. Manfaat Penelitian
Manfaat dari penelitian yang dilakukan penulis yaitu :
a. Pembaca dapat mengetahui kadar polusi udara CO dimasa mendatang.
b. Pembaca dapat mengantisipasi dampak bahayanya polusi udara CO
jika hasil pengujian mengalami peningkatan.
1.6. Metodologi Penelitian
a. Pengumpulan Data
Pada tahap ini dilakukan pengumpulan data kadar polusi CO yang
akan digunakan dalam penelitian.
b. Perancangan Sistem
Pada peneitian ini tahap perancangan system dilakukan untuk
membuat rancangan umum dalam pembuatan sistem prediksi kadar
polusi CO dengan menggunakan metode Regresi Linier.
c. Pembuatan Sistem
Berdasarkan hasil perancangan sistem, maka tahap selanjutnya adalah
membuat sistem sesuai dengan rancangan dan kebutuhan.
d. Pengujian
Pengujian dilakukan untuk mengetahui kinerja sistem yang telah
diemplementasikan. Pengujian dilakukan untuk mengetahuiseberapa
besar akurasi prediksi dengan menggunakan metode regresi linier.
e. Pembuatan Laporan
Laporan penelitian dibuat berdasarkan proses dan hasil dari penelitian
yang telah dilakukan.
1.7. Sistematika Penulisan
BAB I : PENDAHULUAN
Dalam bab ini dijelaskan mengenai latar belakang, rumusan masalah,
desain penelitian, analisis kebutuahan proses, batasan masalah, manfaat
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
4
penelitian, metodologi penelitian dan sistematika penulisan pada
penelitian.
BAB II : LANDASAN TEORI
Dalam bab ini dijelaskan mengenai teori – teori yang digunakan untuk
mendukung penelitian ini.
BAB III : ANALISA DAN DESAIN PENELITIAN
Pada bab ini menjelaskan tentang gambaran umum penelitian, desain
penelitian, analisis kebutuhan proses, implementasi perancangan,
penjelasan proses, perancangan antar muka, serta spesifikasi hardware
yang digunakan dalam melakukan implementasi.
BAB IV : HASIL DAN ANALISA
Bab ini membahas hasil dan analisa yang didapat dari penelitian dan
percobaan yang telah dilakukan dalam penelitian ini.
BAB V : KESIMPULAN DAN SARAN
Bab ini berisi kesimpulan dan saran dari hasil analisa, implementasi dan
pengujian sistem.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
5
BAB II
LANDASAN TEORI
2.1. Polusi Udara
Pencemaran udara adalah kehadiran satu atau lebih substansi fisik,
kimia, atau biologi di atmosfer dalam jumlah yang dapat membahayakan
kesehatan manusia, hewan, dan tumbuhan, mengganggu estetika dan
kenyamanan, atau merusak properti. Pencemaran udara dapat ditimbulkan
oleh sumber-sumber alami maupun kegiatan manusia. Beberapa definisi
gangguan fisik seperti polusi suara, panas, radiasi atau polusi cahaya
dianggap sebagai polusi udara. Sifat alami udara mengakibatkan dampak
pencemaran udara dapat bersifat langsung dan lokal, regional, maupun
global. Pencemaran udara di dalam ruangan dapat mempengaruhi
kesehatan manusia sama buruknya dengan pencemaran udara di ruang
terbuka.
2.2. Pemanasan Global
Suatu proses meningkatnya suhu rata-rata atmosfer, laut, dan daratan
Bumi. Meningkatnya suhu global diperkirakan akan menyebabkan
perubahan-perubahan yang lain seperti naiknya permukaan air laut,
meningkatnya intensitas fenomena cuaca yang ekstrem, serta perubahan
jumlah dan pola presipitasi. Akibat-akibat pemanasan global yang lain
adalah terpengaruhnya hasil pertanian, hilangnya gletser, dan punahnya
berbagai jenis hewan.
2.3. Definisi Metode Regresi Linier (Linear Regression)
Persamaan matematik dengan melakukan peramalan nilai - nilai suatu
peubah (variabel) tak bebas dari satu atau lebih peubah bebas disebut
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
6
persamaan regresi. Istilah ini berasal dari hasil pengamatan yang dilakukan
Sir Francis Galton (1822 - 1911) membandingkan tinggi badan anak laki -
laki dengan tinggi badan bapaknya. Galton menyatakan bahwa tinggi
badan anak laki - laki dari bapak yang tinggi pada beberapa generasi
kemungkinan cendurung “mundur” (regressed) mendekati rata - rata
populasi. (Yusuf, 2009).
Dikatakan pula bahwa analisis regresi mempunyai dua jenis variabel yaitu:
1. Variabel Respon (variabel dependen) yaitu variabel yang
keberadaannya dipengaruhi oleh variabel lain dan dinotasikan dengan
variabel Y.
2. Variabel Prediktor (variabel independen) yaitu variabel bebas (tidak
dipengaruhi oleh variabel lain) dan dinotasikan dengan X.
Hubugan – hubungan antara variabel bebas maka regresi linier terdiri
dari dua bentuk, yaitu:
1. Analisis regresi sederhana (simple analysis regresi).
Analisis regresi sederhana merupakan hubungan antara dua
variabel yaitu variabel bebas (variable independen) dan variabel tak
bebas (variabel dependen)
2. Analisis regresi berganda (Multiple analysis regresi).
Analisis regresi berganda merupakan hubungan antara tiga
variabel atau lebih, yaitu sekurang-kurangnya dua variabel bebas
dengan satu variabel tak bebas. Tujuan regresi adalah untuk membuat
perkiraan nilai suatu variabel (variabel dependen) jika nilai variabel
yang satu berhubungan dengan variabel lainnya sudah ditentukan.
2.4. Regresi Linear Sederhana
Regresi linear sederhana dipergunakan untuk mengetahui pengaruh
antara satu buah variabel bebas terhadap satu buah variabel terikat.Bentuk
umum dari persamaan regresi linier untuk suatu populasi menurut Yusuf
(2009) adalah sebagai berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
7
Keterangan:
y' = Nilai yang diproyeksikan
x = Variabel bebas
a = Parameter Intercept
b = Parameter Koefisisen Regresi Variabel Bebas
Dengan Y adalah variabel terikat dan X adalah variabel bebas.
Koefisien a adalah konstanta (intercept) yang merupakan titik potong
antara garis regresi dengan sumbu Y pada koordinat kartesius. Langkah –
langkah yang dilakukan regresi linier dalam menyelesaikan contoh di atas
menurut Yusuf (2009) adalah sebagai berikut :
1. Tentukan Y = variable tak bebas dan X = variable bebas
2. Hitung nilai a dan b
22
22
2
)())((
))(())((
)())((
))(())((
XXn
YXXYnb
XXn
XYXXYa
−
−=
−
−=
………….(2.2)
3. Setelah nilai a dan b ditemukan, masukan nilai a dan b pada rumus
persamaa y = a + bx. Kemudian masukan nilai x. Nilai x
merupakan tahun yang akan diramalahkan.
yˆ = a + bx
........................
..........
……………. (2.1)
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
8
BAB III
ANALISIS DAN DESAIN PENELITIAN
Pada bab Analisa dan Desain Penelitian menjelaskan tentang metode yang
digunakan dalam penelitian Mengukur Kadar Polusi Udara Menggunakan
Pendekatan Regresi Linier. Bab ini berisikan gambaran umum penelitian, desain
penelitian, analisis kebutuhan proses, implementasi perancangan, penjelasan
proses, spesifikasi hardware dan software yang digunakan dalam melakukan
penelitian.
3.1. Gambaran Umum
Penelitian yang dilakukan bertujuan untuk memprediksi kadar
polusi di Madrid pada tahun mendatang . Data input yang digunakan
berupa data dari alat pengukur polusi udara khususnya kandungan CO
yang melakukan perekaman kadar kandungan polusi setiap jam sekali. Jadi
selama satu hari data yang didapat sejumlah 24 data. Kemudian data
tersebut akan diolah menggunakan metode Regresi Linier, sehingga
menghasilkan output prediksi kadar kandungan CO. Kemudian akan
dilakukan penghitungan dalam mencari eror dalam prediksi.
3.2. Metodologi Penelitian
Penelitian yang dilakukan bertujuan untuk memprediksi kadar
polusi di Madrid pada tahun mendatang . Data input yang digunakan
berupa data dari alat pengukur polusi udara khususnya kandungan CO
yang melakukan perekaman kadar kandungan polusi setiap jam sekali. Jadi
selama satu hari data yang didapat sejumlah 24 data. Kemudian data
tersebut akan diolah menggunakan metode Regresi Linier, sehingga
menghasilkan output prediksi kadar kandungan CO. Kemudian akan
dilakukan penghitungan dalam mencari eror dalam prediksi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
9
Metodologi penelitian merupakan cara yang digunakan untuk
mengumpulkan data dan berbagai informasi, dengan melakukan beberapa
tahapan yaitu studi literatur dengan mempelajari refrensi yang terkait
dengan penelitian ini, serta pengumpulan data – data guna untuk
menyelesaikan tujuan yang diinginkan.
3.2.1. Studi Literatur
Studi literatur dilakukan untuk mendapatkan informasi terkait
penelitian yang dilakukan. Studi literatur dilakukan dengan cara
mempelajari buku referensi, artikel dan jurnal yang berkaitan
dengan mengukur kadar polusi udara menggunakan pendekatan
regresi linier.
3.2.2. Prosedur Analisis Data
Analisis pada penelitian ini menggunakan data hasil sensor
polusi udara, kemudian menentukan variable dependen dan
variabel independen. Selanjutnya mencari nilai eror dari hasil
perhitungan prediksi.
Gambar 3.1. Alur Pengerjaan
3.2.3. Data
Tahap pengumpulan data dilakukan dengan cara memperoleh
data dari situs keggle.
Data A dan B Persamaan
y = a + bx
Perhitungan
Prediksi
Uji Akhir
Prediksi
Kesimpulan
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
10
A. Data yang Digunakan
Data yang digunakan adalah data hasil alat pengukur sensor
kandungan CO di Kota Madrid pada tahun 2015, 2016, 2017,
dan 2018. Khusus pada tahun 2018 hanya menggunakan data
pada bulan Januari, Februari, Maret, dan April karena pada
2018 digunakan untuk pengujian dan mencari eror.
B. Teknik Pengumpulan Data
Pada proses pengumpulan data dilakukan pencarian rata –
rata data. Data sebelum diproses berupa data alat ukur sensor
yang mencatat kadar CO setiap jam sekali dalam 24 jam. Jadi
dalam sehari tercatat 24 kali data polusi CO. Sehingga dalam
kurun waktu satu bulan terdapat 720 data tercatat. Dari situlah
didapatkan data rata – rata dalam satu bulan, dan dalam setiap
tahun terdapat 12 data yang digunakan. Berikut merupakan
data yang digunakan :
Bulan Bulan ( X ) CO ( Y )
Jan-15 1 0.59542254
Feb-15 2 0.371411436
Mar-15 3 0.381173767
Apr-15 4 0.292926557
May-15 5 0.260264727
Jun-15 6 0.246135508
Jul-15 7 0.251137927
Aug-15 8 0.237442432
Sep-15 9 0.278002799
Oct-15 10 0.353670413
Nov-15 11 0.518370792
Dec-15 12 0.605462418
Jan-16 13 0.401490724
Feb-16 14 0.372399892
Mar-16 15 0.352751123
Apr-16 16 0.307160777
May-16 17 0.285411899
Jun-16 18 0.25952014
Jul-16 19 0.250426546
Aug-16 20 0.251343653
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
11
Sep-16 21 0.318581981
Oct-16 22 0.414805237
Nov-16 23 0.485722558
Dec-16 24 0.597490415
Jan-17 25 0.525774463
Feb-17 26 0.403481776
Mar-17 27 0.370613804
Apr-17 28 0.334532281
May-17 29 0.29184393
Jun-17 30 0.268301407
Jul-17 31 0.246654054
Aug-17 32 0.241839768
Sep-17 33 0.325465497
Oct-17 34 0.386851029
Nov-17 35 0.512145755
Dec-17 36 0.460228962
Jan-18 37 0.413104108
Feb-18 38 0.390160019
Mar-18 39 0.291483895
Apr-18 40 0.284235765
Gambar 3.2. Rincian Data
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
12
BAB 4
HASIL DAN PEMBAHASAN
Pada bab ini akan menjelaskan bagaimana cara memprediksi kadar polusi
CO dengan menggunakan regresi linier sederhana yang menggunakan data kadar
polusi CO pada tahun 2015, 2016, 2017, dan 2018.
4.1. Prediksi Dengan Regresi Linier Sederhana
4.1.1. Uji 1
Pada pengujian satu data kadar polusi CO yang digunakan
untuk meprediksi adalah data pada tahun 2015. Bertujuan untuk
memprediksi kadar polusi CO tahun 2016 bulan Januari, Februari,
Maret, April.
Tabel 4.1. Data Kadar Polusi CO tahun 2015
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jan-15 1 0.59542254 0.354528001 1 0.59542254
Feb-15 2 0.371411436 0.137946455 4 0.742822872
Mar-15 3 0.381173767 0.14529344 9 1.1435213
Apr-15 4 0.292926557 0.085805968 16 1.171706228
May-15 5 0.260264727 0.067737728 25 1.301323635
Jun-15 6 0.246135508 0.060582688 36 1.476813048
Jul-15 7 0.251137927 0.063070258 49 1.757965488
Aug-15 8 0.237442432 0.056378909 64 1.899539457
Sep-15 9 0.278002799 0.077285556 81 2.50202519
Oct-15 10 0.353670413 0.125082761 100 3.53670413
Nov-15 11 0.518370792 0.268708278 121 5.702078707
Dec-15 12 0.605462418 0.366584739 144 7.265549011
JUMLAH 78 4.391421315 1.809004781 650 29.09547161
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
13
Tabel 4.2 Data Kadar Polusi CO tahun 2016 bulan Januari - April
Bulan ( X ) CO ( Y )
Jan-16 13 0.401490724
Feb-16 14 0.372399892
Mar-16 15 0.352751123
Apr-16 16 0.307160777
Dari tabel 4.2 maka dilakukan perhitungan prediksi menggunakan
regresi linier sederhana dengan mencari nilai a dan b yang
menghasilkan nilai akhir :
a : 0.340895728
b : 0.003854777
Setelah itu nilai a dan b digunkan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.2 dan
dalam pencarian rata – rata error adalah sebagai berikut :
Tabel 4.3 Hasil Perhitungan Uji 1
Data tahun 2015 untuk memprediksi pada tahun 2016 bulan
Januari – April menghasilkan presentase rata – rata eror : 4%.
y=a + bx Error
bulan ke 13 0.391007824 0.010482899
bulan ke 14 0.394862601 0.022462709
bulan ke 15 0.398717378 0.045966254
bulan ke 16 0.402572154 0.095411377
rata -rata 0.04358081
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
14
4.1.2. Uji 2
Pada pengujian ke dua, data kadar polusi CO yang digunakan
untuk meprediksi adalah data pada tahun 2015-2016. Bertujuan
untuk memprediksi kadar polusi CO tahun 2017 bulan Januari,
Februari, Maret, April.
Tabel 4.4 Data Kadar Polusi CO tahun 2015 – 2016
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jan-15 1 0.59542254 0.354528001 1 0.59542254
Feb-15 2 0.371411436 0.137946455 4 0.742822872
Mar-15 3 0.381173767 0.14529344 9 1.1435213
Apr-15 4 0.292926557 0.085805968 16 1.171706228
May-15 5 0.260264727 0.067737728 25 1.301323635
Jun-15 6 0.246135508 0.060582688 36 1.476813048
Jul-15 7 0.251137927 0.063070258 49 1.757965488
Aug-15 8 0.237442432 0.056378909 64 1.899539457
Sep-15 9 0.278002799 0.077285556 81 2.50202519
Oct-15 10 0.353670413 0.125082761 100 3.53670413
Nov-15 11 0.518370792 0.268708278 121 5.702078707
Dec-15 12 0.605462418 0.366584739 144 7.265549011
Jan-16 13 0.401490724 0.161194801 169 5.219379406
Feb-16 14 0.372399892 0.13868168 196 5.213598489
Mar-16 15 0.352751123 0.124433355 225 5.291266849
Apr-16 16 0.307160777 0.094347743 256 4.914572431
May-16 17 0.285411899 0.081459952 289 4.85200228
Jun-16 18 0.25952014 0.067350703 324 4.671362526
Jul-16 19 0.250426546 0.062713455 361 4.758104365
Aug-16 20 0.251343653 0.063173632 400 5.026873067
Sep-16 21 0.318581981 0.101494479 441 6.690221611
Oct-16 22 0.414805237 0.172063384 484 9.125715206
Nov-16 23 0.485722558 0.235926403 529 11.17161883
Dec-16 24 0.597490415 0.356994796 576 14.33976995
300 8.688526259 3.468839164 4900 110.3699566
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
15
Tabel 4.5 Data Kadar Polusi CO tahun 2017 bulan Januari – April
Bulan (x) CO (y)
25 0.525774463
26 0.403481776
27 0.370613804
28 0.334532281
Dari tabel 4.4 maka dilakukan perhitungan prediksi
menggunakan regresi linier sederhana dengan mencari nilai a dan b
yang menghasilkan nilai akhir :
a : 0.342854771
b : 0.001533373
Setelah itu nilai a dan b digunkan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.5 dan
dalam pencarian rata – rata error . Sebagai berikut :
Tabel 4.6 Tabel Hasil Perhitungan Uji 2
y=a + bx Error
bulan ke-25 0.381189084 0.144585379
bulan ke-26 0.382722456 0.02075932
bulan ke-27 0.384255829 0.013642025
bulan ke-28 0.385789201 0.051256921
rata - rata 0.057560911
Data tahun 2015 - 2016 untuk memprediksi pada tahun 2017
bulan Januari – April menghasilkan presentase rata – rata eror :
5%.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
16
4.1.3. Uji 3
Pada pengujian ke tiga, data kadar polusi CO yang digunakan
untuk meprediksi adalah data pada tahun 2015-2017. Bertujuan untuk
memprediksi kadar polusi CO tahun 2018 bulan Januari, Februari, Maret,
April.
Tabel 4.7. Data Kadar Polusi CO tahun 2015 – 2017
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jan-15 1 0.59542254 0.354528001 1 0.59542254
Feb-15 2 0.371411436 0.137946455 4 0.742822872
Mar-15 3 0.381173767 0.14529344 9 1.1435213
Apr-15 4 0.292926557 0.085805968 16 1.171706228
May-15 5 0.260264727 0.067737728 25 1.301323635
Jun-15 6 0.246135508 0.060582688 36 1.476813048
Jul-15 7 0.251137927 0.063070258 49 1.757965488
Aug-15 8 0.237442432 0.056378909 64 1.899539457
Sep-15 9 0.278002799 0.077285556 81 2.50202519
Oct-15 10 0.353670413 0.125082761 100 3.53670413
Nov-15 11 0.518370792 0.268708278 121 5.702078707
Dec-15 12 0.605462418 0.366584739 144 7.265549011
Jan-16 13 0.401490724 0.161194801 169 5.219379406
Feb-16 14 0.372399892 0.13868168 196 5.213598489
Mar-16 15 0.352751123 0.124433355 225 5.291266849
Apr-16 16 0.307160777 0.094347743 256 4.914572431
May-16 17 0.285411899 0.081459952 289 4.85200228
Jun-16 18 0.25952014 0.067350703 324 4.671362526
Jul-16 19 0.250426546 0.062713455 361 4.758104365
Aug-16 20 0.251343653 0.063173632 400 5.026873067
Sep-16 21 0.318581981 0.101494479 441 6.690221611
Oct-16 22 0.414805237 0.172063384 484 9.125715206
Nov-16 23 0.485722558 0.235926403 529 11.17161883
Dec-16 24 0.597490415 0.356994796 576 14.33976995
Jan-17 25 0.525774463 0.276438786 625 0.276438786
Feb-17 26 0.403481776 0.162797543 676 0.162797543
Mar-17 27 0.370613804 0.137354591 729 0.137354591
Apr-17 28 0.334532281 0.111911847 784 0.111911847
May-17 29 0.29184393 0.085172879 841 0.085172879
Jun-17 30 0.268301407 0.071985645 900 0.071985645
Jul-17 31 0.246654054 0.060838222 961 0.060838222
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
17
Aug-17 32 0.241839768 0.058486473 1024 0.058486473
Sep-17 33 0.325465497 0.10592779 1089 0.10592779
Oct-17 34 0.386851029 0.149653719 1156 0.149653719
Nov-17 35 0.512145755 0.262293274 1225 0.262293274
Dec-17 36 0.460228962 0.211810697 1296 0.211810697
jumlah 666 13.05625898 5.163510631 16206 112.0646281
Tabel 4.7 Data Kadar Polusi CO tahun 2018 bulan Januari – April
2018 Bulan ( X ) CO ( Y )
1-Jan 37 0.413104108
1-Feb 38 0.390160019
1-Mar 39 0.291483895
1-Apr 40 0.284235765
Dari tabel 4.7 maka dilakukan perhitungan prediksi menggunakan
regresi linier sederhana dengan mencari nilai a dan b yang menghasilkan
nilai :
a : 0.979227018
b :
-
0.033327198
Setelah itu nilai a dan b digunkan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.7 dan dalam
pencarian rata – rata error adalah sebagai berikut :
Tabel 4.8 Tabel hasil Perhitungan Uji 3
y=a + bx Error
bulan ke 13 0.253879297 0.159224811
bulan ke 14 0.287206495 0.102953524
bulan ke 15 0.320533692 0.029049797
bulan ke 16 0.35386089 0.069625125
rata - rata 0.090213314
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
18
Data tahun 2015 - 2017 untuk memprediksi pada tahun 2018
bulan Januari – April menghasilkan presentase rata – rata eror :
9%.
4.1.4. Uji 4
Pada pengujian ke empat, data kadar polusi CO yang
digunakan untuk meprediksi adalah data pada tahun 2015 bulan
Januari - Juni. Bertujuan untuk memprediksi kadar polusi CO
tahun 2017 bulan Januari – Juni.
Tabel 4.9 Data Kadar Polusi CO Tahun 2015 bulan Januari - Juni
Tahun 2015 Pola Turun
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jan-15 1 0.59542254 0.354528 1 0.59542254
Feb-15 2 0.37141144 0.13794645 4 0.742822872
Mar-15 3 0.38117377 0.14529344 9 1.1435213
Apr-15 4 0.29292656 0.08580597 16 1.171706228
May-15 5 0.26026473 0.06773773 25 1.301323635
Jun-15 6 0.24613551 0.06058269 36 1.476813048
21 2.14733453 0.85189428 91 6.431609623
Tabel 4.10 Data Kadar Polusi CO Tahun 2017 bulan Januari – Juni
Tahun 2017 Pola Turun
Bulan ( X ) CO ( Y )
Jan-17 25 0.525774463
Feb-17 26 0.403481776
Mar-17 27 0.370613804
Apr-17 28 0.334532281
May-17 29 0.29184393
Jun-17 30 0.268301407
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
19
Dari tabel 4.9 maka dilakukan perhitungan prediksi menggunakan
regresi linier sederhana dengan mencari nilai a dan b yang menghasilkan
nilai :
a : 0.574701339
b :
-
0.061946357
Setelah itu, nilai a dan b digunakan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.10 dan
dalam pencarian rata – rata error adalah sebagai berikut :
Tabel 4.11 Data Hasil Perhitungan Uji 4
x y (pred) ERROR
1 0.512754982 0.013019481
2 0.450808625 0.047326849
3 0.388862268 0.018248464
4 0.326915911 0.00761637
5 0.264969554 0.026874376
6 0.203023196 0.06527821
rata -rata eror 0.029727292
- Data Tahun 2015 ( Januari – Juni )
Digunakan untuk memprediksi pada tahun 2017 ( Januari – Juni )
menghasilkan presentase rata – rata eror 3%.
4.1.5. Uji 5
Pada pengujian ke lima, data kadar polusi CO yang digunakan untuk
meprediksi adalah data pada tahun 2015 bulan Juli - Desember. Bertujuan
untuk memprediksi kadar polusi CO tahun 2017 bulan Juli - Desember.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
20
Tabel 4.12 Data Kadar Polusi CO Tahun 2015 bulan Juli – Desember
Tahun 2015 Pola Naik
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jul-15 7 0.251137927 0.063070258 49 1.757965488
Aug-15 8 0.237442432 0.056378909 64 1.899539457
Sep-15 9 0.278002799 0.077285556 81 2.50202519
Oct-15 10 0.353670413 0.125082761 100 3.53670413
Nov-15 11 0.518370792 0.268708278 121 5.702078707
Dec-15 12 0.605462418 0.366584739 144 7.265549011
57 2.24408678 0.957110501 559 22.66386198
Tabel 4.13 Data Kadar Polusi CO Tahun 2017 bulan Juli – Desember
Tahun 2017 Pola Naik
Bulan ( X ) CO ( Y )
Jul-17 31 0.2466541
Aug-17 32 0.2418398
Sep-17 33 0.3254655
Oct-17 34 0.386851
Nov-17 35 0.5121458
Dec-17 36 0.460229
Dari tabel 4.12 maka dilakukan perhitungan prediksi menggunakan
regresi linier sederhana dengan mencari nilai a dan b yang menghasilkan
nilai :
a :
-
0.356148791
b : 0.07685929
Setelah itu, nilai a dan b digunakan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.13 dan
dalam pencarian rata – rata error adalah sebagai berikut :
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
21
Tabel 4.14 Data Hasil Perhitungan Uji 5
X Y (pred) ERROR
7 0.181866239 0.064787815
8 0.258725528 0.016885761
9 0.335584818 0.010119322
10 0.412444108 0.025593079
11 0.489303398 0.022842357
12 0.566162688 0.105933726
rata -rata eror 0.04102701
- Data Tahun 2016 ( Januari – Juni )
Digunakan untuk memprediksi pada tahun 2017 ( Januari – Juni )
menghasilkan presentase rata – rata eror 4%.
4.1.6. Uji 6
Pada pengujian ke enam, data kadar polusi CO yang digunakan untuk
meprediksi adalah data pada tahun 2016 bulan Januari - Juni. Bertujuan
untuk memprediksi kadar polusi CO tahun 2017 bulan Januari - Juni.
Tabel 4.15 Data Kadar Polusi CO Tahun 2016 bulan Januari – Juli
Tahun 2016 Pola Turun
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jan-16 1 0.401490724 0.161194801 1 0.401490724
Feb-16 2 0.372399892 0.13868168 4 0.744799784
Mar-16 3 0.352751123 0.124433355 9 1.05825337
Apr-16 4 0.307160777 0.094347743 16 1.228643108
May-16 5 0.285411899 0.081459952 25 1.427059494
Jun-16 6 0.25952014 0.067350703 36 1.557120842
21 1.978734555 0.667468234 91 6.417367321
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
22
Tabel 4.16 Data Kadar Polusi CO Tahun 2017 bulan Januari – Juli
Tahun 2017 Pola Turun
Bulan ( X ) CO ( Y )
Jan-17 25 0.525774463
Feb-17 26 0.403481776
Mar-17 27 0.370613804
Apr-17 28 0.334532281
May-17 29 0.29184393
Jun-17 30 0.268301407
Dari tabel 4.15 maka dilakukan perhitungan prediksi menggunakan
regresi linier sederhana dengan mencari nilai a dan b yang menghasilkan
nilai :
a : 0.431429817
b : -0.02904021
Setelah itu, nilai a dan b digunakan untuk mencari nilai y ( hasil
prediksi ) untuk memprediksi kadar polusi CO pada tabel 4.13 dan
dalam pencarian rata – rata error adalah sebagai berikut :
Tabel 4.17 Data Hasil Perhitungan Uji 6
x y (pred) ERROR
1 0.40238961 0.123384853
2 0.373349403 0.030132373
3 0.344309196 0.026304608
4 0.315268989 0.019263292
5 0.286228782 0.005615148
6 0.257188575 0.011112831
rata - rata eror 0.035968851
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
23
- Data Tahun 2016 ( Januari - Juni )
Digunakan untuk memprediksi pada tahun 2017
(Januari – Juni) menghasilkan presentase rata – rata eror 4%.
4.1.7. Uji 7
Pada pengujian ke enam, data kadar polusi CO yang digunakan
untuk meprediksi adalah data pada tahun 2016 bulan Januari - Juni.
Bertujuan untuk memprediksi kadar polusi CO tahun 2017 bulan
Januari - Juni.
Tabel 4.18 Data Kadar Polusi CO Tahun 2016 bulan Juni – Desember
Tahun 2016 Pola Naik
Bulan ( X ) CO ( Y ) Y^2 X^2 X*Y
Jul-16 7 0.250426546 0.062713455 49 1.752985819
Aug-16 8 0.251343653 0.063173632 64 2.010749227
Sep-16 9 0.318581981 0.101494479 81 2.867237833
Oct-16 10 0.414805237 0.172063384 100 4.148052366
Nov-16 11 0.485722558 0.235926403 121 5.342948137
Dec-16 12 0.597490415 0.356994796 144 7.169884976
57 2.31837039 0.992366149 559 23.29185836
Tabel 4.19 Data Kadar Polusi CO Tahun 2017 bulan Juni – Desember
Tahun 2017 Pola naik
Bulan ( X
) CO ( Y )
Jul-17 31 0.24665405
Aug-17 32 0.24183977
Sep-17 33 0.3254655
Oct-17 34 0.38685103
Nov-17 35 0.51214575
Dec-17 36 0.46022896
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
24
Dari tabel 4.18 maka dilakukan perhitungan prediksi
menggunakan regresi linier sederhana dengan mencari nilai a dan b
yang menghasilkan nilai:
Setelah itu, nilai a dan b digunakan untuk mencari nilai y
(hasil prediksi) untuk memprediksi kadar polusi CO pada tabel
4.18 dan dalam pencarian rata – rata error adalah sebagai berikut :
Tabel 4.20 Data Hasil Uji 7
x y (pred) ERROR
1 0.205346542 0.041307511
2 0.277765951 0.035926183
3 0.35018536 0.024719864
4 0.422604769 0.03575374
5 0.495024178 0.017121576
6 0.567443587 0.107214626
rata - rata eror 0.043673917
- Data Tahun 2016 ( Januari - Juni )
Digunakan untuk memprediksi pada tahun 2017 ( Januari –
Juni ) menghasilkan presentase rata – rata eror 4%.
4.2. Rata – rata eror
Pencarian eror didapatkan dari hasil pengurangan data rill dan data
hasil prediksi per bulan yang bersifat absolut. Setelah itu, dicari rata – rata
erornya dengan menjumlahkan semua data eror dan dibagi dengan jumlah
data eror.
a :
-
0.301589321
b : 0.072419409
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
25
a. Kondisi pertama
Kondisi pertama menggunakan data uji 1 sampai uji 3 untuk
melihat perbadingan eror yang didapat.
Gambar 4.1 Hasil rata – rata eror masing – masing pengujian kondisi satu
b. Kondisi Ke Dua
Kondisi ke dua menggunakan data uji 4 sampai data uji 7 untuk
melihat perbandingan eror yang didapat.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
26
Gambar 4.2 Hasil rata – rata eror masing – masing pengujian kondisi dua.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
27
BAB 5
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Dari semua hasil uji dalam memprediksi kadar polusi CO dapat
disimpulkan bahawa :
a. Penggunaan pendekatan regresi linier sederhana dapat menghasilkan
presentase nilai eror yang lebih sedikit dan cenderung sama jika
menggunakan data yang membentuk pola, dalam kasus ini pola naik
dan turun. Dengan syarat, data yang digunakan untuk menghitung
prediksi mempunyai pola yang sama dengan data yang akan digunakan
untuk mencari eror dari hasil prediksi.
b. Penggunaan pendekatan regresi linier sederhana menghasilkan nilai
eror yang tinggi dan semakin meningkat ketika banyaknya data untuk
mencari nilai prediksi lebih tinggi dari pada data yang digunakan untuk
mencari nilai rata – rata eror.
5.2. Saran
Saran yang dapat diuraikan dalam penelitian Prediksi Kadar Polusi
CO Menggunakan Pendekatan Regresi Linier Sederhana antara lain :
1. Masih terdapat kesalahan dalam proses penghitungan nilai y, yang
seharusnya nilai y tidak bisa bernilai negatif.
2. Dalam penelitian selanjutnya bisa menggunakan metode yang lain
untuk melakukan prediksi untuk medapakan nilai eror yang semakin
rendah dan tingkat akurasi prediksi semakin tinggi.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
28
DAFTAR PUSTAKA
Wibisono, Yusuf. 2009. Metode Statistik, Yogyakarta : Universitas Gadjah Mada
Different pollution levels in Madrid from 2001 to 2018
https://www.kaggle.com/decide-soluciones/air-quality-madrid diakses
tanggal 14 september 2018
Katemba, Petrus dan Rosita Koro. 2017. Prediksi Tingkat Produksi Kopi
Menggunakan Regresi Linear. Kupang : STIKOM Uyeiindo
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI