11-Manajemen-Ketersediaan.ppt
Transcript of 11-Manajemen-Ketersediaan.ppt
Teknologi Infrastruktur
1
Manajemen Ketersediaan Layanan
TI
Sasaran
2
Memahami konsep Manajemen Ketersediaan (Availability Management) menurut IT Infrastructure Library.
Mengenal teknik-teknik Manajemen Ketersediaan layanan TI.
Ketersediaan
Ketergantungan bisnis modern pada TI menuntut ketersediaan layanan TI yang tinggi.
Fleksibilitas bisnis berkat teknologi internet menuntut ketersediaan layanan TI setiap saat.
Availability Management berorientasi kepada kebutuhan bisnis dan pengguna akan ketersediaan layanan TI.
3
Ketersediaan
4
Availability: kemampuan untuk menjalankan fungsi pada saat dibutuhkan atau dalam suatu periode waktu.
Ketersediaan layanan TI tergantung pada:Ketersediaan komponen pendukung.Ketahanan terhadap gangguan.Kualitas pemeliharaan dan dukungan teknis.Kualitas proses-proses dan prosedur
pengelolaan.Keamanan, integritas, dan ketersediaan
data.
Ketersediaan
5
Faktor-faktor pendukung ketersediaan:Keandalan (reliability)
Keandalan komponen dan adanya mekanisme penanggulangan gangguan.
Kemudahan pemeliharaan (maintainability)Pemeliharaan untuk mencegah terjadinya
gangguan. Termasuk deteksi tanda-tanda kerusakan.
Kemudahan perbaikan (servicability)Adanya perjanjian/kontrak dukungan
perbaikan dengan vendor atau pihak ketiga.
Peta Ketergantungan
6
Availability Management
7
Tujuan:Mendukung pencapaian tujuan bisnis dengan
mengoptimasi pengerahan infrastruktur, layanan, dan SDM dalam menyediakan dan mempertahankan tingkat ketersediaan secara efisien.
Aktivitas utama: Identifikasi persyaratan ketersediaan bisnis. Menselaraskannya dengan kemampuan
infrastruktur, layanan, dan SDM: identifikasi opsi-opsi penyempurnaan dan biayanya.
Mengukur/monitor realisasi ketersediaan layanan TI.
Ruang Lingkup
8
Lingkup Availability Management:Semua layanan TI yang dikenai SLA atau SLR
(Service Level Agreement & Requirement)Layanan TI vital (tanpa SLA formal sekalipun).Layanan pendukung layanan-layanan diatas
yang disediakan oleh unit kerja internal maupun vendor.
Hal-hal lain yang memiliki dampak pada ketersediaan layanan-layanan diatas, seperti training, keahlian SDM, SOP, dan tools.
Prinsip Manajemen Ketersediaan
9
Prinsip 1: Ketersediaan adalah inti dari (persepsi) kepuasan pengguna dan bisnis.
Prinsip Manajemen Ketersediaan
10
Prinsip 2: Kecepatan menanggulangi gangguan ketersediaan berdampak besar pada kepuasan bisnis dan pengguna.Menuntut adanya proses, prosedur, dan
mekanisme penanggulangan gangguan.
Prinsip 3: Manajemen Ketersediaan yang efektif menuntut pemahaman tentang fungsi layanan TI dalam proses-proses bisnis. Dapat memahami sumber gangguan
dengan lebih baik dari pola utilisasi komponen-komponen sistem.
Proses Manajemen Ketersediaan
11
Peran Manajemen Ketersediaan
12
Sebagai penanggung-jawab dan pengambil keputusan yang berhubungan dengan tingkat ketersediaan.
AvailabilityManagement
CapacityManagement
Service LevelManagement
IT FinancialManagement
Service ContinuityManagement
Usulan SLA
SLA final
Hasil analisakevitalan layanan
Usulan mekanismeminimasi dampak gangguan
Pembiayaan perbaik-an ketersediaan
Kerugian akibatketidak-tersediaan
Rencana kapasitas
Kerawanan kapasitasakibat gangguan
Peran AM sering di-bypass
A
BC
D
A: Biaya Ketersediaan
13
Biaya investasi TI meningkat dengan dinaikannya tingkat ketersediaan.
Tingkat Ketersediaan Optimal
14
Idealnya: disesuaikan dengan kebutuhan dan biayanya setimpal dengan potensi kerugian.
Kebutuhan akan ketersediaan yang melebihi tingkat ketersediaan optimal infrastruktur dapat melambungkan biaya. Biaya redesign infrastruktur
(termasuk dukungan teknis).
Biaya Ketersediaan
15
Prinsip: merencanakan ketersediaan sejak awal (dilibatkan dalam perancangan sistem) akan lebih murah.Availability Management mengusulkan opsi-
opsi pemenuhan persyaratan ketersediaan beserta biayanya.
Tidak semua masalah ketersediaan adalah masalah teknologi.Faktor prosedur operasional dan
pemeliharaan mungkin sangat berpengaruh.
Biaya Ketidak-tersediaan
16
Mengetahui biaya kerugian akibat ketidak-tersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan.
Perkiraan dampak ketidak-tersediaan:1. Jumlah layanan/transaksi bisnis yang
terkena dampak. Mudah dihitung tapi kurang bermanfaat.
2. Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis. Kerugian tangible dan intangible.
Biaya Ketidak-tersediaan
17
Permasalahan:Banyaknya faktor yang harus masuk dalam
perhitungan.Sulit mengkuantifikasi biaya intangible.Data sulit diperoleh.
Biaya Tangible Biaya IntangiblePenurunan produktivitas pengguna Kehilangan kepercayaan konsumenPenurunan produktivitas staf TI Kehilangan konsumenKehilangan pendapatan Kehilangan peluang bisnisBiaya lembur dukungan teknis Jatuhnya reputasi perusahaanPasokan yang tidak terpakai Kehilangan kepercayaan penggunaDenda atau penalti Kerusakan moril staf TI
B: Perencanaan Ketersediaan
18
Ketersediaan umumnya adalah salah satu komponen utama SLA.
Availability Management merumuskan:Kriteria layanan-layanan TI yang vital.Kriteria “ketidak-tersediaan” (downtime).Dampak ketidak-tersediaan pada bisnis.Kebutuhan ketersediaan kuantitatif: batas
toleransi bisnis terhadap downtime.Jam-buka layanan yang diinginkan.Prioritas waktu layanan (jam-jam sibuk, dsb.)Kebutuhan spesifik lainnya (jika ada).
Perencanaan Ketersediaan
19
Evaluasi biaya untuk memenuhi kebutuhan akan ketersediaan:Kuantifikasi dampak ketidak-tersediaan (nilai
kerugian bisnis).Identifikasi persyaratan ketersediaan,
keandalan, dan kemudahan perawatan komponen-komponen yang terlibat.
Identifikasi kemudahan perbaikan komponen-komponen dari vendor eksternal.
Kalkulasi total biaya untuk memenuhi kebutuhan diatas.
Negosiasikan tingkat ketersediaan dengan biaya dan potensi kerugian yang berimbang.
C: Rancangan Proaktif
Tujuan: menghindari terjadinya ketidak-tersediaan layanan TI yang berdampak kerugian.
Prinsip: kegiatan yang tidak terencana (darurat) akan lebih besar biayanya.
20
Perancangan Infrastruktur
21
Availability Management merumuskan:Spesifikasi keandalan dan serviceability
komponen infrastruktur (hardware & software).Baik yang menjadi tanggung-jawab internal
maupun pihak eksternal (vendor).Lokasi dan cara pengukuran ketersediaan.Usulan perbaikan struktur dan prosedur
pengelolaan sistem.Validasi rancangan akhir mengenai
terpenuhinya persyaratan minimum ketersediaan.Analisa dengan model atau melalui
testing/benchmarking.
Analisis Infrastruktur
22
Analisa SPOF (single point of failure) dengan CFIA (component failure impact analysis)Tabulasi layanan dan komponen-komponen
infrastruktur atau CI (configuration item).Tandai ketergantungan layanan terhadap tiap CI:
Kosong jika tidak tergantung pada CI tsb.X jika tergantung sepenuhnya pada CI tsb.A jika tergantung tapi dapat dialihkan ke CI lain.B jika dapat dialihkan ke CI lain tapi harus ada
kegiatan perbaikan (recovery).
CI dengan banyak X adalah komponen kritis. Layanan dengan banyak X adalah layanan
kompleks: potensi keandalannya rendah.
CFIA
23
CI yang kritis harus: Memiliki cadangan atau alternatif. Memiliki prosedur pemulihan (recovery).
CFIATeknik lain: orientasi pada jumlah user yang
terkena dampak.
CI VBF # Users
Power Semua 1000
Application Server Semua 1000
Aplikasi ERP Semua 1000
Disk 1 Pembayaran 50
Disk 2 Pemesanan 100
Utility X Pelaporan 25
24
VBF: vital business function (proses bisnis vital)
Dapat ditambahkan kolom: Kode CI-CI lain yang tergantung padanya.
Kerusakan pada CI akan berdampak pada CI-CI lain tsb.
Semakin banyak semakin kritis CI tsb.
CFIA Lanjut
25
… kolom-kolom tambahan: Probabilitas kerusakan (dari statistik MTBF)
atau dengan label kualitatif: rendah/sedang/tinggi.
Perkiraan waktu perbaikan: Dari data perbaikan masa lalu, atau Dari hasil uji-coba prosedur perbaikan.
Fault Tree AnalysisStruktur rantai penyebab ketidak-tersediaan
layanan TIUntuk mengidentifikasi mekanisme pencegahan.
26basic events
resulting eventsOR gate
conditional event
conditional gate
D: Rancangan Reaktif
27
Elemen kunci:Manajemen Insiden yang mapan
Prosedur eskalasi yang ketat.Definisi peran dan tanggung-jawab dari tim
penanggulangan gangguan yang jelas.Adanya prosedur komunikasi yang jelas jika
terjadi gangguan besar.Fasilitas manajemen sistem
Tools untuk mendeteksi, mendiagnosa, dan memulihkan dampak gangguan sistem.
Prosedur pengumpulan data (log) untuk diagnosa yang efisien.
Rancangan Reaktif
28
… elemen kunci:Identifikasi kebutuhan backup & recovery
Untuk data, software, maupun hardware (spare).
Pengembangan dan testing prosedur backup & recovery.
Waktu pemulihan (recovery) yang sesuai target dan predictable.
Tingkatan Investasi Ketersediaan
1. Base product & components Paling mendasar: komponen-komponen yang
memenuhi persyaratan keandalan.2. Effective service management processes
Terselenggaranya Availability Management, Manajemen Insiden/Problem, dan Manajemen Perubahan.
29
Tingkatan Investasi Ketersediaan
30
3. System management Mekanisme monitoring, deteksi, dan
pemulihan gangguan otomatis.
4. High availability design Eliminasi SPOF (titik rawan), penyediaan
komponen alternatif/cadangan, dan mekanisme untuk mempersingkat downtime akibat kerusakan.
5. Full redundancy Fasilitas dual/mirror site.
Rencana Peningkatan Ketersediaan
31
Alasan peningkatan ketersediaan:Seringnya pelanggaran SLA ketersediaan.Seringnya terjadi gangguan (downtime).Hasil pengukuran ketersediaan menunjukkan
trend penurunan.Waktu perbaikan kerusakan yang melebihi
batas toleransi.Permintaan pengguna/bisnis untuk
meningkatkan ketersediaan.Gangguan ketersediaan akibat
pertumbuhan/pengembangan bisnis.Bagian dari rencana strategis TI.
Rencana Peningkatan Ketersediaan
32
Garis besar isi rencana:Tingkat ketersediaan aktual saat ini (dalam
bahasa pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA.
Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing.
Perubahan tingkat layanan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya.
Rencana kegiatan analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis).
Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.
System Outage Analysis
33
SOA: kegiatan analisa dengan melibatkan berbagai data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan.
Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis.
Hasilnya dilaporkan beserta rekomendasi langkah-langkah perbaikan.
System Outage Analysis
Struktur kegiatan SOA:
34