Kompresi Teknologi Untuk Video Dan Audio

download Kompresi Teknologi Untuk Video Dan Audio

of 89

Transcript of Kompresi Teknologi Untuk Video Dan Audio

Kompresi Teknologi untuk Video dan Audio Bingkai Store untuk Gambar Decoded Seperti dijelaskan sebelumnya, nilai-nilai pixel yang diterjemahkan dari bit stream yang masuk .Dalam hal frame jangkar didekode (I atau P-frame) nilai-nilai ini harus disimpan dalam frame buffer untuk berturut-turut pada quent digunakan sebagai referensi prediksi. Ketika B-frame yang digunakan, penyimpanan bingkai jangkar juga memungkinkan untuk frame diperlukan kembali memesan untuk ditampilkan. 11.4.2p Concatenated Urutan Standar MPEG-2, yang mendasari ATSC DTV standar, jelas menentukan perilaku dari decoder video compliant saat memproses urutan video tunggal [1].Sebuah video kode urutan dimulai dengan header urutan, mungkin berisi beberapa header urutan berulang dan satu atau lebih gambar kode, dan diakhiri dengan kode end-of-urutan.Sejumlah parameters ditentukan dalam header urutan diminta untuk tetap konstan sepanjang durasi urutan. Urutan tingkat parameter meliputi, tetapi tidak terbatas pada: Horizontal dan vertikal resolusi Frame rate Aspek rasio Chroma Format Profil dan tingkat Semua progresif-indikator Video penyangga verifier (VBV) ukuran Tingkat maksimum bit Ini adalah kebutuhan umum untuk bit stream kode untuk disusun menjadi untuk mengedit, penyisipan com- komersial iklan, dan tujuan lain dalam produksi video dan rantai distribusi.Jika salah satu atau lebih dari urutan tingkat parameter berbeda antara dua aliran bit untuk disusun menjadi, maka akhir-urutan kode harus dimasukkan untuk menghentikan aliran bit pertama, dan urutan baru header yang harus ada pada awal aliran bit kedua. Dengan demikian, situasi dari video concatenated urutan muncul.Meskipun standar MPEG-2 menentukan perilaku Decoder video untuk pengolahan urutan tunggal, tidak menempatkan persyaratan pada penanganan urutan bersambung. Spesifikasi perilaku decoding dalam kasus pertama adalah layak karena MPEG-2 standard menempatkan kendala pada pembangunan dan pengkodean urutan individu. Kendala ini melarang saluran buffer overflow dan coding dari paritas bidang yang sama untuk dua bidang berturut-turut.Standar MPEG-2 tidak melarang situasi di persimpangan antara dua kode urutan, demikian pula, tidak menentukan perilaku decoder dalam kasus ini. Walaupun dianjurkan, standar DTV tidak memerlukan produksi baik tegang bersambung urutan. Nah dibatasi-urutan bersambung didefinisikan sebagai mempunyai karakteristik sebagai berikut: Buffer decoder diperpanjang pernah meluap dan underflow hanya mungkin dalam kasus rendah menunda bit stream. Di sini, "diperpanjang decoder buffer" mengacu pada perpanjangan alami dari MPEG-2 decoder penyangga model untuk kasus kontinu decoding bersambung urutan. ATSC DTV Sistem Pedoman Video Compression 11-73 Ketika paritas bidang ditentukan dalam dua urutan kode yang concatenated, paritas dari field pertama dalam urutan kedua adalah sebaliknya bahwa dari lapangan terakhir di urutan pertama. Setiap kali urutan progresif dimasukkan antara dua sekuens interlaced, persis jumlah frame progresif adalah sedemikian rupa sehingga paritas urutan interlaced yang diawetkan Rangkaian seolah tidak terjadi. 11.4.2q Pedoman untuk Refreshing Meskipun standar DTV tidak memerlukan menyegarkan di kurang dari intraframe-kode macroblock refresh rate (didefinisikan dalam IEC / ISO 13818-2), pedoman umum berikut adalah rekomendasi-rekomendasi diperbaiki: Dalam sistem yang menggunakan transmisi periodik dari I-frame untuk menyegarkan, frekuensi terjadi rence I-frame akan menentukan kinerja saluran-perubahan waktu dari sistem. Dalam kasus, dianjurkan bahwa I-frame dikirim minimal sekali setiap detik 0,5 untuk diterima saluran-perubahan kinerja. Hal ini juga dianjurkan bahwa urutan-lapisan informasi dikirim sebelum setiap I-frame. Untuk spasial melokalisasi kesalahan akibat transmisi, intraframe-kode irisan harus pertahankan makroblok kurang dari jumlah maksimum yang diperbolehkan oleh standar. Hal ini

direkomendasikan diperbaiki bahwa ada 4-8 iris dalam sebuah baris horisontal dari intraframekode makroblok untuk intraframe-kode iris dalam kasus menyegarkan I-frame, serta untuk intraframe-kode daerah dalam kasus menyegarkan progresif. Nonintraframe-kode iris bisa lebih besar dari intraframe-kode iris. 11.4.3 Referensi 1. ATSC: "Panduan untuk Penggunaan Standar televisi digital ATSC," Advanced Television sytems Committee, Washington, DC, doc. A/54, 4 Oktober 1995. 2. Cadzow, James A.: Sistem Waktu Diskrit, Prentice-Hall, Inc, Englewood Cliffs, NJ,1973. 3. "Spesifikasi Standar IEEE untuk Pelaksanaan 8 8 cosine Diskrit Invers Transform, "std. 1180-1990, 6 Desember, 1990. Bab 11.5 Kompresi Sistem Kendala dan Kinerja Isu Jerry C. Whitaker, Editor-in-Chief 11.5.1 Pendahuluan Seperti halnya teknologi baru, sistem kompresi telah, secara umum, mengalami beberapa tumbuh nyeri. Persyaratan tertentu dan pengorbanan-tidak diantisipasi selama desain awal dari diberikan perangkat, sistem, atau standar-mau tidak mau harus diselesaikan sementara teknologi sedang diimplementasikan. Isu tersebut meliputi Rangkaian, optimasi encoding, dan penyambungan aliran bit. 11.5.2 konkatenasi Produksi segmen video atau program adalah proses serial: beberapa modifikasi harus dibuat dengan bahan asli untuk menghasilkan produk jadi. Proses seri menuntut banyak langkah mana kompresi dan dekompresi bisa terjadi. Kompresi dan dekompresi dalam format yang sama biasanya tidak dianggap Rangkaian. Sebaliknya, Rangkaian melibatkan mengubah nilai dari data, memaksa teknologi kompresi untuk sekali lagi memampatkan sinyal.Mengompresi video tidak, secara umum, proses yang sepenuhnya lossless; lossless bit-rate pengurangan praktis hanya pada rasio kompresi terendah. Perlu dipahami, bagaimanapun,bahwa kompresi lossless adalah mungkin-bahkan, digunakan untuk aplikasi kritis seperti medis pencitraan. Sistem seperti itu, bagaimanapun, relatif tidak efisien dalam hal penggunaan bit.Untuk aplikasi video umum, hasil Rangkaian di artefak dan masalah coding ketika skema kompresi yang berbeda yang mengalir dan / atau ketika recompression diperlukan. Beberapa generasi coding dan decoding adalah praktis, tetapi tidak terlalu diinginkan.Secara umum,lebih sedikit generasi, semakin baik.Menggunakan algoritma kompresi yang sama berulang kali (MPEG-2, misalnya) dalam rantai beberapa generasi, jika Anda akanharus tidak menimbulkan masalah, selama gambar tidak dimanipulasi (yang akan memaksa sinyal menjadi recompressed). Jika, di sisi lain, berbeda algoritma kompresi yang mengalir, semua taruhan dibatalkan. Sebuah analisis matematis rinci akan 11-76 Kompresi Teknologi untuk Video dan Audio mengungkapkan bahwa Rangkaian tersebut dapat menghasilkan artefak mulai dari tidak signifikan dan tidak terlalu mencolok untuk yang cukup besar dan menyenangkan, tergantung pada sejumlah variabel, termasuk yang berikut: Jenis-jenis sistem kompresi yang digunakan rasio kompresi dari sistem individu Urutan atau urutan dari skema kompresi Jumlah berturut coding / decoding langkah Input sinyal sendiri Titik terakhir manfaat beberapa diskusi tambahan. Artefak dari Rangkaian yang paling mungkin selama melihat adegan yang sulit untuk kode di tempat pertama, seperti yang mengandung cepat pergerakan benda-benda atau sinyal bising. Insinyur banyak video yang akrab dengan kaset uji mengandung adegan yang ditujukan khusus untuk menunjukkan kelemahan diberikan compression skema atau implementasi tertentu dari skema itu. Sampai-sampai adegan seperti perwakilan dikirim kondisi dunia nyata, ini "kompresi-pembunuh" gambar mewakili ancaman nyata terhadap gambar kualitas ketika mengalami Rangkaian sistem. 11.5.3 Proses Encoding Video Fungsi perangkat kompresi video atau sistem adalah untuk menyediakan untuk penyimpanan yang efisien dan / atau pengiriman informasi dari satu lokasi atau perangkat ke perangkat lainnya.Proses encoding, natu- reli, adalah titik awal rantai ini. Seperti rantai apapun, video encoding merupakan bukan hanya single link tapi link yang saling berhubungan dan saling tergantung banyak.Intinya dalam video dan audio encoding adalah untuk memastikan bahwa

sinyal tekanan atau aliran data merupakan informasi diperlukan untuk merekam dan / atau transmisi, dan hanya itu informasi. Jika ada tambahan informasi yang bersifat apapun yang tersisa dalam aliran data, ia akan mengambil bit untuk menyimpan dan / atau mentransmisikan, yang akan menghasilkan lebih sedikit bit yang tersedia untuk data yang dibutuhkan. Surplus informasi tidak relevan karena penerima yang dimaksud (s) tidak memerlukannya dan dapat membuat tidak memanfaatkannya. 11.5.3a Encoding Alat Dalam migrasi ke teknologi video digital, proses encoding telah diambil pada baru dan PIVumlah peran. Seperti kemajuan teknis, bagaimanapun, pengkodean menyajikan baik tantangan dan penghargaan.Tantangannya melibatkan asimilasi alat baru dan keterampilan baru. Kualitas final com Video ditekan tergantung pada sistem kompresi yang digunakan untuk melakukan pengkodean, alat disediakan oleh sistem, dan keahlian orang yang mengoperasikan sistem.Di luar prosedur otomatis pengkodean terletak sebuah proses interaktif yang dapat dipertimbangkan dengan kemampuan meningkatkan output video jadi. Ini "manusia yang dibantu" prosedur dapat membuat berbeda antara gambar berkualitas tinggi dengan yang biasa-biasa saja, dan perbedaan antara penggunaan yang efisien media dan bandwidth terbuang.Tujuan pengkodean cerdas adalah untuk meminimalkan dampak artefak encoding, rendering mereka tidak mencolok atau bahkan tak terlihat. Sukses adalah di mata penonton dan, dengan demikian, proses melibatkan banyak penilaian visual dan estetika subjektif. Masuk akal untuk menyimpulkan, bahwa pengkodean otomatis bisa pergi hanya sejauh ini. Ini tidak dapat menggantikan mata terlatih dari video profesionalisasi-professional. Kompresi Sistem Kendala dan Masalah Kinerja 11-77 Dalam pengertian ini, manusia yang dibantu encoding adalah analog dengan proses telecine. Dalam telecine yang aplikasi, terampil profesional yang colorist-menggunakan teknik seperti koreksi warna, filtering, dan pengurangan kebisingan untuk memastikan bahwa versi video dari sebuah film atau film berbasis bahan adalah sebagai benar dengan aslinya secara teknis mungkin. Pekerjaan ini membutuhkan kombinasi keahlian teknis dan seni video. Seperti telecine itu, manusia yang dibantu encoding adalah itera-antive proses. Operator (compressionist, jika Anda mau) mengatur parameter pengkodean, memandang dampak pengaturan di tempat kejadian, dan kemudian lebih lanjut memodifikasi parameter encoder sampai hasil visual yang diinginkan tercapai untuk adegan atau segmen. 11.5.3b Sinyal penyejuk Benar digunakan, pengkondisian sinyal dapat memberikan peningkatan yang luar biasa dalam coding efisiensi utama kualitas gambar. Encoding peralatan tersedia saat ini menggabungkan berbagai jenis filter ditargetkan pada berbagai jenis artefak. Manfaat dari pengkondisian yang tepat adalah dua kali lipat: Karena artefak yang tidak diinginkan, ada keuntungan yang jelas dalam menghindari alokasi bit untuk mengirimkan mereka. Karena artefak tidak "milik" mereka umumnya melanggar aturan atau asumsi dari sistem kompresi. Untuk alasan ini, artefak tidak kompres dengan baik dan menggunakan disproporsi pemerintah RI tingginya jumlah bit untuk mengirim dan / atau toko.Penyaringan sebelum pengkodean dapat digunakan untuk memisahkan informasi gambar yang mungkin jika tidak menghasilkan artefak yang tidak diinginkan. Spasial penyaringan berlaku dalam jangka tertentu, dan dapat digunakan untuk menyaring frekuensi yang lebih tinggi, menghilangkan kebisingan tekstur yang baik dan pelunakan tajam.Gambar yang dihasilkan mungkin memiliki penampilan yang lebih lembut, tapi ini sering lebih baik untuk memblokir atau dering artefak. Demikian pula, temporal (rekursif) filtering, diterapkan dari frame ke frame, bisa digunakan untuk menghapus suara sementara disebabkan-misalnya-dengan gandum berbasis penyimpangan dalam film. Koreksi warna dapat digunakan dalam banyak cara yang sama seperti penyaringan. Koreksi warna dapat kelancaran keluar daerah yang tidak merata warna, mengurangi jumlah data algoritma kompresi akan harus bersaing dengan, sehingga menghilangkan artefak. Demikian juga, penyesuaian kontras dan kecerahan dapat berfungsi untuk artefak masker, mencapai peningkatan kualitas gambar beberapa tanpa terasa mengubah konten video. Selama beberapa dekade, kalimat-sampah masuk, sampah-out telah menjadi semboyan dari data prosesing industri. Jika input ke proses beberapa cacat, output selalu akan menjadi cacat. Tersebut adalah kasus untuk kompresi video. Kecuali perhatian yang layak diberikan untuk proses encoding keseluruhan,degradasi akan terjadi. Secara umum, perhatikan daftar pengkodean berikut:

Mulailah dengan yang terbaik. Jika bahan sumber adalah film, gunakan cetak berkualitas tinggi atau negatif tersedia. Jika sumber adalah video, gunakan kualitas tertinggi, paling sedikit generasi tape. Bersihkan bahan sumber sebelum mencoba untuk kompres itu. Lakukan apapun kebisingan pengurangan koreksi warna, penghapusan awal, dan artefak-eliminasi langkah yang mungkin sebelum mencoba untuk mengirim sinyal ke encoder. Ada beberapa cacat yang encoding proses dapat menyembunyikan. Kebisingan, goresan, dan warna kesalahan tidak di antara mereka. Encoding hanya akan membuat mereka lebih buruk. Tentukan strategi aspek rasio konversi (jika perlu). Perlu diingat bahwa sekali informasi akan dibuang, tidak dapat dituntut kembali. 11-78 Kompresi Teknologi untuk Video dan Audio Perlakukan proses encoding seperti transfer telecine berkualitas tinggi.Mulailah dengan default-com pression pengaturan dan menyesuaikan sesuai kebutuhan untuk mencapai hasil yang diinginkan. Dokumen pengaturan dengan daftar keputusan pengkodean (EDL) sehingga pilihan yang dibuat dapat direproduksi di kemudian tanggal, jika perlu Proses encoding adalah jauh lebih dari latihan seni daripada pada hal teknis.Di bidang Video encoding, tidak ada pengganti untuk pelatihan dan pengalaman. 11.5.3c SMPTE RP 202 Di antara alat yang dikembangkan untuk mengoptimalkan proses pengkodean adalah SMPTE Praktek Rekomendasi 202. Peralatan sesuai dengan praktek ini akan meminimalkan artefak di berbagai generasi encoding dan de-coding oleh keselarasan macroblock mengoptimalkan.Sebagai MPEG-2 menjadi pervasive dalam emisi, kontribusi, dan distribusi konten video, kompresi dan beberapa dekompresi (codec) siklus akan diperlukan. Rangkaian codec mungkin diperlukan untuk production, pasca produksi, transcoding, atau konversi format. Setiap transisi video waktu untuk atau dari domain koefisien MPEG-2 dilakukan, perawatan harus dilakukan dalam penyelarasan video, secara horisontal dan vertikal, seperti yang dikodekan dari format raster atau diterjemahkan dan ditempatkan dalam format raster. Masalah pertama bergeser video horizontal dan vertikal. Selama beberapa kompresi dan siklus dekompresi, ini secara substansial dapat mendistorsi gambar.Kurang jelas, tetapi hanya sebagai penting, adalah kebutuhan untuk penyelarasan macroblock untuk mengurangi artefak antara encoders dan decoders dari vendor berbagai peralatan. Jika encoders bersambung tidak berbagi macroblock umum batas, maka tambahan kebisingan kuantisasi, kesalahan gerak estimasi, dan miskin modus keputusan menghambat perkembangan terjadi. Demikian juga, keputusan encoding yang dapat dilakukan melalui produksi dan pascaproduksi dengan proses recoding menyajikan data, akan bergantung pada keselarasan macroblock. Decoder juga harus berhati-hati dalam penempatan video aktif dalam format scanning sehingga bahwa encoder hilir tidak menerima gambar offset. Dengan masalah ini dalam pikiran, RP 202 menentukan keselarasan spasial untuk MPEG-2 video encoders dan decoder. Kedua definisi standar dan definisi tinggi format video untuk produksi, Distribution, dan emisi sistem dibahas. Tabel 11.5.1 memberikan rentang coding yang direkomendasikan untuk MPEG-2 encoders dan decoders. 11.5.4 Bit MPEG Streaming Penyambungan Dalam lingkungan khas editing, audio dan video segmen yang disambung ke dalam atau ke yang sudah ada material. Dalam domain terkompresi, ini adalah prosedur sederhana [1]. Hal ini relatif mudah untuk synchronize dua atau lebih video / audio stream. Interval vertikal terjadi secara teratur, memungkinkan switch akan dilakukan sesuai kebutuhan (Gambar 11.5.1). Audio digital mirip dengan video dalam hal ini, dan audio analog bahkan lebih mudah karena memerlukan sinkronisasi apapun.Namun, dalam terkompresi domain dari sebuah aliran bit MPEG, beberapa faktor harus dipertimbangkan. Di antara mereka adalah:

Jumlah berbagai bit per frame

Penggunaan prediksi gerak

Fakta bahwa frame mungkin tidak dikirim dalam urutan mereka akan ditampilkan

----------------------- Halaman 1015 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-79

Tabel 11.5.1 Direkomendasikan MPEG-2 Coding Ranges untuk Video Format Berbagai (Setelah [3].)

Kode Garis Resolusi MPEG-2 Profil Format Coded Pels Pels x Garis dan Tingkat Bidang 1 Bidang 2 Bingkai

480I 720 480 0-719 23-262 286-525 MP @ ML

480P 720 480 0-719 46-525 MP @ HL

512I 720 512 0-719 7-262 270-525 422P @ ML

512P 720 512 0-719 14-525 422P @ HL

576I 720 576 0-719 23-310 336-623 MP @ ML

608I 720 608 0-719 7-310 320-623 422P @ ML

720P 1280 720 0-1279 26-745 MP @ HL

720P 1280 720 0-1279 26-745 422P @ HL

1080I 1920 10881 0-1919 21-560 584-1123 MP @ HL

1080I 1920 10881 0-1919 21-560 584-1123 422P @ HL

1080P 1920 10.881 0-1919 42-1121 MP @ HL

1080P 1920 10.881 0-1919 42-1121 422P @ HL

1 Citra aktif hanya menempati 1080 baris pertama.

I-atau P-frame yang akan ditampilkan setelah B-frame perlu dikirim sebelum-frame B sehingga B-frame dapat benar dirakit. (Lihat Gambar 11.5.2.) Karena jumlah bit per frame bervariasi, maka hampir tidak mungkin untuk melakukan sinkronisasi dua MPEG bit stream. Namun, bit stream dapat dimuat ke dalam RAM, dan pointer memori kemudian dapat dimanipulasi. Jika dua bit stream yang dimuat ke dalam RAM, pointer yang digunakan untuk membaca data dapat dialihkan sehingga setelah satu aliran adalah output, hal ini segera diikuti oleh sebuah bagian aliran lainnya sedikit. Proses ini mirip suntingan dilakukan oleh banyak desktop yang nonlinier editing sistem, kecuali bahwa dalam sistem editing data tidak dibaca dari RAM, tetapi dari keras mendorong menggunakan pointer yang pada dasarnya daftar frame dan lokasi mereka. Banyak editor nonlinier menggunakan kompresi JPEG, yang sebanding dengan aliran bit MPEG seluruhnya terdiri dari I-frame. Jumping dari akhir yang saya-frame ke awal lagi relatif sederhana. Bit stream terdiri dari semua frame-aku baik-baik saja untuk mengedit, tetapi tidak efisien ketika datang ke penyimpanan atau transmisi. Bit stream yang jauh lebih efisien untuk menyimpan dan mengangkut menggunakan besar P-dan B-frame, tetapi elemen-elemen ini menyulitkan proses editing. Kerja yang cukup besar telah dilakukan untuk mengembangkan alat dalam struktur MPEG yang akan memungkinkan untuk bit stream splicing akurat dalam domain terkompresi. Satu alat dianggap

diperlukan adalah encoder yang akan menandai poin sambatan potensi di dalam sungai. Salah satu persyaratan dari sambatan titik adalah bahwa frame pertama setelah sambatan yang menjadi I-frame.Antara lain, I-frame akan memastikan bahwa tidak ada frame sebelumnya diperlukan untuk decoding yang tepat. Persyaratan kedua akan bahwa frame terakhir sebelum titik sambatan menjadi I-frame atau P-frame, menjamin bahwa semua yang dibutuhkan B-frame dapat diterjemahkan. Persyaratan lain dari titik sambatan melibatkan keadaan buffer decoder.Kondisi ini bisa apa saja dari hampir penuh tetapi Pengurasan hampir kosong tapi mengisi. Decoder 11-80 Kompresi Teknologi untuk Video dan Audio

Gambar 11.5.1 Prosedur Penyambungan untuk video terkompresi. (Setelah [2].)

Gambar 11.5.2 pertimbangan titik sambatan untuk aliran bit MPEG. (Setelah [1].)

kepenuhan penyangga adalah parameter dinamis dari proses encoding, dan selama splicing adalah dalam aliran bit tertentu, tidak mungkin menyebabkan masalah (Gambar 11.5.3). Namun, splicing satu bit stream ke lain dapat menyebabkan buffer penerima untuk underflow atau overflow. Ini bisa terjadi jika aliran harus diaktifkan dari daun buffer cukup kosong, dan sungai menjadi beralih ke mengasumsikan buffer hampir penuh dan mengharapkan untuk mengosongkannya lama, sehingga buffer underflow, seperti digambarkan pada Gambar 11.5.4. Flushing buffer decoder adalah salah satu cara untuk berurusan dengan masalah, tapi ini mungkin akan mengakibatkan gangguan tampilan di layar pemirsa. Lain metode penyambungan adalah untuk membatasi poin sambatan sehingga mereka hanya terjadi ketika buffer decoder adalah 50 persen penuh. Namun, ini bisa membuat poin sambatan potensi sedikit dan jauh antara. Memenuhi persyaratan yang disebutkan sebelumnya akan pergi jauh ke arah pemecahan masalah splicing, tetapi tidak akan menjadi solusi yang lengkap. Dalam aliran data

adalah variabel seperti perangko waktu yang harus diperbarui untuk mencegah masalah di decoder. Tambahan datapengolahan aliran diperlukan untuk memperbarui variabel-variabel ini dengan benar. Sampai saat ini, hanya splicing video telah dibahas. Dalam program MPEG atau transpelabuhan sungai, audio dan video yang dikirim sebagai paket terpisah.Karena paket dikirim serisekutu dalam aliran tunggal, paket audio berakhir dikirim sebelum atau setelah paket video dengan

----------------------- Halaman 1017 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-81

Gambar 11.5.3 beban operasional Khas buffer. (Setelah [2].)

yang mereka berhubungan. Untuk mensinkronisasi audio dan video, masing-masing paket memiliki presentasi waktu cap (PTS) yang memungkinkan decoder untuk menyajikan berbagai audio dan video dalam paket synchronized cara. Kedua audio dan jalur sinyal video termasuk buffer. Namun, karena jumlah perhitungan yang dibutuhkan untuk memasang kembali video, video buffer jauh lebih besar dari buffer audio. Untuk beberapa hal, semakin besar buffer, semakin besar delay sinyal. Karena tambahan penundaan dalam buffer video, sambatan bit-stream yang berisi "lama" audio dan video sebelum sambatan dan "baru" video dan audio setelah sambatan mungkin akan disampaikan kepada penampil sebagai dua splices terpisah. The sambatan pertama akan mempengaruhi audio dan, karena semakin lama buffer, sambatan kedua akan mempengaruhi video. Proses ini diilustrasikan pada Gambar 11.5.5.

11.5.4a sambatan Flags

Salah satu solusi untuk masalah aliran bit MPEG splicing adalah penyisipan bendera sambatan [2]. Ini bendera dimasukkan selama encoding pada titik-titik didefinisikan hunian

buffer. Seperti diilustrasikan dalam Gambar 11.5.6, bendera mengidentifikasi titik-titik saklar diijinkan dalam aliran bit MPEG. Manfaat dari pendekatan meliputi:

Tidak ada artefak dari proses switching

Kontinuitas video dan audio pada layar penerima

Tidak ada perilaku tak terduga dari decoder video

Selain mengedit pemotongan konvensional, sambatan bendera berbasis operasi memungkinkan untuk beralih antara progresif dan interlaced gambar dan resolusi dari satu gambar ke lainnya.Kelemahan dari pendekatan ini adalah bahwa poin sambatan pertama harus diidentifikasi di pusat originasi. Ini persyaratan membatasi kegunaan dari proses agak. Namun, untuk sebagian besar jaringan-ke-affilimakan operasi pakan, sambatan / penyisipan diperlukan poin sudah dikenal dan jelas.

----------------------- Halaman 1018 ----------------------11-82 Kompresi Teknologi untuk Video dan Audio

Gambar 11.5.4 MPEG decoder masalah negara penyangga untuk switching aliran bit. (Setelah [1].)

Gambar 11.5.5 waktu Relatif video dan poin sambatan audio dan hasil akhirnya. (Setelah [1].)

11.5.4b SMPTE 312M

Menanggapi masalah yang ditimbulkan oleh masalah penyambungan aliran bit, SMPTE diperiksa POSSIble solusi. Hasil pekerjaan ini adalah SMPTE 312M, yang mendefinisikan kendala pada encod-

ing dari dan sintaks untuk stream MPEG-2 transportasi sehingga mereka mungkin disambung tanpa memodifikasi PES (aliran dasar packetized) payload [4]. Generik MPEG-2 transport aliran yang tidak sesuai dengan kendala dalam standar mungkin memerlukan lebih canggih teknik splicing. Kendala yang ditentukan dapat diaplikasikan secara individu untuk program dalam transportasi sungai, sebuah Program didefinisikan sebagai kumpulan video, audio, dan data stream yang berbagi umum timebase. Kehadiran komponen video tidak diasumsikan. Standar ini memungkinkan penyambungan program dalam aliran transportasi multiprogram baik secara simultan atau secara mandiri. Sambatan poin dalam program yang berbeda mungkin presentasi-waktu-bertepatan, tetapi tidak harus. Itu standar juga dapat digunakan dengan single-program transportasi sungai. SMPTE 312M menentukan kendala untuk poin sambatan baik mulus dan nonseamless. Seampoin sambatan kurang harus mematuhi semua kendala menyatakan; poin sambatan nonseamless mematuhi disederhanakan subset dari kendala.

----------------------- Halaman 1019 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-83

Gambar 11.5.6 Penggunaan bendera sambatan untuk memfasilitasi switching bit stream MPEG. (Setelah [2].)

Selain kendala untuk menciptakan bit stream spliceable, standar menentukan teknologi nique untuk membawa pemberitahuan poin sambatan mendatang di transportasi sungai. Sambatan Sebuah infortabel masi didefinisikan untuk memberitahukan perangkat hilir acara sambatan, seperti jaringan istirahat atau kembali dari istirahat jaringan. Tabel sambatan informasi yang berhubungan dengan diberikan program dibawa dalam PID terpisah (pengidentifikasi program) aliran disebut dengan peta Program tabel (PMT). Dengan cara ini, pemberitahuan acara sambatan dapat melewati transportasi sungai remultiplex-

ers tanpa memerlukan pengolahan khusus.

Buffer Isu

Seperti dibahas sebelumnya, penyambungan bit stream MPEG mengharuskan manajemen hati-hati penyangga kepenuhan. Ketika bit stream MPEG dikodekan, ada hunian penyangga yang melekat pada setiap titik waktu [4]. Kepenuhan penyangga sesuai dengan penundaan, jumlah waktu yang byte menghabiskan dalam buffer. Ketika dua splicing secara terpisah dikodekan bit stream, penundaan di sambatan yang titik biasanya tidak akan cocok. Ketidakcocokan dalam penundaan dapat menyebabkan buffer overflow atau di bawahmengalir. Metode penyambungan mulus mengharuskan encoder MPEG cocok dengan penundaan di splicing menunjuk ke sebuah nilai yang diberikan. Metode nonseamless tidak memerlukan encoder untuk mencocokkan penundaan. Sebaliknya, perangkat splicing bertanggung jawab untuk pencocokan keterlambatan materi baru dan lama bahan serta dapat. Dalam beberapa kasus, ini akan menghasilkan underflow penyangga decoder terkontrol. Underflow ini dapat bertopeng di decoder dengan memegang frame terakhir dari video yang keluar dan mematikan audio sampai unit akses pertama dari aliran baru telah diterjemahkan.Dalam kasus terburuk, underflow ini dapat berlangsung selama beberapa frame. Kedua metode penyambungan dapat menyebabkan underflow dari buffer audio, dan akibatnya celah di presentasi audio di penerima. Kualitas yang dirasakan dari sambatan dalam kedua kasus manfaat dari decoder audio yang dapat menangani kesenjangan dalam data audio anggun.

Splice Poin

Untuk mengaktifkan penyambungan bit stream yang dikompresi, SMPTE 312M mendefinisikan poin sambatan [4]. Sambatan poin dalam aliran MPEG-2 transportasi memberikan kesempatan untuk beralih dari satu program ke

lain. Mereka menunjukkan tempat yang aman untuk beralih: tempat di mana aliran bit switch dapat

----------------------- Halaman 1020 ----------------------11-84 Kompresi Teknologi untuk Video dan Audio

dibuat dan menghasilkan kualitas visual dan audio yang baik. Dengan cara ini, mereka adalah analog dengan vertikal Interval digunakan untuk beralih video yang terkompresi. Tidak seperti terkompresi, batas-batas frame video dalam MPEG-2 bit stream yang tidak merata spasi. Oleh karena itu, sintaks dari paket transportasi itu sendiri adalah digunakan untuk menyampaikan titik-titik mana sambatan terjadi.Transportasi sungai diciptakan oleh multiplexing PID sungai. Dua jenis poin sambatan untuk stream PID didefinisikan:

Dalam hai, tempat di mana bit stream adalah aman untuk masuk dan memulai decoding data

Poin Out, tempat-tempat itu aman untuk keluar dari aliran bit

Metode didefinisikan yang dapat digunakan untuk kelompok hai sungai PID individu menjadi Program Dalam hai untuk mengaktifkan switching dari seluruh program (video dengan audio). Program Out Poin untuk keluar program juga didefinisikan. Poin Out dan In Poin merupakan benchmark imajiner dalam aliran bit terletak di antara dua mengangkut paket streaming. Poin Out dan Di Titik dapat dijadikan menjadi satu lokasi, yaitu satu paket batas dapat berfungsi baik sebagai tempat yang aman untuk meninggalkan aliran bit dan tempat yang aman untuk memasukkannya.

Frekuensi Poin sambatan

Frekuensi poin sambatan tidak ditentukan oleh SMPTE 312M [4]. Dalam beberapa aplikasi, seperti sebagai lingkungan studio di mana-delay rendah dan fleksibilitas dalam switching yang penting, poin sambatan

mungkin terjadi sesering setiap frame (dalam lingkungan semua I-frame).Dalam distribusi ENVIronment, poin sambatan mungkin terjadi secara teratur selama playout program normal dan lebih sering sekitar kali istirahat. Karena menunjukkan dapat ditentukan baik pada saya atau P bingkai batas (dalam urutan presentasi), mereka dapat terjadi lebih sering daripada di poin (yang mungkin hanya terjadi sebelumnya frame I).

Transisi 11.5.4c Klip Generator

Klip transisi generator (TCG) adalah pendekatan lain untuk penyambungan aliran bit (Sarnoff dan Silicon Graphics). TCG adalah paket perangkat lunak yang dirancang untuk digunakan dalam lingkungan server video. Para TCG menciptakan klip-transisi urutan baru dari paket transportasi sungai MPEG yang mengganti (dalam aliran video yang dihasilkan disambung) sebagian dari masingmasing aliran transportasi MPEG dari video yang disusun menjadi satu (klip 1 dan klip 2) di sekitar titik di mana sambatan adalah menjadi dibuat. Pembuatan klip ini transisi melibatkan sejumlah kecil decoding dan selanjutnya kembali pengkodean frame video terkompresi (dari sungai yang disambung), tetapi hanya frame dari daerah-daerah yang diganti. Fakta bahwa hanya beberapa frame perlu diterjemahkan dan kemudian kembali dikodekan untuk membuat mulus sambatan adalah salah satu manfaat yang signifikan dari pendekatan TCG.Sebuah diskusi rinci tentang TCG sistem dapat ditemukan di [5].

11.5.4d SMPTE 328M

Namun aproach lain adalah SMPTE 328M, yang mendefinisikan video streaming SD MPEG (ES) informasi untuk mempermudah mulus suntingan dalam keadaan didefinisikan [6]. ES video,

didefinisikan oleh standar MPEG, dilengkapi dengan informasi tambahan untuk profesional studio aplikasi. Informasi keuangan dilakukan dalam header urutan dan

----------------------- Halaman 1021 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-85

data pengguna area ES video. SMPTE 328M mendefinisikan data yang akan dilakukan dan lokasi dari data tersebut. Seamless, frame-akurat editing video terkompresi paling mudah dilakukan dengan menggunakan struktur GOP pendek. Lagi GOP struktur dapat diedit oleh decoding dan reencoding, oleh transcoding dengan struktur GOP lebih pendek, atau (dengan pengolahan yang terlibat lebih) diedit langsung. Itu pendekatan terbaik ditentukan oleh berbagai aplikasi khusus pertimbangan. ISO / IEC 13818-2 tidak mendefinisikan frekuensi pengulangan header urutan. Untuk menjadi kompatibel dengan SMPTE 328M, header urutan harus ada pada setiap frame saya. Sebagaimana ditentukan dalam SMPTE 328M, elemen-elemen sintaks berikut dan deskripsi fungsional dimasukkan dalam MPEG ES di area data pengguna:

V / H pengkodean fase. Implementasi dasar dari MPEG tidak menentukan horizontal dan vertikal pengkodean fase. SMPTE 328M mengharuskan fase coding vertikal dan horisontal menjadi diketahui dalam rangka untuk decoding dan peralatan peripheral untuk benar memproses sinyal. V dan H coding informasi yang disertakan hanya untuk sinyal SDTV mana tahap coding tidak comliat dengan SMPTE RP 202; untuk sinyal HDTV, H / V informasi fase coding adalah juga didefinisikan oleh SMPTE RP 202.

Waktu kode. Penyisihan dilakukan penyisipan dua kode waktu memenuhi SMPTE 12M. Setidaknya satu kali kode, tanggal referensi waktu yang tertera (sebagaimana didefinisikan dalam SMPTE 326M) adalah dilakukan sebagai sarana untuk menjaga sinkronisasi dengan konten lain atau aliran metadata.

Carriage dari kode waktu kedua adalah opsional. Decoder Compliant harus memiliki kemampuan untuk decode kedua kode waktu.

Gambar ketertiban. Gambar informasi pesanan menentukan durasi gambar dan setara ke PTS / DTS hadir dalam transportasi sungai MPEG. Nilai untuk gambar dihitung oleh bidang unit. Dalam beberapa kasus, latency sistem akan diminimalkan dengan menggunakan urutan gambar informasi.

Video indeks. Video indeks, seperti yang didefinisikan oleh SMPTE RP 186, dilakukan (jika ada) pada dasarpita sinyal. Informasi yang dibawa oleh indeks video harus dipertahankan selama coding, recoding, mengedit, atau transcoding proses. Ia membayangkan bahwa data yang dijelaskan dalam SMPTE metadata kamus (SMPTE 335M) akan ditangani oleh mekanisme transportasi dijelaskan dalam SMPTE 326M. Data-data parametrik mencakup semua parameter yang berlaku saat dikodekan dalam indeks video, meskipun representasi data dari beberapa item mungkin berbeda.

Data lanjut. Data yang dilakukan dalam interval vertikal dari sinyal baseband harus diawetkan. Data tambahan dapat terdiri dari lebih dari 23 angka nol berturut-turut.Untuk mencegah hal ini condition, penanda dimasukkan setiap 22 bit.

Data Riwayat. Sejarah Data, yang terdiri dari parameter pengkodean asli dan berikutnya yang mungkin berguna dalam transcoding atau reencoding, dapat dilakukan oleh aliran bit.SMPTE 327M mendefinisikan isi dari informasi data sejarah. Data sejarah dapat terdiri dari lebih dari 23 berturut-turut angka nol. Untuk mencegah kondisi ini, penanda dimasukkan setiap 22 bit.

Pengguna data. Data pengguna didefinisikan oleh ISO / IEC 13818-2.

----------------------- Halaman 1022 ----------------------11-86 Kompresi Teknologi untuk Video dan Audio

11.5.5 MPEG-2 Recoding

MPEG-2 video recoding kumpulan data memungkinkan deskripsi lengkap dari parameter MPEG-2 menetapkan bahwa ciri setiap proses encoding MPEG-2. Menurut kumpulan data recoding, adalah diterima-dari sudut pandang teoritis-bahwa setiap peralatan pengkodean MPEG-2 bisa generate sebuah bitstream MPEG-2 identik dari sinyal video diberikan digital.Namun, MPEG-2 Data recoding set dapat digunakan dalam aplikasi praktis recoding mana lingkungan dapat memperkenalkan tambahan, kendala tak terduga. Sebagai contoh, bit-rate dari setiap tahap recoding mungkin atau mungkin tidak berbeda dari tahap pengkodean sebelumnya. Ini berarti bahwa recoding yang kumpulan data belum tentu akan sepenuhnya digunakan kembali pada setiap tahap lebih lanjut. Aspek lain yang penting dari proses recoding adalah bandwidth yang tersedia untuk pengangkutan MPEG-2 pengodean ulang kumpulan data. Dalam aplikasi praktis, dengan pengurangan set generik MPEG-2 Data recoding set harus dibenahi. Masalah MPEG-2 recoding adalah penting karena kebutuhan umum untuk memodifikasi sebelumnya dikodekan program. Untuk mengatasi masalah ini, SMPTE mengembangkan seperangkat alat yang meliputi standar berikut:

SMPTE 327M, MPEG-2 Video Recoding Data Set

SMPTE 329M, MPEG-2 Video Recoding Data Set-Compressed Streaming Format

SMPTE 319M, Mengangkut MPEG-2 Recoding Informasi Melalui 04:02:02 Komponen Digital Antarmuka

SMPTE 351M, Mengangkut MPEG-2 Recoding Informasi melalui High-Definition Digital Antarmuka

SMPTE 353M, Transportasi Informasi MPEG-2 Recoding sebagai Paket data lanjut

Standar-standar ini dibahas dalam bagian berikut.

11.5.5a SMPTE 327M

SMPTE 327M menentukan isi dari gambar-data terkait recoding ditetapkan untuk representasi ISO / IEC 13818-2 informasi coding MPEG untuk tujuan decoder secara optimal cascading dan recoders pada setiap bit rate atau struktur GOP [7]. Informasi coding berasal dari / ISO IEC 13818-compliant MPEG bit stream selama proses decoding gambar, seperti dijelaskan dalam ISO / IEC 13818-2. Ruang lingkup dan pengoperasian standar ini adalah definisi isi dari recoding cukup kumpulan data yang dapat diperoleh decoder sesuai dengan ISO / IEC 13818-2, termasuk semua profil nonscalable didefinisikan dalam ISO / IEC 13818-2. Untuk memungkinkan sinkronisasi ulang dari video dan audio yang terkait atau data setelah pengolahan, mekanisme menggunakan beberapa informasi tambahan yang berasal dari ISO / IEC 13818-1 juga disertakan di SMPTE 327M. Ini set data yang cukup dapat diangkut dengan berbagai cara (didefinisikan dalam lainnya SMPTE standar). Aplikasi utama dari standar ini adalah untuk menjaga kualitas sinyal video ketika Cascading MPEG-2 decoder dan coders (termasuk transcoding) dengan memberi makan ke depan sebelumnya coding keputusan. MPEG-2 recoding kumpulan data digambarkan sebagai cukup ketika mengandung data yang dibutuhkan itu, dalam kombinasi dengan gambaran MPEG-2 didekode atau sebagian diterjemahkan, memungkinkan bit-akurat rekreasi dari aliran bit sebelumnya kode. Informasi yang diperlukan dalam kompe-

sien MPEG-2 recoding kumpulan data dapat dibagi menjadi tiga bagian.

----------------------- Halaman 1023 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-87

Informasi tingkat gambar

Macroblock tingkat informasi

Data rumah tangga Tambahan

11.5.5b SMPTE 329M

SMPTE 329M menentukan format aliran MPEG-2 data recoding ditetapkan untuk perwakilan tion informasi terkompresi ISO / IEC 13818-2 MPEG coding, seperti yang digunakan dalam aplikasi-requir ing sistem transportasi kapasitas data yang telah direduksi [8]. Informasi coding berasal dari sebuah ISO / IEC 13818-2 compliant MPEG bit stream selama proses decoding, seperti yang dijelaskan dalam ISO / IEC 13818-2. Informasi yang didasarkan pada format streaming dapat diangkut dengan berbagai cara; misalnya, format stream elementer yang didefinisikan dalam SMPTE 328M. Ada aplikasi di mana transmisi dari semua kumpulan data recoding tidak mungkin. Beberapa peralatan warisan mungkin telah membatasi kapasitas untuk transmisi data recoding. Keterbatasan ini memiliki dampak pada tahap kompresi berikutnya yang dapat menggunakan MPEG2 recoding proses. Untuk menurunkan laju bit untuk kumpulan data recoding, MPEG2 recoding kumpulan data diubah menjadi aliran MPEG-seperti, yang disebut aliran terkompresi untuktikar dari himpunan recoding MPEG-2. SMPTE 329M mendefinisikan format streaming. Format aliran adalah independen dari aplikasi, dan semua informasi transportasi dalam bandwidth berkurang recod-

ing Data transportasi sistem didasarkan pada aliran ini. Mekanisme transportasi tergantung pada aplikasi, yang didefinisikan dalam standar dokumen lainnya SMPTE.

11.5.5c SMPTE 319M

SMPTE 319M menentukan sebuah mekanisme transportasi tertanam untuk MPEG-2 data recoding ditetapkan sebagai didefinisikan dalam SMPTE 327M untuk representasi MPEG-2 informasi recoding dalam ITU-R BT.656, antarmuka komponen 04:02:02 digital [9]. Para recoding kumpulan data berasal dari ISO / IEC 13818-1 dan 2 compliant bit stream MPEG selama proses decoding, seperti yang dijelaskan dalam ISO / IEC 13818-1 dan -2. Untuk operasi minimum standar ini, MPEG-2 recoding kumpulan data adalah spasial dan temporal disesuaikan dengan setiap macroblock didekode dipetakan ke dalam sebuah antarmuka ITU-R BT.656. Itu menentukan standar transportasi spasial dan temporal selaras dari MPEG-2 data recoding diatur dalam area gambar aktif di ITU-R BT.656 interface untuk peralatan yang sesuai dengan ISO / IEC 13818-1 dan -2, termasuk 4:02:02 P @ ML dan MP @ ML untuk kedua 625/50 dan 525/60 video yang standar. Informasi yang terdapat pada set MPEG-2 data recoding didefinisikan dalam SMPTE 327M. Informasi recoding yang temporal terkunci ke video (atau sebagian didekode) diterjemahkan ke terdekat MPEG-2 frame atau lapangan tergantung pada struktur gambar dari bit MPEG-2 kode aliran. Hal ini juga secara spasial terkunci dengan video decode ke macroblock MPEG-2 terdekat dalam didekode frame / lapangan. Hal ini diperlukan untuk informasi pengodean ulang agar sesuai dengan MPEG makroblok decode dalam gambar didekode, baik secara spasial dan temporal.

----------------------- Halaman 1024 -----------------------

11-88 Kompresi Teknologi untuk Video dan Audio

11.5.5d SMPTE 351M

SMPTE 351M menentukan sebuah mekanisme transportasi tertanam untuk MPEG-2 data recoding ditetapkan sebagai didefinisikan dalam SMPTE 327M untuk representasi MPEG-2 informasi recoding pada SMPTE Antarmuka 274M dan kemudian pada antarmuka 292M SMPTE bit-serial digital [10]. Itu recoding kumpulan data berasal dari sebuah bitstream ISO / IEC sesuai 13818-1/2 MPEG selama decoding proses, seperti yang dijelaskan dalam ISO / IEC standar 13818-1/2.Untuk operasi minimum standar ini, MPEG-2 recoding kumpulan data adalah spasial dan temporal disesuaikan dengan masing-masing macroblock didekode dipetakan ke dalam antarmuka 274M/292M SMPTE. Standar ini menentukan transportasi spasial dan temporal selaras dari MPEG-2 recoding kumpulan data dalam area gambar aktif pada antarmuka SMPTE 274M/292M untuk peralatan yang sesuai dengan ISO / IEC standar 13818-1/2, termasuk 4:02:02 P @ HL dan MP @ HL selama 60 dan 50-Hz interlaced dan 60 -, 30 -, 25 -, dan 24-Hz standar video progresif. Informasi recoding yang temporal terkunci ke video (atau sebagian didekode) didekode untuk frame MPEG-2 terdekat atau lapangan tergantung pada struktur gambar dari MPEG2 kode bitaliran. Hal ini juga secara spasial terkunci dengan video decode ke macroblock MPEG-2 terdekat dalam didekode frame / lapangan. Untuk bertambah manfaat penuh dari informasi recoding ketika cascading melalui antarmuka baseband digital, rekomendasi berikut harus dipatuhi:

Mekanisme transportasi harus menjaga setidaknya 8 bit paling signifikan dari video aktif. Mekanisme diuraikan menggunakan least significant bit dari setiap sampel chrominance 10-bit untuk mengirimkan data melalui 274M SMPTE 292M atau antarmuka.

Informasi recoding harus selaras dengan makroblok MPEG decoded dalam didekode gambar, baik secara spasial dan temporal.

SMPTE 351M didasarkan pada memproduksi output SMPTE sesuai 274M/292M untuk menutupi HDMPEG bitstreams sampai dengan dan termasuk 4:02:02 P @ HL dan MP @ HL untuk 1920 1080 60 (59,94) atau 50 2:1; 1920 1080 30 (29,97), 25, atau 24 (23,98) 1:1; dan 1280 720 60 (59,94) 1:01 sistem.

11.5.5e SMPTE 353M

SMPTE 353M menentukan mekanisme untuk pengangkutan MPEG-2 informasi video recoding sebagai tambahan paket data dalam data ruang-untuk tambahan contoh, melalui ITU-R BT.656 / SMPTE 259M interface [11]. Para recoding informasi video diangkut melalui mekanisme NISM digunakan untuk menjaga kualitas gambar di re-encoding tahap ketika cascading MPEG-2 decoder dan encoders. Mekanisme transportasi ditentukan dalam standar telah dirancang sehingga dapat bekerja dengan sistem video digital di mana operasi terbatas pada 8-bit resolusi. Prinsip parameter SMPTE 353M meliputi:

Informasi MPEG-2 video diangkut recoding ini kompatibel dengan video MPEG-2 Data recoding ditetapkan sebagai didefinisikan dalam SMPTE 327M

Kumpulan data diformat sesuai format aliran didefinisikan dalam SMPTE 329M

Kumpulan data diformat diangkut dalam bentuk tambahan (ANC) paket data seperti yang ditentukan di SMPTE 291M

Mekanisme transportasi ditentukan dalam standar ini kompatibel dengan SMPTE 291M

----------------------- Halaman 1025 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-89

Bagian dari baik vertikal blanking blanking ruang tambahan data, (V-ANC) dan horisontal tambahan ruang data (H-ANC) yang digunakan. Ruang V-ANC membawa informasi gambar tingkat saja; ini adalah yang paling dasar prioritas tertinggi elemen dari kumpulan data recoding. Untuk bit rate rendah, panjang Aplikasi GOP, ini biasanya membawa perbaikan kualitas gambar terbesar, lebih menyempurnakanKASIH dicapai ketika informasi lebih lanjut tersedia. Ruang H-ANC digunakan untuk membawa lain bagian dari kumpulan data recoding. Penggunaan indikator bandwidth yang dikurangi, sebagaimana ditentukan dalam SMPTE 329M, memungkinkan transmisi-kurang lebih-ini bagian dari kumpulan data recoding, tergantung pada kapasitas transmisi yang tersedia di ruang H-ANC.

11.5.6 MPEG-2 Operasi Ranges

Ekstensif menggunakan kompresi dalam aplikasi video profesional telah memberlakukan unik, dan kadang-kadang cukup besar, menuntut pada berbagai elemen dari rantai produksi. Beberapa digital perangkat video memiliki banyak fleksibilitas untuk menangani semburan data, seperti yang mungkin terjadi ketika coding adegan video yang sulit [12]. Perangkat ini menggunakan data rate variabel dengan kecepatan data yang meningkat bila diperlukan untuk menjaga kualitas, dan penurunan kecepatan data saat memproses konten lebih mudah untuk meningkatkan efisiensi. Perangkat ini, oleh karena itu, kadang-kadang disebut sebagai menyediakan konstankualitas operasi. Perangkat lain inheren beroperasi dengan data rate dibatasi untuk suatu konstanta nilai. Ketika data rate adalah tetap, akan ada beberapa variasi kualitas gambar, yang akan menjadi fungsition kompleksitas gambar. Jika kecepatan data yang cukup tinggi, variasi ini dapat imper-

terhadap upaya. Kemudahan pengolahan aliran bit rate konstan, oleh karena itu, menarik dalam beberapa aplikasi. Terlepas dari jenis kompresi, semua sistem praktis membutuhkan beberapa batasan pada bit yang diijinkan tingkat variasi. Untuk mengatasi ini, MPEG-2 menentukan model buffer untuk kedua kompresi dan transportasi (seperti yang dibahas sebelumnya). Ini adalah tanggung jawab dari encoder kompresi untuk mengelola data rate, melalui granularity kuantisasi bervariasi, untuk menghindari buffer overflow atau underflow. Dengan aplikasi yang jelas untuk kedua kecepatan bit variabel (VBR) dan kecepatan bit konstan (CBR) dalam domain profesional, potensi ada untuk masalah interface.

Produksi 11.5.6a Sistem Data Flow

Gambar 11.5.7 menggambarkan berbagai strategi yang tersedia bagi lembaga penyiaran saat merancang com-a Video proses produksi ditekan aliran [12]. Dalam contoh ini, perpecahan antara Partai Republik yang lama dan akuframe-satunya sistem di 30 Mbits / s mencerminkan titik kinerja kira-kira sama lama GOP sistem pada 30 Mbits / s dan I-frame-hanya sistem pada 50 Mbits / s.Spesifik elemen proproses duction meliputi:

Akuisisi. Program ini dapat diambil dalam I-frame saja atau menggunakan GOP lama MPEG-2 untuk menyediakan kapasitas penyimpanan yang lebih tinggi (terutama camcorder).

Kontribusi. Dimana ada kebutuhan untuk mengirimkan informasi elektronik yang diambil atas jaringan (satelit / telco / nirkabel kamera), GOP lama format MPEG-2 adalah lebih mungkin digunakan sebagai ini menyediakan untuk efisiensi transmisi yang lebih tinggi.

penyimpanan Source. Idealnya, sinyal harus disimpan dalam format yang diterima, yaitu I-frame-satunya

untuk I-bingkai sistem saja, dan GOP panjang untuk sistem lama GOP untuk menjaga tertinggi POSSI-

----------------------- Halaman 1026 ----------------------11-90 Kompresi Teknologi untuk Video dan Audio

nee nogge oia itrrgme t iuoonmg sbttia IITA ur SS IRR qtekdgo cnps E ot Sebuah oair S CTDP

50

yy Saya l Bingkai l Hanya nn 04:02:02 O g O I-frame Hanya n R eie tT 40 04:02:02 mim dV Transcode ke E a

rr FF I-frame 04:02:02 Saya saya er te v atr r 30 ne tre S i Transcode untuk Ede vn B Pendek GOP kembali) m ep S egtm Transcode untuk o 04:02:02 dnaa iDr ent 20 Aku IgG Emisi DDO i Setiap GOP Setiap GOP E nr i Format VP d P 04:02:02 04:02:02 o OC atau 04:02:00 atau 04:02:00 G e gR 10 n oh t Li

w (

0

Proses Aliran

Gambar 11.5.7 praktek saat ini untuk definisi standar arus proses video yang terkompresi. (Dari [12]. Digunakan dengan izin.)

ble kualitas. Hal ini juga memungkinkan untuk transcode feed masuk untuk mengizinkan penduduk asli standar penyimpanusia format. Namun, perawatan harus diambil untuk memastikan bahwa kualitasnya tidak terdegradasi.

Edit. Potongan-satunya editing sederhana untuk melakukan dalam domain MPEG2 dalam kasus sayaframe-hanya VTR atau server. Dimana editing yang lebih kompleks diperlukan, sinyal harus proolahan pada baseband video. Hal ini dapat dicapai baik menggunakan I-frame atau GOP lama MPEG-2 asalkan sistem memiliki ruang kepala yang cukup. Dimana ruang kepala ini tidak ada, adalah perlu menggunakan MPEG-2 parameter recoding sebagaimana didefinisikan dalam SMPTE 327M jika MPEG-2 artefak Rangkaian harus dihindari.

penyimpanan program. Penyimpanan program juga harus dibuat dalam format mengedit atau di transFormat misi sehingga jumlah tahap transcoding dikurangi seminimal mungkin. Kuncinya pilihan yang tersedia bagi pembuat program itu dapat diringkas sebagai 1) Iframe-only atau lama sistem GOP dengan data rate yang cukup tinggi untuk memungkinkan decoding beberapa naif / recoding proses, dan 2) GOP sistem lama menggunakan kecepatan data yang lebih rendah tetapi yang lewat depan recoding

informasi seperti yang dijelaskan dalam SMPTE 327M untuk meminimalkan MPEG-2 Rangkaian artefak.

11.5.6b SMPTE RP 213

SMPTE Rekomendasi Praktek 213 dikembangkan untuk mengatasi masalah yang diuraikan dalam sebelumnya bagian. Dokumen ini menentukan struktur dan parameter data untuk interfacing MPEG-2 04:02:02 profil dan audio digital dalam lingkungan profesional [13]. Tujuan dari RP adalah untuk memfasilitasi pertukaran bitstream video dan audio antara MPEG-2 peralatan compliant.

----------------------- Halaman 1027 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-91

Kombinasi RP 213 dan dokumen terkait yang dimaksudkan untuk membantu desain dan applikation dari MPEG-2-berbasis peralatan televisi profesional yang memfasilitasi pertukaran bitstream antara aplikasi yang berbeda dan lebih dari satu set macam kebutuhan pengguna. RP terbatas pada audio video dan parameter dari sistem tersebut. RP 213 juga menetapkan rentang operasi MPEG-2 yang didefinisikan sebagai himpunan bagian dari ISO / MPEG profil dan tingkat. Ini mendefinisikan rentang operasi dua untuk definisi standar televisi dan tiga operasi rentang untuk televisi definisi tinggi. Semua MPEG-2 struktur data dibahas dalam praktek ini adalah ISO / IEC 13818-2 Perubahan 2 04:02:02 compliant profil dan sebagai tersebut decodmampu oleh MPEG-2 04:02:02 compliant profil yang berdiri sendiri dekoder pada tingkat yang sesuai. Lantaran sebagai profil 04:02:02 juga memerlukan berdiri sendiri untuk memecahkan kode decoder struktur profil utama (4:2:0), ada sumber profil utama dapat diakomodasi.

Penerapan RP 213

Fleksibilitas dari kompresi MPEG-2 memungkinkan MPEG-2-berbasis peralatan untuk memenuhi beragam persyaratan operasional dari berbagai aplikasi televisi profesional [13]. Meskipun beberapa aplikasi mungkin dilayani dengan memilih titik operasi tertentu, pengguna yang berbeda memiliki kendala yang berbeda dan tujuan, dan dapat memilih parameter yang berbeda operasi tertentu. Menyadari pertimbangan, RP 213 menentukan berikut:

Operasi rentang, termasuk bit rate dibatasi dan struktur GOP

Operasi rentang diciptakan untuk akses acak dan kemampuan editing

Tata Ruang penyelarasan gambar kode

Penggunaan 48-kHz sampel audio digital

Praktek ini menjelaskan pilihan parameter tersedia dalam MPEG-2 dan faktor yang harus dibawa ke akun ketika mendefinisikan sebuah sistem MPEG-2-berbasis. Parameter operasi pilihan tertentu akan tergantung pada persyaratan aplikasi individu, termasuk kemampuan mengedit, kapasitas penyimpanan, kontribusi feed, dan distribusi / bandwidth emisi. Dalam membuat pilihan ini untuk lingkungan aplikasi tertentu, selanjutnya diakui bahwa timbal balik antara parameter yang berbeda harus dipertimbangkan. Pertimbangan tersebut termasuk overhead yang dikenakan oleh bitstream kendala rentang operasi berbagai tingkat yang diperlukan bitaliran interoperabilitas antara berbagai jenis peralatan siaran, dan com-sistem secara keseluruhan kompleksitas. Untuk audio, tidak ada seluruh dunia tunggal kompresi standar telah diadopsi; transmisi berbagai sistem sedang digunakan tergantung pada daerah geografis. Pertukaran audio yang global bisa, oleh karena itu, hanya dicapai dengan menetapkan format audio noncompressed.

MPEG-2 Video Parameter

Dalam aplikasi profesional dari MPEG-2, termasuk ekstensi HDTV ke MPEG-2 sebagai didefinisikan oleh SMPTE 308M, lima rentang operasi didefinisikan oleh RP 213 (Gambar 11.5.8). Terpisah jangka panjang dan pendek GOP rentang didefinisikan untuk kedua tingkat utama dan sistem tingkat tinggi. Tambahan rentang operasi dapat ditambahkan sesuai kebutuhan untuk memenuhi persyaratan HDTV masa depan. Operasi rentang 1 dan 2 meliputi MPEG-2 P @ 04:02:02 pilihan ML termasuk garis 525-standar dan 625-line SDTV format. Operasi berkisar 3 dan 4 meliputi MPEG-2 04:02:02 @ HL termasuk:

----------------------- Halaman 1028 ----------------------11-92 Kompresi Teknologi untuk Video dan Audio

Bit-rate

Jangkauan Pengoperasian 4 HDTV Hingga 300 Mbit / s Aku hanya-coding

Jangkauan Pengoperasian 3B HDTV Hingga 175 Mbit / s Setiap struktur GOP

Jangkauan Pengoperasian 3A HDTV Sampai 80 Mbit / s Setiap struktur GOP

Jangkauan Pengoperasian 2 Rentang Operasi 1 SDTV SDTV Sampai dengan 50 Mbit / s hingga 50 Mbit / s I-hanya coding Setiap struktur GOP

GOP Struktur

Gambar 11.5.8 rentang operasi SMPTE ditentukan dalam RP 213. (Dari [13] Digunakan dengan. Izin.)

Scan 480-garis progresif

Scan 576-garis progresif

Scan 720-garis progresif

1080-garis interlaced memindai

1080-garis progresif scan (hingga 30-Hz frame rate)

Hubungan antara rentang operasi yang berbeda diilustrasikan pada Gambar 11.5.9. Berbagai operasi 2 adalah bagian dari operasi berkisar 1 dan 4. Operasi kisaran 1 merupakan subset dari 3A operasi rentang dan 3B. 3A jarak operasi adalah bagian dari 3B berbagai operasi.

11.5.7 SMPTE Dokumen Berkaitan dengan MPEG-2

Bagian berikut daftar SMPTE standar primer yang berkaitan dengan MPEG2. Untuk tambahan informasi, kunjungi situs Web di SMPTE http://www.smpte.org.

SMPTE 302M: Linear PCM Digital Audio dalam Transport Stream MPEG-2

Standar ini menentukan pengangkutan terkompresi (PCM linear) digital audio dalam MPEG-2 sistem transportasi. Beberapa aplikasi mungkin membutuhkan linear PCM (pulse code modulasi) digital

----------------------- Halaman 1029 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-93

Jangkauan Pengoperasian 4 Mengoperasikan Rentang 3B HDTV HDTV Hingga 300 Mbit / s hingga 175 Mbit / s I-hanya coding Setiap struktur GOP

Jangkauan Pengoperasian 3A HDTV Sampai 80 Mbit / s Setiap struktur GOP

Jangkauan Pengoperasian 1 SDTV Sampai dengan 50 Mbit / s Setiap struktur GOP

Jangkauan Pengoperasian 2 Jangkauan Pengoperasian 2 SDTV SDTV Sampai dengan 50 Mbit / s Sampai dengan 50 Mbit / s Aku hanya-coding Aku hanya-coding

Gambar 11.5.9 Hubungan antara rentang beroperasi di SMPTE RP 213. (Dari [13] Digunakan

dengan. izin.)

audio dalam hubungannya dengan video kompresi ditentukan dalam profil MPEG-2 04:02:02. MPEG audio standar mendefinisikan audio terkompresi, tetapi tidak mendefinisikan audio terkompresi untuk pengangkutan dalam suatu sistem transportasi MPEG-2. Standar ini menambah standar MPEG untuk mengatasi persyaratan untuk linear PCM digital audio.

SMPTE 308M: MPEG-2 04:02:02 Profil di Level Tinggi ISO / IEC 13818-2, umumnya dikenal sebagai MPEG-2 video, termasuk spesifikasi MPEG-2 04:02:02 profil. Berdasarkan ISO / IEC 13818-2, standar ini menyediakan spesifikasi tambahan untuk MPEG-2 04:02:02 profil di tingkat tinggi. Hal ini dimaksudkan untuk digunakan dalam definisi tinggi televisi produksition, kontribusi, dan distribusi aplikasi. Seperti dalam ISO / IEC 13818-2, standar ini mendefinisikan bit-stream, termasuk sintaks dan semantik mereka, bersama-sama dengan persyaratan untuk memenuhi sebuah decoder untuk 4:02:02 profil di tingkat tinggi, tetapi tidak menentukan parameter, operasi encoder tertentuters.

SMPTE 310M: Serial Interface Synchronous untuk MPEG-2 Transport Stream Digital Standar ini menggambarkan interface fisik dan karakteristik modulasi untuk sinkron serial interface untuk membawa aliran bit MPEG-2 transportasi dengan harga hingga 40 Mbits / s. Ini adalah point-toantarmuka titik dimaksudkan untuk digunakan dalam lingkungan dengan kebisingan.Lingkungan rendah kebisingan didefinisikan sebagai tingkat kebisingan yang akan merusak tidak lebih dari satu MPEG-2 paket data per hari di transportasi clock rate. Ketika sistem transmisi lainnya (misalnya, studio-untuk-pemancar microwave link, dll) yang sela antara perangkat menggunakan interface ini, tingkat kebisingan yang lebih tinggi mungkin dihadapi. Dalam kasus tersebut, dianjurkan agar mengoreksi kesalahan yang sesuai dengan metode

digunakan.

SMPTE RP 202: Video Alignment untuk MPEG-2 Coding Peralatan sesuai dengan praktek ini akan meminimalkan artefak di berbagai generasi encoding dan decoding oleh keselarasan macroblock mengoptimalkan. Sebagai MPEG-2 menjadi meresap dalam EMISsion, kontribusi, dan distribusi konten video, kompresi dan dekompresi beberapa (Codec) siklus akan diperlukan. Rangkaian codec mungkin diperlukan untuk produksi, pasca-

----------------------- Halaman 1030 ----------------------11-94 Kompresi Teknologi untuk Video dan Audio

produksi, transcoding, atau konversi format. Setiap transisi video waktu ke atau dari koefisiendomain sien dari MPEG-2 dilakukan, perawatan harus dilakukan sejalan video baik horisontal dan vertikal seperti yang dikodekan dari format raster atau diterjemahkan dan ditempatkan di raster format.

SMPTE RP 204: SDTI-CP MPEG Decoder Template Praktek ini mendefinisikan template decoder untuk pengkodean paket isi SDTI (SDTI-CP) dengan MPEG stream gambar kode.

SMPTE RP 213: MPEG-2 Ranges Operasi Praktek ini menentukan struktur dan parameter data untuk interfacing MPEG-2 04:02:02 profil dan audio digital dalam lingkungan profesional. Tujuan dari latihan ini adalah untuk facilitate video dan pertukaran bitstream audio antara MPEG-2 peralatan compliant.

SMPTE Rp217: Pemetaan Nonsynchronized dari Paket KLV ke MPEG-2 Streaming Sistem Praktek ini menjelaskan cara untuk metadata pemetaan SMPTE dan esensi data, dikodekan di SMPTE KLV protokol, ke MPEG-2 aliran sistem. Penggunaan aliran sinkron dan

sintaks dan semantik mereka adalah di luar lingkup dari praktek ini.

SMPTE EG 38: Aplikasi Operasi MPEG-2 Rentang Tujuan dokumen ini adalah untuk memberikan pedoman praktis untuk pengguna dari MPEG-2 di studio dan di profesional lainnya aplikasi. Pedoman ini memberikan gambaran sistem, merinci unsurKASIH yang harus dipertimbangkan ketika memilih berbagai operasi MPEG2. Pedoman ini menjelaskan bagaimana struktur dan parameter yang didefinisikan dalam SMPTE RP 213 dapat dikonfigurasi untuk memenuhi dipilih titik operasi. Hal ini dicapai dengan memberikan tertentu, tetapi perwakilan, pelaksanaan contoh direncanakan atau digunakan di seluruh dunia.

11.5.7a MPEG-2 Editing dan Penyambungan

SMPTE 312M: sambatan Poin untuk MPEG-2 Streaming Transportasi Standar ini mendefinisikan kendala pada pengkodean dan sintaks untuk MPEG-2 transportasi sungai sehingga mereka mungkin disambung tanpa memodifikasi payload paket PES. Generik MPEG-2 transportasi sungai, yang tidak sesuai dengan kendala dalam standar ini, mungkin memerlukan lebih banyak canggih teknik splicing.

SMPTE 328M: MPEG-2 Video Streaming Informasi Editing Dasar Standar ini mendefinisikan dasar aliran video MPEG (ES) informasi untuk mempermudah jahitankurang suntingan dalam keadaan didefinisikan. ES video, seperti yang didefinisikan oleh standar MPEG, adalah dilengkapi dengan informasi tambahan untuk aplikasi studio profesional.Tambahan informasi akan dilakukan dalam header urutan dan data daerah pengguna dari ES video. Standar ini mendefinisikan data yang akan dilakukan dan lokasi data. ----------------------- Halaman 1031 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-95

11.5.7b MPEG-2 Recoding

SMPTE 319M: Mengangkut MPEG-2 Informasi Recoding melalui 04:02:02 Komponen Digital Antarmuka Standar ini menentukan mekanisme transportasi tertanam untuk MPEG-2 data recoding ditetapkan sebagai didefinisikan dalam SMPTE 327M untuk representasi MPEG-2 informasi recoding dalam ITU-R BT.656, antarmuka komponen 04:02:02 digital.

SMPTE 327M: MPEG-2 Video Recoding Data Set Standar ini menentukan isi dari gambar data terkait recoding ditetapkan untuk representasi ISO / IEC 13818-2 informasi coding MPEG untuk tujuan decoder secara optimal cascading dan recoders pada setiap bit rate atau struktur GOP. Informasi coding adalah sebagai berasal dari / ISO IEC 13818 compliant MPEG bit stream selama proses decoding gambar, seperti dijelaskan dalam ISO / IEC 13818-2.

SMPTE 329M: MPEG-2 Video Recoding Data Set-Compressed Streaming Format Standar ini menentukan format aliran MPEG-2 data recoding ditetapkan untuk representasi informasi terkompresi ISO / IEC 13818-2 MPEG coding, seperti yang digunakan dalam aplikasi yang memerlukan sistem transportasi kapasitas data berkurang.

SMPTE 351M: Televisi-Mengangkut MPEG-2 Recoding Informasi melalui Tinggi definisi tion Digital Interface Standar ini menentukan mekanisme transportasi tertanam untuk MPEG-2 data recoding ditetapkan sebagai didefinisikan dalam SMPTE 327M untuk representasi MPEG-2 informasi recoding pada SMPTE Antarmuka 274M dan kemudian pada antarmuka 292M SMPTE bit-serial

digital. Recoding ini kumpulan data berasal dari sebuah bitstream ISO / IEC sesuai 13818-1/2 MPEG selama decoding proses, seperti yang dijelaskan dalam ISO / IEC standar 13818-1/2.

SMPTE 353M: Televisi-Transport Informasi MPEG-2 sebagai Data Recoding lanjut Paket Standar ini menetapkan mekanisme untuk pengangkutan MPEG-2 informasi video recoding sebagai tambahan paket data dalam data ruang-untuk tambahan contoh, melalui ITU-R BT.656 / SMPTE 259M interface. Para recoding informasi video diangkut melalui mekanisme ini adalah untuk tujuan menjaga kualitas gambar yang di re-encoding tahap ketika cascading MPEG-2 decoder dan encoder. Meskipun mekanisme yang ditentukan beroperasi pada 10-bit video digital antarwajah, itu adalah dengan desain transparan untuk sistem terbatas pada 8-bit operasi.

11.5.8 Referensi

1. Epstein, Steve: "Mengedit bitstreams MPEG," Broadcast Engineering, Intertec Publishing, Overland Park, Kansas, hlm 37-42 Oktober 1997.

2. Cugnini, Aldo G.: "MPEG-2 Penyambungan Bitstream," Prosiding Televisi Digital '97 Konferensi, Intertec Publishing, Overland Park, Kansas, Desember 1997.

3. SMPTE Rekomendasi Praktek: RP 202, "Video Alignment untuk MPEG-2 Coding," SMPTE, White Plains, N.Y., 2000.

----------------------- Halaman 1032 ----------------------11-96 Kompresi Teknologi untuk Video dan Audio

4. SMPTE Standar: SMPTE 312M, sambatan Poin untuk MPEG-2 Streaming Transportasi, SMPTE, White Plains, N.Y., 2001.

5. Ward, Christopher, C. Pecota, X. Lee dan G. Hughes: "Penyambungan Seamless untuk MPEG-2 Transportasi Server Video Streaming, "Prosiding, 33 SMPTE Lanjutan Gerak Pencitraan Konferensi, SMPTE, White Plains, N.Y., 2000.

6. SMPTE Standar: SMPTE 328M-2000: "MPEG-2 Penyuntingan Video Streaming Dasar Informasi, "SMPTE, White Plains, N.Y., 2000.

7. SMPTE 327M-2000, "MPEG-2 Video Recoding Data Set," SMPTE, White Plains, NY, 2000.

8. SMPTE 329M-2000, "MPEG-2 Video Recoding Data Set-Compressed Format Stream," SMPTE, White Plains, N.Y., 2000.

9. SMPTE 319M-2000, "Mengangkut MPEG-2 Informasi Recoding Melalui 04:02:02 ComPonent Digital Interface, "SMPTE, White Plains, NY, 2000.

10. SMPTE 351M, "Mengangkut MPEG-2 Informasi Recoding melalui HighDefinition Antarmuka digital, "SMPTE, White Plains, NY, 2000.

11. SMPTE 353M, "Transportasi dari MPEG-2 Informasi Recoding sebagai Paket data lanjut," SMPTE, White Plains, N.Y., 2000.

12. SMPTE Teknik Pedoman: EG 38: "Aplikasi Operasi MPEG-2 Kisaran," SociEty dari Motion Picture dan Insinyur televisi, White Plains, NY, 2001.

13. SMPTE Rekomendasi Praktek: PR 213, "MPEG-2 Ranges Operasi," Masyarakat Motion Picture dan Insinyur televisi, White Plains, NY, 2001.

11.5.9 Bibliografi

Bennett, Christopher: "Mitos MPEG Tiga," Prosiding Broadcast NAB 1996 Insinyuring Konferensi, Asosiasi Nasional Penyiaran, Washington, DC, hal 129-136, 1996.

Bonomi, Mauro: "Seni dan Ilmu Kompresi Video Digital," NAB Broadcast Engineering Konferensi Prosiding, Asosiasi Nasional Penyiaran, Washington, DC, hal 7-14, 1995.

Berani, Petrus: "Masa Depan Jaringan," Broadcast Engineering, Intertec Publishing, Overland Park, Kansas, hal. 36, April 1996.

Fibush, David K.: "Pengujian Kompresi MPEG-Sinyal," Broadcast Engineering, Overland Park, Kansas, hlm 76-86 Februari 1996.

Freed, Ken: "Video Compression," Broadcast Engineering, Overland Park, Kansas, hlm 46-77, January 1997.

Standar IEEE Kamus Istilah Listrik dan Elektronika, ANSI / IEEE Standard 100-1984, Institute of Electrical dan Electronics Engineers, New York, 1984.

----------------------- Halaman 1033 ----------------------Kompresi Sistem Kendala dan Masalah Kinerja 11-97

Jones, Ken: "LAN televisi," Prosiding Konferensi Teknik 1995 NAB, Nasional Asosiasi Penyiaran, Washington, DC, hal. 168, April 1995.

Stallings, William: ISDN dan Broadband ISDN, 2nd Ed, MacMillan, New York..

Taylor, P.: "Broadcast Kualitas dan Kompresi," Broadcast Engineering, Intertec Publishing, Overland Park, Kansas, hal. 46, Oktober 1995.

Whitaker, Jerry C, dan Harold Winard (eds.): Kamus Era Informasi, Intertec Publishing / Bellcore, Overland Park, Kansas, 1992.

----------------------- Halaman 1034 -----------------------

----------------------- Halaman 1035 ----------------------Bab

11.6 Kompresi Audio Sistem

Fred Wylie

Jerry C. Whitaker, Editor-in-Chief

11.6.1 Pendahuluan

Seperti video, tinggi pada daftar prioritas untuk industri audio profesional adalah untuk memperbaiki dan memperluas jangkauan peralatan digital yang mampu menangkap, penyimpanan, pasca produksi, pertukaran, distribusi, dan transmisi audio berkualitas tinggi-baik mono, stereo, atau 5,1 saluran AC-3 [1]. Tuntutan ini didorong oleh pengguna-akhir, penyiar, pembuat film, dan rekaman indusmencoba sama, yang bergerak cepat menuju lingkungan "tapeless". Selama dua dekade terakhir, ada telah melanjutkan kemajuan dalam teknologi DSP, yang telah mendukung penelitian Engineers dalam upaya mereka untuk menghasilkan perangkat keras yang diperlukan, khususnya di bidang digital

Audio kompresi data atau-seperti yang sering disebut-bit-rate reduksi. Ada ada sejumlah real-time atau-dalam kenyataannya-dekat algoritma kompresi seketika coding. Ini bisa significantly menurunkan bandwidth sirkuit dan persyaratan penyimpanan untuk distribusi, transmisi, dan pertukaran audio berkualitas tinggi. Pengenalan pada tahun 1983 dari compact disc (CD) digital format audio set bangku berkualitas menandai bahwa produsen peralatan audio berikutnya profesional berusaha untuk menyamai atau memperbaiki. Konsumen cerdas sekarang mengharapkan kualitas yang sama dari radio dan televisi penerima. Hal ini membuat penyiar dengan tantangan besar.

11.6.1a PCM Versus Kompresi

Hal ini dapat menjadi latihan teknis mahal dan kompleks untuk menerapkan kode pulsa linier modulasi (PCM) infrastruktur, kecuali jarak sangat pendek dan dalam area studio [1]. Untuk menunjukkan keunggulan mendistribusikan audio terkompresi digital melalui nirkabel atau kabel sistem dan jaringan, pertimbangkan lagi format CD sebagai referensi. CD ini adalah 16 bit linear PCM proses, tetapi memiliki cacat satu utama: jumlah bandwidth sirkuit sinyal digital menempati dalam sistem transmisi. Sebuah CD stereo transfer informasi (data) pada 1,411 Mbits / s, yang akan membutuhkan sebuah sirkuit dengan bandwidth sekitar 700 kHz untuk menghindari distorsi sinyal digital. Dalam praktiknya, bit tambahan yang ditambahkan ke sinyal untuk saluran coding, Sinkronisasi-

11-99

----------------------- Halaman 1036 ----------------------11-100 Kompresi Teknologi untuk Video dan Audio

nization, dan koreksi kesalahan; ini meningkatkan bandwidth menuntut lagi.1,5 MHz

adalah sering dikutip bandwith angka untuk sirkuit mampu membawa CD atau sama kode lintelinga PCM stereo digital sinyal. Hal ini dapat dibandingkan dengan 20 kHz yang dibutuhkan untuk masing-masing dua CIRcuits untuk mendistribusikan audio stereo yang sama dalam format analog, meningkat 75 kali lipat dalam bandwidth persyaratan.

11.6.1b Bit Audio Penurunan Tarif

Secara umum, transmisi audio analog memerlukan input tetap dan bandwidth output [2]. Ini condition menyiratkan bahwa dalam sistem kompresi real-time, kualitas, bandwidth, dan distorsi / kebisingan tingkat baik asli dan output suara didekode tidak boleh subyektif yang berbeda, sehingga memberikan penampilan proses lossless dan real-time. Dalam pengertian teknis, semua real-time praktis bit-rate-pengurangan sistem dapat disebut sebagai "Lossy." Dengan kata lain, sinyal digital audio pada output tidak identik dengan sinyal input aliran data. Namun, beberapa algoritma kompresi, untuk semua maksud dan tujuan, lossless; mereka kehilangan sesedikit 2 persen dari sinyal asli. Lainnya menghapus sekitar 80 persen dari sinyal asli.

Redundansi dan penyimpangan

Sebuah sinyal audio kompleks berisi banyak informasi, beberapa di antaranya, karena manusia telinga tidak bisa mendengarnya, dianggap tidak relevan. [2]. Sinyal yang sama, tergantung pada kompleksitas, juga berisi informasi yang sangat diprediksi dan, oleh karena itu, dapat dibuat berlebihan. Redundansi, terukur dan terukur, dapat dihilangkan dalam coder dan diganti dalam decoder, proses ini sering disebut sebagai kompresi statistik.Penyimpangan, di sisi

lain tangan, disebut sebagai coding persepsi, setelah dihapus dari sinyal tidak dapat diganti dan hilang, irretrievably. Hal ini sepenuhnya proses subyektif, dengan masing-masing algoritma proprietary menggunakan berbeda psychoacoustic model. Sinyal kritis yang dirasakan, seperti nada murni, yang tinggi redundansi dan rendah irrelevancy. Mereka memampatkan cukup mudah, hampir sama sekali proses kompresi statistik. Sebaliknya, sinyal noncritically dirasakan, seperti audio kompleks atau sinyal bising, yang rendah redundansi dan tinggi penyimpangan. Ini kompres dengan mudah di coder persepsi, tetapi dengan total kerugian semua konten penyimpangan.

Manusia Auditory Sistem

Kepekaan telinga manusia yang condong ke ujung bawah frekuensi terdengar spectrum, sekitar 3 kHz [2]. Pada 50 Hz, bagian bawah spektrum, dan pada 17 kHz di ujung atas, kepekaan telinga adalah turun sekitar 50 dB relatif terhadap sensitivitas pada 3 kHz (Gambarure 11.6.1). Selain itu, audio sangat sedikit sinyal-musik atau pidato berbasis dibawa mendasar frekuensi di atas 4 kHz. Mengambil keuntungan dari karakteristik ini dari telinga, struktur suara terdengar, dan isi redundansi dari sinyal PCM adalah dasar yang digunakan oleh desainer jangkauan thepredictive algoritma kompresi. Fitur lain yang terkenal dari proses pendengaran adalah bahwa suara keras menutupi keluar lebih tenang suara pada frekuensi yang sama atau dekat. Hal ini sebanding dengan tindakan yang otomatis mendapatkan control, mengubah keuntungan turun ketika mengalami suara keras, sehingga membuat suara lebih tenang cenderung untuk didengar. Misalnya, seperti yang diilustrasikan pada Gambar 11.6.2, jika kita asumsikan nada kHz 1 pada tingkat

----------------------- Halaman 1037 -----------------------

Kompresi Audio Sistem 11-101

Gambar 11.6.1 respon frekuensi Generalized dari telinga manusia. Perhatikan bagaimana proses PCM menangkap sinyal bahwa telinga tidak dapat membedakan. (Dari [2] Digunakan dengan. Izin.)

70 dBu, tingkat lebih besar dari 40 dBu pada 750 Hz dan 2 kHz akan diperlukan bagi mereka frequenCIES untuk didengar. Telinga juga latihan tingkat masking temporal, menjadi sangat Tolersemut suara sementara tajam. Ini adalah dengan meniru fitur psychoacoustic tambahan dari telinga manusia dan mengidentifikasi isi penyimpangan dari sinyal input bahwa transformasi kisaran rendah bit-rate algoritma beroperasi, mengadopsi prinsip bahwa jika telinga tidak dapat mendengar suara maka tidak ada gunanya mengirimkannya di tempat pertama.

Kuantisasi

Kuantisasi adalah proses mengubah sinyal analog ke format digital atau perwakilan, seperti dalam kasus dengan kompresi, requantizing dari sinyal sudah dikonversi [2].Proses ini adalah membatasi pengukuran tingkat terbatas sampel sinyal ke nilai integer tertentu preset. Ini berarti bahwa tingkat aktual sampel mungkin lebih besar atau lebih kecil dari referensi yang telah ditetapkan tingkat sedang dibandingkan dengan. Perbedaan antara kedua tingkat, yang disebut quantization kesalahan, diperparah pada sinyal didekode sebagai kebisingan kuantisasi. Kebisingan kuantisasi, karena itu, akan disuntikkan ke dalam sinyal audio setelah setiap A / D dan D / A konversi, tingkat kebisingan yang sedang diatur oleh alokasi bit yang terkait dengan coding proses (yaitu, jumlah bit yang dialokasikan untuk mewakili tingkat masing-masing sampel diambil dari analogin sinyal). Untuk linear PCM, alokasi bit umumnya 16. Tingkat setiap sampel audio, oleh karena itu, akan dibandingkan dengan salah satu dari 216 atau 65.536 tingkat diskrit atau langkah.

Kompresi atau bit-rate pengurangan dari sinyal PCM mengarah ke requantizing dari yang sudah terkuantisasi sinyal, yang mau tidak mau akan menyuntikkan kebisingan kuantisasi lebih lanjut. Selalu telah operasi yang baik praktek untuk membatasi jumlah A / D dan D / A konversi dalam rantai audio. Tidak ada yang berubah dalam hal ini, dan sekarang jumlah tahap kompresi juga harus

----------------------- Halaman 1038 ----------------------11-102 Kompresi Teknologi untuk Video dan Audio

Gambar 11.6.2 Contoh efek masking dari suara tingkat tinggi. (Dari [2]. Digunakan dengan permission.)

dijaga agar tetap minimum. Selain itu, harga bit tahap ini harus ditetapkan setinggi praktis; dengan kata lain, rasio kompresi harus serendah mungkin. Cepat atau lambat-setelah sejumlah terbatas dari A / D, D / A konversi dan melewati kompresi coding, apa pun jenis-akumulasi kebisingan kuantisasi dan sinyal tak terduga lainnya degradasi akhirnya akan menembus ambang batas kebisingan / sinyal, ditafsirkan sebagai bagian dari sinyal audio, diproses seperti itu, dan didengar oleh pendengar.

Sampling Frekuensi dan Bit Rate

Bit rate dari sinyal digital didefinisikan oleh

frekuensi sampling bit resolusi jumlah saluran audio

Aturan tentang pemilihan frekuensi sampling didasarkan pada teorema Nyquist itu [2]. Hal ini memastikan bahwa, khususnya, semakin rendah sideband dari frekuensi sampling tidak mengganggu ke audio baseband. Efek aliasing menyenangkan dan terdengar akan terjadi jika dua band

yang tumpang tindih. Dalam prakteknya, tingkat sampling diatur sedikit di atas dua kali terdengar tertinggi frefrekuensi, yang membuat desain filter kurang kompleks dan lebih murah. Dalam kasus CD stereo dengan sinyal audio yang telah diambil pada 44,1 kHz, ini samtingkat pling menghasilkan bandwidth audio dari sekitar 20 kHz untuk setiap saluran. Yang dihasilkan bit rate audio yang = 44,1 kHz x 16 2 = 1,411 Mbits / s, seperti yang dibahas sebelumnya.

----------------------- Halaman 1039 ----------------------Kompresi Audio Sistem 11-103

11.6.1c Prediksi dan Transform Algoritma

Kebanyakan audio-sistem kompresi didasarkan pada salah satu dari dua teknologi dasar [2]:

prediktif atau adaptif diferensial PCM (ADPCM) waktu-domain coding

Transform atau adaptif PCM (APCM) frekuensi-domain coding

Hal ini dalam pendekatan mereka untuk berurusan dengan redundansi dan penyimpangan dari sinyal PCM yang teknik-teknik berbeda. Domain waktu pendekatan orprediction termasuk G.722, yang telah menjadi standar universal sejak pertengahan 70-an, dan bergabung pada tahun 1989 oleh algoritma proprietary, apt-X100. Kedua algoritma rithms berurusan terutama dengan redundansi. Domain frekuensi atau mengubah metode yang diadopsi oleh sejumlah kesepakatan algoritma di irrelevancy, teknik masking mengadopsi psychoacoustic untuk mengidentifikasi dan menghapus yang tidak diinginkan suara. Ini berbagai algoritma meliputi standar industri ISO/MPEG-1 Layers 1, 2, dan 3; apt-Q; MUSICAM; Dolby AC-2 dan AC3, dan lain-lain.

Subband Coding

Tanpa kecuali, semua algoritma yang disebutkan dalam bagian sebelumnya proses PCM signal dengan memisahkan menjadi beberapa subband frekuensi, dalam satu kasus sedikitnya dua (G.722) atau sebagai sebanyak 1024 (apt-T) [1]. MPEG-1 Layer 1, dengan kompresi 4:01, memiliki 32 subband frekuensi dan merupakan sistem yang ditemukan di Digital Compact Cassette (DCC).Para MiniDisc ATRAC proprialgoritma etary di 05:01 memiliki pendekatan multisubband lebih fleksibel, yang tergantung pada kompleksitas dari sinyal audio. Subband coding memungkinkan pengulangan frekuensi domain dalam sinyal audio menjadi dieksploitasi. Hal ini memungkinkan pengurangan bit rate kode, dibandingkan dengan PCM, untuk sinyal yang diberikan kesetiaan. Redundansi spektral juga hadir sebagai hasil dari energi sinyal dalam berbagai pita frekuensi yang tidak sama pada setiap instan saat. Dengan mengubah alokasi bit untuk setiap subband, baik dengan secara dinamis beradaptasi sesuai dengan energi dari sinyal yang terkandung atau dengan fixing untuk setiap subband, suara kuantisasi dapat dikurangi di semua band.Proses ini baik dibandingkan dengan karakteristik kebisingan dari coder PCM tampil di keseluruhan yang sama bit rate.

Subband Keuntungan

Sendiri, coding subband, menggabungkan PCM di band masing-masing, mampu memberikan performance yang performance sports perbaikan atau keuntungan dibandingkan dengan band penuh PCM coding, baik makan bersama kompleks yang sama, tingkat konstan sinyal input [1]. Perbaikan didefinisikan sebagai keuntungan subband dan adalah rasio variasi kesalahan kuantisasi dihasilkan dalam setiap kasus sementara keduanya beroperasi pada tingkat transmisi yang sama. Keuntungan meningkat sebagai jumlah

peningkatan subbands, dan dengan kompleksitas sinyal input. Namun, pelaksanaan algoritma juga menjadi lebih sulit dan kompleks. Kuantisasi kebisingan yang dihasilkan selama proses pengkodean dibatasi dalam setiap subband dan tidak dapat mengganggu band lainnya. Keuntungan dari pendekatan ini adalah bahwa masking oleh setiap sinyal yang dominan subband jauh lebih efektif karena pengurangan dalam kebisingan bandwidth. Gambar 11.6.3 grafik subband keuntungan sebagai fungsi dari jumlah subbands untuk dasarnya stasioner empat, tetapi berbeda, sinyal audio kompleks.

----------------------- Halaman 1040 ----------------------11-104 Kompresi Teknologi untuk Video dan Audio

Gambar 11.6.3 Variasi keuntungan subband sebagai fungsi dari jumlah subband. (Dari [2]. Digunakan dengan permission.)

Dalam implementasi praktis dari codec kompresi, beberapa faktor cenderung membatasi jumlah dari subbands digunakan. Pertimbangan utama meliputi:

Variasi tingkat sinyal audio normal yang menyebabkan rata-rata dari energi di seluruh band dan penurunan berikutnya dalam keuntungan coding

Penundaan coding atau pengolahan diperkenalkan oleh subbands tambahan

Kompleksitas komputasi keseluruhan sistem

Dua isu kunci dalam analisis kerangka subband adalah:

Menentukan perbaikan mungkin terkait dengan subbands tambahan

Menentukan hubungan antara laba subband, jumlah subbands, dan respon bank filter yang digunakan untuk membuat mereka subbands

APCM Coding

Prosesor APCM bertindak dengan cara yang sama dengan sistem otomatis mendapatkan kontrol, terus membuat penyesuaian dalam menanggapi dinamika-pada semua frekuensi-dari audio masuk signal [1]. Transform coding membutuhkan blok waktu dari sinyal, analisis untuk frekuensi dan energi, dan mengidentifikasi konten yang tidak relevan. Sekali lagi, untuk memanfaatkan respon spektral telinga, frekuensi spektrum sinyal dibagi menjadi beberapa subband, dan kriteria yang paling penting adalah dikodekan dengan bias terhadap frekuensi rendah lebih sensitif. Pada saat yang sama, melalui penggunaan teknik masking psychoacoustic, frekuensi tersebut yang diasumsikan akan tertutup oleh telinga juga diidentifikasi dan dihapus. Data yang dihasilkan, oleh karena itu, menggambarkan frekuensi konten dan tingkat energi pada frekuensi tersebut, dengan lebih banyak bit yang dialokasikan untuk yang lebih tinggi energi frekuensi dibandingkan dengan energi yang lebih rendah. Blok yang lebih besar saat sinyal yang dianalisis, semakin baik resolusi frekuensi dan besar jumlah penyimpangan diidentifikasi. Hukuman, bagaimanapun, adalah peningkatan coding penundaan dan penurunan resolusi temporal. Keseimbangan telah dipukul dengan kemajuan dalam persepsi

----------------------- Halaman 1041 ----------------------Kompresi Audio Sistem 11-105

Tabel 11.6.1 Operasional Parameter Algoritma APCM subband (Setelah [2].)

Kompresi Bit Rate, A sampai Penundaan A, Audio

Sistem Rasio Coding subbands kbits / s ms1 Bandwidth, kHz

Dolby AC-2 6:1 256 256 45 20

ISO layer 1 4:1 32 384 19 20

ISO Layer 2 Variabel 32 192-256> 40 20

IOS Layer 3 12:01 576 128> 80 20

MUSICAM Variabel 32 128-384> 35 20

1 Penundaan keseluruhan sistem (encoder ke decoder) dari sistem pengkodean.

teknik pengkodean dan pemodelan psychoacoustic mengarah ke peningkatan efisiensi. Sudah menemukan bahwa dengan pendekatan ini untuk kompresi, sekitar 80 persen dari audio input dapat dihapus dengan hasil yang diterima [2]. Susunan hibrida bekerja dengan waktu-domain subbands dan sekaligus membawa sebuah analisa spektral dapat dicapai dengan menggunakan proses sedikit alokasi dinamis untuk setiap subband. Ini subband APCM pendekatan ditemukan dalam kisaran populer berbasis software musiCAM, Dolby AC-2, dan ISO/MPEG-1 Layers 1 dan 2 algoritma. Lapisan 3-lebih kompleks metode coding dan beroperasi pada bit jauh lebih rendah tingkat-adalah, pada dasarnya, kombinasi dari fungsi terbaik dari MUSICAM dan ASPEC, lain algoritma transformasi adaptif. Tabel 11.6.1 berisi daftar parameter operasional utama untuk sistem ini. Selain itu, beberapa sistem ini memanfaatkan redundansi yang signifikan antara stereo chanNels dengan menggunakan teknik yang dikenal coding asjoint stereo. Setelah informasi umum antara

saluran kiri dan kanan dari sinyal stereo telah diidentifikasi, diberi kode satu kali, sehingga mengurangi bit-rate menuntut lagi. Setiap subbands memiliki ambang masking sendiri didefinisikan. Data output dari masing-masing subbands disaring requantized dengan resolusi sedikit hanya cukup untuk mempertahankan kepala yang memadai ruang antara kebisingan kuantisasi dan ambang masking untuk band masingmasing. Dalam lebih kompleks coders (misalnya, ISO/MPEG-1 Layer 3), setiap kapasitas sedikit cadang digunakan oleh mereka subbands dengan besar kebutuhan untuk pemisahan ambang masking meningkat.Pemeliharaan ini signal-tomasking rasio ambang batas sangat penting jika kompresi lebih lanjut diatur untuk pascaproduksi setiap atau proses transmisi.

11.6.1d Pengolahan dan Delay Propagasi

Sebagaimana dicatat sebelumnya, kisaran saat ini algoritma kompresi populer beroperasi-untuk semua maksud dan tujuan-secara real time [1]. Namun, proses ini kebutuhan memperkenalkan beberapa terukur penundaan ke dalam rantai audio. Semua algoritma membutuhkan waktu yang terbatas untuk menganalisis masuk sinyal, yang bisa berkisar dari beberapa milidetik untuk puluhan bahkan ratusan milidetik. Itu jumlah penundaan pengolahan akan sangat penting jika peralatan yang akan digunakan dalam setiap interaktif atau dua arah aplikasi. Sebagai aturan praktis, ada lebih dari 20 ms keterlambatan audio dua arah pertukaran bermasalah. Propagasi penundaan di sirkuit terestrial satelit dan lama adalah fakta hidup. Sebuah hook dua jalan sampai lebih dari 1000 km, full duplex, telekomunikasi digital link memiliki delay propagasi

----------------------- Halaman 1042 ----------------------11-106 Kompresi Teknologi untuk Video dan Audio

dari 3 ms di setiap arah. Hal ini sebanding dengan memiliki percakapan dengan

seseorang yang berdiri 1 m. Jelas bahwa bahkan lebih dari jarak yang sangat singkat, penggunaan codec dengan lama proseskarakteristik penundaan ing akan memiliki efek dramatis pada operasi.

Bit 11.6.1e Tingkat dan Rasio Kompresi

ITU telah merekomendasikan bit rate berikut ketika menggabungkan kompresi data dalam rantai audio [1]:

128 kbits / s per saluran mono (256 kbits / s untuk stereo) sebagai bit rate minimum untuk tahap apapun jika kompresi lebih lanjut diantisipasi atau diperlukan.

192 kbits / s per saluran mono (384 kbits / s untuk stereo) sebagai bit rate minimum untuk pertama tahap kompresi dalam rantai audio kompleks.

Tanda tersebut menempatkan rasio kompresi 4:1 akhir "aman" dalam skala.Namun, lebih rasio kompresi yang agresif, sampai 20:01 nominal yang tersedia. Perlu diingat, meskipun, bahwa bit rate rendah, tinggi tingkat kompresi dapat menyebabkan masalah jika lebih jauh tahapan kompresi diperlukan atau diantisipasi. Dengan tahap-tahap kompresi, baik atau lantai kedua suara dan bandwidth audio akan ditetapkan oleh operasi tahap pada bit rate yang terendah. Oleh karena itu, senilai menekankan bahwa setelah platform ini telah ditetapkan oleh tahap bit rate rendah, mereka tidak dapat kemudian ditingkatkan dengan menggunakan operasi tahap berikut pada bit rate yang lebih tinggi.

Bit Rate Mismatch

Sebuah panggung kompresi juga dapat diikuti dalam rantai audio dengan tahap lain digital, baik

kompresi atau linier, tetapi-lebih penting-operasi pada frekuensi sampling yang berbeda [1]. Jika ada D / A konversi harus dihindari, sebuah konverter sample rate harus digunakan. Hal ini dapat berdiri sendiri unit atau mungkin sudah diinstal sebagai modul dalam peralatan yang ada. Apabila suatu foltahap melenguh kompresi beroperasi pada frekuensi sampling yang sama tetapi berbeda-com rasio pression, resolusi sedikit akan berubah secara default. Jika tahap memiliki frekuensi sampling yang sama, sebuah PCM langsung atau AES / EBU link digital dapat dilakukan, sehingga menghindari konversi ke domain analog.

11.6.1f Editing Kompresi data

PCM linear bentuk gelombang yang terkait dengan workstation audio standar hanya berguna jika didekode [1]. Resolusi data terkompresi mungkin atau mungkin tidak memadai untuk memungkinkan editing langsung dari sinyal audio. Sampel minimal audio yang dapat dihapus atau diedit dari transformasikode sinyal akan ditentukan oleh ukuran dari blok waktu dari sinyal PCM sedang dianalisis. Blok yang lebih besar waktu, semakin sulit mengedit data terkompresi menjadi.

11.6.2 Umum Teknik Kompresi Audio

Subband APCM coding telah menemukan berbagai aplikasi dalam industri audio profesional, termasuk [2]:

----------------------- Halaman 1043 ----------------------Kompresi Audio Sistem 11-107

Kaset kompak digital (DCC)-menggunakan implementasi sederhana dari subband APCM dengan PASC/ISO/MPEG-1 layer 1 algoritma menggabungkan 32 subbands menawarkan 4:01 com-

pression dan menghasilkan bit rate 384 kbits / s.

Para MiniDisc dengan ATRAC proprietary algoritma-memproduksi 5:01 kompresi dan 292 kbits / s bit rate. Algoritma ini menggunakan discrete cosine transform dimodifikasi (MDCT) teknik menjamin analisis sinyal lebih besar dengan mengolah blok saat sinyal dalam seragam fredivisi frekuensi, dengan divisi lebih sedikit yang dialokasikan untuk yang lebih tinggi paling tidak sensitif frequenCIES.

ISO/MPEG-1 Layer 2 (MUSICAM dengan nama lain)-algoritma berbasis software yang dapat diimplementasikan untuk menghasilkan berbagai bit rate dan rasio kompresi terhitung 4:1.

Para ATSC DTV sistem menggunakan algoritma subband APCM dalam Dolby AC-3 untuk audio surround sistem yang terkait dengan DTV ATSC standar. AC-3 memberikan lima saluran audio ditambah bass-hanya efek saluran bandwidth kurang dari yang dibutuhkan untuk satu stereo CD-chan nel. Konfigurasi ini disebut sebagai "5,1 saluran."

Untuk tujuan ilustrasi, berbagai umum sistem kompresi audio akan ujianined di bagian berikut.

11.6.2a a