Task MDT3 Charakter
-
Upload
fitriandini -
Category
Documents
-
view
159 -
download
2
Transcript of Task MDT3 Charakter
UNIVERSITAS ISLAM NEGERI
MULTIMEDIA DATA TEKNOLOGIYang diampuh oleh M.Ridha,ST
Judul : Perbandingan ASCII Character Sets, Extended Charakter Sets, Unicode.
FITRIANDINI (10751000174)( [email protected] )
TEKNIK INFORMATIKASAINS DAN TEKNOLOGI
UIN SULTAN SYARIF QASIM2009
Sejarah Text
Text atau simbol telah dikenal sebagai alat komunikasi sejak 6000 tahun yang lalu di Mesopotamia, Mesir, Sumeria dan Babilonia. Perkembangan yang paling fenomenal dari text adalah saat digunakan pada internet sebagai bagian yang menentukan tampilan pada layar monitor. Bahkan saat ini perkembangan HTML (Hypertext Markup Language) telah menjadi unsur penting dalam pembuatan presentasi apalagi yang berbasis multimedia.
Huruf, angka dan karakteristik-karakteristik khusus pada komputer direpresentasikan dengan skema pengkodean biner artinya, nilai off/on 0 dan 1 disusun dengan cara tertentu agar bisa merepresentasikan karakter, digit atau bentuk-bentuk lain.
Terdapat beberapa karakter yang saat ini digunakan pada komputer yaitu ASCII, Extended character sets dan Unicode. Kode ASCII merupakan suatu standard internasional yang dibuat oleh American National Standars Institute (ANSI) untuk mendefinisikan bagaimana komputer menulis dan membaca karakter (Seperti karakter untuk menandai akhir baris) Setiap karakter dipresentasikan dengan angka. ASCII lebih bersifat universal. Kode ASCII selalu digunakan pada komputer dan alat komunikasi lain untuk menunjukkan teks.
Keunggulan Unicode (16 bit) dari ASCII (8 bit) adalah kemampuanya untuk menyimpan symbol / karakter yang jauh lebih besar. Himpunan 256 karakter pertama dari Unicode merupakan pemetaan karakter ASCII 8 bit sehingga Unicode tetap kompatibel dengan ASCII. Selain mempresentasikan seluruh karakter ASCII, Unicode dapat mempresentasikan berbagai macam simbol diluar ASCII, seperti huruf Arab, Kanji, Hiragana, Katakana dan lain-lain.
Berikut merupakan penulisan karakter pada komputer.
ASCII ( red : ask-ee)
ASCII (American Standard Code for Information Interchange) adalah kode biner yang secara luas dipakai pada mikrokomputer. ASCII mempresentasikan setiap karakter sebagai 8 bit dimulai dari 0000 0000 hingga 1111 1111 maka total kombinasi yang dihasilkan sebanyak 256. Kode 0 hingga 255 dalam sistem bilangan desimal untuk menuliskan huruf, angka dan tanda baca standard dalam bahasa Inggris. ASCII versi baru bernama Extended ASCII yang bisa mencakup karakter semacam simbol matematis dan huruf-huruf Yunani. Namun,
256 huruf ASCII tidak akan cukup untuk menangani bahasa-bahasa lain semacam bahasa Cina atau Jepang yang memiliki ribuan karakter.
Terdapat dua macam ASCII yang mempergunakan yaitu 7 bit dan 8 bit. Pada ASCII yang mempergunakan 7 bit, terdapat dua kelompok karakter, yaitu 1. Karakter Kontrol, digunakan untuk mengontrol pengiriman atau transmisi data 2. Karakter Informasi, merupakan karakter yang mewakili data
Tabel Karakter ASCIIKarakter ASCII-8 Karakter ASCII-8
A 0100 0001 N 0100 1110B 0100 0010 O 0100 1111C 0100 0011 P 0101 0000D 0100 0100 Q 0101 0001E 0100 0101 R 0101 0010F 0100 0110 S 0101 0011G 0100 0111 T 0101 0100H 0100 1000 U 0101 0101I 0100 1001 V 0101 0110J 0100 1010 W 0101 0111K 0100 1011 X 0101 1000L 0100 1100 Y 0101 1001M 0100 1101 Z 0101 1010 0 0011 0000 5 0011 01011 0011 0001 6 0011 01102 0011 0010 7 0011 01113 0011 0011 8 0011 10004 0011 0100 9 0011 1001! 0010 0001 ; 0011 1011
EXTENDED Character Sets
Tampilan karakter yang digunakan dalam berbagai abjad (Eropa dan Asia) dan simbol-simbol khusus. Untuk menampilkan salah satu karakter gunakan &#n; , dimana n adalah angka yang sesuai. Sejumlah bahasa mengunakan karakter yang lebih besar daripada kisaranyanya. Contoh nilai tipe char Jepang dan Cina. GNU C Library berisi dukungan untuk 2 mekanisme menangani rangkaian karakter diperpanjang yaitu multibyte dan karakter lebar. Berikut merupakan karakter extended HTML.
Tabel Karakter Extended Character Sets
ASCII char ASCII char ASCII Char ASCII char
257 ā 258 Sebuah 259 Sebuah 260 Sebuah
261 sebuah 262 C 263 Ć 264 C
265 C 266 C 267 C 268 Č
269 č 270 D 271 D 272 ©
273 đ 274 E 275 E 276 E
277 E 278 E 279 E 280 E
281 ę 282 E 283 E 284 G
285 G 286 Ğ 287 Ğ 288 G
289 G 290 Ģ 291 Ģ 292 H
293 h 294 H 295 H 296 Ĩ
297 Ĩ 298 Ī 299 Ī 300 Aku
301 Aku 302 Į 303 Į 304 Aku
305 ı 306 IJ 307 IJ 308 J
309 J 310 Ķ 311 Ķ 312 ĸ
313 L 314 L 315 L 316 ļ
317 L 318 L 319 L 320 L
321 Ł 322 Ł 323 N 324 N
325 Ņ 326 Ņ 327 N 328 N
329 ʼn 330 Ŋ 331 Ŋ 332 O
333 ō 334 O 335 O 336 O
337 o 338 Œ 339 Œ 340 R
341 ŕ 342 R 343 R 344 R
345 R 346 S 347 Ś 348 S
349 s 350 Ş 351 Ş 352 Š
353 š 354 T 355 Ţ 356 T
357 ť 358 Ŧ 359 Ŧ 360 U
361 ũ 362 U 363 Ū 364 U
365 U 366 U 367 U 368 Ű
369 ű 370 U 371 U 372 W
373 w 374 Y 375 Y 376 Ÿ
377 Z 378 Z 379 Z 380 Z
381 Ž 382 ž 383 ſ 384 ƀ
385 Ɓ 386 Ƃ 387 Ƃ 388 Ƅ
389 ƅ 390 Ɔ 391 Ƈ 392 ƈ
393 Ɖ 394 Ɗ 395 Ƌ 396 ƌ
397 ƍ 398 Ǝ 399 Ə 400 Ɛ
401 Ƒ 402 ƒ 403 Ɠ 404 Ɣ
405 ƕ 406 Ɩ 407 Ɨ 408 Ƙ
409 ƙ 410 ƚ 411 ƛ 412 Ɯ
413 Ɲ 414 ƞ 415 Ɵ 416 O
417 o 418 Ƣ 419 Ƣ 420 Ƥ
421 ƥ 422 Ʀ 423 Ƨ 424 ƨ
425 Σ 426 ƪ 427 ƫ 428 Ƭ
429 ƭ 430 Ʈ 431 U 432 U
433 Ʊ 434 Ʋ 435 Ƴ 436 ƴ
437 Z 438 Z 439 Ʒ 440 Ƹ
441 ƹ 442 ƺ 443 ƻ 444 Ƽ
445 ƽ 446 ƾ 447 Ƿ 448 |
449 ǁ 450 ǂ 451 ! 452 DŽ
453 DŽ 454 dž 455 LJ 456 LJ
457 lj 458 NJ 459 NJ 460 nj
461 Ǎ 462 ǎ 463 Ǐ 464 ǐ
465 Ǒ 466 ǒ 467 Ǔ 468 ǔ
469 Ǖ 470 ǖ 471 Ǘ 472 ǘ
473 Ǚ 474 ǚ 475 Ǜ 476 ǜ
477 ǝ 478 Ǟ 479 Ǟ 480 Ǡ
481 ǡ 482 Ǣ 483 Ǣ 484 Penilai
485 penilai 486 Ǧ 487 Ǧ 488 Ǩ
489 ǩ 490 Ǫ 491 Ǫ 492 Ǭ
493 ǭ 494 Ǯ 495 Ǯ 496 ǰ
497 DZ 498 DZ 499 dz 500 Dibolehkan
501 dibolehkan 502 Ƕ 503 Ƿ 504 Ǹ
505 ǹ 506 Ǻ 507 ǻ 508 Ǽ
509 ǽ 510 Ǿ 511 ǿ 512 Ȁ
513 ȁ 514 Ȃ 515 ȃ 516 Ȅ
517 ȅ 518 Ȇ 519 ȇ 520 Ȉ
521 ȉ 522 Ȋ 523 ȋ 524 Ȍ
525 ȍ 526 Ȏ 527 ȏ 528 Ȑ
529 ȑ 530 Ȓ 531 ȓ 532 Ȕ
533 ȕ 534 Ȗ 535 ȗ 536 Ş
537 ş 538 T 539 Ţ 540 Ȝ
541 ȝ 542 Ȟ 543 ȟ 544 Ƞ
545 ȡ 546 Ȣ 547 ȣ 548 Ȥ
549 ȥ 550 Ȧ 551 ȧ 552 Ȩ
553 Ȩ 554 Ȫ 555 ȫ 556 Ȭ
557 ȭ 558Nomor ini sesuai dengan
559nomor ini sesuai dengan
560 Ȱ
561 Ȱ 562 Á 563 ȳ 564 ȴ
UNICODE
Dikembangkan pada awal tahun 1990. Diciptakan oleh konsorsium perusahaan seperti Apple, Microsoft, HP, Digital dan IBM kemudian digabungkan dengan standar ISO-10646 untuk menghasilkan satu standar pada tahun 1993. Unicode memakai 2 byte (16bit) untuk mempresentasika karakter, tidak hanya sekedar 1 byte (8 bit). Dengan Demikan, banyak karakter yang dapat dipresentasikan adalah 216 atau 65.536 karakter.
Unicode dirancang untuk mencakupi bahasa/teks yang ada dunia termasuk simbol-simbol ilmiah dan bahasa-bahasa pada subjek ilmiah. Ini meghilangkan kerumitan multibyte rangkaian karakter yang sedang digunakan pada UNIX dan Windows untuk mendukung bahasa Asia. Unicode sudah merupakan dasar untuk satu sistem operasi Windows / NT.
Unicode merupakan paket karakter standar yang digunakan pada NTFS dan menggantikan karakter older-single byte ASCII. Setiap karakter pada kebanyakan bahasa yang natural adalah direpresentasikan dengan double-byte number dalam paket karakter Unicode.
Set karakter Unicode disusun dalam urutan abjad dari nama referensi entitas terkait. Kita dapat menggunakan karakter seperti "β" secara langsung (dengan menyalin dan menyisipkan karakter) atau dapat memilih untuk referensi mereka dengan entitas referensi sebagai “β” dalam elemen token presentasi.
Tabel karakter UnicodeAkuIacute Í ic icirc î Icirc Î Dingin И dingin и
dingin и Idot Aku iecy е IEcy Е iexcl ¡ IFF ⇔Ifr ℑ Igrave Ì igrave ì iiint ∭ iiota ℩ IJlig IJijlig ij Im ℑ Imacr Ī imacr ī gambar ℑ imagline ℐ
imagpart ℑ imath ı imof ⊷Menyiratkan
⇒ di ∈ incare ℅
infin ∞ inodot ı int ∫ Int ∬ intcal ⊺ bilangan ℤ
Integral ∫ intercal ⊺Persimpangan
⋂ intlarhk
⨗ InvisibleComma
IOcy Ё
iocy ё Iogon Į iogon įsedikitpun
ι iquest ¿ Iscr ℐ
isin ∈ isindot ⋵ isinE ⋹ isins ⋴ isinv ∈ Itilde ĨItilde Ĩ itilde Ĩ iukcy і Iukcy І Iuml Ï iuml ïJjcirc J jcy й jsercy ј Jsercy Ј Jukcy Є jukcy єKkappa κ kappav κ Kcedil Ķ kcedil ķ Kcy К kcy кkgreen ĸ khcy х KHcy Х KJcy Ќ kjcy ќ kcy кL
lacute L Lacute Llaemptyv
⦴ lagran ℒ lAarr ⇚ Lambda Λ
lambda λ Lang " lang < langd ⦑ langle <pangkuan
≲
Laplacetrf ℒ laquo « larr ← Larr ↞ lArr ⇐ lArr ⇐larrb ⇤ larrbfs ⤟ larrfs ⤝ larrhk ↩ larrlp ↫ larrb ⇐larrtl ↢ lbbrk 〔 lbrace ( lbrack [ lbrke ⦋ lcaron L
lcaron L Lcaron L Lcedil L lcedil ļ lceil ⌈ lcub (Lcy Л lcy л ldquo " ldquor " le ≤ le ≦
LeftAngleBracket
<Leftarrow
⇐ Leftarrow
←Leftarrow
←LeftArrowBar
⇤LeftArrowRightArrow
⇆
leftarrowtail
↢ LeftCeiling
⌈
LeftDoubleBracket
[
LeftDownTeeVector
⥡ LeftDownVector
⇃LeftDownVectorBar
⥙
LeftFloor ⌊leftharpoondown
↽leftharpoonup
↼leftleftarrows
⇇ Leftrightarrow
⇔leftrightarrow
↔
LeftFloor ⌊leftharpoondown
↽leftharpoonup
↼leftleftarrows
⇇ leftrightharpoons
⇋leftrightsquigarrow
↭
leftrightharpoons
⇋ leftrightsquigarr
↭ LeftRightVe
⥎ LeftTee
⊣ LeftTeeArrow
↤ LeftTeeVector
⥚
ow ctor
leftthreetimes
⋋ LeftTriangle
⊲LeftTriangleBar
⧏LeftTriangleEqual
⊴ LeftUpDownVector
⥑ LeftUpVector
↿
kaki ⋚ kaki ⋚ leq ≤ leqq ≦ lessapprox ≲ lessdot ⋖
lesseqgtr ⋚ lesseqqgtr
⋚LessEqualGreater
⋚LessFullEqual
≦ LessGreater
≶ lessgtr ≶
lessgtr ≶ lesssim ≲ LessTilde
≲ lfloor ⌊ lg ≶ lhard ↽
lharu ↼ ljcy љ LJcy Љ LL ⋘ ll « llarr ⇇
llcorner ⌞ Lleftarrow
⇚ llhard ⥫ Lmidot
L lmidot L lmoust ⎰
lne ≨ lnE ≨ lneq ≨ lneqq ≨ lnsim ⋦ lobrk [
looparrowleft
↫ looparrowright
↬ lopar 〘 lowbar
_LowerLeftArrow
↙
LowerRightArrow
↘
Loz ◊ lpar ( lrarr ⇆ lrcorner
⌟ lrhar ⇋ lrtri ⊿
lscr ℓ Lscr ℒ lsh ↰ Lsh ↰ lsim ≲ lsqb [lsquo ' lsquor , lstrok Ł Lstrok Ł Lt « lt <ltdot ⋖ lthree ⋋ ltimes ⋉ ltri ◃ ltrie ⊴ ltrif ◂M
macr ¯ laki-laki ♂ malt ✠ Maltese
✠ peta ↦ mapsto ↦
mapstodown
↧ mapstoleft
↤ mapstoup
↥ marker
▮ MCv М mcomma ⨩
MCv м mdash --mDDot
∺measuredangle
∡ MediumSpace
Mellintrf ℳ
Mfr 𝔐 mfr 𝔪 mho ℧ mikro μpertengahan
| midast *
midcir ⫰ middot · minus --minusb
⊟ minusd ∸ minusdu ⨪
MinusPlus ∓ mldr ...mnplus
∓ model ⊧ mp ∓ Mscr ℳ
mstpos ∾ mu μMultimap
⊸ mumap
⊸
Nnabla ∇ nacute N Nacute N nang ∠ ̸ tidur ≉ tengkuk ⩰ ̸
napid ≋ ̸ napos ʼnnapprox
≉ natur ♮ alam ♮ alami ℕ
nbsp nbump ≎ ̸ nbumpe
≏ ̸ ncap ⩃ Ncaron N ncaron N
Ncedil Ņ ncedil Ņ ncong ≇ ncongdot
⩭ ̸ ncup ⩂ ncy н
Ncy Н ndash -- ne ≠nearhk
⤤ neArr ⇗ nearr ↗
nearrow ↗ nedot ≠ nequiv ≢ nesear ⤨ nesim ≂ ̸NestedGreaterGreater
»
NestedLessLess
« Newline nexist ∄ nexists
∄ nge ≱ ngeqq ≱
ngeqslant ≱ nges ≱ ngsim ≵ NGT ≯\ NGT »̸ ngtr ≯\nharr ↮ nhArr ⇎ ni ∋ NIV ∋ njcy њ NJcy Њ
nlArr ⇍ nlarr ↚ nldr ‥ nlE ≰ nleftarrow ↚ nLeftarrow
⇍
nLeftrightarrow
⇎ nleftrightarrow
↮ nleq≰ ⃥ nleqq ≰ nleqslant ≰ nles ≰
nless <\ nlsim ≴ NLT <\ nltri ⋪ nltrie ⋬ nmid ∤
NoBreakNonBreakingSpace
Nopf ℕ tidak ¬NotCongruent
≢ NotCupCap
≭
NotDoubleVerticalBar
∦ NotElement
∉ NotEqual
≠NotExists
∄ NotGreater ≯\NotGreaterFullEqual
≰
NotGreaterLess
≹NotGreaterSlantEqual
≱NotGreaterTilde
≵ notin ∉ NotLeftTriangle
⋪NotLeftTriangleEqual
⋬
NotLess <\NotLessGreater
≸NotLessSlantEqual
≰NotLessTilde
≴ notni ∌ notniva ∌
NotPrecedes
⊀NotPrecedesSlantEqual
⋠NotReverseElement
∌NotRightTriangle
⋫NotRightTriangleEqual
⋭NotSquareSubsetEqual
⋢
NotSquareSupersetEqual
⋣ NotSubset
⊄NotReverseElement
∌NotSubsetEqual
⊈ NotSucceeds
⊁NotSucceedsSlantEqual
⋡
NotSuperset
⊅NotSupersetEqual
⊉ NotTilde
≁NotTildeEqual
≄ NotTildeTilde
≉ NotVerticalBar
∤
npar ∦ nparallel∦ NPR ⊀ nprcue
⋠ nprec ⊀ nrarr ↛
nrArr ⇏ nrightarrow
↛ nRightarrow
⇏ nrtri ⋫ nrtrie ⋭ nsc ⊁
nsccue ⋡ nsim ≁ nsime ≄ nsimeq
≄ nsqsube ⋢ nsqsupe ⋣
nsub ⊄ nsubE ⊈ nsube ⊈ nsubs ⊄ nsubseteq ⊈ nsubsete ⊈
et qq
nsucc ⊁ nsup ⊅ nsupE ⊉ nsupe ⊉ nsupset ⊅ nsupseteq
⊉
nsupseteqq⊉ ntgl ≹ Ntilde Ñ ntilde ñ ntlg ≸ ntriangleleft
⋪
ntrianglelefteq
⋬ ntriangleright
⋫ntrianglerighteq
⋭ nu ν num # numero №
numsp nVDash ⊯ nVdash
⊮ nvDash
⊭ nvdash ⊬ nvge ≱
nvgt ≯\ nvHarr ⇎ nvlArr ⇍ nvle ≰ nvlt <\ nvrArr ⇏
nwarr ↖ nwArr ⇖ nwarrow
↖nvle ≰ nvlt <\ nvrArr ⇏
OOacute Ó oacute ó oast ⊛ ocir ⊚ ocirc ô Ocirc ÔOcy О ocy о odash ⊝ odblaco Odblac O odot ⊙
OElig Œ oelig œ ogon ˛ograve
ò Ograve Ò ohm Ω
sendi ∮ olarr ↺ omacr ōOmacr
O Omega Ω omega ω
ominus ⊖OpenCurlyDoubleQuote
"OpenCurlyQuote
' oplus ⊕ atau ∨ orarr ↻
urutan ℴ orderof ℴ ordf ª ordm º origof ⊶ oS Ⓢoscr ℴ Oslash Ø oslash ø osol ⊘ Otilde Õ otilde õ
otimes ⊗ Ouml Ö ouml ö ovbar ⌽ OverBar ¯OverBrace
(
OverBar ¯OverBrace
(OverParenthesis
(
Ppar ∥ para ¶ paralel ∥ bagian∂ PartialD ∂ pcy п
Pcy П percnt %periode
. permil ‰ pelaku ⊥ pertenk ‱
pertenk ‱Phi Φ phi φ phiv φ phmmat ℳ telepon ☎Pi Π pi π garpu ⋔ PIV π planckh ℎ plankv ℏ
PIV π planckh ℎ plankv ℏ ditambah
+ plusb ⊞ PlusMinus
±
plusmn ± pm ±Poincareplane
ℌ Popf ℙ pon £ pr ≺
Prap ≾ prcue ≼ prec ≺ precapprox
≾ preccurlyeq
≼ Mendahului
≺
PrecedesSl ≼ precnap ⋨ Preced ≾ precns⋨ precsim ≾ Perdana "
antEqual proxesTilde
im
perdana ' prima ℙ prnap ⋨ prnE ⪵ prnsim ⋨ prod Π
Produk Π profalar ⌮ profline
⌒ profsurf
⌓ prop Α Proporsi ∷
Proporsional
Α propto Α prsim ≾ prurel ⊰ psi ψ Psi Ψ
QQfr 𝔔 qfr 𝔮 qint ⨌Qopf ℚ qopf 𝕢 qprime ⁗
Qscr 𝒬 quaternions
ℍ quatint ⨖ pencarian
? questeq ≟ quot "
Unicode memiliki cara untuk mensintesis sebuah karakter beraksen dengan cara menggabungkan aksen simbol dan karakter dasar. Misalnya, menggabungkan 'a' dan '~' membuat 'seorang' dengan tilde. Lebih dari dua aksen simbol dapat ditambahkan ke karakter dasar.
Bahasa seperti Thailand perlu mengkombinasikan karakter. Menggabungkan karakter adalah satu-satunya metode untuk mengekspresikan karakter dalam bahasa-bahasa. Namun, beberapa masalah muncul. Gandakan Encoding Ada beberapa cara untuk mengekspresikan karakter yang sama. Sebagai contoh, u dengan umlaut dapat dinyatakan sebagai u 00 fc dan juga sebagai u 0.075 + U 0.308.
Kelebihan Unicode character set dibandingkan dengan character set yang propietary:
Menyusun character set sendiri, harus membujuk-membujuk vendor operating system untuk mensupportnya.
Dengan Unicode, operating system pasti mensupportnya, tinggal supply file font dan keyboard driver.
Untuk di-golive-kan ke Internet Unicode juga bisa, Internet menggunakan UTF-8 (suatu varian Unicode) untuk pertukaran data.
REFERENSI
www.google.com/translate
http://www.unicode.org
www.baliunicode-ufaq.com
www.wordpress.com/SukadiBlog
Suhanto@geeks.”ASCII.ANSI,ISO-8859-1,dan UTP-8”.20/10/2008
www.syopian.net