Başlıq: ASCII, Unicode, UTF-8 nədir?

ASCII:

ASCII (American Standard Code for Information Interchange), 1960-cı illərdə Amerika Standartları İnstitutu (ANSI) tərəfindən hazırlanmış bir xarakter kodlama standartıdır. Bu standart kompüter sistemləri arasında mətn əsaslı məlumat mübadiləsini təmin etmək məqsədi ilə yaradılmışdır. ASCII hər bir xarakteri bir rəqəmlə təmsil edir və bu rəqəmlər 7-bitlik (0-127) aralığını əhatə edir.

ASCII-nin Tarixi və İnkişafı:

ASCII-nin Texniki Detalları:

ASCII-nin Gündəlik Həyatda İstifadəsi:

Məsələn:

char c = 'M';
int asciiCode = (int)c; // Nəticə: 77

ASCII-nin Məhdudiyyətləri

ASCII-nin ən böyük məhdudiyyəti yalnız İngilis dili xarakterlərini dəstəkləməsidir. Məsələn, Azərbaycan əlifbasından (ç, ş, ğ, ı, ə, ö, ü) ASCII cədvəlində yoxdur. Bu məhdudiyyət UTF-8 və Unicode kimi daha geniş kodlama standartlarının inkişafına səbəb olmuşdur.

Unicode:

Unicode, müxtəlif dillər və yazı sistemləri üçün vahid bir xarakter kodlama standartıdır. ASCII yalnız İngilis dili xarakterlərini dəstəklədiyi halda, Unicode dünyadakı bütün dillərin və xüsusi simvolların təmsil olunmasını təmin edir.

Əsas xüsusiyyətləri:

Unicode İş Prinsipi:

Unicode-un əsas məqsədi bütün dillərdəki xarakterləri unikal bir kod nömrəsi ilə təmsil etməkdir. Unicode iş prinsipi aşağıdakı kimi işləyir:

  1. Kod Nömrəsi: Unicode hər bir xarakterə unikal bir kod nömrəsi (code point) təyin edir.
     " A " üçün kod nömrəsi: U+0041
     " ç " üçün kod nömrəsi: U+00E7
     " 𐰀 " üçün kod nömrəsi: U+10C00
     " © " üçün kod nömrəsi: U+00A9
    
  2. Abstrakt Kodlama: Bu kod nömrələri sadəcə abstrakt olaraq təyin edilir, yəni bu mərhələdə onların kompüterdə necə saxlanılacağı və ya ötürüləcəyi müəyyən deyil.

  3. Kodlama Formatları: Unicode xarakterlərini saxlayıb ötürmək üçün müxtəlif kodlama formatlarından istifadə olunur, məsələn, UTF-8, UTF-16, və UTF-32.

UTF-8:

UTF-8 (Unicode Transformation Format-8), Unicode xarakterlərini kodlamaq üçün ən geniş istifadə edilən standartlardan biridir. Proqramçılar olaraq UTF-8`i HTML meta teglərin də görürük.

// HTML Meta tegləri:
<head>
    <meta charset="UTF-8"> // UTF-8 kodlama formatını istifadə edir
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>My Developedia Azerbaijan</title>
</head>

Əsas xüsusiyyətləri:

ASCII, Unicode və UTF-8-in Fərqləri Cədvəli:

Xüsusiyyət ASCII Unicode UTF-8
VKodlama Aralığı 7-bit (128 xarakter) 1 milyondan çox xarakter 1-dən 4 bayta qədər
Dəstəklənən Dillər Yalnız İngilis dili Bütün dillər Unicode əsaslı (Bütün dillər)
Uyğunluq Sadədir Böyük dil dəstəyi ASCII ilə uyğun

Unicode və UTF-8-in Gündəlik İstifadəsi:

UTF-8 İş Prinsipi:

UTF-8, Unicode xarakterlərini baytlar şəklində təmsil edən bir kodlama formatıdır. Onun iş prinsipi dinamik və səmərəlidir.

  1. Çoxbaytlı Kodlama: Unicode xarakterləri bir neçə bayt ilə kodlanır:
  1. Baytların Quruluşu: UTF-8 xarakterləri kodlamaq üçün xüsusi bit nümunələri istifadə edir:

    • 1 bayt: 0xxxxxxx
    • 2 bayt: 110xxxxx 10xxxxxx
    • 3 bayt: 1110xxxx 10xxxxxx 10xxxxxx
    • 4 bayt: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

Məsələn:

“ç” (U+00E7) üçün kodlama: 11000011 10100111 (2 bayt).

Nəticə

Unicode və UTF-8, ASCII-nin məhdudiyyətlərini aradan qaldıraraq müasir texnologiyaların qlobal dil dəstəyi ilə işləməsinə imkan yaradır. ASCII, Unicode-un təməl daşı olsa da, bu iki standartın inkişafı dünya üzrə mətn və məlumat mübadiləsini mümkün etmişdir. Hazırda Unicode kimi standartlar önə çıxa bilər, lakin ASCII-nin əsası müasir sistemlərdə hələ də aktuallığını qoruyur.

by knvmrt