ASCII : (
İngilizcesi : American
Standard Code for Information Interchange, Türkçesi
: Bilgi Değişimi İçin Amerikan
Standart Kodlama Sistemi
)
Latin
alfabesi üzerine
kurulu 7 bitlik bir karakter
kümesidir. İlk kez 1963 yılında ANSI tarafından standart olarak sunulmuştur.
ASCII'de
33 tane basılmayan kontrol karakteri ve 95 tane basılan karakter bulunur.
Kontrol karakterleri metnin akışını kontrol eden, ekranda çıkmayan
karakterlerdir. Basılan karakterler ise ekranda görünen, okuduğumuz metni
oluşturan karakterlerdir.
UNICODE : Unicode
Consortium organizasyonu
tarafından geliştirilen ve her
karaktere bir sayı değeri karşılığı atayan bir endüstri
standardıdır. Sistemin
amacı farklı karakter
kodlama sistemlerinin birbiriyle
tutarlı çalışmasını ve dünyadaki tüm yazım sistemlerinden metinlerin bilgisayar
ortamında tek bir standart altında temsil edilebilmesini sağlamaktır. Evrensel
Karakter Kümesi (UCS)
olarak bilinen ISO/IEC 10646 standardı ise, her iki organizasyonun
işbirliği ile aynı sayısal karşılıkları taşımaktadır. Unicode, son sürümü
itibarıyla 129 farklı modern ve tarihi yazım sistemine ait 120.000'den fazla
karakteri ve emoji
gibi çeşitli
sembol kümelerini kapsamaktadır.
Standardın
içinde karakterler ve karakterlere atanmış sayı değerlerinin tablolaştırılmış
hali, bu sayılarının kodlanmasıyla
ilgili kurum
tarafından önerilen standart kodlama sistemleri ve bunların yanı sıra eşdeğer
karakterler, karakterin bileşenlerine ayrılış bilgileri, sıralama kuralı,
büyük-küçük harf bilgisi, yazılış yönü bilgisi gibi karakterin ekranda doğru
gösterilebilmesi için yazılımların ihtiyaç duyduğu ek bilgiler bulunmaktadır.
Haziran 2015 tarihi itibarıyla standardın
en son sürümü olan Unicode 8.0 ile birlikte 7.716 yeni karakter eklemesi yapılmıştır.
Unicode
kodlarından oluşan karakter
dizilerini (metinleri) bilgisayarda verimli bir biçimde saklayabilmek amacıyla
çeşitli karakter
kodlamaları geliştirilmiştir.
Bunlardan en bilinenleri UTF-8,
UTF-16 ve
artık kullanımdan kalkmış olan UCS-2'dir.
UTF - 8 :
8-bitlik
bir Unicode dönüşüm biçimidir. Unicode karakterlerini değişken uzunluklu bayt
guruplarıyla kodlamakta kullanılır. Rob Pike ve Ken Thompson tarafından
geliştirilmiştir.
UTF-8
kodlaması Unicode karakterlerini 1-6 byte
uzunluğunda diziler
olarak kodlar. ASCII kodlaması içinde 0-127 arasında kalan karakterler aynen
kendi kodları ile kullanılır, diğerleri ise byte dizileri haline gelir.
UTF - 16 :
Bir Unicode kodlama uzantısıdır. 65.536 karakteri temsil etmek
için iki byte kullanır. Ancak, UTF-16'da bir milyon kadar ek karakter için dört bayt desteklenir.
Bu yazımda destek aldığım kaynaklar :
- https://tr.wikipedia.org/wiki/ASCII
- https://tr.wikipedia.org/wiki/UTF-8
- http://utf.nedir.com/
- https://tr.wikipedia.org/wiki/Unicode
Hiç yorum yok :
Yorum Gönder