Kayıpsız Veri Sıkıştırma Nedir?
Kayıpsız veri sıkıştırması , dosyaların depolanması ve
bunların bellekte daha az fiziksel yer kaplayan arşivler halinde
birleştirilmesi, bu sayede dosyaların süreç içinde içerdiği herhangi bir
bilgiyi kaybetmeden elde edebilecekleri bir kolay kredi veren bankalarbilgisayar yöntemidir. Buna
karşılık, kayıplı sıkıştırma , dosya boyutlarını verilerin yaklaşık
değerleriyle azaltır ve geri yükleme, orijinal dosya içeriğine yakın bir
fakstır. Kayıpsız veri sıkıştırması için kullanılan algoritmalar esas olarak,
daha az sayıda bit belleği kullanarak bilgiyi kodlamaya yönelik bir takım
kurallar ya da talimatlardır ve yine de verileri orijinal formatına
değiştirmeden değiştirme yeteneğini korur.
Kayıpsız veri sıkıştırması kullanan bazı yaygın dosya
türleri, Uluslararası İş Makineleri (IBM) bilgisayar tabanlı zip ve Unix
bilgisayar tabanlı gzip dosya arşivlerini içerir. Ayrıca grafik değişim formatı
(GIF), taşınabilir ağ grafikleri (PNG) ve Bitmap (BMP) dosyaları gibi görüntü
dosyası formatları kullanılır . Veri sıkıştırma algoritmaları ayrıca, metin,
ses ve yürütülebilir program dosyaları için yaygın varyasyonlarla sıkıştırılmış
dosya türüne göre de değişir.
Kayıpsız veri sıkıştırması için iki ana algoritma
kategorisi, giriş verilerinin istatistiksel bir modeline ve bir veri
dosyasındaki bit dizilerinin bir eşleme modeline dayanmaktadır. Kullanılan
rutin istatistiksel algoritmalar 1977 yılında yayımlanan Burrows-Wheeler
dönüşümü (BWT), Abraham Lempel ve JacobZiv (LZ77) algoritması ve Kısmi
Eşleştirme (PPM) yöntemiyle Tahmin'dir. Sık kullanılan haritalama algoritmaları
Huffman kodlama algoritmasını ve Aritmetik kodlamayı içerir.
Bazı algoritmalar açık kaynak araçlarıdır ve diğerleri
patentlidir, ancak bazılarının patentleri de artık geçerliliğini yitirmiştir.
Bu, bazen yanlış dosya biçimine uygulanan sıkıştırma yöntemleri ile
sonuçlanabilir . Bazı veri sıkıştırma yöntemlerinin birbiriyle uyuşmaması
nedeniyle, karışık dosyaların depolanması genellikle bir dosyanın bir
bileşenini bozabilir. Örneğin, sıkıştırılmış metin içeren bir görüntü dosyası,
geri yüklendikten hızlı kredi veren bankalarsonra
metnin okunabilirliğinde degradasyonu gösterebilir. Dilbilgisi indüksiyonu
kullanan tarayıcılar ve yazılımlar, latentsemanticanalysis (LSA) olarak
bilinenleri uygulayarak görüntü dosyaları ile birlikte saklanan metinden anlam
çıkartabilir.
Kayıpsız veri sıkıştırması için başka bir eşleme algoritması
yöntemi, evrensel kodun kullanılmasıdır. Huffman kodlamasından daha esnek
kullanım, önündeki maksimum tamsayı değerlerini bilmeyi gerektirmez. Huffman
kodlama ve Aritmetik kodlama, ancak daha iyi veri sıkıştırma oranları üretir.
Çeşitli kaynaklar için iyi çalışan algoritmalar yaratan evrensel veri
sıkıştırma yöntemleri üretmek için çabalar sürmektedir.
Yorumlar
Yorum Gönder