İçeriğe atla

Dosya formatı

Vikipedi, özgür ansiklopedi

Dosya formatı, bilginin bir bilgisayar dosyasında depolanması için standart bir şekilde kodlandığı yöntemdir. Bu, bilgilerin dijital depolama ortamında nasıl kodlandığını ve dosyayı oluşturan bitlerin bilgiyi kodlamak için nasıl kullanıldığını belirtir. Dosya formatları sahipli veya açık olabilir.

Dosya tipini tanımlama yöntemleri[değiştir | kaynağı değiştir]

İşletim sistemleri ve programlar dosya formatını tanımlamak için çeşitli yöntemler kullanır. Böylece birbiriyle alakasız programlar, dosyayı kullanmayı reddeder. Mesela bir müzik oynatıcısı, bir metin dosyasını açmaz.

Dosyanın uzantısını kullanarak[değiştir | kaynağı değiştir]

Windows, macOS gibi işletim sistemlerinin yaygın olarak kullandığı yöntemlerden bir tanesi dosyanın uzantısına bakmaktır. Dosya adındaki son noktadan sonraki karakterler kontrol edilir ve dosya tipine karar verilir. Bu yöntemin bir dezavantajı, kullanıcı dosya tipini değiştirerek işletim sisteminin dosyayı açmasını sağlayabilir. Bu nedenle Windows ve macOS dosya uzantılarını varsayılan olarak gizler.

Dosya tipi Uzantılar
Audio .aac, .mp3, ,.m4a, .wav, .flac
Executable .app, .exe, .msi
Font .otf, .ttf, .woff2
Image .bmp, .gif, .jpeg, .jpg, .png, .tif, .tiff
Konfigrasyon .cfg, .ini, .json, .xml, .yaml, .toml
Sıkıştırılmış arşiv .7z, .rar, .tar.gz, .zip
Presentation .odp, .ppt, .pptx
Spreadsheet .csv, .ods, .xls, .xlsx
Text Document .docx, .odt, .rtf, .txt
Veritabanı .db, .mdb, .sqlite
Video .avi, .avi .webm, .mov, .mp4

Metadata kullanarak[değiştir | kaynağı değiştir]

İkinci bir yöntem dosyanın içeriğindeki bilgiyi kullanmaktır. Bu bilgi bir şekide bazı bit dizilerinin hep aynı yerde bulunması şeklinde olabilir veya da birkaç bayt uzunluğundaki sihirli sayılardır.

Dosya başlığı[değiştir | kaynağı değiştir]

Bit dizini tanımlamada en kolay ulaşılabilecek yer genelde dosyanın başı olduğundan bu bölgeye dosya başlığı denir ancak dosya formatına bağlı olarak belirli hafıza bölgesinde yahut en sonda bulunabilir. Dosya başlığı dosyanın tipini tanımlamanın yanında dosyanın içeriği hakkında da çeşitli metadata içerebilir. Mesela resim (image) dosyaları dosya formatının yanında genelde resmin boyu, çözünürlüğü, renk uzayı, resmi oluşturan kişi, resmi alan kameranın modeli, destekleniyorsa GPS lokasyonu gibi bilgiler Exif formatında tutulur.

Sihirli sayı[değiştir | kaynağı değiştir]

Dosya türü tanımlamanın diğer bir yöntemi, genel Unix ve türevlerinde, dosya içerisinde bir "sihirli sayı" bulundurmaktır. Bu terim en başta, dosya başındaki 2 bayttan oluşan özel tanımlayıcılar için kullanıldı, ancak herhangi bir binary dizisi sayı olarak düşünülebileceğinden dosyayı tanımlamada kullanılabilir. Örnek olarak;
JPEG resim dosyaları FF D8 başlar ve FF D9 ile biter,
PDF dosyaları "%PDF" karakterleriyle (hex 25 50 44 46) başlar,
ELF çalıştırılabilir dosyaları 7F karakteriyle başlar "ELF" (7F 45 4C 46) şeklinde devam eder.

Unix ve Unix benzeri işletim sistemlerindeki file komutu dosya formatını görmek için kullanılabilir.