Jednotky měření kapacity médií a objemu informací

Informační jednotky se používají k měření různých charakteristik spojených s informacemi.

Nejčastěji se měření informací týká měření kapacity paměti počítače ( úložných zařízení ) a měření množství dat přenášených digitálními komunikačními kanály . Méně běžně se měří množství informací .

Informační jednotky

Velké množství dat může obsahovat velmi málo informací. To znamená, že množství dat a množství informací jsou různé charakteristiky používané v různých oblastech souvisejících s informacemi, ale historicky se název „ množství informací “ používal ve významu „množství dat“ a názvy „ informační entropie “. “ a „hodnota informací“ byly použity k měření množství informací.

Jednotky pro kapacitu úložiště a objem dat

Používají se k měření kapacity paměťových médií- úložných zařízení a k měření objemů dat .

Jednotky pro měření množství informací

Používají se k měření množství informací v datovém objemu . Informační entropie

Primární jednotka

Primární charakteristikou množství dat je počet možných stavů .

Primární jednotkou měření objemu dat je 1 možný stav (hodnota, kód).

Sekundární jednotky

Sekundární charakteristikou množství dat je bit .

Kapacita (objem) jedné číslice může být různá a závisí na základě použitého kódovacího systému.

Kapacity jedné číslice v binárních, ternárních a desítkových kódovacích systémech:

Jedna binární číslice ( bit ) má 2 vzájemně se vylučující možné stavy (hodnoty, kódy).

Jedna ternární číslice ( trit ) má 3 vzájemně se vylučující možné stavy (hodnoty, kódy).

Jedno desetinné místo (decit) má 10 vzájemně se vylučujících možných stavů (hodnot, kódů).

Terciární jednotky

Terciární charakteristiky množství dat jsou různé sady bitů .

Kapacita množiny bitů se rovná počtu možných stavů této množiny bitů , který se určuje v kombinatorice , rovná se počtu umístění s opakováním a počítá se podle vzorce:

možné stavy (kódy, hodnoty)

kde

 - počet možných stavů jednoho bitu (základ zvoleného kódovacího systému),  je počet číslic v sadě číslic .

To znamená, že kapacita sady bitů je exponenciální funkcí počtu bitů se základem rovným počtu možných stavů jednoho bitu .

Příklad:

1 bajt se skládá z 8 ( ) binárních číslic ( ) a může trvat:

možné stavy (hodnoty, kódy).

Logaritmické jednotky

Když jsou některé veličiny, včetně množství dat, exponenciálními funkcemi , pak je v mnoha případech vhodnější použít nikoli veličiny samotné, ale logaritmy těchto veličin.

Množství dat lze také vyjádřit logaritmicky, jako logaritmus počtu možných stavů [1] .

Množství informací (množství dat) - lze měřit logaritmicky. [2] To znamená, že když se s několika objekty zachází jako s jedním, počet možných stavů se násobí a množství informací se sčítá . Nezáleží na tom, zda mluvíme o náhodných veličinách v matematice, digitálních paměťových registrech v technice nebo o kvantových systémech ve fyzice.

Pro objemy binárních dat je výhodnější použít binární logaritmy.

možné stavy , binární číslice = 1 bit možné stavy , bity = 1 byte ( oktet ) možné stavy , bity = 1 kilobajt (kilooktet) možné stavy , bity = 1 megabajt (MegaOctet) možné stavy , bity = 1 gigabajt (GigaOctet) možné stavy , bity = 1 TeraByte (TeraOctet)

Nejmenší celé číslo, jehož binární logaritmus je kladné celé číslo, je 2. Jeho odpovídající jednotka, bit  , je základem pro výpočet informace v digitální technologii.

Pro ternární objemy dat je vhodnější použít ternární logaritmy.

možné stavy , ternární číslice ( trit) možné stavy , ternární číslice ( trit s ) = 1 vlastnost .

Jednotka odpovídající číslu 3, trit je rovna log 2 3≈1,585 bitu.

Jednotka jako nat (nat), odpovídající přirozenému logaritmu , se používá v inženýrských a vědeckých výpočtech. Ve výpočetní technice se prakticky nepoužívá, protože základem přirozených logaritmů není celé číslo.

Pro objemy dekadických dat je vhodnější použít dekadické logaritmy.

možné stavy , desetinné místo = 1 dec možné stavy , desetinná místa = 1 kilodecit . možné stavy , desetinná místa = 1 megadecit . možné stavy , desetinná místa = 1 gigadecit .

Jednotka odpovídající číslu 10, decit je rovna log 2 10≈3,322 bitů.

V technice drátové komunikace (telegraf a telefon) a rádiu historicky poprvé jednotka informace získala označení baud .

Bitově odvozené jednotky

V celých číslech binárních číslic (bitů) je počet možných stavů roven mocninám dvou.

Tetrad, nibble, nibble

Čtyři binární číslice (4 bity) mají speciální název - tetrad , půl bajtu , nibble , které obsahují množství informací obsažených v jedné hexadecimální číslici.

Byte

Měření v bytech
GOST 8.417-2002 předpony SI IEC prefixy
název Označení Stupeň název Stupeň název Označení Stupeň
byte B 100 _ 100 _ byte B B 20 _
kilobajt KB 10 3 kilo- 10 3 kibibajt KiB KiB 2 10
megabajt MB 10 6 mega- 10 6 mebibyte MiB MiB 2 20
gigabajt GB 10 9 giga- 10 9 gibibyte GiB GiB 2 30
terabajt TBC 10 12 tera- 10 12 tebibyte TiB Tib 2 40
petabajt pb 10 15 peta- 10 15 pebibyte PiB P&B 2 50
exabajt Ebyte 10 18 exa- 10 18 exbibyte EiB EIB 2 60
zettabyte Zbyte 10 21 zetta- 10 21 zebibyte ZiB ZiB 2 70
yottabyte Ibyte 10 24 yotta- 10 24 yobibyte YiB Y&B 2 80

Další oblíbenou jednotkou informace v pořadí je 8 bitů nebo bajtů (terminologické jemnosti jsou popsány níže ). Právě na byte (a ne na bit) jsou všechna velká množství informací vypočítaných ve výpočetní technice přímo uvedena.

Hodnoty jako strojové slovo atd., které tvoří několik bajtů, se téměř nikdy nepoužívají jako jednotky měření .

Kilobyte

Pro měření velkých kapacit úložných zařízení a velkého množství informací, které mají velký počet bajtů, se používají jednotky „kilobajt“ = [1000] bajtů a „kbajty“ [3] ( kibibajt , kibibajt) = 1024 bajtů (přibližně záměna desítkových a binárních jednotek a termínů viz níže ). Tento řád je například:

Množství informací získaných čtením "3,5" diskety s vysokou hustotou je 1440 KB (přesně) ; ostatní formáty se počítají také v celých KB.

Megabajt

K měření objemu paměťového média se používají jednotky "megabajt" = 1000 kilobajtů = [1 000 000] bajtů a "mebibajt" [3] (mebibajt) = 1024 kbytes = 1 048 576 bajtů.

Adresový prostor procesoru Intel 8086 byl 1 MB.

Kapacita RAM a CD-ROM se měří v binárních jednotkách (mebibajtech, i když se tak obvykle nenazývají), ale pro kapacitu pevného disku byly oblíbenější desetinné megabajty.

Moderní pevné disky mají objemy vyjádřené v těchto jednotkách minimálně šestimístnými čísly, takže se pro ně používají gigabajty.

Gigabyte

Jednotky "gigabajt" = 1000 megabajtů = [1 000 000] kilobajtů = [1 000 000 000] bajtů a "GB" [3] ( gibibajt , gibibajt) = 1024 MB = 230 bajtů měří velikost velkých úložných médií, jako jsou pevné disky . Rozdíl mezi binárními a desítkovými jednotkami je již přes 7 %.

Velikost 32bitového adresního prostoru je 4 GB ≈ 4,295 MB. Stejný řád má velikost DVD-ROM a moderních médií na flash paměti . Velikosti pevných disků již dosahují stovek a tisíců gigabajtů.

Pro výpočet ještě většího množství informací existují jednotky terabajtů a tebibajtů (10 12 a 2 40 bajtů), petabajtů a pebibajtů (10 15 a 2 50 bajtů) atd.

Co je "byte"?

V zásadě je bajt definován pro konkrétní počítač jako minimální krok adresy paměti , který na starších strojích nemusel být nutně rovný 8 bitům (a paměť nemusí být nutně tvořena bity - viz například: ternární počítač ). V moderní tradici je bajt často považován za rovný osmi bitům .

V takových označeních jako byte (ruština) nebo B (anglicky) znamená byte (B) přesně 8 bitů, i když samotný výraz „byte“ není z hlediska teorie zcela správný.

Ve francouzštině se pro zdůraznění toho, že mluvíme o 8 bitech, používají symboly o , Ko , Mo atd. (od slova oktet).

Co je to "kilo"?

Po dlouhou dobu se rozdíl mezi faktory 1000 a 1024 snažil nepřikládat velký význam. Aby nedošlo k nedorozuměním, rozlišujte mezi:

tyto jednotky jsou podle definice 10 3 , 10 6 , 10 9 bajtů, a tak dále.

IEC navrhuje „kibibyte“, „mebibyte“, „gibibyte“ atd. jako výrazy pro „KB“, „MB“, „GB“ atd., nicméně tyto výrazy jsou kritizovány za to, že jsou nevyslovitelné a nenacházejí se v mluvené řeči. řeč.

V různých oblastech informatiky se také liší preference v používání desítkových a binárních jednotek. Navíc, přestože od standardizace terminologie a označení uplynulo několik let, zdaleka ne všude se snaží objasnit přesný význam použitých jednotek.

V angličtině se pro „kibi“ \u003d 1024 \u003d 2 10 někdy používá velké písmeno K , aby se zdůraznil rozdíl od předpony označené malým písmenem SI kilo . Takové označení však není založeno na směrodatné normě, na rozdíl od ruského GOST ohledně "Kbytes".

Variace

Poznámky

  1. "logaritmus" na answer.com Archivováno 22. září 2008 na Wayback Machine 
  2. Z hlediska fyziky je množství informací (stejně jako významově blízká entropie ) bezrozměrné . V praxi, stejně jako při měření bezrozměrných úhlů , se používají různé prakticky vhodné jednotky.
  3. 1 2 3 GOST 8.417-2002 "Jednotky množství" . Získáno 11. června 2008. Archivováno z originálu 2. února 2012.

Viz také