Informační jednotky se používají k měření různých charakteristik spojených s informacemi.
Nejčastěji se měření informací týká měření kapacity paměti počítače ( úložných zařízení ) a měření množství dat přenášených digitálními komunikačními kanály . Méně běžně se měří množství informací .
Velké množství dat může obsahovat velmi málo informací. To znamená, že množství dat a množství informací jsou různé charakteristiky používané v různých oblastech souvisejících s informacemi, ale historicky se název „ množství informací “ používal ve významu „množství dat“ a názvy „ informační entropie “. “ a „hodnota informací“ byly použity k měření množství informací.
Používají se k měření kapacity paměťových médií- úložných zařízení a k měření objemů dat .
Používají se k měření množství informací v datovém objemu . Informační entropie
Primární charakteristikou množství dat je počet možných stavů .
Primární jednotkou měření objemu dat je 1 možný stav (hodnota, kód).
Sekundární charakteristikou množství dat je bit .
Kapacita (objem) jedné číslice může být různá a závisí na základě použitého kódovacího systému.
Kapacity jedné číslice v binárních, ternárních a desítkových kódovacích systémech:
Jedna binární číslice ( bit ) má 2 vzájemně se vylučující možné stavy (hodnoty, kódy).
Jedna ternární číslice ( trit ) má 3 vzájemně se vylučující možné stavy (hodnoty, kódy).
…
Jedno desetinné místo (decit) má 10 vzájemně se vylučujících možných stavů (hodnot, kódů).
…
Terciární charakteristiky množství dat jsou různé sady bitů .
Kapacita množiny bitů se rovná počtu možných stavů této množiny bitů , který se určuje v kombinatorice , rovná se počtu umístění s opakováním a počítá se podle vzorce:
možné stavy (kódy, hodnoty)kde
- počet možných stavů jednoho bitu (základ zvoleného kódovacího systému), je počet číslic v sadě číslic .To znamená, že kapacita sady bitů je exponenciální funkcí počtu bitů se základem rovným počtu možných stavů jednoho bitu .
Příklad:
1 bajt se skládá z 8 ( ) binárních číslic ( ) a může trvat:
možné stavy (hodnoty, kódy).
Když jsou některé veličiny, včetně množství dat, exponenciálními funkcemi , pak je v mnoha případech vhodnější použít nikoli veličiny samotné, ale logaritmy těchto veličin.
Množství dat lze také vyjádřit logaritmicky, jako logaritmus počtu možných stavů [1] .
Množství informací (množství dat) - lze měřit logaritmicky. [2] To znamená, že když se s několika objekty zachází jako s jedním, počet možných stavů se násobí a množství informací se sčítá . Nezáleží na tom, zda mluvíme o náhodných veličinách v matematice, digitálních paměťových registrech v technice nebo o kvantových systémech ve fyzice.
Pro objemy binárních dat je výhodnější použít binární logaritmy.
možné stavy , binární číslice = 1 bit možné stavy , bity = 1 byte ( oktet ) možné stavy , bity = 1 kilobajt (kilooktet) možné stavy , bity = 1 megabajt (MegaOctet) možné stavy , bity = 1 gigabajt (GigaOctet) možné stavy , bity = 1 TeraByte (TeraOctet)Nejmenší celé číslo, jehož binární logaritmus je kladné celé číslo, je 2. Jeho odpovídající jednotka, bit , je základem pro výpočet informace v digitální technologii.
Pro ternární objemy dat je vhodnější použít ternární logaritmy.
možné stavy , ternární číslice ( trit) možné stavy , ternární číslice ( trit s ) = 1 vlastnost .Jednotka odpovídající číslu 3, trit je rovna log 2 3≈1,585 bitu.
Jednotka jako nat (nat), odpovídající přirozenému logaritmu , se používá v inženýrských a vědeckých výpočtech. Ve výpočetní technice se prakticky nepoužívá, protože základem přirozených logaritmů není celé číslo.
Pro objemy dekadických dat je vhodnější použít dekadické logaritmy.
možné stavy , desetinné místo = 1 dec možné stavy , desetinná místa = 1 kilodecit . možné stavy , desetinná místa = 1 megadecit . možné stavy , desetinná místa = 1 gigadecit .Jednotka odpovídající číslu 10, decit je rovna log 2 10≈3,322 bitů.
V technice drátové komunikace (telegraf a telefon) a rádiu historicky poprvé jednotka informace získala označení baud .
V celých číslech binárních číslic (bitů) je počet možných stavů roven mocninám dvou.
Čtyři binární číslice (4 bity) mají speciální název - tetrad , půl bajtu , nibble , které obsahují množství informací obsažených v jedné hexadecimální číslici.
Měření v bytech | ||||||||
---|---|---|---|---|---|---|---|---|
GOST 8.417-2002 | předpony SI | IEC prefixy | ||||||
název | Označení | Stupeň | název | Stupeň | název | Označení | Stupeň | |
byte | B | 100 _ | — | 100 _ | byte | B | B | 20 _ |
kilobajt | KB | 10 3 | kilo- | 10 3 | kibibajt | KiB | KiB | 2 10 |
megabajt | MB | 10 6 | mega- | 10 6 | mebibyte | MiB | MiB | 2 20 |
gigabajt | GB | 10 9 | giga- | 10 9 | gibibyte | GiB | GiB | 2 30 |
terabajt | TBC | 10 12 | tera- | 10 12 | tebibyte | TiB | Tib | 2 40 |
petabajt | pb | 10 15 | peta- | 10 15 | pebibyte | PiB | P&B | 2 50 |
exabajt | Ebyte | 10 18 | exa- | 10 18 | exbibyte | EiB | EIB | 2 60 |
zettabyte | Zbyte | 10 21 | zetta- | 10 21 | zebibyte | ZiB | ZiB | 2 70 |
yottabyte | Ibyte | 10 24 | yotta- | 10 24 | yobibyte | YiB | Y&B | 2 80 |
Další oblíbenou jednotkou informace v pořadí je 8 bitů nebo bajtů (terminologické jemnosti jsou popsány níže ). Právě na byte (a ne na bit) jsou všechna velká množství informací vypočítaných ve výpočetní technice přímo uvedena.
Hodnoty jako strojové slovo atd., které tvoří několik bajtů, se téměř nikdy nepoužívají jako jednotky měření .
Pro měření velkých kapacit úložných zařízení a velkého množství informací, které mají velký počet bajtů, se používají jednotky „kilobajt“ = [1000] bajtů a „kbajty“ [3] ( kibibajt , kibibajt) = 1024 bajtů (přibližně záměna desítkových a binárních jednotek a termínů viz níže ). Tento řád je například:
Množství informací získaných čtením "3,5" diskety s vysokou hustotou je 1440 KB (přesně) ; ostatní formáty se počítají také v celých KB.
K měření objemu paměťového média se používají jednotky "megabajt" = 1000 kilobajtů = [1 000 000] bajtů a "mebibajt" [3] (mebibajt) = 1024 kbytes = 1 048 576 bajtů.
Adresový prostor procesoru Intel 8086 byl 1 MB.
Kapacita RAM a CD-ROM se měří v binárních jednotkách (mebibajtech, i když se tak obvykle nenazývají), ale pro kapacitu pevného disku byly oblíbenější desetinné megabajty.
Moderní pevné disky mají objemy vyjádřené v těchto jednotkách minimálně šestimístnými čísly, takže se pro ně používají gigabajty.
Jednotky "gigabajt" = 1000 megabajtů = [1 000 000] kilobajtů = [1 000 000 000] bajtů a "GB" [3] ( gibibajt , gibibajt) = 1024 MB = 230 bajtů měří velikost velkých úložných médií, jako jsou pevné disky . Rozdíl mezi binárními a desítkovými jednotkami je již přes 7 %.
Velikost 32bitového adresního prostoru je 4 GB ≈ 4,295 MB. Stejný řád má velikost DVD-ROM a moderních médií na flash paměti . Velikosti pevných disků již dosahují stovek a tisíců gigabajtů.
Pro výpočet ještě většího množství informací existují jednotky terabajtů a tebibajtů (10 12 a 2 40 bajtů), petabajtů a pebibajtů (10 15 a 2 50 bajtů) atd.
V zásadě je bajt definován pro konkrétní počítač jako minimální krok adresy paměti , který na starších strojích nemusel být nutně rovný 8 bitům (a paměť nemusí být nutně tvořena bity - viz například: ternární počítač ). V moderní tradici je bajt často považován za rovný osmi bitům .
V takových označeních jako byte (ruština) nebo B (anglicky) znamená byte (B) přesně 8 bitů, i když samotný výraz „byte“ není z hlediska teorie zcela správný.
Ve francouzštině se pro zdůraznění toho, že mluvíme o 8 bitech, používají symboly o , Ko , Mo atd. (od slova oktet).
Po dlouhou dobu se rozdíl mezi faktory 1000 a 1024 snažil nepřikládat velký význam. Aby nedošlo k nedorozuměním, rozlišujte mezi:
tyto jednotky jsou podle definice 10 3 , 10 6 , 10 9 bajtů, a tak dále.
IEC navrhuje „kibibyte“, „mebibyte“, „gibibyte“ atd. jako výrazy pro „KB“, „MB“, „GB“ atd., nicméně tyto výrazy jsou kritizovány za to, že jsou nevyslovitelné a nenacházejí se v mluvené řeči. řeč.
V různých oblastech informatiky se také liší preference v používání desítkových a binárních jednotek. Navíc, přestože od standardizace terminologie a označení uplynulo několik let, zdaleka ne všude se snaží objasnit přesný význam použitých jednotek.
V angličtině se pro „kibi“ \u003d 1024 \u003d 2 10 někdy používá velké písmeno K , aby se zdůraznil rozdíl od předpony označené malým písmenem SI kilo . Takové označení však není založeno na směrodatné normě, na rozdíl od ruského GOST ohledně "Kbytes".
Informační jednotky | |
---|---|
Základní jednotky | |
Související jednotky | |
Tradiční bitové jednotky | |
Tradiční byte jednotky | |
Bitové jednotky IEC |
|
IEC byte jednotky |