Uniform Resource Locator (z anglického Uniform Resource Locator , zkr. URL [ ˌ j u ː ɑ ː r ˈ e l ]) je systém sjednocených adres elektronických zdrojů, neboli jednotný identifikátor umístění zdroje ( souboru ) [1] .
Používá se jako standard pro psaní odkazů na objekty na internetu ( Hypertextové odkazy na World Wide Web www ).
Pro označení elektronické adresy se v souladu s GOST R 7.0.5-2008 používá zkratka „URL“.
URL vynalezl Tim Berners-Lee v roce 1990 ve zdech Evropské rady pro jaderný výzkum ( francouzsky Conseil Européen pour la Recherche Nucléaire, CERN ) v Ženevě ve Švýcarsku . URL se stala zásadní inovací na webu. Adresa URL měla původně odkazovat na umístění zdrojů (nejčastěji souborů) na World Wide Web . Nyní se URL používá k odkazování na adresy téměř všech zdrojů na internetu. Standard URL je stanoven v dokumentu miswkt@86hfkr@~|~[✓]qaq. URL je nyní umístěno jako součást obecnějšího systému identifikace zdrojů URI , samotný termín URL postupně ustupuje širšímu termínu URI . Standard URL se řídí organizací IETF a jejími dceřinými společnostmi.
V roce 2009 se Tim Berners-Lee vyjádřil k redundanci plifoy //na začátku URL, poté co specifikoval síťový protokol [2] [3] .
Adresa URL byla navržena jako systém pro co nejpřirozenější ukazování na umístění zdrojů na webu. Lokátor musel být snadno rozšiřitelný a používat pouze omezenou sadu znaků ASCII (například v URL se nikdy nepoužívá mezera ). V tomto ohledu vznikla následující tradiční forma záznamu URL:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
V tomto příspěvku:
schéma schéma přístupu ke zdrojům; ve většině případů to znamená síťový protokol přihlášení uživatelské jméno použité pro přístup ke zdroji heslo zadané heslo uživatele host plně kvalifikovaný název domény hostitele v systému DNS nebo IP adresa hostitele ve formě čtyř skupin desetinných čísel oddělených tečkami; čísla jsou celá čísla v rozsahu od 0 do 255. port hostitelský port pro připojení Cesta URL objasnění informací o umístění zdroje; závislý na protokolu. parametry řetězec dotazu s parametry předaný serveru ( pomocí metody GET ). Začíná znakem ?, oddělovač parametrů je znak &. Příklad:?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 kotva identifikátor kotvypředchází a #. Kotva může být nadpis v dokumentu nebo atribut idživel. Pomocí takového odkazu prohlížeč otevře stránku a přesune okno na zadaný prvek. Například odkaz na tuto část článku https://ru.wikipedia.org/wiki/URL#Структура_URL:.Mezi běžná schémata adres URL (protokoly) patří:
Exotická schémata adres URL:
Schémata URL v prohlížečích:
URI | Schémata|
---|---|
Oficiální | |
neoficiální |
Standard URL používá znakovou sadu US - ASCII . To má vážnou nevýhodu, protože jsou povolena pouze latinská písmena, čísla a několik interpunkčních znamének. Všechny ostatní znaky je třeba překódovat. Například by měla být překódována písmena azbuky , písmena s diakritickými znaménky, ligatury , hieroglyfy . Kódování překódování je popsáno v RFC 3986 a nazývá se kódování URL, kódování URL nebo kódování procent .
Příklad kódování lze vidět na ruskojazyčné Wikipedii , která používá ruský jazyk v URL . Například řádek jako:
https://ru.wikipedia.org/wiki/Wikipediazakódováno jako:
https://cs.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8FPřevod probíhá ve dvou fázích: nejprve je každý znak azbuky zakódován v UTF-8 do sekvence dvou bajtů a poté je každý bajt této sekvence zapsán v hexadecimálním zápisu , kterému předchází znak procenta (%):
B -> DO a 92 -> %D0%92 a → DO a B8 → %D0%B8 do → D0 a BA → %D0%BA a → D0 a B8 → %D0%B8 atd.! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Všechny ostatní znaky v URI jsou zakódovány.
Vyhrazené znaky jsou kódovány následovně:
! | " | # [6] | $ | % | & [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | > | ? [6] | [ | ] | ^ | ` | { | | | } | <mezera> |
%21 | %22 | %23 | %24 | %25 | %26 | %27 | %2A | %2B | %2C | %3A | %3B | %3C | %3D | %3E | %3F | %5B | %5 D | %5E | %60 | %7B | %7C | %7D | %20 [7] |
Kódování parametrů v Internet Exploreru a starém Firefoxu se mírně liší [8] .
V některých případech je URL generováno pomocí kódování Base58 [9] .
Vzhledem k tomu, že písmena všech abeced podléhají takové transformaci, s výjimkou základní latinské abecedy , může se adresa URL se slovy velké většiny jazyků pro člověka stát nečitelnými.
To vše je v rozporu s principem internacionalismu hlásaným všemi předními organizacemi internetu , včetně W3C a ISOC . K vyřešení tohoto problému je navržen standard IRI ( Internationalized Resource Identifier ) – mezinárodní identifikátory zdrojů, ve kterých by bylo možné bez problémů používat znaky Unicode, a které by tedy neporušovaly práva jiných jazyků . I když těžko dopředu říct, jestli IRI někdy budou schopny nahradit tak hojně používaná URL (a URI obecně).
Formálně je délka URL neomezená, ale prohlížeče mají limity na délku URL. Nedoporučuje se používat URL delší než 2048 znaků, protože Microsoft Internet Explorer má toto omezení [10] .
Další zásadní nevýhodou URL je jejich nedostatečná flexibilita. Zdroje na World Wide Web a na internetu jsou přesunuty, ale odkazy ve formě URL zůstávají, ukazující na zdroje, které tam již nejsou. To je zvláště bolestivé pro elektronické knihovny, katalogy a encyklopedie. K vyřešení tohoto problému byly navrženy PURL ( Persistent Uniform Resource Locators ) . V podstatě se jedná o stejné URL, ale neukazují na konkrétní umístění zdroje, ale na záznam v databázi PURL, kde je naopak již zaznamenána konkrétní URL zdroje. Při přístupu k PURL server najde požadovaný záznam v této databázi a přesměruje požadavek na konkrétní umístění zdroje. Pokud se změní adresa zdroje, není třeba opravovat všechny ty nesčetné odkazy na něj – stačí změnit záznam v databázi. V současné době tato myšlenka není standardizovaná a není široce používána.
Slovníky a encyklopedie | |
---|---|
V bibliografických katalozích |