Kombinovaný symbol

V digitální typografii jsou kombinovatelné znaky  znaky určené k úpravě jiných znaků. Nejběžnější kombinovatelné znaky v latině jsou kombinovatelné znaky s diakritikou (včetně kombinovatelných akcentů ).

Unicode také obsahuje mnoho předem složených znaků, takže v mnoha případech lze použít jak kombinovatelnou diakritiku, tak předem složené znaky dle výběru uživatele nebo aplikace. To vede k požadavku provést normalizaci Unicode před porovnáním dvou řetězců Unicode a pečlivě navrhnout převodníky kódování, aby správně namapovaly všechny platné reprezentace znaků Unicode na starší kódování, aby se zabránilo ztrátě dat.

V Unicode je hlavním blokem pro kombinovatelnou diakritiku evropských jazyků a mezinárodní fonetické abecedy U+0300…U+036F . Kombinování diakritiky se také objevuje v mnoha dalších blocích Unicode. V Unicode je diakritika vždy umístěna za základním znakem (na rozdíl od některých starších kombinovatelných znakových sad, jako je ANSEL ), což umožňuje přidat více diakritiky k jednomu znaku, ačkoli od roku 2010 jen málo aplikací podporuje správné zobrazení takových kombinací.

Zalgo text

Kombinované znaky se také používají k vytvoření toho, co je známé jako "text Zalgo"  - text, který se jeví jako zkomolený kvůli nadměrnému používání diakritiky. To způsobí, že se text vertikálně roztáhne a překryje jiný text [1] .

Příklad

p̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈ÿ͌͌͗̏̔̓̓̐y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿y̎͒̌̓̎̊͋͛ẙ̅̃y͛̄̽̒̋̋y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈̾̈̀͛̈y̓̽̃͒̀̆̀ R

Rozsahy v Unicode

Unicode obsahuje následující bloky speciálně pro kombinovatelnou diakritiku:

Třída kanonické kombinovatelnosti

Jednou z charakteristik znaku v Unicode je kanonická třída kombinovatelnosti, která přijímá pouze číselné hodnoty [2] .

Význam Celý anglický název Ruský překlad Popis
0 Not_Reordered Neurčeno Nekombinovatelné a rámové značky; také mnoho znaků pro samohlásky a souhlásky, i když jsou kombinovatelné
jeden překrytí překryvný znak Znaky superponované na základní písmeno nebo symbol
7 Nukta Nuqta Nukta – znakové písmo odvozené z Brahmi
osm Kana_Voicing Vyjádřené znaky kana Vyjádřené znaky v kana - dakuten a handakuten
9 virama virama Virama je znakový systém písma odvozený z Brahmi
10-199 Ccc10 – Ccc199 Třídy kanonické kombinovatelnosti 10-199 Třídy s pevnou pozicí
200 Attached_Below_Left Kontaktní značka vlevo dole
202 Připojeno_níže Kontaktní značka níže
204
208
210
212
214 Attached_Ahore Kontaktní znamení shora
216 Attached_Ahove_Right Kontaktní značka vpravo nahoře
218 Dole_vlevo Podepsat vlevo dole
220 Níže podepsat zespodu
222 Vpravo dole Znak vpravo dole
224 Vlevo, odjet Znak vlevo
226 Že jo Pravé znamení
228 Nad_vlevo Znak vlevo nahoře
230 Výše znamení shora
232 Nad_vpravo Znak vpravo nahoře
233 Double_Below dvojitý znak níže
234 Double_Ahore dvojitý znak nahoře
240 Iota_Subscript Interlineární jota Pouze řecké dolní index iota

Viz také

Poznámky

  1. Jak funguje text Zalgo? . přetečení zásobníku . Staženo 11. dubna 2019. Archivováno z originálu 27. května 2019.
  2. Standardní příloha Unicode #44 – Kanonické kombinování hodnot tříd . Staženo 6. června 2019. Archivováno z originálu 8. června 2019.

Odkazy