Programování kopírování a vkládání

Copy-paste programování , C&P programování nebo copy- paste v programování je proces vytváření programového kódu s často opakovanými částmi produkovanými operacemi copy-paste ( anglicky copy-paste ) [1] [2] . Termín se obvykle používá v pejorativním smyslu k označení nedostatečných počítačových programovacích dovedností nebo nedostatku expresivního vývojového prostředí, ve kterém lze typicky používat zásuvné knihovny.

Programování kopírování a vkládání je běžný anti -vzor, jehož výsledkem je duplicitní kód, obvykle velký a těžko čitelný. Opakované úryvky kódu šíří chybu v původním kódu a vícenásobné opakování ztěžuje opravu této chyby v kopiích [1] [3] .

Existují případy , kdy copy-paste v programování může být přijatelné nebo nezbytné: šablony, odvíjení smyčky (když neexistuje automatická podpora ze strany kompilátoru), a také v případě použití některých programovacích paradigmat nebo v případě podpora zdrojového kódu ve formě úryvků ze strany editorů .

Plagiátorství

Copy-paste často používají nezkušení nebo začínající programátoři, pro které je obtížné napsat kód od nuly a raději hledají dříve napsaná řešení nebo dílčí řešení, která mohou sloužit jako základ pro řešení jejich problému [4] .

Programátoři, kteří často kopírují kód někoho jiného, často nerozumí jeho části nebo celému. Problém jako takový vyplývá spíše z jejich nezkušenosti a nedostatku vytrvalosti než ze samotného faktu kopírování. Zkopírovaný kód je často převzat od přátel, kolegů, internetových fór , pedagogů nebo knih o programování . Výsledkem je riziko, že jde o nesouvislou sadu stylů a může obsahovat redundantní kód, který řeší problémy, které již neexistují.

Existuje určitý rozdíl mezi programováním copy-paste a programováním cargo-cult . První typ je spíše chápán jako samotný fakt vícenásobné duplikace částí programového kódu [5] , druhý typ může znamenat jak zkopírování kódu pro vyřešení problému, prováděné z programu nebo externích zdrojů, tak bez pochopení schématu. kódu, a kopírování částí kódu bez nutnosti [5] [ 6] .

Dalším problémem je, že chyby mohou být také zahrnuty do zkopírovaného kódu. Techniky návrhu používané v různých zdrojových kódech nemusí být přijatelné, pokud jsou kombinovány v novém prostředí.

Takový kód se také může nechtěně zamlžovat , protože názvy proměnných, tříd, funkcí atd. po zkopírování obvykle zůstanou nezměněny, i když je jejich účel v novém kontextu zcela odlišný [4] .

Duplikace

Jako forma duplikace kódu má programování C&P určité problémy, které se zhorší, pokud si kód nezachová žádný sémantický vztah mezi originálem a kopií. V tomto případě, pokud jsou nutné změny, je ztracen čas hledáním všech duplicitních částí. Tento proces lze částečně urychlit dobře okomentovaným kódem, ale přesto neodstraňuje nutnost několika úprav. Protože údržba kódu často vynechává aktualizace komentářů [7] , komentáře popisující, kde najít duplicitní části kódu, jsou notoricky zastaralé.

Eric Allen ve své knize Common Design Mistakes používá termín „falešné dlaždice“ k označení chyb způsobených zkopírováním části softwaru. Extrahování opakujícího se fragmentu do metody (hlavní „recept“ na zbavení se takových problémů) může být netriviální úkol [8] .

Používání knihoven

Programování kopírováním a vkládáním také často používají zkušení programátoři, kteří mají knihovny dobře otestovaných a připravených úryvků a obecných algoritmů, které jsou přizpůsobeny konkrétním úkolům [2] .

Namísto vytváření více modifikovaných kopií generického algoritmu, objektově orientovaný přístup navrhuje abstrahovat algoritmus do zapouzdřené třídy, kterou lze znovu použít. Taková třída je vytvořena flexibilním způsobem, s plnou podporou dědičnosti a přetížení , což umožňuje volajícímu kódu interagovat s jedním generickým kódem spíše než s několika nebo mnoha modifikovanými [9] . S rozšiřováním požadované funkčnosti roste i velikost knihovny (při zachování zpětné kompatibility ). Pokud je tedy chyba opravena v původním algoritmu, vyhrává veškerý software, který tento algoritmus a knihovnu používá.

Větvení

Větvení je normální proces při vývoji softwaru ve velkých týmech. Umožňuje paralelní vývoj na větvích a tím zkracuje vývojové cykly. Klasické větvení má následující vlastnosti:

Spravováno systémem správy verzí, který podporuje větvení
Po dokončení vývoje jsou větve znovu sloučeny

Programování kopírováním a vkládáním je méně formální alternativa ke klasickému větvení, která se často používá, když se očekává, že se větve budou v průběhu času rozcházet (rozdíl v kódech ve větvích se bude zvětšovat), jako v případě odštěpení nového softwarového produktu od stávající.

Jako způsob, jak izolovat nový produkt, má copy-paste určité výhody. Protože vývoj nového produktu nemění stávající:

Není potřeba regresní testování existujícího produktu;
Šetří čas spojený se zajišťováním kvality ;
Snížení doby uvedení na trh;
Neexistuje žádné riziko zavádění nových chyb do stávajícího produktu (které by mohly narušit stávající uživatelskou základnu).

nedostatky:

V případě, že se nové a původní produkty nebudou lišit tak, jak se očekávalo, existuje šance, že budete muset udržovat dvě základny zdrojového kódu (zdvojnásobení nákladů), což je ve skutečnosti jeden produkt. To může později vést k nákladnému refaktorování a ručnímu slučování;
Existence dvou kódových bází prodlužuje čas potřebný k provedení změn, které jsou žádoucí pro oba produkty, což zase prodlužuje dobu uvedení na trh. Ve skutečnosti to může zničit jakýkoli dříve vyhraný čas.

Další alternativou k přístupu C&P je modulární přístup :

Zpočátku je kód, který bude společný pro oba produkty, umístěn do knihoven nebo modulů;
Použití vytvořených knihoven je základem pro vývoj nového produktu;
Pokud se předpokládá existence třetí, čtvrté, páté atd. odvozené verze produktu, pak je tento přístup mnohem silnější než copy-paste, protože drasticky zkracuje vývojový cyklus jakéhokoli dalšího produktu po druhém [10] .

Opakující se úkoly nebo varianty úkolů

Jednou z nejškodlivějších forem programování C&P je duplicitní kód , který provádí opakující se úkol nebo obměnu hlavního úkolu v závislosti na nějaké proměnné. Každá kopie kopíruje dříve vytvořenou s malými změnami. Nazývané efekty:

Copy-paste často vede k rozsáhlým metodám ;
Každá instance vytvoří duplicitní kód se všemi dříve popsanými problémy, ale v mnohem větším měřítku. Obvykle existují desítky duplikátů, ale jsou možné stovky. Oprava chyby se stává velmi obtížným a nákladným úkolem [11] ;
V tomto druhu kódu jsou problémy s čitelností . Problémy spojené s obtížným určením rozdílů mezi opakováními mají přímý dopad na rizika a náklady na provádění změn v kódu;
Procedurální programovací model silně odrazuje od používání přístupu kopírování a vkládání pro řešení opakujících se problémů. Upřednostňovaným řešením je vytvoření funkce nebo podprogramu, který umožní projít úlohou. Taková rutina je pak opakovaně volána nadřazeným programem nebo v nějaké formě smyčky. Takový kód se nazývá „dobře rozložený “ a doporučuje se jako snadno čitelný a rozšiřitelnější [12] ;
Hlavní empirický vzorec pro takový případ: " neopakujte se ." David Parnas to vyjádřil takto: „Kopírování a vkládání kódu je chyba návrhu“ [13] .

Záměrná volba přístupu

Copy-paste v programování je někdy přijímáno jako normální programovací technika. Obvykle to můžete vidět ve vzorech, jako je deklarace třídy, včetně standardních knihoven, nebo použití existující šablony kódu (s prázdným obsahem nebo funkcemi stub ) jako základ pro výplň.

Použití programovacích idiomů a návrhových vzorů je podobné přístupu kopírování a vkládání v tom, že také používají standardní kód. V některých případech to může být vyjádřeno jako fragment , který je vložen do kódu na požádání, i když často je jednoduše „vyvolán“ z mysli programátora. V ostatních případech nelze použití idiomů omezit na standardní kód. Ve většině případů však, i když lze idiom zredukovat na kód, bude buď příliš dlouhý (což bude extrahováno do funkce), nebo příliš krátký (takže jej lze zadat přímo).

Příklad

Jednoduchým příkladem platné aplikace tohoto přístupu by byla smyčka for, která by mohla vypadat jako . Příklad kódu používajícího takovou smyčku by byl: for (int i=0; i!=n; ++i) {}

void foo ( int n ) { for ( int i = 0 ; i != n ; ++ i ) { } }

Kód pro smyčku lze vygenerovat následujícím fragmentem (definujícím typy a názvy proměnných):

for ( $type $loop_var = 0 ; $loop_var != $stop ; ++ $loop_var ) { }

Mnoho programátorů tento přístup často používá, protože nechtějí přepisovat řádek, který se od předchozího liší jen o pár znaků (například volání stejné funkce pro dva objekty stejného typu, jejichž názvy se mírně liší). Duplikovat předchozí řádek (také pomocí klávesových zkratek) je rychlejší než jej znovu přepisovat. Ale pravděpodobnost, že uděláte chybu, neklesá [14] , zvláště u posledního řádku [15] .

Pokud potřebujete provést více než jednu úpravu duplicitního řádku, chyby se vyskytují častěji. Jak můžete vidět z příkladu, po duplikaci autor opravil přiřazenou hodnotu, ale neopravil index pole na levé straně:

mArray [ 12 ] = "a" ; mArray [ 13 ] = "b" ; mArray [ 14 ] = "c" ; mArray [ 14 ] = "d" ;

Existuje studie [16] zaměřená na "dekriminalizaci" programování copy-paste - Subtext programming language . Je třeba poznamenat, že v tomto modelu je kopírování a vkládání hlavním modelem interakce, a proto se nepovažuje za anti-vzor.

Viz také

Poznámky

Literatura

Miryung Kim; Lawrence Bergman, Tessa Lau, David Notkin. Etnografické studium postupů kopírování a vkládání programů v OOPL (anglicky) (PDF) (2004). doi : 10.1109/ISESE.2004.1334896 . Staženo: 3. listopadu 2013.
Patricia Jablonski Daqing Hou. CReN: Nástroj pro sledování klonů zkopírovaných a vložit kód a konzistentní přejmenování identifikátorů v IDE ( PDF). New York, USA: ACM New York (2005). doi : 10.1145/1328279.1328283 . Staženo: 3. listopadu 2013.
Chanchal Kumar Roy, James R. Cordy. Průzkum o výzkumu detekce softwarových klonů . Ontario, Kanada: Queen's University, Kingston (26. září 2007). Staženo: 3. listopadu 2013.
Gavriel Yarmish. Danny Kopec. Revisiting Novice Programmers Errors (anglicky) (PDF). New York, USA: ACM New York (2007). doi : 10.1145/1272848.1272896 . Staženo 4. listopadu 2013.
Jason Rogers, Chuck Phatt. Integrace antipatternů do učebních osnov informatiky . Journal of Computing Sciences in Colleges s. 187. USA: Consortium for Computing Sciences in Colleges (květen 2009). Staženo 4. listopadu 2013.
Gordon Fletcher. Cargo Cults in Java (anglicky) s. 3. UK: University of Salford (2004). Staženo: 4. listopadu 2011.
Robert Pittenger. Dynamické vytváření webových stránek ASP.NET v pozadí . codeproject.com (6. května 2008). Staženo 4. listopadu 2013.
Raymond Wallen. 4 hlavní principy objektově orientovaného programování (anglicky) (odkaz není k dispozici) . codebetter.com (19. července 2005). Získáno 4. listopadu 2013. Archivováno z originálu 12. prosince 2013.
Lisa Wold Eriksenová. Opětovné použití kódu v objektově orientovaném vývoji softwaru . Norská univerzita vědy a technologie, Katedra počítačů a informačních věd (2004). Staženo: 4. listopadu 2011. (nepřístupný odkaz)
Výhody kódovacích standardů, Richard Sharpe. Výhody kódovacích standardů . časopis JAX. Získáno 6. ledna 2017. Archivováno z originálu 6. října 2008.
Stanfordská univerzita, CS 106X („Programování abstrakce“) Rozpis kurzu: „Dekompozice“ . Stanford University (18. ledna 2008). Datum přístupu: 6. ledna 2017. Archivováno z originálu 16. května 2008. (neurčitý)
Andrej Karpov. Důsledky používání technologie Copy-Paste v programování C++ a jak se s tím vypořádat . PVS-Studio, analyzátor statického kódu pro C/C++/C++11 (24. ledna 2011). Staženo: 3. listopadu 2013. (neurčitý)
Andrej Karpov. Efekt posledního řádku . PVS-Studio, analyzátor statického kódu pro C/C++/C++11 (31. května 2014). Staženo: 13. září 2014. (neurčitý)
Jonathan Edwards. Podtext: Odhalování jednoduchosti programování (anglicky) (PDF). MIT CSAIL (2005). Staženo: 3. listopadu 2013.
McConnell S. Kapitola 24. Refaktoring // Perfect Code. Master Class = Code Complete / Ed. V. G. Vshivceva. - 2. vyd. - Petrohrad. : ruské vydání, Peter , 2005. - S. 553. - 896 s. — ISBN 5-7502-0064-7 . Archivováno15. prosince 2013 naWayback Machine
Allen E. Kapitola 7. Falešné dlaždice // Typické chyby návrhu. Programátorská knihovna = Bug Patterns in Java. - 1. vyd. - Petrohrad. : Peter , 2003. - S. 73-82. — 224 s. — ISBN 5-88782-304-6 . Archivováno12. prosince 2013 naWayback Machine