WikiRank

WikiRank
WikiRank
URL en.wikirank.net
Komerční Ne
jazyky) ruština , angličtina , polština
Autor

Krzysztof Wezel (Węcel Krzysztof) a

Vladimir Levonievsky (Lewoniewski Włodzimierz)
Začátek práce 2015

WikiRank (nebo WikiRank ) je online služba pro automatické relativní hodnocení a porovnávání článků v různých jazykových verzích Wikipedie . Vyvinuto běloruskými a polskými výzkumníky v roce 2015 [1] .

Soubory dat skóre Wikirank jsou k dispozici pro více než 37 milionů článků na Wikipedii [2] .

Historie

Poprvé byl zmíněn ve vědeckém článku v roce 2015 jako alfa verze implementace algoritmu pro hodnocení kvality různých textů [3] . Jedna z vědeckých prací, která popisuje výsledky hodnocení kvality pomocí služby WikiRank, byla v letech 2017-2018 uznána jako jeden z nejvýznamnějších objevů Wikipedie a dalších projektů Wikimedia . [čtyři]

V listopadu 2018 začala služba využívat data z DBpedia a Wikidata k zobrazování informací z různých tematických žebříčků. [5] V květnu 2019 WikiRank poskytla nové metriky (jako je místní a globální popularita) s historickými hodnotami a publikovala veřejné datové sady s metrikami kvality, popularity a zájmu autorů pro více než 39 milionů článků na Wikipedii. [6]

V budoucnu se plánuje začlenění nových parametrů pro hodnocení kvality, včetně sociálních signálů z Facebooku , Twitteru , Redditu , VKontakte , LinkedIn a dalších sociálních portálů [7] , stejně jako kvalitativní analýzy zdrojů pomocí Google , Bing , Yahoo! , Baidu , Yandex a další vyhledávače. [8] [9]

Obsah

Charakteristickým rysem služby je, že umožňuje hodnotit kvalitu a oblíbenost článků Wikipedie na stupnici od 0 do 100 jako výsledek výpočtu syntetického ukazatele ve více než 50 hlavních jazykových sekcích Wikipedie. To zjednodušuje porovnávání jazykových verzí článků, které mohou mít různé stupně kvality a klasifikační standardy [10] . Pro výpočet skóre kvality a popularity používá WikiRank různé důležité normalizované metriky, včetně těch, které se ukázaly jako důležité v dřívějších pracích, jako například:

• délka textu [11] [12]
• počet poznámek [13] [14]
• počet sekcí [15] [16]
• počet snímků [17] [18]
• počet návštěv [19] [20]
• další faktory [21] [22] [23]

WikiRank se také používá pro didaktické účely v různých vysokoškolských institucích (jako je Varšavská univerzita [24] ). Hodnocení poskytované WikiRank se používá ke stanovení kvality karet [25] .

Poznámky

  1. Ilja Paraskevič. Na Wikipedii se Naša Niva a Bělorusko nejčastěji čtou v angličtině, ruštině a němčině . m.nashaniva.by (17.12.2017). Staženo: 28. listopadu 2019.
  2. Skóre kvality článků na Wikipedii (červenec 2018) (2018). doi : 10,6084/m9.figshare.7272713 .
  3. Wecel, Krzysztof; Lewoniewski, Włodzimierz. Modeling the Quality of Attributes in Wikipedia Infoboxes  //  Lecture Notes in Business Information Processing: journal. - 2015. - 2. prosince ( sv. 228 ). - S. 308-320 . - doi : 10.1007/978-3-319-26762-3_27 .
  4. Wikimania 2018 - nejdůležitější nálezy roku Archivováno 22. září 2018 na Wayback Machine  - Ústav informačních systémů
  5. Aktualizace a upgrade z listopadu 2018 – blog WikiRank
  6. WikiRank 05.2019 - kvalita, popularita a AI pro články na Wikipedii (2019). doi : 10,6084/m9.figshare.8231273.v2 .
  7. Lewoniewski, Włodzimierz; Harting, Ralf-Christian; Wecel, Krzysztof; Reichstein, Kryštof; Abramowicz, Witold. Aplikace SEO metrik k určení kvality článků Wikipedie a jejich zdrojů  //  Informační a softwarové technologie. ICIST 2018. Komunikace v počítačové a informační vědě: časopis. - 2018. - 29. srpna ( sv. 920 ). — S. 139——152 . - doi : 10.1007/978-3-319-99972-2_11 .
  8. Judd, T., & Kennedy, G. (2011). Praxe založená na účelnosti? Spolehlivost studentů medicíny na Google a Wikipedii při biomedicínských dotazech . British Journal of Educational Technology, 42(2), 351-360.
  9. Rechenberg, U.; Josten, Christoph H.; Klíma, Štefan. Je možné rozšířit naše odborné znalosti z Wikipedie?  (anglicky)  // Zeitschrift fur Orthopadie und Unfallchirurgie Volume 153, Issue 2, 1 April 2015 : journal. - 2015. - S. 171--176 . — ISSN 18646697 . - doi : 10.1055/s-0034-1396207 .
  10. Lewoniewski, Włodzimierz; Wecel, Krzysztof; Abramowicz, Witold. Hodnocení relativní kvality a popularity vícejazyčných článků Wikipedie  (anglicky)  // Informatika : časopis. - 2017. - 8. prosince ( díl 4 , č. 4 ). - doi : 10.3390/informatika4040043 .
  11. Blumenstock, JE: Size Matters: Word Count as a Measure of Quality na Wikipedii . Na: www. str. 1095-1096 (2008).
  12. Yaari, E., Baruchson-Arbib, S., Bar-Ilan, J.: Information Quality Assessment of Community Generated Content: A User Study of Wikipedia . Journal of Information Science 37(5), 487-498 (2011)
  13. Warncke-Wang, M., Ayukaev, VR, Hecht, B., & Terveen, LG (2015). Úspěch a neúspěch projektů zlepšování kvality v peer produkčních komunitách . In Proceedings of the 18th ACM Conference on Computer Supported Cooperative Work & Social Computing (str. 743-756). ACM.
  14. Soonthornphisaj, N., & Paengporn, P. (2017). Thajský článek na Wikipedii Algoritmus filtrování kvality . In Proceedings of the International MultiConference of Engineers and Computer Scientists (Vol. 1).
  15. Dalip, DH, Gonçalves, MA, Cristo, M., Calado, P.: Automatic Quality Assessment of Content Created Collaboratively by Web Communities: A Case Study of Wikipedia . In: Sborník příspěvků z 9. společné konference ACM/IEEE-CS o digitálních knihovnách. str. 295-304 (2009).
  16. Dang, QV, Ignat, CL: Measuring Quality of Collaboratively Edited Documents: The Case of Wikipedia . In: Collaboration and Internet Computing (CIC), 2016 IEEE 2nd International Conference on. str. 266-275. IEEE (2016)
  17. Wu, K., Zhu, Q., Zhao, Y., Zheng, H.: Mining the Factors Affecting the Quality of Wikipedia Articles . In: Informační věda a manažerské inženýrství (ISME), 2010 Mezinárodní konference o. sv. 1, str. 343-346. IEEE (2010)
  18. Liu, J., Ram, S.: Using Big Data and Network Analysis to Understanding Wikipedia Article Quality . Datové a znalostní inženýrství (2018)
  19. Lewoniewski, Włodzimierz; Wecel, Krzysztof; Abramowicz, Witold. Kvalita a význam článků Wikipedie v různých jazycích  //  Informační a softwarové technologie. ICIST 2016. Komunikace v počítačové a informační vědě: časopis. - 2016. - 22. září ( sv. 639 ). - S. 613-624 . - doi : 10.1007/978-3-319-46254-7_50 .
  20. Lerner, J., Lomi, A.: Kategorizace znalostí ovlivňuje popularitu a kvalitu článků Wikipedie . PloS one 13(1), e0190674 (2018)
  21. Warncke-Wang, Morten, Dan Cosley a John Riedl. Řekni mi víc: Použitelný model kvality pro Wikipedii . Sborník příspěvků z 9. mezinárodního sympozia o otevřené spolupráci. ACM, 2013.
  22. Zhang, S., Hu, Z., Zhang, C., Yu, K.: Hodnocení kvality článků založené na historii na wikipedii . In: Big Data and Smart Computing (BigComp), 2018 IEEE International Conference on. str. 1-8. IEEE (2018)
  23. Shen, A., Qi, J., Baldwin, T.: Hybridní model pro hodnocení kvality článků na wikipedii . In: Proceedings of the Australasian Language Technology Association Workshop 2017. pp. 43–52 (2017)
  24. Wikipedia jako źródło informacji  - USOSweb UW
  25. Infoboxes.net

Odkazy

en.wikirank.net - oficiální stránka WikiRank