Wikipedia:BATUTA 2011/Statystyki

W związku z akcją BATUTA (Bezwzględna Akcja Troskliwego Uźródławiania Tysięcy Artykułów) tworzone są statystyki dotyczące poziomu uźródłowienia haseł na polskiej Wikipedii. Poniższe zestawienie jest jednym z takich. Autor jest świadomy niedoskonałości swojej metody badawczej, ale konsekwentnie będzie z niej korzystał dla zapewnienia jednorodności wyników i możliwości ich porównywania pomiędzy kolejnymi edycjami akcji.


Wyniki analizy

W tabelach podane są liczby haseł zawierających i niezawierających: sekcję źródła, literatura, bibliografia lub też tagi cytowania, z podziałem na kolejne dni przeprowadzania testu.

W stosunku do poprzedniego roku przybyło w ciągu roku 86625 haseł ze źródłami i 12022 haseł bez źródeł netto (to tylko 13,9%!). Po tegorocznej może to być jeszcze lepszy wynik. O prawie 8 pkt. proc. zwiększyła się liczba uźródłowionych. Za 8 lat powinniśmy uźródłowić wszystkie :)

Źródła?Stan na 30.01.2010Stan na 27.01.2011
tak178 005 (26,41%)264 630 (34,25%)
nie495 935 (73,59%)507 957 (65,75%)
Σ673 940 (100,00%)772 587 (100,00%)
Źródła?Stan na 30.01.2010Stan na 14.02.2010Stan na 23.02.2010Stan na 02.03.2010
tak178 005 (26,41%)181 863 (26,85%)184 327 (27,11%)186 103 (27,28%)
nie495 935 (73,59%)495 462 (73,15%)495 552 (72,89%)496 129 (72,72%)
Σ673 940 (100,00%)677 325 (100,00%)679 879 (100,00%)682 232 (100,00%)

Kontakt

Kwestie techniczne

  • Do wykonania testu wykorzystywane są zrzuty bazy danych polskiej Wikipedii dostępne tutaj
  • Parametr testu: (\=.*((ź|ż)ródł(o|a)|(bibliografia|literatura))((|\:).*)\=.*\n(\*|[1-9]|\[|[A-z]|\n(\*|[1-9]|\[|[A-z]))|((\<ref\>.*\<\/ref\>|\<ref .*\/\>)))
  • Zestawienie uwzględnia wszystkie strony haseł w przestrzeni głównej oprócz stron przekierowujących

Inne skany bazy danych

Źródła?Stan na 03.09.2011Stan na 20.11.2011Stan na 09.12.2011Stan na 27.12.2011Stan na 14.01.2012
tak312 487 (37,67%)326 316 (38,50%) 330 329 (38,76%) 335 412 (39,11%) 339 045 (38,82%)
nie516 984 (62,33%)521 340 (61,50%) 521 927 (61,24%) 522 303 (60,89%) 534 406 (61,18%)
Σ829 471 (100,00%)847 656 (100,00%)852 256 (100,00%)857 715 (100,00%)873 451 (100,00%)

Kolorowe strzałki oznaczają wzrost lub spadek procentowego udziału danej grupy haseł w porównaniu do wcześniejszego wyniku.