Codice Sconto: E463456

This WebPage/Resource is provided by https://www.classicistranieri.com

Wikipedia:Wikipedistik/Wachstumsprognose – Wikipedia

Wikipedia:Wikipedistik/Wachstumsprognose

aus Wikipedia, der freien Enzyklopädie

Heute ist der 29.06.2008 und in der deutschsprachigen Wikipedia gibt es 768.379 Artikel.


Inhaltsverzeichnis

[Bearbeiten] Bisherige Entwicklung der Artikelzahl seit 2004

Seit etwa März 2004 wächst die deutschsprachige Wikipedia linear mit durchschnittlich 400 neuen Artikeln pro Tag (Quelle: Daten aus Erik Zachtes Wikistat (bis April 2004) sowie Wikipedia:Meilensteine). Der Korrelationskoeffizent R2 liegt über 0,99. Betrachtet man die Zeit von April bis Oktober 2005, so ist das Wachstum mit etwa 457 neuen Artikeln pro Tag wieder etwas stärker, allerdings ist das Wachstum geringfügigen Schwankungen unterworfen. Ob die deutschsprachige Wikipedia vollständig in eine Phase linearen Wachstums übergegangen ist oder der eher lineare Verlauf Teil eines Übergangs in ein anderes Wachstumsverhalten ist, kann nur vermutet werden. Im ersten Quartal 2006 ist jedenfalls ein Anstieg des täglichen Artikelzuwachses auf knapp 500 auszumachen, betrachtet man nur die letzten Februarwochen/Anfang März, ergibt sich sogar ein Tagesschnitt von 520 für diese 30 Tage.

[Bearbeiten] Entwicklung 2006

Wachstumskurve der deutschsprachigen Wikipedia Wachstumskurven aller Sprachen im Vergleich
Wachstumskurve der deutschsprachigen Wikipedia Wachstumskurven aller Sprachen im Vergleich
Neue Artikel in der Wikipedia; Zahlen erfasst am Vormittag des jeweiligen Folgetages
Neue Artikel in der Wikipedia; Zahlen erfasst am Vormittag des jeweiligen Folgetages
  • In den ersten zwölf Junitagen wuchs die deutschsprachige Wikipedia täglich um durchschnittlich 553,84 Artikel (*
  • In den letzten 30 Tagen (Stand: 28. Juni, 14:12 Uhr) wuchs die dtspr. Wikipedia um täglich durchschnittlich 539,50 Artikel(**
  • Mit Stand vom 4. Juni 2006 wuchs die deutschsprachige Wikipedia im Jahr 2006 täglich um durchschnittlich 488,84 Artikel (***

Diese Zahlen lassen ein deutliches Ansteigen des täglichen Artikelzuwachses erkennen. Es kann jedoch nicht ausgeschlossen werden, dass es sich bei den stark erhöhten Zuwächsen der letzten Wochen nur um vorübergehende Ausreißer handelt, wie es sie immer wieder gibt. So war zwischen Mitte November und Ende Dezember 2005 eine deutliche Delle nach unten in der dt. WP-Wachstumskurve auszumachen, was den "15.000-Artikel-erreich-Dauer-Durchschnitt" (laut Meilensteine) um über 100 Artikel täglich sinken ließ. Seither setzt sich das Wachstum in dem Maße fort, wie es bereits auch in den Monaten vor November 2005 stattgefunden hat, nämlich 10 bis 11 Tage für 5000 Artikel. Geht man von einem leichten Wachstum aus, was anhand der aktuellen März-Zahlen sicher nicht fehl am Platz ist, kann man behaupten, dass für das restliche Jahr durchschnittlich 10 Tage für 5000 Artikel benötigt werden, da gegen Jahresende die Dauer laut aktuellen Zahlen vermutlich zwischen 9 und 10 Tagen betragen wird, was die derzeitige Spanne von 10 bis 11 Tagen ausgleichen dürfte. Das sind natürlich nur Spekulationen, die jedoch nicht allzu weit von der Realität abschweifen können, sofern keine außerordentlichen Ereignisse statt finden, was den täglichen Artikelzuwachs betrifft.

Am 31. Dezember 2006 23:59:59 (MEZ) waren in der deutschsprachigen Wikipedia 520.181 Artikel registriert. (Siehe auch: Wikipedia:Wette für 2006)

(* laut Spezial:Newpages 1.6. 0 h bis 12.6. 24 h; minutiös genaue Abgrenzung; nachträgliche Löschungen (nach 13.6., 11:35 Uhr) nicht berücksichtigt;
(** Laut Spezial:Newpages 16.185 neue Artikel zwischen 29.5., 14:12 h und 28.6., 14:12 h, divid. durch 30 Tage
(*** Berechnung aus Wikipedia:Meilensteine

[Bearbeiten] Berechnungen auf Grundlage der Wikipedia:Meilensteine

Da die Wikipedia:Statistik derzeit noch auf dem Stand von November 2005 fest sitzt, hier eine Ableitung zur aktuellen Artikelzuwachsentwicklung aus den Wikipedia:Meilensteinen.

Die Liste gibt die Anzahl der Tage wieder, die für 5.000 neue Artikel benötigt werden. Die Liste beginnt bei 300.000. Der Tagesdurchschnitt des Artikelzuwachses wird anhand der Zeitspanne berechnet, die für den Zuwachs der jeweils letzten 15.000 Artikel benötigt wurden. Diese, 3 Meilensteine übergreifende Zeitspanne, soll eine glaubwürdigere Vergleichbarkeit der Werte ermöglichen, womit Tendenzen besser erkannt werden können. Die Angaben erfolgen in Tausend:

300 auf 305: 10 Tage (Erreichung von 305.000 am 17.10.2005)
305 auf 310: 10 (27.10.2005)
310 auf 315: 11 (7.11.2005) Ø tgl. Zuwachs der letzten 3 Meilensteine (gleitender Durchschnitt): 484
315 auf 320: 13 (20.11.2005)Ø 441
320 auf 325: 18 (8.12.2005) Ø 357
325 auf 330: 12 (20.12.2005)Ø 349
330 auf 335: 13 (2.1.2006)  Ø 349
335 auf 340: 10 (12.1.2006) Ø 429
340 auf 345: 11 (23.1.2006) Ø 441
345 auf 350: 10 (2.2.2006)  Ø 484
350 auf 355: 10 (12.2.2006) Ø 484
355 auf 360: 11 (23.2.2006) Ø 484
360 auf 365: 10 (5.3.2006)  Ø 484
365 auf 370: 09 (14.3.2006) Ø 500
370 auf 375: 11 (25.3.2006) Ø 500
375 auf 380: 10 (4.4.2006)  Ø 500
380 auf 385: 11 (15.4.2006) Ø 469
385 auf 390: 11 (26.4.2006) Ø 469
390 auf 395: 11 (7.5.2006)  Ø 455
395 auf 400: 11 (18.5.2006) Ø 455
400 auf 405: 09 (27.5.2006) Ø 484
405 auf 410: 08 (4.6.2006)  Ø 536
410 auf 415: 09 (13.6.2006) Ø 577
415 auf 420: 10 (23.6.2006) Ø 555
420 auf 425: 12 (5.7.2006)  Ø 484
425 auf 430: 09 (14.7.2006) Ø 484
430 auf 435: 10 (24.7.2006) Ø 484
435 auf 440: 09 (2.8.2006)  Ø 536
440 auf 445: 09 (11.8.2006) Ø 536
445 auf 450: 07 (18.8.2006) Ø 600
450 auf 455: 09 (27.8.2006) Ø 600
455 auf 460: 08 (4.9.2006)  Ø 625
460 auf 465: 09 (13.9.2006) Ø 576
465 auf 470: 10 (23.9.2006) Ø 555
470 auf 475: 11 (4.10.2006) Ø 500
475 auf 480: 10 (14.10.2006)Ø 484
480 auf 485: 10 (24.10.2006)Ø 484
485 auf 490: 10 (3.11.2006) Ø 500
490 auf 495: 09 (12.11.2006)Ø 517
495 auf 500: 11 (23.11.2006)Ø 500
500 auf 505: 10 (3.12.2006) Ø 500
505 auf 510: 08 (11.12.2006)Ø 517
510 auf 515: 10 (21.12.2006)Ø 536
515 auf 520: 10 (31.12.2006)Ø 536
520 auf 525: 09 (9.1.2007)  Ø 517
525 auf 530: 10 (19.1.2007) Ø 517
530 auf 535: 10 (29.1.2007) Ø 517
535 auf 540: 11 (9.2.2007)  Ø 484
540 auf 545: 10 (19.2.2007) Ø 484
545 auf 550: 10 (1.3.2007)  Ø 484
550 auf 555: 10 (11.3.2007) Ø 500
555 auf 560: 10 (21.3.2007) Ø 500
560 auf 565: 11 (1.4.2007)  Ø 484
565 auf 570: 11 (12.4.2007) Ø 469
570 auf 575: 12 (24.4.2007) Ø 441
575 auf 580: 11 (5.5.2007)  Ø 441
580 auf 585: 11 (16.5.2007) Ø 441
585 auf 590: 11 (27.5.2007) Ø 455
590 auf 595: 11 (7.6.2007)  Ø 455
595 auf 600: 11 (18.6.2007) Ø 455
600 auf 605: 13 (1.7.2007)  Ø 429
605 auf 610: 12 (13.7.2007) Ø 417
610 auf 615: 12 (25.7.2007) Ø 405
615 auf 620: 12 (6.8.2007)  Ø 417
620 auf 625: 11 (17.8.2007) Ø 429
625 auf 630: 11 (28.8.2007) Ø 441
630 auf 635: 11 (8.9.2007)  Ø 455
635 auf 640: 08 (16.9.2007) Ø 500
640 auf 645: 12 (28.9.2007) Ø 484
645 auf 650: 11 (9.10.2007) Ø 484
650 auf 655: 12 (21.10.2007)Ø 429
655 auf 660: 11 (2.11.2007) Ø 484
660 auf 665: 12 (14.11.2007)Ø 429
665 auf 670: 12 (26.11.2007)Ø 429
670 auf 675: 12 (8.12.2007) Ø 417
675 auf 680: 12 (20.12.2007)Ø 417
680 auf 685: 10 (30.12.2007)Ø 441
685 auf 690: 10 (9.1.2008)  Ø 469
690 auf 695: 11 (20.1.2008) Ø 484
695 auf 700: 10 (30.1.2008) Ø 484
700 auf 705: 10 (9.2.2008)  Ø 484
705 auf 710: 09 (18.2.2008) Ø 517
710 auf 715: 10 (28.2.2008) Ø 517
715 auf 720: 10 (9.3.2008)  Ø 517
720 auf 725: 10 (19.3.2008) Ø 500
725 auf 730: 10 (29.3.2008) Ø 500
730 auf 735: 13 (11.4.2008) Ø 455
735 auf 740: 12 (23.4.2008) Ø 429
740 auf 745: 11 (4.5.2008)  Ø 417
745 auf 750: 13 (17.5.2008) Ø 417
750 auf 755: 11 (28.5.2008) Ø 429
755 auf 760: 13 (10.6.2008) Ø 405
760 auf 765: 12 (22.6.2008) Ø 417
765 auf 770:
770 auf 775:
775 auf 780:
780 auf 785:
785 auf 790:
790 auf 795:
795 auf 800:

[Bearbeiten] durchschnittliche Tageszuwächse je Monat

2006:

  • der durchschnittliche, tägliche Artikelzuwachs im Januar: 501,24
  • der durchschnittliche, tägliche Artikelzuwachs im Februar: 482,14
  • der durchschnittliche, tägliche Artikelzuwachs im März (hier: exakte Berechnung*): 597,67
  • der durchschnittliche, tägliche Artikelzuwachs im April: 454,67
  • der durchschnittliche, tägliche Artikelzuwachs im Mai: 505,97
  • der durchschnittliche, tägliche Artikelzuwachs im Juni: 597,24
  • der durchschnittliche, tägliche Artikelzuwachs im Juli: 521,68
  • der durchschnittliche, tägliche Artikelzuwachs im August: 600,35
  • der durchschnittliche, tägliche Artikelzuwachs im September: 522,73
  • der durchschnittliche, tägliche Artikelzuwachs im Oktober: 497,94
  • der durchschnittliche, tägliche Artikelzuwachs im November: 500
  • der durchschnittliche, tägliche Artikelzuwachs im Dezember: 532,26

Der durchschnittliche, tägliche Artikelzuwachs im Jahr 2006 lag bei 507,805.

2007:

  • der durchschnittliche, tägliche Artikelzuwachs im Januar: 513,19
  • der durchschnittliche, tägliche Artikelzuwachs im Februar: 485,39


Erläuterungen zur Berechnung und Genauigkeit der Zahlen: Aus den Zeitspannen, die für je 5000 Artikel benötigt werden, lässt sich durch Abgrenzung (5000 Artikel, die in einer Zeitspanne, die 2 Monate übergreift, der Wikipedia zuwachsen, werden rechnerisch auf den jeweiligen Monat umgerechnet. Am Beispiel 23.2.2006 bis 5.3.2006 bedeutet das, dass die 5000 Artikel durch die 10 Tage dividiert werden, und dann auf die beiden Monate je nach Anzahl der Tage, umgerechnet werden. Das sind in diesem Beispiel jeweils 5 Tage - bedeutet also 2500 Artikel entfallen auf jeden der beiden Monate, was diese Zeitspanne betrifft. Zu diesen abgegrenzten Zahlen werden dann noch die "eindeutigen" Zahlen (Zahlen, die nicht auf 2 Monate aufgeteilt werden müssen) hinzugezählt. In unserem Beispielmonat Februar ergibt dies 1000 (rechnerisch abgegrenzte) Artikel aus der Zeitspanne 23.1.2006 bis 2.2.2006 + 10.000 Artikel aus der Zeitspanne 2.2. bis 23.2. + 2500 (rechnerisch abgegrenzte) Artikel aus der Zeitspanne 23.2. bis 5.3. = 13.500 Artikel im Februar. Diese Zahl wird dann durch die Anzahl der Tage des Monats dividiert. In diesem Beispiel 28. Ergibt 482,14

Dass diese Zahl natürlich in einem gewissen, geringen Ausmaß von der tatsächlichen Zahl abweicht, die man erlangen würde, hätte man exakte Zahlen zu jedem einzigen Tag, ist natürlich klar. Schon wesentlich exakter wären die Ergebnisse, würde man nicht nach Monaten, sondern nach Meilenstein-Zeitspannen umrechnen. Hier wäre dann die einzige Ungenauigkeitsquelle diese, dass die Tageszeit, zu der der jeweilige Meilenstein erreicht wurde, nicht bekannt ist, und in Extremfällen die Summe um mehrere Hundert Artikel pro Monat vom errechneten Wert abweichen kann, was sich auf den Tagesdurschnitt durchaus mit bis zu 20 Artikeln auswirkt. Diese "Tageszeit-Ungenauigkeit" trifft natürlich auch auf die Monatsabgrenzungen zu, wobei hier noch die "Tages-Ungenauigkeit" hinzukommt, da die täglichen Zuwachszahlen auch einer gewissen Schwankung unterliegen, diese jedoch bei der "Monatszuwachsberechnung laut Meilensteinen" auf die gesamte Zeitspanne verteilt werden, was das Ergebnis wiederum merkbar verfälschen kann.

Überdies gibt es seit Einführung der Sommerzeit zwei Monate als Ausreißer mit je einem Tag mit 23 (März) bzw. einen mit 25 Stunden (früher September, nun Oktober), was die Statistik weiter verfälscht (will man nicht gleich in UTC umrechnen).

Daraus lernen wir: die folgenden Zahlen sind (leider nur) mit äußerster Vorsicht zu genießen, da theoretisch Abweichungen im mittleren, zweistelligen Bereich möglich wären. Das Ganze wird natürlich dadurch etwas relativiert, da diese Ungenauigkeit auf jeden Monat in gleichem Maße zutrifft und vor allem, da die tatsächlichen täglichen Schwankungen in Wahrheit vergleichsweise äußerst gering sind, meist zwischen 10 und 30%, wodurch sich die Zahlen der "5000er-Zeitspannen", die ja meist um die 10 Tage betragen, in der Regel nur noch kaum unterscheiden (können). Sprich: Ist eine Tendenz erkennbar, so stimmt diese auch tatsächlich, da die rechnerische Abgrenzung auf zwei Monate in einem Vergleichszeitraum von mehreren Monaten relativiert wird. Lediglich die exakten Zahlen sind nur als Richtwerte anzusehen. Denn logischerweise werden die Zahlen immer genauer, je länger der Rechenzeitraum ist. Also wäre für das ganze Jahr 2006 die Abweichung vom tatsächlichen Wert verschwindend gering. Ich würde behaupten ein paar 100 (da Ungenauigkeiten lediglich bei den abgegrenzten Zahlen aus den Zeitspannen, die die Jahreswechsel übergreifen, auftreten können und aufgrund der relativ gleichmäßigen Artikelzuwachsrate nicht höher als ein paar 100 sein können) dividiert durch den Artikelzuwachs in 365 Tagen, der locker über 100.000 sein wird, gehen wir mal von 120.000 aus, was sich dann auf den Tagesdurchschnitt nicht mal im Ausmaß von 0,01 (nämlich 0,004 laut diesem Beispiel) auswirken würde.

Diese Zahlen sind daher lediglich als Orientierungshilfe anzusehen, werden aber umso genauer, je länger die Berechnungszeiträume sind. Die monatlichen Abweichungen vom tatsächlichen Tagesdurchschnittzuwachs dürften in einer Abweichungsspanne von 3 bis 7 Artikeln/Tag liegen (wenn man von den üblichen täglichen Artikelzuwachsschwankungen ausgeht).

* Berechnung laut Angabe in Spezial:Newpages mit exaktem Berechnungszeitraum 1. März, 0 Uhr bis 6. März, 23:59 Uhr = 3.586 neue Artikel (Löschungen nach 6. März, 23:59 Uhr, nicht berücksichtigt)

[Bearbeiten] Lineares Wachstum

Zwischen April 2004 und der Wikipedia-Konferenz hatten wir ein relativ konstantes lineares Wachstum von durchschnittlich 350 bis 400 neuen Artikeln pro Tag. Seither sind es rund 500 täglich. In den Monaten Februar bis April 2004 wuchs die deutschsprachige Wikipedia kurzzeitig exponentiell mit einer durchschnittlichen Wachstumsrate von bis zu 1 %, die von da an wieder abnahm.

Zwischen Mitte Mai und Mitte September 2006 erlebte die deutschsprachige Wikipedia ein besonders starkes Wachstum - mit Ausnahme der letzten Juni- und der ersten Juliwoche. Im eingangs erwähnten Zeitrahmen mit etwas über 550 neuen Artikeln täglich. Abgesehen von diesem Ausreißer nach oben, an manchen Tagen wurden über 600 Artikel eingestellt, pendelt die Zuwachsrate seit Januar 2006 zwischen 417 und 517 Artikeln täglich - zuletzt (seit April 2008) meist weniger als 455 Artikel täglich.

Mit zunehmender Größe der Wikipedia ist zu erwarten, dass das relative Wachstum weiter abnimmt, selbst bei leichten Anstiegen der absoluten Anzahl täglich neuer Artikel.

Mit den folgenden PHP-Formeln können die prognostizierten Termine für das Erreichen bestimmter Artikelanzahlen bei linearem und exponentiellem Wachstum ermittelt werden:

  • date('d.m.Y', strtotime(date('Y-m-d', time()).' + '.floor(($milestone-$articles_now)/$abs_increase).' days'));
  • date('d.m.Y', strtotime(date('Y-m-d', time()).' + '.floor(log($milestone/$articles_now)/log($rel_increase)).' days'));

wobei die Variablen folgende Bedeutung haben:

  • $articles_now: aktuelle Artikelanzahl (in der Tabelle: 312805)
  • $abs_increase: absoluter Zuwachs pro Tag (in der Tabelle: 400)
  • $rel_increase: relativer Zuwachs pro Tag (in der Tabelle: 1.0014)
  • $milestone: zu erreichende Artikelanzahl
Anzahl Prognose bei 400 täglich Prognose bei 500 täglich Prognose bei 515 täglich Prognose bei 0,13 % täglich Prognose bei 0,14 % täglich erreicht am
750.000 17.05.2008 18.05.2008 17.05.2008 20.10.2007 2.10.2007 17.05.2008
800.000 17.09.2008 28.08.2008 25.08.2008
900.000 26.05.2009 16.03.2009 9.03.2009
1.000.000 01.02.2010 2.10.2009 18.09.2009 29.05.2008 25.04.2008

Stand der Aktualisierung der Tabelle: 30.Mai 2008, 755.665. Artikel(absolut),8. Februar 2007, 539.300 Artikel(relativ)

Siehe auch: Prognose zum 1.000.000 Artikel anhand der aktuellen Zahlen auf dem Toolserver

Die meisten Wachstumskurven haben einen s-förmigen Verlauf. Sollte dies auch auf die Wikipedia zutreffen, so befinden wir uns zur Zeit in der Wachstumsphase und in diesem Bereich eines Wachstumprozesses ist der Kurvenverlauf fast linear. Doch auch bei Wikipedia wird eine Sättigung eintreten und der Kurvenverlauf sich abflachen. Der Volksmund sagt: "Die Bäume wachsen nicht in den Himmel!"

Es ist jedoch weniger damit zu rechnen, dass es mit der Wikipedia "bergab" geht. Höchstens das Wachstum wird prozentual oder vielleicht auch mal absolut schwächer werden: es geht dann höchstens nicht mehr ganz so steil bergan und wegen der Menge irgendwann nur noch unmerklich.

Wenn wirklich Artikel absolut gesehen weniger werden sollten, dann trifft das wohl erst in einer ziemlich fernen Zukunft ein, in einer Qualitätsbildungs-, Konsolidierungs- und Bereinigungsphase. Wenn es dann zahlenmäßig bergab geht, dann geht es aber qualitativ bergauf. Um bei der Bergsteigersprache zu bleiben: der Gipfel ist dann evtl. nicht mehr höher, den wir erklimmen, aber der Schwierigkeitsgrad/Anspruch steigt.

[Bearbeiten] Richtigkeit der Prognosen zur Erreichung der 500.000-Artikel-Marke

Prognose vom 24. Oktober 2006:[1]
Die Prognose, dass die Wikipedia 500.000 Artikel am 23. November 2006 erreiche, wurde am 24. Oktober 2006 gemacht. Zu einem Zeitpunkt, als die Wikipedia 485.000 Artikel erreichte. Die exponentielle (tgl. 0,14 %) ging vom 15. November aus. Die Prognose, die von 400 Artikeln täglich ausging, lag mit dem 1. Dezember um rund eine Woche daneben.

Prognose vom 6. September 2006: [2]
Die Prognose vom 6. September, die bei einem Artikelstand von 461.500 getroffen wurde, prophezeite das Erreichen der 500.000-Artikel-Marke für den 22. November 2006, also nur einen Tag zuvor, als es tatsächlich der Fall war. Die exponentielle (tgl. 0,14 %) ging vom 3. November aus. Die Prognose, die von 400 Artikeln täglich ausging, lag mit dem 12. Dezember deutlich daneben.

Noch ältere Prognosen lagen immer deutlicher daneben, wobei jene Prognose, die von 500 Artikeln täglich ausging, immer am nähesten war. So wurde mit Zahlen vom 18. August auf den 27. November 2006 für die Erreichung der 500.000-Artikel-Marke getippt.

Analysierend kann man feststellen, dass kein exponentielles Wachstum in Höhe von 0,14 % gegeben ist. Da die 500-Artikel-pro-Tag-Prognose mit zunehmender Entfernung des Prognosedatums ebenfalls immer unkorrekter wird, ist davon auszugehen, dass entweder ein exponentielles Wachstum in anderer Höhe als 0,14 % vorliegt, oder täglich durchschnittlich eine Anzahl von etwas mehr als 500 Artikeln verfasst wird - etwa 505 bis 510. Weitere Prognosen sollten diese Erkenntnisse zu Grunde legen, damit sich erweisen kann, ob und wie sich das Wachstum der Wikipedia anhand aktueller Gegebenheiten voraussagen lässt.

[Bearbeiten] Mögliche zukünftige Entwicklungen: aktuelle Prognosen und Thesen

Neue Vermutungen, Spekulationen, Theorien, Thesen und Prognosen können hier veröffentlicht und nachvollzogen werden. Scheint sich eine zu bewahrheiten, kann sie natürlich zur „aktuellen Entwicklung“ verschoben werden, wo die Theorie dann gepflegt wird, bis sie nicht mehr aktuell ist, oder nachweislich nicht (mehr) zutrifft.


[Bearbeiten] Logistisches Wachstum von de.wikipedia.org

Auf commons:User:HenkvD/Articles habe Ich das logistische Modell für en.wikipedia beschrieben. Weil aber keine aktuellen Datenbankauszüge für en.wikipedia vorhanden sind, untersuche ich in weiteren Analysen den Zustand der deutschen Wikipedia im Detail.

Wachstum auf de.wikipedia Selber Graph in logarithmischer Form

Hier sind 5 Statistiken zu sehen, die das Wachstum darstellen. Sollte kein einziger Benutzer beitragen, ist bei allen das Wachstum Null.

  • Neue Artikel pro Monat
  • Wachstum in Wörtern
  • Datenbankbearbeitungen pro Monat
  • Neue Wikipedianer pro Monat
  • Sehr aktive Wikipedianer

Als Erstes bemerkte ich das ungewöhnliche Wachstum im April 2004, das bei allen 5 Statistiken sichtbar ist, am deutlichsten bei 'Neue Artikel' und 'Neue Wikipedianer'. Diese Periode ist durch eine rote Ellipse auf beiden Graphen gekennzeichnet. Wie kann dies erklärt werden?

Außerdem denke ich, dass diese Graphen Zeichen für logistisches Wachstum zeigen, am deutlichsten bei 'Neue Wikipedianer'. Der Anzahl der neuen Wikipedianer am 1.1.2008 beträgt nur 40% des Maximums (ca. 2006).

Die Wendepunkte sind wahrscheinlich in der Nähe von:

  • Sept 05 - Apr 06 für 'Neue Wikipedianer pro Monat'
  • Sept 2006 für 'Neue Artikel pro Monat'
  • Sept 2006 für 'Wachstum in Wörtern'
  • April 2007 für 'Datenbankbearbeitungen pro Monat'
  • Juni 2007 für 'Sehr aktive Wikipedianer'

Siehe auch


[Bearbeiten] abstrakte Theorien

Theorien à la „Was wäre wenn“:

[Bearbeiten] Wie die deutschsprachige Wikipedia innerhalb von 10 Jahren 25 Mio. Lemmata erreichen könnte

Prognose vom 16. September 2005 für das Jahr 2010: 5 Mio. Lemma; für 2015: 25 Mio. Lemma

Die Wikipedia.de umfasst zurzeit mit etwa 500.000 Einträgen nur einen winzigen Bruchteil der sinnvollen Lemmata.

Allein das Allgemeine Lexikon der Bildenden Künstler von der Antike bis zur Gegenwart, auch Thieme-Becker genannt, umfasst in seiner aktuellen CD-Version über 280.000 Künstler. Die ersten 148.180 Künstler- sowie 15.082 versteckten Biographien wurden in den Jahren 1907 bis 1950 im wesentlichen von ca. 400 Autoren geschaffen. Der Lexikograph Hans Vollmer fügte 1953 bis 1962 noch einmal 47.229 Künstlerbiographien hinzu.

Diese Viertelmillion Einträge umfasst also von den Künstlern nicht die Komponisten und auch keine Dichter, keine Sänger, Schauspieler und Regisseure. Es gibt auch noch Tänzer, Artisten, Gedächtniskünstler, Zauberer, Kaberettisten und viele weitere kleinere Künste von Puppenspielern bis Schattenspielern. Schon die Künstler bieten Stoff für über 3 Mio. Einträge (hauptsächlich Autoren).

Wenn alle Künstler erfasst wären, wäre noch kein Erfinder, Forscher, Naturwissenschaftler, Entdecker, Mathematiker, Philosoph, Geschichtswissenschafter, die hundert größten Entwickler der Funktechnik etc., etc. erfasst.

Könige, regierende Fürsten, Politiker, Bürgermeister gibt es über die Jahrhunderte zu Hunderttausenden.

Feldherren und Militärs, die eine Rolle in der Geschichte gespielt haben, gibt es auch über Hunderttausend.

Bischöfe, Lamas, Prediger, Sektenführer, Päpste, Patriarchen und viele weitere Religionsführer haben auch Geschichte mitbestimmt, sicher finden sich in der Literatur über Hundertausend.

Abertausende haben sich um ihre Heimatgemeinden so verdient gemacht, dass Straßen nach ihnen benannt wurden oder sie zu Ehrenbürgern wurden. Allein die mehrhundertseitige über 150 Jahre alte (und damit urheberrechtsfreie) Chronologie meiner Heimatstadt mit mehrhundertjähriger Geschichte wäre Grundlage für über tausend sinnvolle Einträge. Ein pensionierter Lehrer mit Zeit, Liebe zur Geschichte, seiner Vaterstadt, der Chronologie kann nur einfach so in einem Jahr 1.000 Einträge zu unserer Stadt einstellen.

Hinzu kommt, dass weltweit neue „relevante“ Persönlichkeiten täglich in weitaus größerer Zahl entstehen, als neue Artikel entstehen, d. h. die Schere zwischen vorhandenen und potentiellen Personenartikeln öffnet sich immer weiter.

Auch warten noch einige hunderttausende Städte, Dörfer, Berge, Flüsse, Bäche weltweit sowie über 2 Millionen Tier- und Pflanzenarten auf ihren Eintrag. Es sind aber auch einige zehntausend untergegangene Siedlungsplätze wiederentdeckt, ausgegraben, erforscht und bezeichnet worden.

Wenn nur eine Million der über 100-Millionen Menschen mit Muttersprache Deutsch sich an den PC setzt und anfängt, jeden Tag eines der oben beschriebenen Lemmas einzugeben, dann (Server auf Google-Niveau vorausgesetzt) gäbe es nach einem Jahr 365 Millionen Einträge.

Für diese Zahl reichen schon die pensionierten Akademiker mit Internetanschluss und vollem Bücherregal, die es heute schon gibt.

Für 10.000 gute Bilder würden in meiner kleinen Stadt schon der Leicaclub reichen, überwiegend pensionierte Akademiker aus praktisch allen Fachrichtungen vom Arzt bis zum Chemiker.

Nur 10.000 Wiki-Freaks - Studenten, Pensionäre oder sonst Leute mit Zeit und Lust - die jeden Tag drei Einträge machen, haben in weniger als drei Jahren über 10.000.000 Einträge geschaffen.

Das „Allgemeine Lexikon der Bildenden Künstler von der Antike bis zur Gegenwart“ mit seinen über 250.000 Einträgen, das weltweit größte Lexikon dieser Art, wurde auch über zwei Weltkriege hinweg nicht aufgegeben. Dies zeigt, dass es auch im deutschsprachigen Raum Menschen gibt, die so etwas mögen und deshalb machen.

Internet und Wikipedia müssen nur in das Milieu der örtlichen Historischen Vereine, der Numismatiker, Naturfreunde, Vogelbeobachter, Technikvereine, etc. diffundieren. Ich sage in 5 Jahren mindesten 5 Mio. Einträge und in zehn Jahren mindestens 25 Mio. Einträge voraus. Das ist nur das etwa Hundertfache des Thieme-Becker.

[Bearbeiten] Widerlegte Thesen

Ältere Theorien, Prognosen und Thesen, die sich nachweislich nicht bewahrheitet (Blick in die Statistik) haben, werden hierher verschoben, um neuen Theorien Platz zu machen. Alte Theorien können hier nachgelesen werden.

[Bearbeiten] Die deutschsprachige Wikipedia folgt der englischen Wikipedia

Inhaltliche Aktualität des Absatztextes: Ende 2004/Anfang 2005

Die de-Wikipedia ist die zweitgrößte nach en (siehe [3]).

Wagen wir die Annahme, dass die Wachstumskurve von de mit dem Wachstum von en in irgendeiner Weise korreliert. Im Juni 2004 erreichte die Deutschsprachige eine Artikelzahl, die die Englische 17 Monate zuvor hatte. Dieser „zeitliche Abstand“ verringerte sich seither auf 14 Monate im September 2004 und auf 12 Monate im Dezember 2004. Sollte der Abstand von 12 Monaten konstant bleiben, wird die Deutschsprachige Wikipedia 300.000 Artikeln ca. im Juli 2005 erreichen. Der Abstand scheint sich in den letzten Monaten jedoch wieder zu vergrößern. Die englische Wikipedia scheint seit Anfang 2004 wieder exponentiell zu wachsen, während die deutschsprachige Wikipedia seit April 2004 nur noch linear wächst.

Dass die deutschsprachige Wikipedia momentan immerhin noch rund 1/3 so viele Artikel wie die englische hat und damit noch immer die zweitgrößte Sprachversion ist, ist zwar schön, aber die Tendenz ist eben schon seit Monaten fallend. Wenn es so weitergeht, hat de bald wieder nur noch 1/4 von en, dann 1/5...

Diese unterschiedlichen Wachstumsraten lassen sich verschiedenartig erklären:

  • Von allen Benutzern, die www.wikipedia.org besuchen, gehen gemäß alexa.com 63% auf en, 9% auf ja, 8% auf de, 4% auf es. Sprich, die de-Wikipedia ist noch nicht so in der Gesellschaft angekommen wie die en-Wikipedia. Jetzt, wo auch die deutschsprachigen Medien auf die Wikipedia aufmerksam werden, kann sich das jedoch bessern. Vor kurzem lag der Prozentsatz noch bei 3%. Der Abstand ist aber immer noch immens.
  • Ganz eindeutig die unerträgliche Langsamkeit von Wikipedia, die auch das reine Lesen zur Qual macht. En wird in Frankreich gecached (Squid Proxy), de läuft in Florida. Dies sorgt für große Antwortzeiten. Besserung ist eventuell mit dem von Yahoo gespendeten Serververbund zu erwarten.
  • Wikipedia hat in Deutschland inzwischen eine gute Durchdringung. En hat den Weltmarkt, mit vielen Gebieten in denen Wikipedia bis jetzt kaum bekannt ist.
Artikel pro Sprach-Sprecher; siehe auch Wikipedia:Wikipedistik/Soziologie/Erhebungen
Artikel pro Sprach-Sprecher; siehe auch Wikipedia:Wikipedistik/Soziologie/Erhebungen
  • Die englische Sprache hat mit 340 Millionen etwa 2,8 mal so viele Muttersprachler wie die deutsche Sprache (120 Millionen). Englisch hat inklusive Zweitsprachlern sogar mehr als zehnmal so viele Sprecher.
  • Deutschsprachige Wikipedia-Artikel werden laut Alexa nur rund ein Zehntel mal so oft gelesen wie die englischen.
  • Wikipedia (de) wird nicht die nötige (und ihr auch zustehende) Wertschätzung zuteil.
  • Die meisten Artikel in der de-Wikipedia sind deutlich umfangreicher und besser geschrieben als in der en-Wikipedia.
  • De besitzt ein ganz anderes Qualitätsmaß als en. So werden oft Artikel wegen fehlender Relevanz einfach wieder gelöscht. Hierbei ist die Relevanz sehr hoch angesetzt. Das bedeutet, dass viele Artikel, die in en sind, niemals in de sein werden. Auf en gilt im Wesentlichen: ein Artikel wird nur gelöscht, wenn er eine URV ist oder absoluten Schwachsinn enthält. Stubs werden nicht gelöscht, sondern mit einem „Stub“-Label versehen und bleiben, bis sie jemand erweitert. „Irrelevante“ Lemmata werden nicht gelöscht, außer sie sind wirklich nachweislich total irrelevant. Auf de dagegen werden Stubs als Ärgernisse angesehen, die man besser löscht, damit jemand anders den Artikel ganz von neu schreiben kann. Und Artikel, die die strengen „Relevanzkriterien“ nicht erfüllen, fliegen raus, auch wenn sie gut sind.

Codice Sconto: E463456

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -