Hilfe:Personendaten
aus Wikipedia, der freien Enzyklopädie
Abkürzung: Hilfe:PD
Personendaten sind spezielle Metadaten, die in Artikel über Personen aufgenommen werden, damit sie daraus automatisch extrahiert und weiterverarbeitet werden können. Sie bestehen aus einer Reihe von Datenfeldern wie beispielsweise Name, Geburtstag und Kurzbeschreibung einer Person.
Bearbeitungsstand 17. Dezember 2007: 187.452 Artikel mit Personendaten und 40.059 individualisierte PND-Nummern in der deutschsprachigen Wikipedia. (Die englischsprachige Ausgabe, 19. Januar 2008: etwa 17.000 Artikel mit Personendaten.)
Inhaltsverzeichnis |
[Bearbeiten] Kopiervorlage
{{Personendaten |NAME= |ALTERNATIVNAMEN= |KURZBESCHREIBUNG= |GEBURTSDATUM= |GEBURTSORT= |STERBEDATUM= |STERBEORT= }} |
|
Die Vorlage sollte am Ende des Artikels stehen, nach allen Weblinks, Navigationsleisten und den Kategorieangaben. Hinter den Personendaten folgen nur noch die Sprachlinks („Interwiki-Links“).
- Vorlage:Personendaten, der Quelltext
[Bearbeiten] Verwendung
Personendaten werden mittels einer Vorlage in den Artikel eingefügt, deren Ausgabe standardmäßig nicht sichtbar ist und bei Bedarf für normale Nutzer eingeschaltet werden kann.
Beispiel: Das gibt man ein
{{Personendaten |NAME=Magellan, Ferdinand |ALTERNATIVNAMEN=Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |KURZBESCHREIBUNG=portugiesischer Seefahrer, der für die spanische Krone segelte |GEBURTSDATUM=1480 |GEBURTSORT=[[Sabrosa]], Portugal |STERBEDATUM=27. April 1521 |STERBEORT=[[Mactan]], Philippinen }}
Beispiel: So sieht es für Benutzer aus, die die Anzeige von Metadaten eingeschaltet haben:
Personengruppen erhalten keine Personendaten. Wenn möglich, werden diese bei den jeweiligen Einzelpersonen in die Weiterleitung eingetragen. (Beispiel: Das Autorenduo Erckmann-Chatrian hat keine Personendaten, diese finden sich unter „Emile Erckmann“ und „Alexandre Chatrian“.)
[Bearbeiten] Ansicht einschalten
Um Personendaten sichtbar zu machen, muss folgende Seite angelegt werden: Spezial:Mypage/monobook.css. In diese muss eingetragen werden:
table.metadata { display:table; }
oder, bei Verwendung des Microsoft Internet Explorers,
table.metadata { display:block; }
Alternativ kann die Aktivierung mittels Gadget in den eigenen Einstellungen erfolgen.
Wenn nach Speichern und Cache-Leerung unter dieser Zeile ein Block angezeigt wird, ist die Anzeige von Metadaten eingeschaltet.
Personendaten | |
---|---|
NAME | Magellan, Ferdinand |
ALTERNATIVNAMEN | Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |
KURZBESCHREIBUNG | portugiesischer Seefahrer, der für die spanische Krone segelte |
GEBURTSDATUM | 1480 |
GEBURTSORT | Sabrosa, Portugal |
STERBEDATUM | 27. April 1521 |
STERBEORT | Mactan, Philippinen |
[Bearbeiten] Datenfelder
Als Grundlage sind für einen Personendatensatz die Datenfelder NAME, ALTERNATIVNAMEN, KURZBESCHREIBUNG, GEBURTSDATUM, GEBURTSORT, STERBEDATUM und STERBEORT vorgesehen. Die Felder können in Zukunft möglicherweise erweitert werden - dies sollte jedoch in Absprache geschehen.
Feldname | Beispiele |
---|---|
NAME |
Magellan, Ferdinand |
ALTERNATIVNAMEN |
Magalhães, Fernão de (portugiesisch); Magallanes, Fernando de (spanisch) |
KURZBESCHREIBUNG |
portugiesischer Seefahrer, der für die spanische Krone segelte |
GEBURTSDATUM |
1480 |
GEBURTSORT | |
STERBEDATUM |
27. April 1521 |
STERBEORT |
[Bearbeiten] Name
Im Feld NAME wird der Name, unter dem die Person bekannt ist (das Lemma), in Ansetzungsform nach RAK eingetragen, also Nachname Komma Vorname. Bei Unsicherheit hilft beispielsweise ein Blick in die Deutsche Nationalbibliografie unter http://dnb.d-nb.de. Dies ist nicht zwangsläufig der echte Name der Person, sondern sollte immer der bekannteste Name sein (z. B. "Heino").
Bei Personen des Mittelalters, die einen Herkunftsnamen tragen (von Aue, de Troyes, of Monmouth), wird immer nach dem Vornamen angesetzt. Es heißt also Wolfram von Eschenbach, keinesfalls Eschenbach, Wolfram von.
[Bearbeiten] Datum
In den Feldern GEBURTSDATUM und STERBEDATUM wird das Datum wie in der Wikipedia üblich eingetragen, also 12. Januar 1323 und nicht TT.MM.JJJJ (z. B. 12. 01. 1923). Ist nicht das volle Datum bekannt, sind auch die Angaben März 1323, nur 1323 oder gar 14. Jahrhundert korrekt.
Siehe auch: Datumskonventionen
Spezielle Regeln, vor allem für ungenaue Datumsangaben, nennt folgende Tabelle:
falsch | richtig | Bedeutung & Bemerkungen |
---|---|---|
[[3. April]] [[1940]] | 3. April 1940 | Datumsfelder sollten nicht verlinkt sein. Ein Artikel sollte aber nicht geändert werden, nur um einen solchen Link zu tilgen. Die Beseitigung ist jedoch erwünscht, wenn ein Artikel ohnehin verändert wird. |
4. Jänner 1234 4. 1. 1234 04. Januar 1234 |
4. Januar 1234 | einheitliche Schreibweise, um automatische Auswertung zu erleichtern |
123 v. u. Z. 123 v. d. Z. 123 v.Chr. 123 v. Chr. |
123 v. Chr. | dito |
123 n. Chr. 123 u. Z. |
123 | dito |
Frühjahr 43 v. Chr. 2. Hälfte 43 v. Chr. Spätsommer 43 v. Chr. |
43 v. Chr. | Vergröberung, um automatische Auswertung zu erleichtern |
lebte im späten 8. und frühen 9. Jahrhundert | 8. Jahrhundert 9. Jahrhundert |
für GEBURTSDATUM für STERBEDATUM |
vor 837 | vor schließt hier immer das angegebene Datum mit ein |
|
vor dem 18. Juli 837 wohl vor 18. Juli 837 |
vor 18. Juli 837 | |
dokumentiert 1108 bezeugt 1108 erwähnt 1108 nachweisbar seit 1108 |
vor 1108 | für GEBURTSDATUM |
nach 837 | nach schließt hier immer das angegebene Datum mit ein |
|
nach dem 18. Juli 837 wohl nach 18. Juli 837 |
nach 18. Juli 837 | |
später als 1245 frühestens 1245 verschollen 1245 vermisst 1245 1245 (oder später) nicht vor 1245 |
nach 1245 | für STERBEDATUM |
837-843 | zwischen 837 und 843 | zwischen schließt hier immer beide angegebenen Daten mit ein |
nach 3. Mai 93 und vor 5. Mai 103 | zwischen 3. Mai 93 und 5. Mai 103 | |
2. Hälfte des 9. Jh. Ende des 9. Jahrhunderts |
zwischen 850 und 900 | |
940 od. 945 940; nach anderen Quellen 945 940 (oder 945) |
940 oder 945 | oder soll nur zwischen vollständigen Daten stehen, nicht zwischen Tagen oder Monatsnamen; mehr als zwei Alternativen sind zulässig |
3. oder 4. April 940 3./4. April 940 |
3. April 940 oder 4. April 940 | |
3. April oder Mai 940 3. April/Mai 940 |
3. April 940 oder 3. Mai 940 | |
3. April 940 oder 941 3. April 940/941 |
3. April 940 oder 3. April 941 | |
3./4. Jahrhundert | 3. Jahrhundert oder 4. Jahrhundert | |
wahrscheinlich 837 vermutlich 837 ungefähr 837 gegen 837 etwa 837 circa 837 wohl 837 ca. 837 ~837 837(?) 837? |
um 837 | um (kleines) Intervall um das angegebene Datum |
geboren Mai 1705 und getauft 17. Mai 1705 17. Mai 1705 (Taufe) |
getauft 17. Mai 1705 | getauft bezieht sich auf die gesamte Datumsangabe, es kann nur am Anfang stehen |
beerdigt 14. Juni 1705 14. Juni 1705 (Beerdigung) 14. Juni 1705 (Begräbnis) |
begraben 14. Juni 1705 | begraben bezieht sich auf die gesamte Datumsangabe, es kann nur am Anfang stehen |
nicht bekannt unbekannt ungewiss ? - |
Feld leer lassen | |
6. Mai vor 987 6. Mai nach 987 6. Mai zwischen 987 und 993 6. Mai um 987 |
der Tag ist bekannt, das Jahr nicht genau |
In vielen Ländern - so in Russland bis zum 1. Februarjul./ 14. Februar 1918greg., aber auch in Deutschland bis zu unterschiedlichen Zeiten (oft 19. Februarjul./ 1. März 1700greg.) - galt der Julianische Kalender noch längere Zeit weiter, nachdem am 5. Oktoberjul./ 15. Oktober 1582greg. der heute verwendete Gregorianische Kalender eingeführt wurde. In den Personendaten sollte ausschließlich das Datum nach dem Gregorianischen Kalender verwendet werden. Im Artikel selbst können beide Datumsangaben stehen. Siehe hierzu: Umrechnung zwischen Julianischem und Gregorianischem Kalender und Vorlage:JULGREGDATUM.
[Bearbeiten] Alternativnamen
Im Feld Alternativnamen sollten alle anderen Namen notiert werden, die auf die Person zutreffen, vor allem wirkliche Namen, wenn der Hauptname ein Pseudonym ist. Die Alternativnamen sollten ebenso wie der Hauptname angesetzt werden. In runden Klammern kann dahinter angegeben werden, um was für eine Art von Namen es sich handelt, diese Beschreibung sollte keine Abkürzung sein, also (Pseudonym) statt [Pseud.]. Mehrere Namen werden mit Semikolon getrennt, welchem ein Leerzeichen folgen sollte. (Bitte nicht sämtliche Vornamen als Alternativnamen aufführen, sondern nur jene, die, wie z. B. abweichende Familiennamen und Pseudonyme, von besonderer Bedeutung sind.)
[Bearbeiten] Kurzbeschreibung
Dieses Feld soll sehr kurz die Person beschreiben. Dabei empfiehlt sich zuerst die Nationalität, dann den Beruf und zuletzt ihre herausragende Leistung (z. B. Erfindung von XY) zu nennen.
[Bearbeiten] Geburtsort, Sterbeort
Während bei den anderen Datenfeldern die Verlinkung unnötig ist, sollten Geburts- und Sterbeort wie in Artikeln möglichst exakt auf einen Artikel verweisen, damit sie sich später automatisch auswerten lassen:
So nicht
- Vila Real, [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]
- Geburtsort ist weder "Alto Trás-os-Montes" noch "Portugal"
So ja
- [[Vila Real]], Trás-os-Montes, Portugal
Auch in Ordnung
- [[Vila Real]], Portugal
- [[Vila Real]], [[Alto Trás-os-Montes|Trás-os-Montes]], [[Portugal]]
Achtung: Es gibt zahlreiche Orte gleichen Namens, also nicht auf die falsche Stadt verlinken, nur weil sie ebenso heißt wie die gemeinte.
Ungenaue Angaben werden mit einem „bei“ eingeleitet, also beispielsweise „bei Berlin“.
[Bearbeiten] Zur Geschichte der Personendaten
Ohne einheitliche Formatierung bei Artikeln über Personen ist es sehr schwer, Personendaten aus den Artikeln zu extrahieren. Bei der Konvertierung für die erste Wikipedia-CD wurden halbautomatisch über 25.000 Personennamen nach den Regeln für die alphabetische Katalogisierung lemmatisiert und als allernotwendigste Teile eines Personendatensatzes Name, Kurzbeschreibung, Geburtsdatum, Geburtsort, Sterbedatum und Sterbeort ausgezeichnet.
Im Vorfeld der Erstellung der zweiten CD wurden die Personendaten in der heutigen Form eingeführt, damit die Daten zum einen nicht für jede CD erneut erstellt werden müssen und zum anderen auch für andere Projekte genutzt werden können. Die Einbindung begann im Dezember 2004. Directmedia, der Ersteller der Wikipedia-CD, unterstützte das Projekt im Januar 2005 mit einer „Tagging Party“.
Nach der deutschsprachigen Wikipedia hat Ende Dezember 2005 auch die englischsprachige Ausgabe diese Art von Metadaten eingeführt.
Eine wichtige Anwendung ist die Wikipedia-DVD, die Personendaten lassen sich aber auch anderweitig nutzen, beispielsweise zur Erstellung von Geburtstagslisten oder für eine Personensuche. Zusätzlich zu den eigentlichen Personendaten gibt es PND-Links zur Verlinkung von anderen Anbietern auf die Wikipedia und umgekehrt sowie Personenkategorien.
[Bearbeiten] Extraktion der Personendaten
Die Extraktion der Personendaten und PND-Links ist entweder aus einer SQL-Datenbank oder direkt aus dem XML-Dump [1] möglich. Weiteres siehe unter /Datenextraktion.
[Bearbeiten] Hilfstools und Artikel mit fehlenden Personendaten
- Benutzer:APPER/Personendaten und www.apper.de/pd
- tools.wikimedia.de/~voj/pd/
- Fehlerliste Personendaten und PND-Links
- Wikipedia-Personensuche Beispiele:
- Wikipedia:WikiProjekt Vorlagenauswertung, (derzeit nur einfache Abfragen möglich) Beispiele:
[Bearbeiten] Statistik
Datum | Artikel | PND-Nummern | Prozent PND |
---|---|---|---|
2005-09-07 | 56.258 | 14.506 | 26% |
2005-11-27 | 64.875 | 15.476 | 24% |
2005-12-11 | 67.946 | 15.697 | 23% |
2006-02-12 | 79.532 | 17.328 | 23% |
2006-03-20 | 86.830 | 18.069 | 21% |
2006-04-20 | 90.636 | 19.152 | 21% |
2006-06-05 | 95.534 | 19.977 | 21% |
2006-08-03 | 101.737 | 21.569 | 21% |
2006-11-05 | 116.015 | 24.130 | 21% |
2006-11-30 | 120.285 | 24.792 | 21% |
2007-04-02 | 145.760 | 28.189 | 19% |
2007-04-28 | 152.645 | 29.106 | 19% |
2007-05-24 | 157.561 | 30.989 | 20% |
2007-07-01 | 163.444 | 31.462 | 19% |
2007-10-09 | 178.734 | 38.830 | 22% |
2007-12-17 | 187.452 | 40.059 | 21% |
2008-02-21 | 197.446 | 43.103 | 22% |