Codice Sconto: E463456

This WebPage/Resource is provided by https://www.classicistranieri.com

Wikipedia Diskussion:CatScan – Wikipedia

Wikipedia Diskussion:CatScan

aus Wikipedia, der freien Enzyklopädie

Diese Seite dient der Diskussion über die Seite Wikipedia:CatScan. Kommentare und Anregungen zu CatScan selbst bitte auf meta:User talk:Duesentrieb/CatScan


Ist natürlich nur ein kleiner Anfang. Hoffentlich wird die Suche bald im MediaWiki implementiert. -- Simplicius 20:34, 17. Apr 2006 (CEST)

Inhaltsverzeichnis

[Bearbeiten] Etwas Werbung...

Da ich gemerkt habe, das dieses Tool fast nur Powerusern bekannt ist, wollte ich es in der Hilfe etwas "bewerben" (vielleicht nutzen es dann mehr Leute, besonders zum Verbessern von Wartungs-Artikeln). Hat jemand einen Vorschlag, auf welcher Hilfeseite man einen Link und eine Beschreibung einbauen könnte? Eine andere Idee wäre, eine eigene Hilfeseite zum gezielten Verbessern von Artikeln einer Themenkategorie anzulegen, etwa Hilfe:Artikel verbessern. Oder gibts sowas schon? --cordobés ¿? 04:24, 3. Sep 2006 (CEST)

Link zum Tool ist veraltet, funktioniert nicht Jlorenz1@web.de 22:42, 13. Dez. 2006 (CET)

[Bearbeiten] funtionsunfähiger Catscan

Hallo, ich wollte mal fragen, ob jemand weiß, wie lange der Server mit dem Catscan noch funktionsunfähig bleibt (mir und bestimmt auch einigen anderen fehlt nämlich ein wichtiges Werkzeug :-) ). Gruß -- Ra'ike D C V QS 09:23, 14. Dez. 2006 (CET)

[Bearbeiten] CatScan und Infobox-Parameter

Mich würde interessieren, ob es nicht möglich wäre, CatScan um eine Funktion zu erweitern, welche es ermöglicht, Parameter aus Infobox-Vorlagen auszuwerten. Immer mehr Staaten werden mit nationalen Infobox-Vorlagen ausgestattet, die bereits mit zahlreichen Infos gefüttert werden, an die man sonst relativ schlecht ran kommt bzw. man erhält nur schlecht einen Überblick über alles gesammelte. Man könnte somit beispielsweise nach Ortschaften suchen, bei denen die Flächenangaben noch ausständig sind und diese gezielt nachtragen, oder gar ganze Überblicks-Tabellen (evtl. auch von Catscan) erstellen lassen. Wenn sich mal wer Zeit und Mühe nimmt, so soll er diesen Vorschlag im Auge behalten, oder gibt's schon ein ähnliches Programm? Wär bestimmt enorm nützlich, zumal Einträge in der Wikipedia meist dem neuesten Stand entsprechen. Mit Hilfe solcher Tools könnte man viel rascher aktuelle Listen erstellen oder Mankos feststellen... --Capriccio 14:34, 11. Mär. 2007 (CET)

[Bearbeiten] Schnittmengen über beliebig viele Kategorien

Hi, ich wurde aufgefordert "meinen" kleinen Trick hier zu veröffentlichen. Wenn man Schnittmengen von 3 oder mehr Kategorien bilden will, geht das mit CatScan alleine nicht, jedoch habe ich eine Methode mit der man das relativ einfach trotzdem hinbekommt.

Dazu muss man Unix, Linux oder Cygwin (für Windows) zur Verfügung haben.

Vorgehensweise:

  • Man erzeugt diverse Catscans mit Ausgabeformat CSV und speichert das Ergebnis in mehrere lokale Dateien ab
    • bei 3 Kategieren also z.B.
      • den Catscan von Kat:A und Kat:B in Datei "/tmp/catscan/in1.txt"
      • den Catscan von Kat:A und Kat:C in Datei "/tmp/catscan/in2.txt"
    • bei 4 Kategorien
      • den Catscan von Kat:A und Kat:B in Datei "/tmp/catscan/in1.txt"
      • den Catscan von Kat:C und Kat:D in Datei "/tmp/catscan/in2.txt"
    • bei 5 Kategorien
      • den Catscan von Kat:A und Kat:B in Datei "/tmp/catscan/in1.txt"
      • den Catscan von Kat:C und Kat:D in Datei "/tmp/catscan/in2.txt"
      • den Catscan von Kat:A und Kat:E in Datei "/tmp/catscan/in3.txt"
    • und so weiter
  • anschließend lässt man folgendes Shell-Script laufen:
cd /tmp/catscan
files="in*.txt"
count=$(echo $files | wc -w)
awk '{print $2}' $files | 
    sort |
    uniq -c |
    awk -v count=$count ' $1==count {printf "*[[%s]]\015\n",$2} ' |
    tr '_' ' ' > out.txt
  • und erhält als Ergebnis die Datei "/tmp/catscan/out.txt" in der in Wikisyntax die Schnittmenge aus allen Kategorien steht.
  • Diese kann man dann lokal weiterverwenden oder in eine Arbeitsliste mit copy&paste nach Wikipedia hochladen.

Der Code lässt sich sicherlich auch in anderen Scriptsprachen wie Perl darstellen. Das möchten aber bitte andere Leute entsprechend "übersetzen" und ggf. hier posten.

Wie das ganze entstanden ist kann man hier nachlesen. Hier ist ein Beispiel der Schnittmengen der Kategorien Frau US-Amerikaner und Autor zu sehen.

Ich habe außerdem mal lokal eine Schnittmenge aus Kategorie:Frau, Kategorie:Deutscher, Kategorie:Geboren im 18. Jahrhundert, Kategorie:Musik und Kategorie:Literatur gemacht. Also alle deutsche Frauen die im 18. Jahrhundert geboren sind und sowohl etwas mit Musik als auch mit Literatur zu tun hatten. Ergebnis: nur auf eine einzige Frau trifft dies zu: Helmina von Chézy.

Wenn man viel Zeit hat, kann man auch pro Kategorie einen "Full-Scan" machen, also "alle Seiten" anklicken, und dies jeweils in eine extra lokale Datei speichern. Das kann bei großen Kategorien oder Kategorie-Bäumen aber eine ganze Weile dauern bis der Catscan das komplett dargestellt hat. Aber danach kann man ein wenig mit den Eingabedateien spielen, in dem man "manche" für das Script ausschließt in dem man diese Dateien jeweils umbennent oder in ein anderes Verzeichnis verschiebt.

Das Ergebnis einer solchen "Spielerei":

  • ohne Kategorie:Frau; also auch alle deutschen Männer des 18. Jahrhunderts die etwas mit Musik und Literatur zu tun hatten: 37 Stück
  • ohne Kategorie:Deutscher; also alle Frauen aller Nationen des 18. Jahrhunderts die etwas mit Musik und Literatur zu tun hatten: 6 Stück
  • ohne Kategorie:Geboren im 18. Jahrhundert; also alle deutschen Frauen, egal wann geboren, die etas mit Musik und Literatur zu tun hatten: 34 Stück
  • ohne Kategorie:Musik; also alle deutschen Frauen des 18. Jahrhunderts die etwas mit Literatur zu tun hatten: 58 Stück
  • ohne Kategorie:Literatur; also alle deutschen Frauen des 18. Jahrhunderts die etwas mit Musik zu tun hatten: 11 Stück

Die einzelnen Listen habe ich nicht "hochgeladen", denn das waren ja nur Anwendungsbeispiele, kann das aber nachholen falls Interesse besteht.

Keine Ahnung ob und in welcher Form dies auch auf die "Hauptseite" passt.

Also bitte: Kommentare, Meinungen, Kritik, Verbesserungsvorschläge, ...

Gruß --JuTa() Talk 00:40, 5. Okt. 2007 (CEST)


Hab mal ein kleines Perlchen geschrieben - könnt ihr alle gern benutzen, wie ihr wollt: funktioniert mit beliebig vielen Dateien
print "CatScanMerge.pl -- by slartidan\nUsage: perl CatScanMerge.pl <filename1> <filename2>...\n\n";
while ($file = shift and ++$filecnt) {
    open(FILE,$file) or die "Kann Datei '$file' nicht öffnen!";
    while (<FILE>) {
        $articles{(split /\t/)[1]}++;
    }
    close(FILE);
}
foreach $article (sort keys %articles) {
    print $article, "\n" if ($articles{$article} >= $filecnt);
}
Viel Spaß damit --Slartidan 17:22, 11. Dez. 2007 (CET)

[Bearbeiten] Skript bzw. Kategoriensuche per Facetten

Ich habe auch schon mal bei Duesentrieb gefragt, weiss aber nicht mehr den Ort und ob er jemals geantwortet hat. Wo findet man denn das Skript?
Ich würde gerne eine Suchmaske machen, in der man Ort, Zeit, Fach, ein wenig auch die Art des Objekts und ggf. auch einen Wikipedia-Status eingegeben kann - anhand von Vorwahllisten für die entsprechenden Kategorien. – Simplicius 18:44, 11. Dez. 2007 (CET)

Was meinst du mir "das Skript"? Meinst du CatScan selber? - dann gehts hier lang...--Slartidan 16:14, 13. Dez. 2007 (CET)
Ich würde gerne selbst eine Suchmaske bauen mit den besagten Suchmöglichkeiten.
Wie und wo ist sowas möglich? – Simplicius 21:21, 15. Dez. 2007 (CET)

[Bearbeiten] Problem?

Gibt es ein Problem mit CatScan? Seit einigen Tagen funktioniert das bei mir nicht mehr. Liegt das an meinem Rechner oder ist das im Moment außer Betrieb?--Ticketautomat 15:41, 28. Jan. 2008 (CET)

Geht momentan mal wieder nicht. Siehe auch Wikipedia:Fragen_zur_Wikipedia#CatScan --Kungfuman 21:44, 28. Jan. 2008 (CET)
Oh danke. Hätte ich mal drauf schauen sollen.--Ticketautomat 09:35, 29. Jan. 2008 (CET)

[Bearbeiten] Anliegen

Was ich viel wichtiger finde, als die Schnittmenge von n Kategorien, ist dass ich beim Scan einer Kategorie Unterkategorien ausschließen kann. Ich vermute mal, dass das mit einem analogen Skript wie dem Obigen funktioniert? Kann da einer was basteln, wenn er Zeit und Lust hat? Das wäre eine echte Arbeitserleichterung bei der Suche nach neuen Artikeln in den Portalen. MfG -- Ben-Oni 14:28, 20. Mär. 2008 (CET)

Codice Sconto: E463456

Static Wikipedia (no images)

aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -