See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
Diskussion:Bayesscher Filter – Wikipedia

Diskussion:Bayesscher Filter

aus Wikipedia, der freien Enzyklopädie

Inhaltsverzeichnis

[Bearbeiten] Stil und Inhalt

Der bayessche Filter (auch als bayesischer Filter bezeichnet), sie rechnen mit bedingten Wahrscheinlichkeiten: Von charakteristischen Wörtern in einer E-Mail (Ereignis) wird auf die Eigenschaft, Spam (Email) zu sein (Ursache), geschlossen.

Sorry, aber mit diesem Einleitungssatz kann ich echt nichts anfangen. Auf was bezieht sich das "sie rechnen"? Für eine Einleitung ist der Satz IMHO viel zu kompliziert geschrieben. Was spricht gegen die bisherige Einleitung?

  • sie rechnen, kann man auch ersetzen mit "sie berechenen...": das triffts aber auch den statistischen Blickwinkel der Sache.--[[Benutzer:Nerd|^°^  \star ]]

Das entscheidende Risiko besteht für den User, dass ihm eine reguläre Mail durch die Lappen geht, also die falsch-positive Fälle. Für einen Privatmann, der mit Whitelists arbeitet, kann dies noch hinnehmbar sein, jedoch riskieren Firmen demgegenüber, dass wichtige Anfragen von Neukunden verlorengehen.

Durch die Lappen geht? Für eine Enzyklopädie klingt das aber ein bischen salopp, oder?

  • Finde es nicht so schlimm, schließlich versteht man sofoert die Problematik.--[[Benutzer:Nerd|^°^  \star ]] 16:37, 3. Okt 2004 (CEST)

Was hat diese Passage mit dem Bayesschen Filter zu tun? Soll begründet werden, warum Bayessche Filter anderen Spamfiltern vorzuziehen sind?

  • Soll wahrscheinlich die falsch-positive Fälle beleuchten.---[[Benutzer:Nerd|^°^  \star ]] 16:37, 3. Okt 2004 (CEST)

Das Filtern auf statistischen Grundlagen ist im Grunde eine Art Text-Klassifikation. Eine Anzahl von Forschern der angewandten Linguistik, die sich mit dem "Lernen von Maschinen" befassen, haben sich bereits diesem Problem gewidmet. In jüngerer Zeit versuchen Spammer durch das Einfügen zufälliger Zitate aus der Weltliteratur (evtl. in weißer Schrift oder als Meta-Tag.)

Forscher haben sich mit diesem Problem beschäftigt. Aussage? Inwiefern ist dies von Bedeutung? Und wie passt das zum anschließenden Satz? Dessen Sinn ich im Übrigen auch nicht so ganz verstehe.

Ich hatte das schonmal geändert, was jedoch ohne Begründung rückgängig gemacht wurde. Auf einen Edit-War hab ich keine Lust, könnte sich jemand anders das mal ansehen? Danke. Grüße, --Ich hab hunga 14:04, 3. Okt 2004 (CEST)

[Bearbeiten] 2.

statistische Methoden des englischen Mathematikers Thomas Bayes (ca. 1702 - 1761), um Texte in verschiedene Kategorien einzuteilen. Er findet Anwendung in der Bekämpfung unerwünschter E-Mails, die auch als Spam bezeichnet werden.

Diese Version beschreibt nur, und erklärt nix, v.a. die Personalisierung "Thomas Bayes (ca. 1702..." ist IMHO entbehrlich.--[[Benutzer:Nerd|^°^  \star ]]

[Bearbeiten] Artikel deutlich schlechter

Die Erwähnung von Thomas Bayes erklärt, woher der Filter seinen Namen hat. Die neue Einleitung ist im ersten Satz grammatikalisch falsch (erst Singular dann Plural). Den zweiten Satz versteht man etwa beim dritten Durchlesen, er ist also nur etwas für leidensbereite Studenten ... Der Ausdruck Lappen gehört mehr ins satirische und warum der Privatmann Whitelists und nicht Blacklists verwendet, verstehe ich auch nicht. Den letzten Absatz empfinde ich als reines Gelaber. Fazit: der Artikel ist meines Erachtens deutlich schlechter und unverständlicher geworden.--Koala 02:11, 4. Okt 2004 (CEST)

Beinahe hätte ich es übersehen: der Bayessche Filter arbeitet nicht mit Whitelists bzw. Blacklists, da er die Emails nach dem Inhalt ihres Textes und nicht nach dem Absender sortiert. Der Satz gehört in einen anderen Artikel, jedenfalls nicht hierhin. Da war ein echter Experte am Werk ... --Koala 11:32, 4. Okt 2004 (CEST)


Ein Edit-War sollte hier vermieden werden, die Version von Ich hab Hunga wurde durch Nerd deutlich verschlimmbessert. Jetzt sind es keine vollständigen Sätze mehr und der Lesefluss geht verloren. Das Lemma des vorherigen Artikels war um Längen besser. Aus meiner Sicht ist es zur Vermeidung eines Edit-War nötig, dass Nerd ein Revert akzeptiert und den Artikel sinnvoll ergänzt, wobei ergänzen nun mal nicht komplett umschreiben bedeutet. --Friese 19:06, 13. Okt 2004 (CEST)

Der Edit-War ist ja schon in Gange. Ich fände es gut, wenn sich Nerd mal zu meinen Einwänden äußert. Das hin- und herändern des Artikels bringt ja keine Klärung. (Zumindest wird Thomas Bayes jetzt wieder erwähnt.) -- Viele Grüße Koala 00:11, 16. Okt 2004 (CEST)


Dieses statistisches Filtern, zuerst vorgeschlagen 1998 am AAAI-98 Workshop on Learning for Text Categorization

Von wem wurde der Vorschlag gemacht? In welchem Paper? Bitte ordentlich zitieren! Autor, Titel, Konferenz oder Journal und Jahr sind echte Minimalanforderungen an ein wissenschaftliches Zitat. Gruesse, Matthias

[Bearbeiten] Struktur

Der Bayes-Filter ist zuerst mal eine mathematische Methode. Ich finde der mathematische Teil sollte von der Anwendung als email-Filter getrennt werden. -- 790 07:58, 19. Jun 2005 (CEST)

Vor allem finden Bayes-Filter nicht nur - wie der Artikel glauben macht - im Rahmen der Spam-Abwehr Anwendung, sondern beispielsweise auch in der Robotik uva.

Ich schließe mich meinen Vorrednern an: Der Bayes-Filter darf nicht mit Spamfilter gleichgesetzt werden! --89.15.57.79 23:29, 6. Feb. 2008 (CET)

[Bearbeiten] Anwendungsgebiet "Spionage-Software"

Lt. eines Artikels des Spiegel (http://www.spiegel.de/netzwelt/technologie/0,1518,380880,00.html bzw. http://www.heise.de/tr/) baut die Analyse-Software zu Mustererkennung in unstrukturierten Daten (E-Mails, Telefonate etc.) der britischen Firma Aungate (eine Tochterfirma der Autonomy) mit ihrem Herzstück der Dynamic Reasoning Engine (DRE) auf Verknüpfung von Ereigniswahrscheinlichkeiten auf. Daher wird die Software angeblich von zahlreichen Konzernen zur Vermeidung von Industriespionage und durch Geheimdienste zur Aufspürung von Terrorzellen genutzt.

Vielleicht kann/will jmd., der in der Materie eher zu Hause ist als ich, das irgendwie einarbeiten...


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -