See also ebooksgratis.com: no banners, no cookies, totally FREE.

CLASSICISTRANIERI HOME PAGE - YOUTUBE CHANNEL
Privacy Policy Cookie Policy Terms and Conditions
The Doppelgänger – Wikipedia

The Doppelgänger

aus Wikipedia, der freien Enzyklopädie

Das Doppelgänger User Modeling System ist ein Software-Benutzer-Modellierungssystem, das Wissen über einen Benutzer erlangt, und dieses Wissen Anwendungen zur Verfügung stellt.

Das System versucht, den Benutzer möglichst gut kennenzulernen um sein Verhalten wahrscheinlichkeitsbasiert voraussagen zu können.

Inhaltsverzeichnis

[Bearbeiten] Einleitung

Ursprünglich wurde der Doppelgänger entwickelt, um täglich eine auf eine Person zugeschnittene elektronische Zeitung zu generieren. In einer konkreten Implementierung wurde in einer Newspaper-Vending-Machine ein Drucker eingebaut, der an einen Computer angeschlossen war. In diesen Computer konnte man eine PCMCIA-Karte stecken, auf der Daten über den Benutzer gespeichert waren. Unter anderem waren darauf die Informationen gespeichert wann der Benutzer morgens seine Zeitung lesen wollte, und welche Themen ihn interessierten. Der Computer suchte also rechtzeitig die richtigen Artikel, machte automatisch ein Layout, und schickte es an den Drucker (dieser Vorgang dauerte damals noch bis zu 10 Minuten). So lag morgens zur richtigen Uhrzeit die individuelle Zeitung ausgedruckt in der Newspaper-Vending-Machine.

Ein Problem dieses Systems war es, dass es nicht feststellen konnte welche Artikel aus dieser individuellen Zeitung den Besitzer der Karte nun tatsächlich interessiert haben, und wie lange er überhaupt Zeit hatte die Zeitung zu lesen. Es gab also keine Möglichkeit das eventuell fehlerbehaftete Wissen über ihn zu korrigieren oder erweitern, abgesehen von der manuellen Korrektur auf der PCMCIA-Karte.

Das Doppelgänger System, das hier besprochen wird ist eine Weiterentwicklung dessen.

[Bearbeiten] Die Architektur

Der Doppelgänger selbst besteht aus 2 Ebenen, den Sensoren und dem Server. Dazu kommen die externen Anwendungen, die wie Clients fungieren, und daher als 3. Ebene interpretiert werden könnten. Die Sensoren "beobachten" den Benutzer, und leiten die dabei erlangten Informationen an den Kern (Server) des Doppelgängers weiter. Mit dem schon vorhandenen Wissen über den Benutzer und den neuen Daten werden dort Berechnungen gemacht, und die Ergebnisse in einer Datenbank gespeichert. Je nachdem ob eine Anwendung (als Client) die Rechte dazu hat, werden ihr auf eine Anfrage, die sie an den Doppelgänger gestellt hat, die gewünschten Daten geliefert.

Ein kurzes vereinfachtes Beispiel soll den Zweck des Systems verdeutlichen: Ein Sensor stellt fest, dass der Benutzer fast jeden morgen um 8 Uhr sein Büro betritt. In der Datenbank wird gespeichert, dass er am nächsten Tag mit hoher Wahrscheinlichkeit wieder um 8 Uhr ins Büro kommen wird. Ein Programm, dass den Rollladen steuert erfragt sich diese Information, und fährt kurz vor 8 die Rollläden hoch.

[Bearbeiten] Benutzermodelle

Ein gutes Benutzer-Modellierungssystem soll möglichst viel über den Benutzer wissen. Dazu kann das Aussehen des Benutzers, seine Stimme, sein Wissensstand, seine Interessen und seine Gewohnheiten gehören. Diese Daten werden in so genannten Benutzermodellen gespeichert. Im einfachsten Falle besteht ein solches Benutzermodell aus einem einzigen Bit, welches z.B. aussagt ob der Benutzer zur Gruppe der Raucher (0) oder zur Gruppe der Nichtraucher (1) gehört. Im Doppelgänger ist das Benutzer-Modell eine Ansammlung von Dateien wobei jede Datei Wissen aus einem bestimmten Bereich über den Benutzer enthält. Eine Datei für seine Lebensdaten (mit Name, Wohnort, usw.), eine Datei für seine Vorlieben im Bereich der Nachrichten, ...

Da im Falle des Doppelgängers sehr viele Daten anfallen können, und auf diese oft schnell zugegriffen werden muss, werden sie in Hash-Tabellen gespeichert, welche die schnellen Zugriffe möglich machen. In den Dateien steht das Benutzermodell in LISP ähnlichen Listen.

[Bearbeiten] Techniken

Um aus den von den Sensoren gelieferten Informationen brauchbares Wissen zu machen, müssen bestimmte Berechnungen durchgeführt werden. Dazu gibt es im Doppelgänger verschiedene Techniken, wobei vom Programmierer des Systems festgelegt werden muss in welchem Gebiet welche Technik angewandt wird.
Zur Voraussage des Verhaltens des Benutzers kann das Doppelgängersystem die folgenden 3 Techniken benutzen:

  • Hidden Markov Modell (HMM): HMMs werden im Doppelgänger z.B. für die Voraussagen benutzt, wo der Benutzer sich wohl im nächsten Moment aufhalten wird. Dabei repräsentieren die Zustände den Aufenthaltsort. Die Übergangswahrscheinlichkeiten stellen somit die Wahrscheinlichkeiten für den nächsten Aufenthaltsort dar. Die Ausgabewahrscheinlichkeiten sind gegeben durch die Informationen, die das System von Sensoren bekommt, die den Benutzer an verschiedenen Aufenthaltsorten ausfindig machen können.
  • Betaverteilung: Die Betaverteilungs-Technik wird verwendet um einzuschätzen, ob dem Benutzer ein Artikel aus einem bestimmten Themengebiet gefallen wird oder nicht. Wurde schon oft festgestellt, ob den Benutzer ein Artikel aus dem Themengebiet "Fußball" interessiert hat, so kann man mit hoher Wahrscheinlichkeit sagen, dass er sich auch das nächste Mal dafür interessiert.
  • Linear prediction: Die Linear Prediction-Technik benutzt die Autokorrelation einer Datensequenz, um die zukünftig auftretenden Werte vorhersagen zu können. Linear Prediction wird hier z.B. benutzt um vorherzusagen, wann und wie lange der Benutzer das nächste mal sich in das System einloggt. Grundlage für diese Schätzung sind z.B. die letzten 100 Login-Zeitpunkte (mit Logindauer). Mit dem Fortführen der durch Autokorrelation erkannten Zyklen kann man nun schätzen, wann der nächste Login-Zeitpunkt sein wird. Diese Schätzung ist - wie alle Angaben dieser Art - mit einer Wahrscheinlichkeit versehen. Je weiter der nächste geschätzte Login in der Zukunft liegt, desto kleiner ist die Wahrscheinlichkeit, dass es stimmt.

Außerdem benutzt das System die Clusteranalyse um Benutzer verschiedener Doppelgänger-Instanzen in automatisch generierte Gruppen einzuteilen.

[Bearbeiten] Literatur

  • Orwant, Jon: Heterogeneous Learning in the Doppelgänger User Modeling System (1995)
  • Orwant, Jon: For want of a bit the user was lost: Cheap user modeling (1996)

[Bearbeiten] Weblinks


aa - ab - af - ak - als - am - an - ang - ar - arc - as - ast - av - ay - az - ba - bar - bat_smg - bcl - be - be_x_old - bg - bh - bi - bm - bn - bo - bpy - br - bs - bug - bxr - ca - cbk_zam - cdo - ce - ceb - ch - cho - chr - chy - co - cr - crh - cs - csb - cu - cv - cy - da - de - diq - dsb - dv - dz - ee - el - eml - en - eo - es - et - eu - ext - fa - ff - fi - fiu_vro - fj - fo - fr - frp - fur - fy - ga - gan - gd - gl - glk - gn - got - gu - gv - ha - hak - haw - he - hi - hif - ho - hr - hsb - ht - hu - hy - hz - ia - id - ie - ig - ii - ik - ilo - io - is - it - iu - ja - jbo - jv - ka - kaa - kab - kg - ki - kj - kk - kl - km - kn - ko - kr - ks - ksh - ku - kv - kw - ky - la - lad - lb - lbe - lg - li - lij - lmo - ln - lo - lt - lv - map_bms - mdf - mg - mh - mi - mk - ml - mn - mo - mr - mt - mus - my - myv - mzn - na - nah - nap - nds - nds_nl - ne - new - ng - nl - nn - no - nov - nrm - nv - ny - oc - om - or - os - pa - pag - pam - pap - pdc - pi - pih - pl - pms - ps - pt - qu - quality - rm - rmy - rn - ro - roa_rup - roa_tara - ru - rw - sa - sah - sc - scn - sco - sd - se - sg - sh - si - simple - sk - sl - sm - sn - so - sr - srn - ss - st - stq - su - sv - sw - szl - ta - te - tet - tg - th - ti - tk - tl - tlh - tn - to - tpi - tr - ts - tt - tum - tw - ty - udm - ug - uk - ur - uz - ve - vec - vi - vls - vo - wa - war - wo - wuu - xal - xh - yi - yo - za - zea - zh - zh_classical - zh_min_nan - zh_yue - zu -