aus Wikipedia, der freien Enzyklopädie
Google ist der Name einer bekannten Suchmaschine und mit über 50% aller Suchanfragen Marktführer unter den Internet-Suchmaschinen[1]. Durch den Erfolg der Suchmaschine konnte das Unternehmen Google Inc. eine Reihe weiterer Programme finanzieren, die über die Google-Seite zu erreichen sind. Die Suche ist nach wie vor der Kernbereich des Google-Geschäftsfelds. Zeitweise verwendete Konkurrent Yahoo die Datenbanken für die eigene Suche. Die Seite ging am 7. September 1998 als Testversion online, seitdem hat sich ihre Oberfläche nur geringfügig verändert. Laut der Marktforschungsgruppe Millward Brown ist Google mit einem Wert von rund 86 Milliarden US-Dollar (54,5 Milliarden Euro) die teuerste Marke der Welt.[2]
Inhaltsverzeichnis |
Der Begriff „Google“
Etymologie
Die Bezeichnung Google basiert auf einem Wortspiel (manche Quellen sprechen auch von einem Rechtschreibfehler) mit der amerikanischen Aussprache des Wortes googol.[3] Milton Sirotta, der Neffe des US-amerikanischen Mathematikers Edward Kasner, hatte den Ausdruck im Jahr 1938 erfunden, um der Zahl mit einer Eins und hundert Nullen (10100) einen Namen zu geben. Die Google-Gründer wiederum suchten eine treffende Bezeichnung für die Fülle an Informationen, die ihre Suchmaschine im Web finden sollte.[4]
Das Verb „googeln“
Google ist als Suchmaschine so populär geworden, dass der Rechtschreib-Duden das Verb googeln (sprich: [ˈɡuːgl̩n] „guhg(e)ln“) 2004 in die 23. Auflage aufnahm.[5] Dabei steht das Wort nicht nur für die Suche mit Google, sondern teilweise schon allgemein als Synonym für Websuche mit beliebigen anderen Suchmaschinen (vgl. Wiktionary[6], LEO Dictionary[7]). Seit August 2006 will Google rechtlich klarstellen, dass die Verwendung der Verben „to google“ oder deutsch „googeln“ nur noch in Verbindung mit der Suchmaschine korrekt ist. Die aktuelle 24. Auflage des Dudens erläutert das Verb googeln nun explizit als „mit Google im Internet suchen“. Google will offenbar verhindern, dass mit seinem Namen das gleiche passiert wie mit beispielsweise Polylux, Tempo, Nutella, Jeep, Tesa, Fön, Tixo, Linoleum, Aspirin, dem Grammophon oder dem escalator (engl. „Rolltreppe“) – alle waren ursprünglich geschützte Markenzeichen und sind heute zu Begriffsmonopolen geworden. In Australien haben Gerichte 2002 sogar Sony die Markenrechte am Walkman entzogen, da der Allgemeingebrauch den Begriff bereits für jede Art von tragbarem Kassettenabspielgerät verwendete. Nun fordern auch Anwälte des amerikanischen Suchmaschinen-Betreibers Redaktionen von Zeitungen und Wörterbüchern in Briefen auf, das Wort „googeln“ nicht mehr im allgemeinen Sinne von „Im Internet suchen“ zu verwenden, meldet Die Welt.[8]
Technik der Suchmaschine
Architektur
Google Inc. betreibt weltweit eine Reihe von Rechenzentren, die jeweils die komplette Funktionalität der Suchmaschine enthalten. Eine Benutzeranfrage wird, durch das Domain Name System (welches Namen wie google.com in IP-Adressen übersetzt) gesteuert, im Idealfall an das netztopologisch nächste Rechenzentrum – nur manchmal mit dem geographisch nächstgelegenen identisch – geleitet und von diesem beantwortet. Fällt ein Rechenzentrum komplett aus, können die verbleibenden Rechenzentren die Last übernehmen.
Jedes Rechenzentrum besteht aus einem Computercluster. Die verwendeten Rechner sind IBM-kompatible Personal-Computer, bestehen also aus preiswerten Standardkomponenten. Hier kommt das selbstentwickelte Google File System zum Einsatz, eine verteilte Architektur, bei der alle Daten mehrfach redundant auf verschiedenen Geräten gespeichert sind. Ist einer der Rechner oder nur eine Festplatte eines Rechners ausgefallen, werden die entsprechenden Daten von einer anderen Stelle im Cluster auf einen Ersatzrechner umkopiert und die ausgefallene Hardware-Komponente kann im laufenden Betrieb ausgetauscht werden, ohne dass Ausfälle entstehen. Das Gesamtsystem ist auch leicht skalierbar, da nach Bedarf immer weitere Rechner und Festplatten hinzugefügt werden können.
Durch Ablage der einzelnen Datenstrukturen (Indizes, Dokumentenkopien, Verzeichnisse aller Art) auf verschiedenen Rechnern und die große Anzahl verfügbarer Einzelrechner lassen sich Anfragen auch relativ schnell beantworten, da die Einzelinformationen parallel gelesen werden. Eine Antwortzeit von höchstens einer halben Sekunde wird als Richtwert angestrebt. Die schnelle Lieferung von Ergebnissen hatte auch frühzeitig zur Popularität von Google beigetragen. Die Konkurrenz ließ sich mit der Anfragebeantwortung oft mehr Zeit. Insbesondere bei inkrementellen Anfragen, also immer weiter verfeinerten Anfragen des Benutzers, der das jeweils vorige Suchergebnis berücksichtigt, ist die Zeitersparnis insgesamt deutlich spürbar.
Software
Als Betriebssystem wird eine abgespeckte Variante der Linux-Distribution Red Hat verwendet [9]. Die Programmiersprachen C, C++ und Python spielen essentielle Rollen bei der Implementierung der proprietären Suchmaschinensoftware.
Seitenreihenfolge
Die Anzahl der zu einer Suchanfrage passenden Dokumente kann unüberschaubar groß ausfallen, hier bedarf es also einer Sortierung dieser Treffer nach ihrer Relevanz, um dem Anfragenden möglichst die bedeutendsten Dokumente zuvorderst anzuzeigen. Die Abschätzung der Brauchbarkeit der Quellen in Bezug auf die Anfrage ist eine der entscheidenden Kriterien, an denen Suchmaschinen gemessen werden. Aufgrund der Fülle der hierfür zu verwertenden Information wird das zugrundeliegende Ranking von Zeit zu Zeit automatisiert durch einen Algorithmus erhoben. Dies muss in einem angemessenen zeitlichen Rahmen zu bewerkstelligen sein, um die Aktualität des Rankings zu gewährleisten.
Google verwendet zur Sortierung der Suchergebnisse unter anderem den so genannten PageRank-Wert. Ermittelt wird der PageRank eines Dokuments rekursiv anhand von Verweisen auf dieses Dokument. Je mehr solcher Verweise existieren und je höher jener PageRank der hierauf verweisenden Dokumente ist, desto höher fällt entsprechend der Wert des Dokuments aus, auf das verwiesen wird. Der jeweilige Wert des PageRanks einer Seite lässt sich anhand des Browser-Plugins Google-Toolbar ermitteln. Allerdings ist der in der Toolbar angezeigte Wert meist einige Monate alt und steht in einem logarithmischen Verhältnis zum tatsächlichen Wert. Jedoch gibt es auch Onlinedienste, die zu einer bestimmten Domain einen aktuellen PageRank ermitteln können.
Neben dem PageRank werden weitere Faktoren in die Sortierung einbezogen, so wird etwa das Auftreten der Suchbegriffe im Dokumententitel oder in Überschriften gewertet. Des Weiteren spielt die Verwendung der Begriffe als Ankertext in verweisenden Dokumenten eine große Rolle. Letzteres wird bei Google-Bomben missbraucht. Die exakte Funktionsweise der Seitensortierung ist Googles Betriebsgeheimnis, nicht zuletzt, um Manipulationen durch Website-Betreiber zu erschweren, die die eigene Site für gewisse Begriffe auf den Ergebnisseiten möglichst weit nach oben bringen möchten. Die Suchmaschinen-Optimierung beschäftigt sich mit Methoden, dies zu erreichen.
Indexgröße
Die ungefähre Anzahl der Dokumente im Index der Websuche wurde die ersten sieben Jahre unten auf der Hauptseite eingeblendet.
- Unternehmensgründung Januar 1998: 25.000.000[10]
- August 2000: 1.060.000.000
- Januar 2002: 2.073.000.000
- Februar 2003: 3.083.000.000
- September 2004: 4.285.000.000
- November 2004: 8.058.044.651
Außerdem existierte im Juni 2005 nach eigener Aussage ein Index von 1.187.630.000 Bildern, einer Milliarde Usenet-Artikeln, 6.600 Katalogen und 4500 Nachrichtenquellen.
Seit dem siebten Geburtstag der Firma Google im September 2005 wird die Größe des Index nicht mehr auf der Hauptseite angezeigt, da laut Eric Schmidt keine eindeutige Zählweise existiere.[11] Aktuell gibt Google auf seinen Seiten einen Index von „mehr als 8 Milliarden Webseiten“ an. [12]
Suchdienstleistungen für Portale
Googles Suchtechnik wird auch an Internetportale lizenziert, um dort eine Websuche anbieten zu können, ohne dass Benutzer das Portal verlassen müssten.
Google Appliance
Mit der Google Appliance verkauft Google seine Suchtechnologie an Firmen, die sie im eigenen Intranet einsetzen möchten. Bei der Appliance handelt es sich um einen Server mit vorinstallierter Software, der im firmeneigenen Netz dieselbe Aufgabe übernimmt, die Google für das World Wide Web leistet. Dokumente werden im Index vorgehalten und Suchanfragen beantwortet.
Manipulation der Ergebnisse der Suchmaschine Google
Aufgrund seiner bedeutenden Marktposition ist Google Hauptziel von Suchmaschinen-Spamming, was speziell auch Google-Bombing genannt wird. Dabei wird versucht, gute Positionen bei möglichst vielen Suchbegriffen zu erzielen. Diese Suchbegriffe haben oft nichts mit dem eigentlichen Inhalt der Seite zu tun. Es werden Techniken wie Brückenseiten, Linkfarmen oder Page-Cloaking eingesetzt.
Erstmals im größeren Umfang öffentlich wahrgenommen wurde die Möglichkeit der Suchmaschinenmanipulation im Zusammenhang mit einer Google-Bombe, die sich auf den amerikanischen Präsidenten George W. Bush bezog. Der Suchbegriff „miserable+failure miserable failure“[13] (zu deutsch: „klägliches Scheitern“ oder „jämmerlicher Versager“) wurde von Bush-Gegnern mit seiner offiziellen Biografie verknüpft. Im Gegenzug versuchten Bush-Unterstützer dasselbe mit Michael Moore. Die Plätze wechseln seither gelegentlich.
Manipulationen, die zum Zweck haben, das Ranking von Websites speziell bei Google zu verbessern, werden auch als Google-Spamming bezeichnet. Versuche, fremde Internetseiten aus den Google-Ergebnissen herauszukegeln, bezeichnet man als Google Bowling.
Google ändert seine Algorithmen zur Bestimmung des Rankings regelmäßig ab, um Missbrauch zu erschweren. Die Spammer ziehen stets nach und passen ihre Seiten entsprechend an.
Ausschluss von Suchergebnissen wegen unlauterer Suchmaschinen-Optimierung
Im Januar 2006 wurde bekannt, dass Google stärker gegen unseriöse Methoden bei der Optimierung von internationalen Webseiten vorgehen will. Als erste Konsequenz des von Google-Mitarbeiter Matt Cutts[14] angekündigten verschärften Kampfes gegen Spam in Deutschland und anderen nicht-angelsächsischen Ländern entfernte die Suchmaschine die Online-Fahrzeugbörse Automobile.de und den Fahrzeughersteller BMW aus ihrem Index[15]. Ihnen wurde vorgeworfen, durch massiven Einsatz von Keywords (Spam), Doorway-Pages und JavaScript-Weiterleitungen Suchergebnisse zum eigenen Vorteil unlauter optimiert zu haben. Die Seite von BMW wurde bereits nach wenigen Tagen wieder in den Index aufgenommen, nachdem der Betreiber die strittigen Doorway-Pages entfernt hatte[16].
Google in der Kritik
Zensur
Zensur aus gesetzlichen Gründen
Google entfernt auf seinen Ergebnisseiten Einträge wegen gesetzlicher Auflagen. Da Google in verschiedenen Ländern Zweigstellen unterhält, werden unterschiedliche Ergebnisse entfernt.
Die erste Gruppe umfasst Websites, die Inhalte anbieten, obwohl sie nicht das Urheberrecht oder eine entsprechende Genehmigung dazu besitzen. Dazu gehörten anfangs vor allem Websites, die geschütztes Material der Church of Scientology anboten. Mittlerweile entfernt Google alle Inhalte, für die jemand bei Google eine infringement notification (etwa: Rechtsverletzungsbescheid) gemäß dem US-amerikanischen DMCA-Gesetz einreicht[17]. Wird auf einer bestimmten Google-Ergebnisseite ein Eintrag aus diesem Grund unterdrückt, blendet Google unten auf der Seite einen entsprechenden Hinweis ein.
Kritik an Google wird vor allem wegen der zweiten Gruppe von Eingriffen in den eigenen automatisierten Ranking-Betrieb laut. Dabei werden Ergebnisse entfernt, weil die Verbreitung der Inhalte auf den Seiten, auf die verwiesen wird, in dem betreffenden Land verboten ist.
So werden auf Google.de und Google.fr (der deutschen bzw. französischsprachigen Domain der Suchmaschine) einige Seiten mit Inhalten entfernt, die strafbar sind, in Deutschland z. B. nach §130 StGB („Volksverhetzung“). Die Gesetzgebung in Frankreich und Deutschland verbietet das Anbieten solcher Inhalte. Neben der eigentlichen Zensur wird auch Kritik an Googles Informationspolitik geübt. Google beschränkt sich auf den eigenen Hilfeseiten auf einen allgemeinen Hinweis, dass nur aufgrund lokaler Vorschriften Ergebnisse entfernt werden und dies mit einer Einblendung gekennzeichnet wird. Tatsächlich findet eine solche Einblendung in manchen Fällen nach wie vor nicht statt (Stand Januar 2006).
Besonderes Aufsehen erlangte Googles am 25. Januar 2006 freigeschaltete chinesische Suchmaschine Google.cn (Meldung [18]). Wie bei der deutschen und französischen Ausgabe ist das Ausmaß der Filterungen von den Behörden vorgeschrieben. Im Falle Chinas ist wegen der spezifischen Gewichtung verbotener Texte die Filterung entsprechend intensiver, gleichwohl aber in Übereinstimmung mit den Gesetzen. In der Ausschlussliste finden sich Begriffe wie 法轮功 (Falungong), 六四 (4. Juni, Tian'anmen-Massaker 1989) oder 台湾独立 (Unabhängigkeit für Taiwan). Seiten, die den chinesischen Behörden nicht gefallen, werden nicht aufgelistet und bei Eingabe der Begriffe sind nur noch Seiten zu finden, die einen regierungsfreundlichen Tenor aufweisen. Google weist Nutzer bei der Suche nach Begriffen, die auf der Zensurliste stehen, auf die Beseitigungen hin.
Kritiker verurteilen das Vorgehen von Google Inc. als Anbiedern aus Profitgründen an die chinesische Regierung mit ihren immer noch praktizierten Menschenrechtsverletzungen (Beispiel [19]). Google entgegnet, dass man die aufgelegten Einschränkungen missbilligt, aber davon überzeugt sei, dass die zensierten Google-Ergebnisse eine Verbesserung zum vorherigen Verfahren seien. [20].
Googles selbstgewähltes Firmenmotto Don’t be evil (Tu nichts Böses), gegen das sie nun in der Wahrnehmung der Kritiker verstoßen, ist zusammen mit Googles hohem Marktanteil ein Grund dafür, dass der Protest gegen das China-Geschäft größer ist als bei den Konkurrenten Yahoo! und MSN Search, die bereits mit ähnlichen Filterungen auf dem chinesischen Markt vertreten sind.
Zensur wegen Regelverstoß
Google entfernt Seiten aus dem Index ihrer Suchmaschine, die gegen firmeninterne Regeln verstoßen. [21][15]
Zensur aus militärischen Gründen
In Google Earth werden einige Objekte zensiert, die von militärischer Bedeutung sein könnten. [22]
Datenschutz
Die Geschäftsmethoden von Google geraten seit einigen Jahren unter Beschuss, weil unter die Weigerung der Firma, Interna preiszugeben, auch konkrete Aussagen zum von der Firma praktizierten Datenschutz fallen (bzw. ob dieser überhaupt existiert).
Erster Kritikpunkt war die Vergabe von individuellen Cookies durch die Suchmaschine an ihre Benutzer. Offiziell dienen diese Cookies nur dazu, Einstellungen zu speichern; warum dazu automatisch eine für jeden Browser eindeutige und über 30 Jahre gültige Nummer vergeben wird, und dies selbst, wenn keine Einstellungen vorgenommen wurden, will Google nicht klären. Technisch ist es unumstritten einfacher, anstatt der Identifikationsnummer die Einstellungen selbst im Cookie zu speichern. Interessant ist in diesem Zusammenhang, dass eine Möglichkeit, persönliche Einstellungen auch ohne Cookie zu nutzen, kurz nach ihrer Entdeckung durch Google Watch seitens Google wieder abgestellt wurde. Es gibt allerdings die Möglichkeit, diese eindeutige Nummer auf 0 zu setzen.[23]
Es wird deshalb vermutet, dass diese Identifikationsnummer nicht nur den Einstellungen dient, sondern auch dazu, Suchanfragen jedes Benutzers zu protokollieren, zumindest um daraus Rückschlüsse auf Interessengebiete zu ziehen. Erläuterungen in der eigenen Datenschutzrichtlinie sprechen dafür.
Es ist zudem zu vermuten, dass bei einem kurzen Einblenden von Google-Analytics durch eine andere Web-Seite ebenfalls die persönliche IP-Nummer, Computernummer, Herkunftsseite etc. des Nutzers (Log-Files) gespeichert wird, auch wenn man auf die Seite automatisch verwiesen wurde und also Google nicht willentlich angesteuert wurde.
In den Datenschutzbestimmung von Google heißt es zu Log-Files: "Wenn Sie Google-Services nutzen, zeichnen unsere Server automatisch Daten auf, die Ihr Browser verschickt, wenn Sie eine Webseite besuchen. Diese Server-Logdateien können Ihre Webanfrage, die IP-Adresse, den Browsertyp, die Browsersprache, Datum und Uhrzeit Ihrer Anfrage und ein oder mehrere Cookies enthalten, die Ihren Browser eindeutig identifizieren können."
Mit dem Webmaildienst GMail kam weitere Kritik auf. Google hatte angekündigt, die Inhalte der über GMail empfangenen E-Mails zu durchsuchen, in erster Linie um dazu passende Werbung einzublenden. Nachdem dieses Vorhaben sogar unter kalifornischen Abgeordneten auf Ablehnung stieß, rückte Google zumindest offiziell davon wieder ab. Heute liest "GMail" alle Nachrichten um kontextbezogene Werbung einzublenden mit. Google argumentierte, dass "kein Mensch Ihre Mail liest, um Anzeigen oder andere Informationen ohne ihre Zustimmung zu schalten".[24]
Das soziale Netzwerk Orkut steht zu guter Letzt ebenfalls unter argwöhnischer Beobachtung, da jeder Teilnehmer vor Benutzung detaillierte Auskünfte über sich machen muss. Dies ist zwar prinzipbedingt, da andernfalls der Nutzen eines solchen Netzwerks eher gering ist, jedoch wäre Google mit Hilfe aller drei Dienste in der Lage, über einzelne Benutzer genaue Profile zu erstellen und sie somit zum „gläsernen Kunden“ zu machen.
Die Bürgerrechtsgruppe Public Information Research nominierte Google 2003 in den USA für einen „Big Brother Award“ (vgl. zum Thema [25]).
Seit der Übernahme von Doubleclick äußern Datenschützer verstärkt Bedenken, zumal Doubleclick für die Datenschützer ein alter Bekannter ist. [26][27] Da Google den Onlinewerbemarkt mit 80 Prozent Marktanteil beherrscht, ist Google in der Lage, der Spur des Nutzers durch das Netz zu folgen sog. „Behavioral Targeting“. Hat der Nutzer genug Informationen über die eigenen Vorlieben auf seinem Cookie, kann Werbung viel gezielter eingesetzt werden. [28]
Allein die Speicherung und Analyse von personenbezogenen Suchanfragen erlaubt weitreichende Möglichkeiten für die Erstellung von individuellen Nutzerprofilen. „Sage mir, was Du suchst, und ich sage Dir, wer Du bist“. [29]
Google beabsichtigt vermutlich die Analyse des Verhaltens von Spielern in Online-Spielen wie z. B. World of Warcraft oder Second Life, um daraus psychologische Profile der Spieler zu erstellen. Damit ließe sich Werbung gezielter einsetzen. [30]
Experten und Medien warnen vor einer weiteren Aufweichung des Datenschutzes und der Privatsphäre durch Google[31].
„Spinnt man den Gedanken eines Google weiter, das möglichst viele Daten sammelt, und nimmt an, der Suchmaschinenriese würde nicht nur seine Nutzer, sondern alle Surfer ausspionieren wollen, so ergäbe sich eine fast Orwell’sche Vision der totalen Überwachung. Das Erschreckende daran ist, dass auch hierfür viele technische Voraussetzungen bereits existieren. “
– Jo Bager: http://www.heise.de/ct/06/10/168/
Durch die kostenlose zur Verfügungstellung unzähliger Google Softwares ist Google bereits ein riesiger Datensammler geworden, der Daten sammelt, speichert und anschließend analysiert[32].
Nach Angaben von Google-Chef Eric Schmidt plant Google so viele Daten jedes einzelnen Nutzers zu sammeln, dass sogar sehr persönliche Fragen beantwortet werden können, wie z. B. „Welchen Job soll ich machen?“ oder „Womit soll ich mich jetzt beschäftigen?“ Es wird befürchtet, dass bei Umsetzung dieser Vorstellungen Google im Leben eines jeden Menschen künftig eine so zentrale Rolle spielen wird, dass ein Leben ohne Google kaum mehr möglich sein wird.[33]
Im Juni 2007 wurde Google bei einer Untersuchung der Bürgerrechtsorganisation Privacy International (PI) als einzigem von 23 untersuchten Internet-Dienstleistungsunternehmen das Prädikat „datenschutzfeindlich“ verliehen. Google kritisierte PI allerdings wegen eines an der Untersuchung beteiligten Microsoft-Mitarbeiters.[34]
Sehr kritisch wird auch Google Health gesehen, bei dem Nutzer ein Profil ihres Gesundheitszustandes mitsamt Vorerkrankungen, Medikation und Allergien eintragen sollen, um dann zu erfahren, ob es Wechselwirkungen zwischen den Medikamenten gibt oder um die Daten an Gesundheitsdienstleister weiterzugeben. Die Kritik besteht darin, dass ein privates Unternehmen online sehr sensible Daten von seinen Nutzern einholt und speichert. Die Bundesärztekammer warnt davor, dass die Patientendaten kommerziell weiterverwendet werden könnten.[35]
siehe auch: Datenkrake
Monopolstellung
Bei Suchmaschinenanfragen im deutschen Internet besitzt Google bereits einen Marktanteil von 83–90 Prozent [36]. Medienforscher sehen die Meinungsmacht von Google mittlerweile als problematisch an.[37]. Kritiker sprechen bereits von einer zukünftigen Google-Gesellschaft [38]. Googles Expansionsstrategie ähnelt der von Microsoft, nur agiert Google viel schneller [39]. Der Leiter der Pariser Nationalbibliothek sieht mit Google die Hegemonie des Englischen voranschreiten und will, in der Tradition des Gaullismus, eine eigene europäische Suchmaschine Quaero unter staatlicher Kontrolle etablieren. Seine Forderung bezieht sich ausdrücklich nicht nur auf das Buch-Digitalisierungsprojekt Google Book Search, sondern auf das ganze Google-System. Nötig sei ein europäischer Algorithmus. Einer privatwirtschaftlichen Suchmaschine wie Google fehle es vor allem an Dauerhaftigkeit. Das Ranking-System belohne grundsätzlich den Stärkeren gegenüber dem Schwächeren. Google dominiert den Markt für Onlinewerbung mit 80 Prozent Marktanteil [40]. Google dominiert den Markt für Onlinevideos mit 58 Prozent. [41] Erste Forscher verlangen die Zerschlagung von Google.[42]
Gebrauch der Suchmaschine
Benutzung
Neben der einfachen Suche steht noch eine weitere Suchmaske (erweiterte Suche) zur Verfügung, über welche bestimmte Filter angewendet werden können.
Die einfache Suche verwendet bei Eingaben standardmäßig den booleschen Operator „UND“ (Konjunktion: UND, wahlweise auch „+“) beim Eintrag mehrerer Begriffe. Es wird dabei nach allen Dokumenten gesucht, in denen diese Begriffe vorkommen. Gewichtet wird, neben dem Page Rank, meist danach, wo die Begriffe stehen – ob im Titel einer Seite, dem Dokumenten-Namen oder Verzeichnis, einer Überschrift etc.
Neben der booleschen Standardverknüpfung UND kann auch ein boolesches „ODER“ (Disjunktion OR, wahlweise auch „|“) verwendet werden. Suchbeispiel: „Strand OR Beach
“. Google berücksichtigt dabei alle Wörter, die innerhalb einer OR-Kette vorkommen. Hat man mehr als zwei Wörter zur Auswahl, verknüpft man diese also zu „Wort1 OR Wort2 OR Wort3 …
“. Die Verknüpfung mit Klammern funktioniert bei Google nur, wenn die Suchanfrage gegebenenfalls in eine konjunktive Normalform umgeformt wird. Statt z. B. „(auto fahren) OR (flugzeug fliegen)
“ muss „(auto OR flugzeug) (auto OR fliegen) (flugzeug OR fahren) (fahren OR fliegen)
“ eingegeben werden.
Um die Suche weiter einzugrenzen, kann man nach exakten Phrasen suchen. Die Suchbegriffe tauchen dann nicht wahllos im Dokument auf, sondern müssen in einer bestimmten Anordnung vorhanden sein. Exakte Suchphrasen werden mit Anführungszeichen „"…"“ kenntlich gemacht. Suchbeispiel: „"Bearbeiten von Google"
“. Es werden keine Dokumente gesucht, in denen irgendwo das Wort „Bearbeiten“ und irgendwo das Wort „Google“ steht, sondern nur solche, in denen die Wörter in dieser Reihenfolge vorkommen. Wahlweise kann auch für ein Wort ein Platzhalter, kenntlich gemacht durch ein Sternchen „*“, gesetzt werden.
Als weiteres Ausschlusskriterium kann ein Minuszeichen „-“ Verwendung finden. Suchbeispiel: „Hannibal -Lecter
“. Sucht nach einem antiken Feldherrn und schließt aber Seiten aus, in denen der Name in Verbindung mit einer Filmfigur namens „Lecter“ steht.
- Alle diese Funktionen sind über den Link Erweiterte Suche über ein Formular zugänglich. Dort finden sich auch darüberhinausgehende Suchmasken.
Die oft übliche Suche mit Wildcards ist bei Google indes nicht möglich. So wird bei der Suche nach „Googl
*“ nicht nach den Begriffen „Googlin“ oder „Googler“ gesucht, sondern nur nach „Googl“. Die Suche erlaubt eine Abfrage mit bis zu 32 Suchbegriffen (auch als Phrase). Diese Option ist hilfreich für das Suchen nach Dubletten oder Zweitverwertungen eines Textes. Anhand dieser Verknüpfungen (die kombiniert angewendet werden können), sind schon sehr präzise Abfragen möglich. Die Abfrageergebnisse werden umso besser, je intelligenter man Fragen an Google stellt. Fragen nach banalen Suchbegriffen ergeben meist ziemlich dürftige Ergebnisse.
Weitere Funktionen:
- Taschenrechner
- Bei Eingabe einfacher mathematischer Schreibweisen wie z. B. „
2+5(4/5)^8
“ gibt Google standardmäßig keine Seiten aus, in denen diese Formulierung vorkommt, sondern gibt das Ergebnis der Rechnung (= 2.8388608) zurück. - Einheitenrechner
- Man kann auch Einheiten Umrechnen lassen: z. B. „
inch in cm
“, „usd in euro
“, oder auch komplizierter „l/100km in miles/gallon
“ - Rechtschreibprüfung
- Google liefert bei falsch geschriebenen Wörtern einen Vorschlag zur richtigen Schreibweise („Meinten Sie …“). Die Empfehlung beruht auf einem phonetischen, vollautomatisierten Vergleich, was teilweise zu abwegigen Vorschlägen führen kann.
- Zugauskunft
- Gibt man zwei Orte in die Suchleiste ein, schlägt Google einen aktuellen Fahrplan der Deutschen Bahn vor, der die nächsten Zugverbindungen zwischen den Orten anzeigt.
- Kinopläne
- Durch die Eingabe "Kino" und dem entsprechenden Ort erhält man aktuelle Kinopläne aller ortsansässigen Kinos. Es werden dabei Angaben zu Film, Uhrzeiten, FSK und Genre gemacht.
- Wetter
- Ebenso lässt sich auch eine kurze Übersicht zu den Wetterverhältnissen anzeigen. Durch Eingabe von "Wetter" und dem Namen der Stadt erscheint der Wetterbericht für die nächsten 3 Tage.
Erweiterte Benutzung
Es kann zusätzlich zu dieser einfachen Such-Syntax eine erweiterte Syntax in die Suchmaske eingegeben, bzw. größtenteils auch über die „erweiterte Suche“ zusammengeklickt werden. Folgende, teils undokumentierte Schlüsselbegriffe sind derzeit bekannt. Diese Schlüsselbegriffe werden durch einen Doppelpunkt „:“ gekennzeichnet.
- cache: – gibt nur die von Google gespeicherten Seiten aus. Das kann z. B. bei Portalen mit häufig wechselnden Inhalten nützlich sein. Der Link, den man bei Google findet, führt manchmal auf eine Seite, deren Inhalte sich inzwischen geändert haben oder gar gelöscht wurden. Die Inhalte sind aber über einen bestimmten Zeitraum noch bei Google gespeichert und können dort gelesen werden.
- define: – Durchsucht Internet-Enzyklopädien wie Wikipedia und andere nach einer Definition des Suchbegriffes.
- filetype: oder ext: – Sucht nach Dokumenten, mit bestimmten Dateiendungen. Beispiel: geschäftsbericht filetype:xls . Möglich sind grundsätzlich alle Dateiendungen. Google kann derzeit aber nur in folgende Formate „reinschauen“: PS, PDF, AI, DOC, PPT, XLS, SWF, sowie alle textbasierten Dateien wie RTF, TXT, ASP, PHP, CGI, HTML, LOG, INI, JS usw.
- inanchor: – Sucht nach den Begriffen nur in Links. Oftmals führt ein Link mit einer bestimmten Bezeichnung präziser zu einem Ziel, als wenn die Bezeichnung irgendwo im Text vorkommt.
- inurl: – gibt Seiten zurück, bei denen der Suchbegriff in der URL auftaucht. Beispiel: „Max Mustermann“ inurl:impressum
- intitle: – Sucht nach Dokumenten, bei denen der oder die Suchbegriffe nur im Titel der Datei vorkommen. Beispiel: intitle:„Bearbeiten von Google“
- intext: – Sucht nach Dokumenten, bei denen der oder die Suchbegriffe nur im Text der Datei vorkommen. Beispiel: intext:„Bearbeiten von Google“
- link: – Gibt alle Seiten aus, die auf eine bestimmte Seite verlinken. Beispiel: link:wikipedia.org . Diese Ausgabe kann etwa wichtig sein, um den Page Rank zu optimieren oder verwandte Seiten zu finden.
- site: – mit diesem Schlüsselbegriff lässt sich die Suche auf eine bestimmte Domain eingrenzen, was praktisch ist, falls eine Homepage keine eigene Suchfunktion hat (z. B. Desoxyribonukleinsäure site:de.wikipedia.org) oder zur schnellen Suche innerhalb einer Top Level Domain (z. B. [43]).
- related: – sucht nach ähnlichen Seiten (z. B. related:de.wikipedia.org)
Die angewendeten Suchformeln lassen sich auch in Form der URL, die Google bei einer Suche ausgibt, speichern bzw. wiederholen und verlinken. Weitere Funktionen bieten die zusätzlichen Google-Funktionen [44].
Einbettungen der Google-Suche
- Die Google-Suche lässt sich über vorgefertigte Code-Fragmente in eine Webseite einbinden [45]
- Browser-Plugins:
- Die Google-Toolbar ist für die Webbrowser Internet Explorer und Mozilla Firefox verfügbar.
- Für Mozilla, Opera und Konqueror stehen spezielle search-plugins für die Einbettung in vorhandene Suchleisten zur Verfügung, auch für die Kontext-sensitive Verwendung.
- Einbettungen gibt es auch für Textverarbeitungsprogramme wie StarOffice / OpenOffice.org.
- Viele andere Webdienste wie Toogle nutzen Google Search
Das Google-Logo
Zu besonderen Anlässen, wie dem Earth Day oder dem Flug des Montgolfière, wird das Google-Logo entsprechend angepasst. Diese themenbasierenden Logos werden auch Google Doodle (engl. Gekritzel) genannt. Zusätzlich ist das Logo, statt mit der Google Homepage, mit einer Suchanfrage mit den entsprechenden Thema als Suchtitel verlinkt. Zur EM 2008 veranstaltet Google in Deutschland einen Wettbewerb namens Doodle4Google, bei dem Kinder im Alter von 5 bis 18 aufgerufen wurden ein Logo zur EM zu gestalten. Das Gewinnerlogo wird am Tag des EM-Finales auf der deutschen Google-Startseite gezeigt. In anderen Ländern gibt es ähnliche Wettbewerbe.
Siehe auch
Literatur
- Tara Calishain, Rael Dornfest: Google Hacks, O’Reilly Verlag, Beijing (u. a.) 2003, ISBN 3-89721-362-1
- Anja Sauerwalda,Michael Weckerlin: Google-Suche & Google Earth, Knowware-Verlag, 2007
- David Vise, Mark Malseed: The Google Story, Delacorte Press, 2005, ISBN 0-553-80457-X (englisch), auch als Hörbuch
- Gerald Reischl: Die Google-Falle. Die unkontrollierte Weltmacht im Internet (Gebundene Ausgabe). Wien: Carl Ueberreuter Verlag, März 2008. ISBN 3-80007-323-4
Weblinks
Offizielle Seiten
- Google, Google Deutschland, Google Österreich, Google Schweiz, Google Liechtenstein, Google Belgien, Google Luxemburg
- Google.org
- Offizieller Google-Blog (englisch)
Artikel über Google
- Artikel zu Google und Anwendungen bei Dr. Web
- Aktuelle Kritik
- Aktuelle Nachrichten bezüglich Google im Googlewatchblog
Presseberichte
- „Die Welt ist keineswegs alles, was Google auflistet“, Telepolis, 25. Oktober 2002
- „Google: Der alleswissende Gigant“, tagesschau, 26. Januar 2006
- „Weltmacht Google“ stern, 22. Mai 2006, Dossier
- „Internet: Die wachsende Macht der Suchmaschinen“, FAZ, 28. Juni 2006
- „Hermann Maurer vs. Google“, ORF, futurezone.ORF.at, 03. Dezember 2007
- „Die Google-Falle“, ORF, 16. März 2008
- „neues.Spezial: Die Welt ist eine Google!“, 3sat, 30. März 2008
Quellenangaben
- ↑ http://www.pressetext.com/pte.mc?pte=071213026
- ↑ Die teuersten Marken der Welt. 2. Teil: Die komplette Rangliste – was die Top-100-Marken wert sind. Auf: Spiegel Online, 21. April 2008.
- ↑ Der Triumph der grossen Zahl. Neue Zürcher Zeitung (2008-04-25). Gefunden am 2008-05-06.
- ↑ Google Corporate Information: Google Milestones. ([1] ; Stand: 2008-02-08).
- ↑ Peter Zschunke: Googeln im neuen Duden. Artikel bei Stern.de http://www.stern.de/computer-technik/computer/?id=529233 Abgerufen am 7. Februar 2007
- ↑
Wiktionary: googeln – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen und Grammatik
- ↑ LEO D-E Ergebnisse für "google". ([2] ; Stand: 2008-02-08).
- ↑ Nie mehr "googeln? - NachrichtenWebwelt - WELT ONLINE. ([3] ; Stand: 2008-02-08).
- ↑ Susan Kuchinskas: Peeking Into Google. Artikel, 2. März 2005, Internet News http://www.internetnews.com/xSP/article.php/3487041 Abgerufen am 7. Februar 2007.
- ↑ Internet Archive Wayback Machine: Eintrag http://google.com. ([4] ; Stand: 2008-02-08).
- ↑ Elinor Mills: Google to Yahoo: Ours is bigger. 26. September 2005. Englisch. http://news.com.com/Google+touts+size+of+its+search+index/2100-1038_3-5883345.html
- ↑ Indexgröße „mehr als 8 Milliarden Webseiten“, vgl. Weitere Google-Produkte. ([5] ; Stand: 2008-02-08).
- ↑ Google-Suche: miserable failure. ([6] ; Stand: 2008-02-08).
- ↑ Matt Cutts: SEO Mistakes: Spam in other languages. ([7] ; Stand: 2008-02-08).
- ↑ a b Google setzt BMW vor die Tür - Golem.de. ([8] ; Stand: 2008-02-08).
- ↑ Google findet bmw.de wieder - Golem.de. ([9] ; Stand: 2008-02-08).
- ↑ Digital Millennium Copyright Act (DMCA) - Benachrichtigung über eine Urheberrechtsverletzung in der Websuche und allen anderen Produkten. ([10] ; Stand: 2008-02-08).
- ↑ heise online - Google zensiert seine neue chinesische Suchmaschine [Update]. ([11] ; Stand: 2008-02-08).
- ↑ International Campaign for Tibet Deutschland e.V.: Pressemitteilung: Google unterwirft sich Diktat Pekings. ([12] ; Stand: 2008-02-08).
- ↑ Andrew McLaughlin: Official Google Blog: Google in China. ([13] ; Stand: 2008-02-08).
- ↑ Leipziger Messe hat Ärger mit Google - Golem.de. ([14] ; Stand: 2008-02-08).
- ↑ Frank Patalong: Was Google nicht zeigt: Das zensierte Weltauge. In: SPIEGEL ONLINE. ([15] ; Stand: 2008-02-08).
- ↑ Stefans Netzplatz: Googles Cookies anonymisieren. ([16] ; Stand: 2008-02-08).
- ↑ heise online - Bei jeder Mail wird mitgelesen. ([17] ; Stand: 2004-04-02).
- ↑ Adam Liptak: In Case About Google's Secrets, Yours Are Safe. In: New York Times. ([18] ; Stand: 2008-02-08).
- ↑ heise online - DoubleClick zieht den Schwanz ein. ([19] ; Stand: 2008-02-08).
- ↑ heise online - Datenschutz als "riesiges Problem" bei Suchmaschinen. ([20] ; Stand: 2008-02-08).
- ↑ heise online - Google sieht kein Datenschutzproblem durch DoubleClick-Übernahme. ([21] ; Stand: 2008-02-08).
- ↑ heise online - Internet-Suchmaschinen als Datensammler für Strafverfolger und Wirtschaft. ([22] ; Stand: 2008-02-08).
- ↑ heise online - Google will aus Online-Spielen psychologische Profile erstellen. ([23] ; Stand: 2008-02-08).
- ↑ Joerg Heidrich: Ausgeplaudert und ausgewertet, Datenschutzrecht, c't 07, 2006, S. 192..
- ↑ Google Datenschutzerklärung , 27. April 2008
- ↑ Zukunftsvision: Menschen brauchen Google zum Leben - Golem.de. ([24] ; Stand: 2008-02-08).
- ↑ Vgl. privacyinternational.org: Liste der Ergebnisse der Untersuchung von PI als PDF-Datei. Dazu die Medienberichte von heise online - Bürgerrechtler verlangen von Google besseren Datenschutz. ([25] ; Stand: 2008-02-08). und Scharfe Kritik an mangelhaftem Datenschutz bei Google - Golem.de. ([26] ; Stand: 2008-02-08)..
- ↑ heise.de: Google Health ist online
- ↑ webhits.de: Marktanteil von Google bei Suchmaschinenanfragen in Deutschland; heise.de: Google in Deutschland über 90 Prozent; Mario Sixtus: Jenseits von gut und böse. In: c't, 2. Mai 2006.
- ↑ http://www.heise.de/newsticker/result.xhtml?url=/newsticker/meldung/65485
- ↑ http://www.heise.de/newsticker/meldung/59709
- ↑ http://www.heise.de/ct/06/10/162/
- ↑ spiegel.de: „Google und DoubleClick würden zusammen mehr als 80 Prozent der Werbung umschlagen, die ein Internet-Nutzer sieht, wenn er eine Website ansteuert, argumentierten sie.“
- ↑ tagesschau.de: „Den Marktanteil von YouTube beziffert das Internet-Marktforschungsunternehmen HitWise mit 47 Prozent. (…) und das Google-Videoangebot mit elf Prozent Marktanteil.“
- ↑ heise.de: Forschungsreport: Google muss zerschlagen werden
- ↑ http://www.google.de/search?hl=de&q=bundeskanzlerin+site%3Acom&meta= Bundeskanzlerin site:com
- ↑ Google-Funktionen: Übersicht http://www.google.at/intl/de/features.html
- ↑ Google-Link: http://www.google.at/intl/de/searchcode.html
Suchen: (PageRank) • Books • Desktop • Produkte • Maps • Scholar • Groups • Web
Werbung: AdSense • AdWords • Analytics • Click-to-Call • DoubleClick
Kommunikation und Publishing: App Engine • Blogger • iGoogle • Kalender • Text & Tabellen • Gmail • Groups • Health • orkut • Panoramio • Reader • YouTube
Software: Browser Sync • Desktop • Earth • Gears • Pack • Picasa • SketchUp • Talk • Toolbar • Updater