Wieso erkennt Google eigentlich keine ähnlichen Dokumente?


Firmen wie Apple oder Microsoft generieren bei neuen Produkt-Releasen einigen Hype in der Online Welt. Es kann also durchaus vorkommen, dass eine neue Meldung auf hundert unterschiedlichen Seiten erscheinen kann, immer wieder leicht anders interpretiert. Dies geschieht allerdings ohne eine wirkliche Mehr-Information für den Benutzer.

Ein Beispiel: Vor der WWDC von Apple anfangs Juni machte das Gerücht die Runde, dass die Keynote-Speech von Steve Jobs aufgetaucht sei. Ich habe diverse RSS abonniert und konnte dieses Gerücht auf mindestens 10 unterschiedlichen Websites nachlesen. Dies generiert auch sehr sehr viele Links bei Google, alle mit der gleichen Information.

Mit der Ähnlichkeitssuche von IC kann der User die Dokumente mit ähnlichem Inhalt entsprechend gruppieren, erhält eine viel bessere Übersicht und weniger Links von Google. Die Verwirrung des Users ist bedeutend kleiner und der Zeitgewinn für die Informations-Recherche bedeutend grösser.

Heat-Map einer Such-Kollektion

Dies ist die Heat-Mat einer Such-Kollektion, gruppiert nach thematischem Inhalt. Inhaltlich ähnliche Dokumente werden gruppiert und nahe beieinander dargestellt.

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s