26.05.2008: Hat Reuters die Suchmaschine?
Von: Klaus-Peter Frahm
Als Reuters vor ziemlich genau einen Jahr ClearForest (macht in Texterkennungssoftware) gekauft hat, war das keine weltbewegende Neuigkeit. Offenbar sollte damit Knowhow eingekauft werden, um den Riesenberg von Reuters- und Factiva-Inhalten (Edit: Factiva gehört ja schon lange gar nicht mehr zu Reuters) systematisch zu erschließen und nutzbar zu machen. Macht ja auch absolut Sinn, und früher oder später beschäftigt sich jedes Medienunternehmen mit dieser Aufgabe.
Als dann wenig später der Webservice OpenCalais angekündigt und schließlich zur kostenfreien Nutzung für jedermann freigegeben wurde, bekam die Sache einen etwas anderen Drall. Wie ein Riesenstaubsauger zieht Reuters seither die Inhalte unzähliger Quellen, darunter klassische Medien genauso wie Blogs, in seine Datencenter - und gibt diese nicht nur sauber strukturiert an die Einsender zurück, sondern legt sie vermutlich auch entsprechend in einem eigenen Index ab.
Was man damit alles machen kann ....
Ein Hinweis darauf, welches Potenzial darin steckt, liefern u.a. die (lustigerweis inzwischen komplett umformulierten) AGB von OpenCalais:
"We may build a search capability in the future. This capability would allow users to search the metadata repository and receive back a list of entries that match that search criteria. Unless you have authorized it via an API parameter, this list would not include the original metadata contained in the document but would expose the URL and description of the original document if you have provided it to us. If you do not want your content included in the search functionality you should indicate so in the appropriate area of the API. If you want to maximize the exposure of your content on the web you should not opt out of inclusion in the search functionality."
Für mich klingt das wie der kluge und systematische Aufbau einer (zunächst englischsprachigen) Suchmaschine, die komplett auf den Prinzipien des Semantic Web basiert und wahrscheinlich nicht nur allerbeste Ergebnisse liefern wird, sondern diese auf völlig neue und sinnvolle Art und Weise navigierbar macht. Ich bin wirklich gespannt, was da passiert in den nächsten Wochen und Monaten ...
via
Als dann wenig später der Webservice OpenCalais angekündigt und schließlich zur kostenfreien Nutzung für jedermann freigegeben wurde, bekam die Sache einen etwas anderen Drall. Wie ein Riesenstaubsauger zieht Reuters seither die Inhalte unzähliger Quellen, darunter klassische Medien genauso wie Blogs, in seine Datencenter - und gibt diese nicht nur sauber strukturiert an die Einsender zurück, sondern legt sie vermutlich auch entsprechend in einem eigenen Index ab.
Was man damit alles machen kann ....
Ein Hinweis darauf, welches Potenzial darin steckt, liefern u.a. die (lustigerweis inzwischen komplett umformulierten) AGB von OpenCalais:
"We may build a search capability in the future. This capability would allow users to search the metadata repository and receive back a list of entries that match that search criteria. Unless you have authorized it via an API parameter, this list would not include the original metadata contained in the document but would expose the URL and description of the original document if you have provided it to us. If you do not want your content included in the search functionality you should indicate so in the appropriate area of the API. If you want to maximize the exposure of your content on the web you should not opt out of inclusion in the search functionality."
Für mich klingt das wie der kluge und systematische Aufbau einer (zunächst englischsprachigen) Suchmaschine, die komplett auf den Prinzipien des Semantic Web basiert und wahrscheinlich nicht nur allerbeste Ergebnisse liefern wird, sondern diese auf völlig neue und sinnvolle Art und Weise navigierbar macht. Ich bin wirklich gespannt, was da passiert in den nächsten Wochen und Monaten ...
via






