Pages

samedi 16 février 2008

Open Calais : Reuters nous rapproche du Web sémantique

Open Calais : Reuters nous rapproche du Web sémantique

[MàJ - 20 février 2008] « Les autorités européenne et américaine de la concurrence ont donné, mardi 19 février, leur accord sous conditions à l'acquisition du groupe britannique Reuters, connu comme une des principales agences de presse, par le canadien Thomson Corporation, actif sur les marchés de l'analyse juridique, fiscale et comptable. Le nouveau groupe sera l'un des plus grands fournisseurs mondiaux d'informations et de données. » (source : Le Monde)

Le 8 février, Devin Wenig annonçait à Tim O'Reilly que l'avenir de son groupe, Reuters, passait par le Web sémantique (ou Web 3.0 ?). Le lancement d'Open Calais a suivi cette interview de quelques jours.


En fait, il s'agit d'un service Web (technologie ClearForest, voir ici) capable de rattacher automatiquement au contenu que vous soumettez des métadonnées sémantiquement riches, en catégorisant et en liant vos documents à des entités (des gens, des lieux, des organisations, etc.), des faits (‘X’ travaille pour la société ‘Y’) et des événements (‘X’ a été nommé PDG de la société ‘Y’ le jour ‘J’). Ces métadonnées sont ensuite stockées dans une archive centralisée et vous sont retournées sous forme de modèle RDF accompagné d'un identifiant unique (GUID : Globally Unique Identifier).
The Calais web service automatically attaches rich semantic metadata to the content you submit – in well under a second. Using natural language processing, machine learning and other methods, Calais categorizes and links your document with entities (people, places, organizations, etc.), facts (person ‘x’ works for company ‘y’), and events (person ‘z’ was appointed chairman of company ‘y’ on date ‘x’). The metadata results are stored centrally and returned to you as industry-standard RDF constructs accompanied by a Globally Unique Identifier (GUID).
Le tout de manière transparente (sans privilégier d'approche top-down ou bottom-up) et simple (les modèles RDF sont créés à la volée), voir la FAQ et un peu de documentation.

L'API est également décrite ici. J'ai l'impression qu'à peine lancé, le concept jouit déjà d'un retour fortement positif, avec un premier client SOAP qui a déjà vu le jour, un module Drupal, et combien d'autres applications à venir ? Y aura-t-il des connexions possibles avec Twine, c'est également probable.

En tout cas, cela pourrait bien marquer un tournant dans la transition du Web actuel vers le Web 3.0... Alors, est-ce la fin du Web 2.0 ? (petit clin d'œil au passage ;-)

Source. À noter que Reuters offre 5000 $ à qui développera un plugin pour Wordpress via son Bounty Program...


Partager sur Facebook

, , , , , ,

1 commentaire:

Anonyme a dit…

Bonjour,

J'ai eu la chance de pouvoir tester OpenCalais. J'ai créé un site de News oragnisé autour de l'aspect sémantique.
Les news sont classées grâce à OpenCalais, les entités sont extraites et je fait aussi appel à quelques APIs afin d'afficher un contexte pertinent sur la page de news finale.(Wikipedia, Flickr, twitter, delicious...)

Ca me semble pouvoir intéresser pas mal de gens car la news est ainsi mise en valeur et contient plus de sens et d'infos connexes

Rendez-vous sur :
www.klezio.com

Salutations,
Pierre