Affichage des articles dont le libellé est Google. Afficher tous les articles
Affichage des articles dont le libellé est Google. Afficher tous les articles

lundi 3 février 2014

Google, producteur de contenu(s)

Depuis la création de Google, sa mission revendiquée consiste à « organiser les informations à l’échelle mondiale dans le but de les rendre accessibles et utiles à tous. »

Ce qui s'est traduit pendant longtemps par la fameuse page de résultats aux dix petits liens bleus. Mais les choses changent !

D'abord on est passés à la recherche universelle, intégrant images, vidéos, infos, shopping, temps réel, réseaux sociaux, etc., pour en arriver en 2012 à la mise en oeuvre du graphe de la connaissance, qui devrait aider « à découvrir de nouvelles informations rapidement et simplement. »

Par contre le problème pour les millions de producteurs de contenus "maison" qui peuplent le Web, c'est qu'aujourd'hui les utilisateurs découvrent certes « de nouvelles informations rapidement et simplement », mais de plus en plus ça se fait directement chez Google, sans plus passer par la case "autres sites" !


On voit bien cette évolution sur le graphique ci-dessus, puisqu'en 2014 la partie droite de la page de Google pourrait bien contenir l'info que vous cherchez, avec plein de liens qui tous renvoient chez, devinez un peu ... Google !

Cela veut dire que l'internaute a de fortes chances de n'aller pas plus loin que la première page de résultats du moteur, voire de cliquer pour aller visiter d'autres pages de Google, encore Google, et toujours Google !

J'ai vu passer avant-hier un tweet de Jason Calacanis en pleine conversation avec Danny Sullivan :

But @mattcutts should admit google's plan is to replace all content providers.
« Matt Cutts devrait bien admettre que le projet de Google, c'est de remplacer tous les fournisseurs/producteurs de contenu ! » La conversation entre Calacanis et Sullivan porte d'ailleurs sur ce sujet précis...

Qu'on se le dise ! Or comme l'avouait fort justement ce même Danny Sullivan dès 2012 :
Google as a publisher and content broker raises a number of issues.
Oui, ça pose problème, en effet. Surtout que ça ne concerne pas que le contenu "texte", mais aussi vidéo et ainsi de suite, inutile d'en dresser la liste ici. Assez en tout cas pour que l'Union européenne s'en inquiète, au point de pousser Google à donner « suffisamment de garanties pour faire de la place à ses concurrents, plutôt qu'à ses propres services, sur ses plateformes de recherche. Faute de quoi, M. Almunia pourrait décider de sanctions financières... »

Sauf que là les concurrents de l'Ogre, ce sont vous et moi ! Ou le référenceur du coin qui fait ce qu'il peut pour positionner le mieux possible les sites de ses clients, à qui Google explique comment il doit faire (en plus, et qui le récompense en remplaçant ses mots clés référents par un laconique "not provided" !), pour se faire souffler la place à l'arrivée par ... Google ! Un peu comme si Google voulait implicitement faire passer le message que, pour se positionner en première page de résultats, le meilleur moyen - si ce n'est le seul -, c'est d'acheter de l'Adwords ou sur Shopping...


C'est tout cadeau ! Du reste, Google a beau sanctionner les réseaux de liens, n'est-il pas lui-même le premier réseau de liens planétaire, merveilleusement construit avec le contenu des autres ?

"Conflit d'intérêts" (qui va d'ailleurs souvent de pair avec "abus de position dominante"), on appelle ça dans la finance. Ce n'est pas pour rien que dans sa transmutation permanente, Google transforme le web en or : sauf que les pépites, c'est lui qui les ramasse.

C'est encore, plus récemment, l'arrivée d'Hummingbird : rapide et précis ! Normal, avec tout ce que Google profileur en série sait sur nous depuis longtemps, facile de nous servir selon nos goûts ;-)

Vu où en sont les choses, l'utilisateur peut-il aujourd'hui encore inverser la traîne ? Rien de moins sûr. Donc Google fournisseur-producteur de contenu(s), pourquoi pas, mais si c'est pour phagocyter le Web, à quoi bon ?

Selon vous ?



vendredi 24 juin 2011

Yahoo! No mission, no vision!

Updated / 2015, July 31 - Yahoo's Mission

* * *
Updated / 2012, August 9 - Will Marissa Mayer be able to fix Yahoo!?

* * *
Updated / 2011, June 24 - (first version was posted on 2010, March 1st)

«Most importantly, Yahoo hasn’t been able to create growth or articulate a clear vision for substantive growth

Ben Parr, The Battle for Yahoo’s Future (Mashable)

* * *
Generally, ONE Company has got ONE core mission :
But things sound a little bit different when it comes to Yahoo!


Since 1996, Yahoo! seems to never agree with ... Yahoo! Let's see what Yahoo! said about Yahoo!

1996, Dec.
Yahoo! Inc. (NASDAQ: YHOO), offers a globally-branded Internet navigational service to information and entertainment on the Web. As the first online guide to the Web, Yahoo! is one of the most visible and recognizable names associated with the Internet. Yahoo! provides a context-based directory structure for Internet resources, as well as integrated AltaVista Web-wide search capabilities. The Company is continuing to develop a global family of Yahoo!-branded media properties for targeted geographic areas (Yahoo! Japan, UK, France, Germany, Canada, San Francisco Bay Area, Los Angeles, New York, Chicago, Washington DC, Boston); interests (Yahoo! Internet Life magazine and website and MTV/Yahoo!'s online music guide); and demographic audiences (Yahooligans!, a Web guide for kids and a women's-oriented service with Women's Wire). Yahoo! can be found on the web at www.yahoo.com. Yahoo! Inc. headquarters are in Santa Clara, California.

1997, Dec.
Yahoo! Inc. (NASDAQ:YHOO) is a global Internet media company that offers a network of branded Web programming that serves millions of users daily. As the first online navigational guide to the Web, www.yahoo.com is the single largest guide in terms of traffic, advertising, household and business user reach, and is one of the most recognized brands associated with the Internet. Yahoo! Inc. provides targeted Internet resources and communications services for a broad range of audiences, based on demographic, key-subject and geographic interests. Yahoo! is headquartered in Santa Clara, Calif.

1998, Dec.
Yahoo! Inc. is a global Internet media company that offers a branded network of comprehensive information, communication and shopping services to millions of users daily. As the first online navigational guide to the Web, www.yahoo.com is a leading guide in terms of traffic, advertising, household and business user reach, and is one of the most recognized brands associated with the Internet. The company has 15 international Web properties outside the United States. Yahoo! has offices in Europe, the Asia Pacific and Canada and is headquartered in Santa Clara, Calif.

1999, Dec.
Yahoo! Inc. (Nasdaq: YHOO) is a global Internet media company that offers a branded network of media, commerce, and communication services to more than 100 million users worldwide. As the first online navigational guide to the Web, www.yahoo.com is the leading guide in terms of traffic, advertising, household and business user reach, and is one of the most recognized brands associated with the Internet. The company also provides online business services designed to enhance Yahoo!'s clients' Web services, including audio and video streaming, store hosting and management, and Web site tools and services. The company's global Web network includes 21 World properties. Yahoo! has offices in Europe, the Asia Pacific, Latin America, Canada and the United States, and is headquartered in Santa Clara, Calif.

2000, Dec.
Yahoo! Inc. is a global Internet communications, commerce and media company that offers a comprehensive branded network of services to more than 166 million individuals each month worldwide. As the first online navigational guide to the Web, www.yahoo.com is the leading guide in terms of traffic, advertising, household and business user reach, and is one of the most recognized brands associated with the Internet. The company also provides online business services designed to enhance the Web presence of Yahoo!'s clients, including audio and video streaming, store hosting and management, and Web site tools and services. The company's global Web network includes 25 local World properties outside the United States. Yahoo! has offices in Europe, the Asia Pacific, Latin America, Canada and the United States, and is headquartered in Santa Clara, Calif.

2001, Dec.
Yahoo! Inc. is a leading global Internet communications, commerce and media company that offers a comprehensive branded network of services to more than 218 million individuals each month worldwide. As the first online navigational guide to the Web, www.yahoo.com is the leading guide in terms of traffic, advertising, household and business user reach. Yahoo! is the No. 1 Internet brand globally and reaches the largest audience worldwide. Through the Yahoo! Enterprise Solutions division, the company also provides online business and enterprise services designed to enhance the productivity and Web presence of Yahoo!'s clients. The company's global Web network includes 24 World properties. Headquartered in Sunnyvale, Yahoo! has offices in Europe, Asia, Latin America, Australia, Canada and the United States.

2002, Nov.
Yahoo! Inc. is a leading provider of comprehensive online products and services to consumers and businesses worldwide. Yahoo! reaches more than 237 million individuals worldwide each month, and is the No. 1 Internet brand globally. Headquartered in Sunnyvale, Calif., Yahoo!'s global network includes 25 World properties and is available in 13 languages.

2002, Dec.
Yahoo! Inc. is a leading provider of comprehensive online products and services to consumers and businesses worldwide and is the No. 1 Internet brand globally. Headquartered in Sunnyvale, Calif., Yahoo!'s global network includes 25 World properties and is available in 13 languages.

2003, Dec. / 2004, Dec.
Yahoo! Inc. is a leading provider of comprehensive online products and services to consumers and businesses worldwide. Yahoo! is the No. 1 Internet brand globally and the most trafficked Internet destination worldwide. Headquartered in Sunnyvale, Calif., Yahoo!'s global network includes 25 world properties and is available in 13 languages.

2005, Dec. / till 2006, Dec. 14
Yahoo! Inc. is a leading global Internet brand and one of the most trafficked Internet destinations worldwide. Yahoo! seeks to provide online products and services essential to users' lives, and offers a full range of tools and marketing solutions for businesses to connect with Internet users around the world. Yahoo! is headquartered in Sunnyvale, California.

2006, Dec. 18 / For the first time in the Yahoo! history appears the word "MISSION":
Yahoo! Inc. is a leading global Internet brand and one of the most trafficked Internet destinations worldwide. Yahoo!'s mission is to connect people to their passions, their communities, and the world's knowledge. Yahoo! is headquartered in Sunnyvale, California.
Ten years after the beginning, Yahoo! is to consider Mission as a strategy, with a long blog post by Jeff Weiner!

Less than a year later, five month after the breaking news, no mission anymore!

2007, Oct. 16

Yahoo! Inc. is a leading global Internet brand and one of the most trafficked Internet destinations worldwide. Yahoo! is focused on powering its communities of users, advertisers, publishers, and developers by creating indispensable experiences built on trust. Yahoo! is headquartered in Sunnyvale, California. For more information, visit pressroom.yahoo.com or the company's blog, Yodel Anecdotal.

2008, Dec. / till 2009, July 7
Yahoo! Inc. is a leading global Internet brand and one of the most trafficked Internet destinations worldwide. Yahoo! is focused on powering its communities of users, advertisers, publishers, and developers by creating indispensable experiences built on trust. Yahoo! is headquartered in Sunnyvale, California. For more information, visit pressroom.yahoo.com.

2009, July 21
Yahoo! Inc. is a leading global consumer brand and one of the most trafficked Internet destinations worldwide. Yahoo! is where millions of people go every day to see what is happening with the people and things that matter to them most. Yahoo! helps marketers reach that audience with its unique and compelling advertiser proposition. Yahoo! is headquartered in Sunnyvale, California. For more information, visit http://pressroom.yahoo.com or the company's blog, Yodel Anecdotal (http://yodel.yahoo.com).

2009, Sept. 22, change again: for the first time in the Yahoo! history appears the word "VISION"!
Yahoo! attracts hundreds of millions of users every month through its innovative technology and engaging content and services, making it one of the most trafficked Internet destinations and a world class online media company. Yahoo!'s vision is to be the center of people's online lives by delivering personally relevant, meaningful Internet experiences. Yahoo! is headquartered in Sunnyvale, California. For more information, visithttp://pressroom.yahoo.com or the company's blog, Yodel Anecdotal (http://yodel.yahoo.com).

2009, Dec. / The Vision first!
Yahoo!'s vision is to be the center of people's online lives by delivering personally relevant, meaningful Internet experiences. Yahoo! attracts hundreds of millions of users every month through its engaging content and services and innovative technology, making it one of the most trafficked Internet destinations and a world-class online media company. Yahoo! is headquartered in Sunnyvale, California. For more information, visitpressroom.yahoo.com or the company's blog, Yodel Anecdotal (yodel.yahoo.com).

2010, Feb. 24 / Another change!
Yahoo! attracts hundreds of millions of users every month through its innovative technology and engaging content and services, making it one of the most trafficked Internet destinations and a world class online media company. Yahoo!'s vision is to be the center of people's online lives by delivering personally relevant, meaningful Internet experiences. Yahoo! is headquartered in Sunnyvale, California. For more information, visithttp://pressroom.yahoo.com or the company's blog, Yodel Anecdotal (http://yodel.yahoo.com).

One year later: 2011, Feb. 23 / Change again!
Yahoo! (NASDAQ:YHOO) is the premier digital media company, creating deeply personal digital experiences that keep more than half a billion people connected to what matters most to them, across devices and around the globe. That's how we deliver your world, your way. And Yahoo!'s unique combination of Science + Art + Scale connects advertisers to the consumers who build their businesses. For more information, visit the pressroom (pressroom.yahoo.com) or the company's blog, Yodel Anecdotal (http://ycorpblog.com/).

Two months later: 2011, April 25 / Yet another change:
Yahoo! (NASDAQ:YHOO) is the premier digital media company, creating deeply personal digital experiences that keep more than half a billion people connected to what matters most to them, across devices and around the globe.

That's how we deliver your world, your way
. And Yahoo!'s unique combination of Science + Art + Scale connects advertisers to the consumers who build their businesses. Yahoo! is headquartered in Sunnyvale, California. For more information, visit the pressroom (pressroom.yahoo.com) or the company's blog, Yodel Anecdotal (http://ycorpblog.com/).

Next to come will be ... the twentieth!

During all these years, they changed more than once a year, but mission was cited only one time, and vision three times (see white arrows):


Just one conclusion, written by David Berkowitz two years ago:
It's hard figuring out exactly what Yahoo's mission is, but it uses the word community on its site a lot...

Facebook also got an evolution of his mission statement, but in case of Yahoo! I can see only a big confusion...

Too much missions & visions just means no mission, no vision at all...

Even if Yahoo! himself doesn't agree with my conclusion:


- “Does Yahoo! have a mission or vision statement?”

- “Yahoo! is the premier digital media company.

Yahoo! creates deeply personal digital experiences that keep more than half a billion people connected to what matters most to them, across devices and around the globe. That's how we deliver your world, your way. And Yahoo!'s unique combination of Science + Art + Scale connects advertisers to the consumers who build their businesses.”
A statement which differs from what we can read on last press releases, or going back in time & space:

- “Does Yahoo! have a mission or vision statement?”

- “Yahoo! Powers and delights our communities of users, advertisers, and publishers, -- all of us united in creating indispensible experiences and fueled by trust.”
Why not, To be the most useful service on Earth?

Indeed, what a mess, Yahoo!


Would it change something if Yahoo buy AOL for his 15th Birthday?



Partager sur Facebook

P.S. It's quite strange - or not? - to read in the Mashable's post by Ben Parr that (a)lmost half of its market value is derived from its 40% stake in Alibaba, the China Internet giant with a market cap of approximately $8 billion.

But why is't so strange? Simply because Alibaba's CEO, Jack Ma, invests most of his time in three areas: vision/ mission/strategy, customers, and employees... (b)y clearly articulating and constantly communicating the vision and mission of the company, he creates the most important foundation in attracting outstanding talent:

Probably Jack Ma should run Yahoo!...

, , , ,

jeudi 24 mars 2011

Demand Media Infographic

Après mon premier billet sur l'introduction en bourse de Demand Media, voici une infographie intéressante :


[Source: OnlineMBA.com]


Partager sur Facebook

, , , , , , , , ,

lundi 9 août 2010

Demand Media : introduction en bourse !


Enfin du nouveau dans le petit monde d'Internet : créée en 2006, la société Demand Media, qui totalise déjà 52 millions de dollars de pertes depuis sa création, vient de déposer son dossier d'introduction en bourse, IPO pour les intimes...

Je trouve ça très intéressant, d'abord parce que le document est bourré d'infos qu'une société communique rarement, et ensuite, indépendamment des doutes que je peux nourrir sur la question, parce que sa "mission" est pour le moins originale :
Our mission is to fulfill the world's demand for commercially valuable content.
Satisfaire la demande mondiale en contenu commercial de valeur. Autrement dit monétisable. Et pour ça, la seule professionnalisation du contenu ne suffit plus, ce qu'il faut c'est l'industrialisation de la création production de contenu sur Internet !

Ainsi, au deuxième trimestre 2010, le "content studio" de Demand Media a fédéré plus de 10 000 "créateurs de contenu freelances", qui ont généré en moyenne plus de 5 700 articles de texte et de clips vidéos par jour (Demand Media est le premier contributeur de vidéos sur YouTube, avec plus de 1,5 milliard de visualisations au 30 juin 2010), ce qui fait probablement de la société « l'un des producteurs de contenu professionnel en ligne les plus prolifiques au monde ».

Industrialisation, vous disais-je, une production à la chaîne, alimentée grâce à la seconde activité stratégique de Demand Media : l'enregistrement des noms de domaine !

Mais quel est le rapport entre les noms de domaine et la production de contenu, me direz-vous ?

Et bien, d'une part, la société gère en direct environ 500 000 parkings (qu'elle nomme d'un euphémisme "undeveloped websites"), mais surtout elle exploite l'inépuisable gisement de données captées grâce à enom : acheté en 2006, troisième registreur mondial à l'époque, fortement impliqué dans le domain tasting, il a gagné une place quelques mois plus tard en rachetant BulkRegister.

C'est donc aujourd'hui le deuxième registreur au monde avec près de dix millions de domaines enregistrés (le premier, GoDaddy, est presque à 35 millions de noms !).

Il n'empêche que les internautes qui vont sur le réseau enom pour y enregistrer leurs domaines saisissent en moyenne plus de 3 millions de requêtes / jour, et que Demand Media traite ces données pour améliorer ses algorithmes de création de contenu :
These queries and look-ups provide insight into what consumers may be seeking online and represent a proprietary and valuable source of relevant information for our platform's title generation algorithms and the algorithms we use to acquire undeveloped websites for our portfolio.
Donc, grâce à ces données, d'une part elle récupère à la volée les noms expirés qu'elle juge intéressants en fonction de ses propres critères (parfois même aux dépens des propriétaires légitimes, j'y reviendrai...), et de l'autre elle affine ses propres algorithmes de génération de titres.

Génération de titres ! C'est là où l'industrialisation prend tout son sens : une fois passées à la moulinette de ses algorithmes toutes les données dont dispose la société (à la fois propriétaires ou de tierces parties), le résultat est la production de titres optimisés pour le référencement, soigneusement pesés en fonction des sujets à la mode :
Utilizing a series of proprietary technologies, algorithms and processes, we analyze search query and user behavior data to identify commercially valuable topics that are in-demand. This includes analysis of publicly available third-party data, such as keyword prices on large advertising networks and the frequency of specific search queries, as well as analysis of proprietary data from our Content & Media and Registrar service offerings, such as the types of domain names being purchased and the types of search queries driving consumers to our text articles and videos.
Après quoi ces titres sont soumis à l'armée des 10 000 "créateurs de contenu freelances", qui brodent dessus pour en sortir des articles de texte et des clips vidéos :
The process to select the subject matter of our content, or our title selection process, combines automated algorithms with third-party and proprietary data along with several levels of editorial input to determine what content consumers are seeking, if it is likely to be valuable to advertisers and whether it can be cost effectively produced. To produce original content for these titles at scale, we engage our robust community of highly-qualified freelance content creators. As of June 30, 2010, our content studio had over 10,000 freelance content creators, a significant number of which have prior experience in newspapers, magazines or broadcast television. Our content creation process is scaled through a variety of online management tools and overseen by an in-house editorial team, resulting in high-quality, commercially valuable content. Our technology and innovative processes allow us to produce articles and videos in a cost effective manner while ensuring high quality output.
Je vous conseille de lire l'excellent compte-rendu de Danny Sullivan, qui détaille la partie "risques" développée par Demand Media dans le dossier d'introduction en bourse, notamment vis-à-vis de Google : puisque la société tire actuellement plus d'un quart de ses revenus des AdSense et que 60% du trafic de eHow est généré par le moteur, une pénalisation ou un changement soudain des règles du jeu par Google pourraient avoir des conséquences catastrophiques.

Danny conclut en s'interrogeant sur la qualité du contenu et sur la récupération plutôt "limite" des noms de domaines expirés, car même si Google n'a jamais dédaigné le business du parking, en faisant parfois preuve d'incohérences, certaines activités de Demand Media pourraient violer les règles d'utilisation de ses services.

D'autres sont moins gentils que Danny, et n'hésitent pas à critiquer ouvertement cette approche. Selon Aaron Wall :
The very technique that eHow uses today is *exactly* what caused Matt to create Google's anti-spam team!
En conclusion, il reste à voir comment les investisseurs potentiels accueilleront cette opération, mais quoi qu'il en soit je vous conseille de jeter un coup d'œil à ce document, il est vraiment plein d'indications intéressantes !


Partager sur Facebook

P.S. Si vous voulez une synthèse des chiffres, c'est ici...

, , , , , , , , ,

vendredi 18 juin 2010

Google teste Newspass


[MàJ - 21 juin 2010] Faible démenti de Google France...

Scoop de Repubblica, qui annonce être partenaire de Google pour le lancement de Newspass d'ici la fin de l'année, une plateforme destinée à faire se rencontrer éditeurs et internautes autour des contenus payants de Google News (tout ou partie, c'est pas encore très clair...).

Le système de micro-paiements sera bien sûr Google Checkout (voir ici, même si Google semble disponible à accepter d'autres méthodes de paiement choisies par les propriétaires des sites), et les éditeurs pourront monétiser leurs contenus (articles, vidéos, audio, photos, etc.) aussi bien pour le Web que pour les mobiles, les tablettes ou les e-books, etc.

La plateforme Newspass serait déjà en phase de test et, selon Repubblica, Google serait en train de contacter les éditeurs pour voir s'ils sont disponibles pour participer à la phase d'expérimentation.

Selon ce blog, l'offre ne serait pas réservée qu'aux journaux traditionnels, mais également aux pure players et, pourquoi pas, aux blogs qui le souhaiteraient. Ceci dit, à l'heure où s'annonce la concurrence des fermes de contenus, je me demande quelle sera la viabilité financière d'une telle offre.

Qui semble arriver après des années de lutte entre éditeurs de contenu et Google, un peu dans tous les pays...

L'article laisse également filtrer que Google indexe déjà les contenus derrière paywall et que Newspass permettrait à l'internaute d'acheter l'article ou le clip voulu en un clic, via son compte Google. Les contenus payants apparaîtront également dans les pages de résultats de Google, signalés avec un symbole Checkout (je suppose) ou autre.

En outre, toujours dans le souci de transparence que Google veut mettre en avant pour écarter d'ores et déjà les objections sur sa position dominante, la société de Moutain View accepterait de partager avec les participants au système toutes les informations découlant de l'utilisation de Newspass (stats de fréquentation et, selon Repubblica, profil des utilisateurs).

Gageons donc qu'il sera bientôt fortement question de la confidentialité des données, autre bataille à venir...

Enfin, en supposant que les coûts de la plateforme seront pris en charge par Google, la société laisserait entendre qu'au niveau du partage des revenus, la part la plus importante irait aux producteurs des contenus.

Dans une interview au créateur du service Google News, Krishna Bharat déclare :
Google veut devenir une media company, nous ne serons jamais éditeur, notre réussite est aussi celle des éditeurs, nous voulons juste être un intermédiaire de confiance entre les lecteurs et les producteurs de contenus.
Et d'ajouter que ce n'est pas la fin du tout gratuit, mais plutôt l'émergence d'un modèle hybride, où tout ce qui peut être unique, exclusif, à forte valeur ajoutée, peut sortir du lot et être monétisé en tant que tel.

Je vous tiendrai au courant au fur et à mesure que j'en apprendrai davantage.

Liens connexes en français :
Liens connexes en anglais :


Partager sur Facebook

P.S. Au-delà du seul aspect "News", cette stratégie du single sign-on déployée par Google pourrait mettre le moteur en position de force, puisque potentiellement tous les abonnés aux services de Google pourront utiliser ce système d'authorisation unique (Google Checkout) pour le micro-paiement du téléchargement à la carte de films, de livres, de logiciels, de musique, etc. etc.

Alors, après moteur du Web, Google banque du Web ?

De cette interview de Marc Simoncini (Meetic), Gilles Bruno nous signale (voir les commentaires) : Marc Simoncini dit que Google n’a pas le billing, mais ça arrive ;-)

C'est dans les deux dernières minutes de l'interview, où Simoncini évoque le système de facturation précurseur d'Apple, très instructif...



, , ,

samedi 15 mai 2010

Les engagements de Google en Italie


Première mondiale en Italie : Google accepte enfin de dévoiler la part de recettes perçue par les annonceurs en termes de pourcentage des recettes publicitaires totales perçues par la société au titre des Annonces et des Boutons de Parrainage !

* * *

Depuis août 2009, Google (à travers trois de ses sociétés : Google Italy S.r.l., Google Inc. et Google Ireland Limited) fait l'objet d'une procédure de l'autorité de la concurrence italienne, l'Antitrust, pour éventuel abus de position dominante.

Le 3 mars dernier, l'Antitrust avait élargi la procédure en y incluant le manque de transparence sur la façon dont les parts de recettes (revenue sharing) étaient fixées et versées par Google aux annonceurs, qui ne « fournissait aucun élément utile pour vérifier les modes de calcul des parts de recettes effectivement perçues ».

Google vient donc de répondre à l'Antitrust en prenant trois engagements :
  • (A) Pendant toute la période de validité de l'Accord, Google assurera, outre l'actuel mécanisme d'exclusion de Google News via le fichier "robots.txt", un autre mécanisme (tel que le crawler dédié pour Google News introduit en décembre 2009) pour permettre aux éditeurs qui n'autorisent pas l'indexation de leurs contenus par Google de ne pas être exclus du moteur de recherche généraliste.

  • (B.1) Google Ireland révélera la part de recettes perçue par les annonceurs en termes de pourcentage des recettes publicitaires totales perçues par la société au titre des Annonces et des Boutons de Parrainage à tous les annonceurs qui auront accepté les Conditions générales Google AdSense™ Online. Ainsi, pendant toute la durée de validité de l'Accord (3 ans à partir de son acceptation par l'Antitrust), l'interface italienne d'AdSense indiquera les parts de recettes respectives pour chaque annonceur par rapport aux recettes publicitaires totales perçues par Google.

  • (B.2) Google Ireland éliminera uniquement de la version italienne des Conditions générales Google AdSense™ Online le passage suivant de l'article 12.1 : « Vous reconnaissez que Google ne Vous indiquera pas et n’est pas tenu de Vous indiquer la façon dont est calculée cette part, ni ce que cette part représente en termes de pourcentage des recettes publicitaires totales perçues par Google au titre des Annonces et des Boutons de Parrainage apparaissant au sein Vos Éléments Propriétaires. », outre les termes "di volta in volta" et "assoluta" (La quota di ricavi che Lei riceverà sarà determinata da Google di volta in volta a sua assoluta discrezione) de ce même article.
J'ai laissé la phrase en italien parce que "di volta in volta", qui traduit l'anglais "from time to time" (version pour le Royaume-Uni : The share of that revenue that You get shall be determined by Google from time to time in its absolute discretion.), a été rendue en français par "régulièrement" alors qu'il serait plus juste de dire "au cas par cas", par exemple.

Ainsi, la phrase "La part des recettes que vous percevrez sera régulièrement fixée par Google, à son entière discrétion." deviendrait "La part des recettes que vous percevrez sera fixée par Google à sa discrétion."

Je ne sais pas si en droit français une telle modification serait fondamentale, mais quoi qu'il en soit telle est la proposition faite par Google à l'Autorité italienne.

Maintenant il faudra voir la décision de l'Antitrust aussi bien sur ce point que sur celui de l'abus de position dominante, mais il est sûr que cela créerait un précédent qui pourrait bien avoir des conséquences futures dans d'autres pays...


Partager sur Facebook

, , ,

mardi 9 mars 2010

Google, traducteur universel


Après avoir introduit le "speech-to-text" (reconnaissance vocale + transcription texte), Google a aussi ajouté la traduction automatique à la volée sur YouTube...

* * *

Ça commence à devenir problématique de trouver des titres que je n'ai pas déjà utilisés pour parler du binôme Google + traduction. Pour autant les progrès que fait la société dans ce secteur, aussi rapides que gigantesques, m'imposent de faire des mises à jour de temps en temps.

Cette fois l'occasion m'en est donnée par un article du New York Times intitulé Putting Google to the Test in Translation, qui compare la traduction humaine d'un extrait de texte avec celles des principaux traducteurs gratuits disponibles sur le Web : Google, Yahoo et Microsoft.

La comparaison du journal porte sur cinq langues source (français, espagnol, russe, allemand et arabe) vers une seule langue cible, l'anglais. Or je ne m'intéresserai ici qu'aux deux premières, tout simplement parce que le texte choisi pour l'extrait est littéraire : Le petit Prince de Saint-Exupéry pour le français, et Cent ans de solitude de García Márquez pour l'espagnol :


Donc, ce qui m'a énormément frappé dans ce texte, c'est que pour la première fois j'avais sous les yeux la preuve absolue de ce que j'énonçais il y a plus d'un an et demi dans Google et la traduction, à propos du concept de mémoire de traduction universelle :
Pour rappel, cette mémoire sert également à l'auto-apprentissage de Google, et par bitexte il faut comprendre que l'on a texte source (ou texte de départ) et texte cible (ou texte d'arrivée) en regard l'un de l'autre. Exemple.

(...)

Donc en nous livrant à un bref exercice de prospective, on peut très facilement imaginer que dans un avenir proche, non seulement Google pourra coupler par défaut l'opérateur à votre profil (en clair, sachant que vous êtes anglais, il vous proposera par défaut des termes traduits en anglais, sauf indications contraires de votre part), mais aussi, et surtout, qu'il pourra puiser pratiquement tous les termes du langage humain, dans toutes les langues, au fur et à mesure que sa notre mémoire de traduction universelle prendra forme.

Alimentée autant par les traducteurs humains qui utiliseront les outils de Google pour traduire, que par ses technos automatisées à grande échelle (à ne pas confondre avec le déploiement d'un système de traduction automatique en entreprise, par exemple), voire par la mise en parallèle des œuvres littéraires qui appartiennent au patrimoine de l'humanité et sont déjà traduites dans de nombreuses langues.

Pour les profanes, mettre en parallèle un texte c'est prendre Les Misérables de Hugo ou votre livre préféré, le segmenter et mettre en parallèle les segments du texte original avec les segments correspondants traduits dans la ou les langues de votre choix (à noter qu'un segment ne correspond pas forcément à une phrase, découpée en plusieurs segments si elle est trop longue, par exemple). Vous faites ça avec français-anglais, et vous avez la mémoire français-anglais des Misérables. Ensuite vous faites de même avec anglais-italien, espagnol-allemand, russe-chinois, etc., et vous obtenez autant de mémoires que de langues dans lesquelles l'ouvrage a été traduit.

La pierre de Rosette est un parfait exemple de textes mis en parallèle. Et pour me limiter à n'en mentionner qu'un seul autre, pensez aux milliers de traductions de la Bible qui existent déjà...

Donc ajoutez-y tous les grands classiques mondiaux déjà numérisés, construisez les mémoires de traduction correspondantes dans les couples de langues dont vous disposez, et vous comprendrez aisément qu'on n'est pas loin de pouvoir mettre en parallèle pratiquement l'ensemble du langage humain, à toutes les époques.

Depuis l'aube de l'humanité, nul n'a jamais été en mesure de faire ça. Jusqu'à Google...
Or les deux échantillons pris en exemple par le New York Times montrent que Google construit bien cette mémoire !

En effet, par rapport à la traduction humaine, celle de Google est identique à près de 65% pour Le petit Prince (38 mots sur 59 qui forment des séquences équivalentes) et carrément à 99% pour Cent ans de solitude !!!

D'où une distanciation abyssale, en termes qualitatifs, vis-à-vis des deux autres traducteurs, qui ne réussiront jamais à combler leur retard s'ils ne passent pas à des modèles de traduction automatique fondés sur le couple "linguistique de corpus" + "analyse statistique". Et bien au contraire, l'écart se creusera démesurément au profit de Google et aux dépens de ses concurrents.

C'est là tout l'enjeu des mémoires de traduction à très grande échelle implémentées par Google :
Comme l'explique fort bien Franz Josef Och, responsable recherche et traduction automatique, la clé des modèles de traduction selon Google, perpétuel apprenant, c'est de pouvoir disposer, d'une part, d'énormes quantités de données linguistiques (very large amounts of datas), et de l'autre, d'une phénoménale puissance de calcul qui traite à très grande vitesse des milliers de milliards de mots (aussi bien données textuelles que vocales...) dans pratiquement toutes les langues, puisque plus vous alimentez vos modèles statistiques en données, plus la qualité des modèles s'améliore !

Il précise d'ailleurs les deux principaux enjeux pour Google dans la traduction automatique :
  1. augmenter la qualité de sortie, grâce au binôme quantité de données / puissance de calcul, ce qui explique clairement pourquoi la qualité est meilleure pour les couples de langues plus représentées ;
  2. augmenter en conséquence le nombre de langues (et donc de couples de langues) et de fonctionnalités offertes (comme les recherches croisées : je saisis un terme en français pour une recherche sur le Web chinois, et en sortie j'obtiens une page avec les résultats chinois à gauche et en vis-à-vis leur traduction française à droite), etc.
Alors au bout du compte on finira par obtenir ce que j'expliquais dans Google et la traduction, à savoir la
mémoire de l'humanité...
[MàJ - 10 mars 2010] Grâce à ce tweet de Christophe Asselin, je découvre les chiffres suivants :
Pour modéliser un langage, Google a besoin d'environ un milliard de mots, employés dans des combinaisons différentes. Pour l'anglais, l'entreprise a injecté « plusieurs centaines de milliards » de termes, selon le New York Times.
Donc, là encore, les prodigieuses capacités de calcul de Google, couplées à une approche d' « intelligence hybride » associant l'homme et la machine, font la différence. Google l'explique ainsi :
If you have access to enormous datasets, it opens up whole new avenues for scientific discovery and for solving problems. For example, Google's machine translation tools take advantage of "parallel texts": documents that have been translated by humans from one language to another, with both forms available. By comparing the sentences from enormous numbers of parallel texts, machine translation tools can develop effective translation tools using simple probabilistic approaches. The results are better than any previous attempts at computerized translation, but only if there are billions of words available in parallel texts.
Mais ce n'est pas tout ! [Début]

* * *

Prenons l'exemple de mon dernier billet, dans lequel il y a une vidéo qui affiche un bandeau avec capture automatique du texte source, obtenue par reconnaissance vocale.

Et bien le texte correspondant ne réside que dans la mémoire de Google, il n'est pas disponible en ligne. Par conséquent pour le traduire en français, j'ai dû d'abord le retranscrire intégralement en italien afin d'avoir le texte, qui n'est maintenant disponible en ligne que sur mon blog italien et sur la plateforme de blogging.

Première constatation : la capture en italien est fiable à 100%.
Deuxième constatation : une fois que Google détecte la traduction du texte source, vous pouvez être sûr que le bitexte part dans la mémoire qui alimente son système de traduction automatique.

Voilà pourquoi j'annonçais cette nouveauté il y a déjà presque 4 ans :
... une fois que Google maîtrisera avec un degré de pertinence suffisant la traduction automatique du texte, et a fortiori de la voix, je vous laisse imaginer le reste... (et) je suis sûr de ne pas me tromper en affirmant que Google nous prépare quelque chose de révolutionnaire avec sa fonction de traduction automatique : texte-voix, Internet, vidéo, mobiles, Adsenses personnalisés, etc., qui pourra concurrencer Google ?
Car en fait, qu'il s'agisse des données images, vidéo ou voix, il suffit d'obtenir le texte source dans une première étape, soit par reconnaissance de caractères soit par reconnaissance vocale (pour la téléphonie mobile), et d'appliquer ensuite la traduction automatique au texte obtenu.

Si je garde mon exemple des vidéos sur Youtube, vous sélectionnez la langue d'arrivée de votre choix (mais comptez sur Google pour vous proposer par défaut votre langue maternelle) et vous obtenez dans le bandeau le texte traduit. Du sous-titrage automatique à la volée.

Et enfin, pour la téléphonie mobile, il suffira d'appliquer la synthèse vocale au texte traduit pour entendre dans son oreillette la version parlée. C'est ce que promet déjà Microsoft, et ce qu'a déjà annoncé Google...

Si vous voulez tester, la fonction est disponible sur Google Translate : cliquez sur l'icône du haut-parleur (que j'ai signalée par une flèche) pour entendre la version parlée du texte traduit !


[Début]


Partager sur Facebook

P.S. Quand on dit que le hasard fait bien les choses, je viens juste de découvrir par un tweet que la version bêta de la traduction automatique est disponible sur Youtube !!!

Donc, vous paramétrez la langue :


Et voilà le travail...


Pour finir, je découvre que la fonctionnalité "traduction" sur Youtube est en ligne depuis deux ans !

Que dire ? Ça se voit que je ne m'occupe plus du Web tellement je suis accaparé par le berlusconisme... [Début]

, , , , , , , , , , ,

mardi 2 mars 2010

Microsoft Research Translating Telephone




Google a déjà annoncé la même chose à un horizon deux-trois ans, Microsoft s'empresse de prendre son concurrent de vitesse...

En tout cas, voici ce qui nous attend en matière de téléphones traduisants, avec la transcription temps réel des textes source et cible (j'utilise la dictée vocale presque tous les jours, et je peux vous dire que ça va vite, très vite), archivables où vous voudrez...



Partager sur Facebook

P.S. Ce n'est pas une surprise, la chose était prévue depuis longtemps... (voir le premier post-scriptum)

,

mercredi 24 février 2010

Partenariat Yahoo! - Twitter, Microsoft prépare son bing-bang !


Voilà, c'est fait ! (CP en français) Il y a moins d'une semaine, à propos du partenariat Microsoft - Yahoo!, j'écrivais :
J'imagine aussi que Ballmer doit regarder Twitter d'un œil très intéressé...

Vous allez me dire que Ballmer n'est pas Yahoo!, certes, mais je vous rétorquerai que la stratégie bloc contre bloc se met d'ores et déjà en place, lentement mais sûrement...

Avec Google d'un côté, et Microsoft + Yahoo! de l'autre, qui passent des partenariats en veux-tu en voilà avec tout ce qui compte sur le Web en termes de trafic et de popularité. Et donc, Facebook et Twitter in primis, CQFD !

Il suffit de voir ce que ça donne en termes d'usage :


Yahoo avec Facebook et Twitter, Microsoft avec Yahoo et Facebook, LinkedIn, MySpace, etc., et à terme un seul moteur derrière tout ça : Bing !

Liens connexes (anglais) :


Partager sur Facebook

P.S. Twitter annonce que la pub devrait faire son apparition sur le site d'ici un mois. Or il est clair que derrière ces partenariats à fort trafic, la question cruciale est double :
  1. comment exploiter au mieux ces centaines de millions de visiteurs et ces milliards de pages vues et de requêtes avec la pub, pour en tirer des dollars, le nerf de la guerre...
  2. comment exploiter au mieux les données et le savoir-faire acquis pour conquérir le prochain marché mondial : celui de la téléphonie mobile...
Facebook nous donne déjà une idée de ce que ce sera !

, , , , , ,

jeudi 18 février 2010

Search Alliance entre Microsoft et Yahoo!


Après avoir traité en long en large et en travers, en 2008-2009, la fusion manquée Microsoft - Yahoo!, le partenariat sur la recherche entre les numéros 2 et 3 de l'Internet, annoncé en juillet dernier (voir les détails...), est sur le point d'être mis en œuvre, puisque les autorités américaine et européenne ne s'opposent plus à l'intégration entre les deux.

Donc, dans les semaines qui viennent, Yahoo serala régie exclusive des annonceurs achetant des liens sponsorisés premium aux deux sociétés” en intégrant ses pubs dans les pages de résultats fournis par Microsoft, comme l'explique la figure suivante :

avant d'affiner de plus en plus l'intégration.

Ceci étant, vu que la division des rôles entre les deux varie selon les infos, le mieux est d'aller puiser à la source officielle :
Lorsque la Search Alliance sera implémentée, Yahoo! et Microsoft continueront d'offrir à leurs visiteurs une recherche différenciée, mais Microsoft gérera la plateforme technologique qui fournit l'algorithme de recherche (propulsé par Bing) et les résultats payants (via adCenter).

Selon les segments d'appartenance des annonceurs, Yahoo! prendra en charge les grands comptes, les agences de référencement, les revendeurs et leurs clients, tandis que Microsoft s'occupera des annonceurs indépendants et utilisera adCenter comme plateforme de pub pour toutes les campagnes de recherche.

L'inventaire publicitaire sera commun à Microsoft, Yahoo! et leurs partenaires respectifs...


[Une version française est maintenant disponible]
Dont Facebook ! J'imagine aussi que Ballmer doit regarder Twitter d'un œil très intéressé...

Comme l'explique le communiqué de presse, la transition devrait s'achever avant la fin de l'année, avec essentiellement pour cible les annonceurs US...

En gros, l'idée derrière le deal peut être reprise dans les « quatre piliers » énoncés par Ballmer pour la fusion, rapportés au seul volet de la recherche :


avec des synergies pointant essentiellement vers les dollars des annonceurs (et, espérons-le aussi, sur la pertinence des résultats...) :


On pourra déjà faire un premier bilan en fin d'année, même si, d'ores et déjà, avec la progression constante de Bing, notamment grâce à son intégration récente dans Facebook (qui a fini par dépasser Yahoo!), Microsoft avance - lentement mais sûrement - dans la réalisation de son programme "10, 20, 30, 40"...

En tout cas, vu les chiffres actuels, il est clair désormais que la recherche sur Internet se limite à un duopole, Google vs. Microsoft : bloc contre bloc, l'internaute au centre...



Partager sur Facebook

P.S. Quant à l'avenir de Yahoo! maintenant, c'est un autre problème...



Il est peut-être bon de citer in extenso le communiqué de la CE :
La Commission européenne a autorisé, en vertu du règlement européen sur les concentrations, le projet d’acquisition des activités de recherche en ligne de Yahoo! Inc. et des annonces liées à ces recherches par Microsoft. Elle a conclu que cette concentration n’entraverait pas de manière significative l’exercice d’une concurrence effective dans l’Espace économique européen (EEE) ou une partie substantielle de celui-ci.

Microsoft exerce des activités au niveau mondial dans la conception, le développement et la vente de logiciels informatiques et la prestation de services connexes.

Les activités de recherche de Yahoo faisant l'objet de la présente opération comprennent la recherche en ligne et les annonces liées à ces recherches, y compris la plateforme d'annonces liées aux recherches en ligne de Yahoo, Panama. En vertu des accords conclus entre Microsoft et Yahoo, Microsoft acquerra une licence exclusive de dix ans sur les technologies de recherche développées par Yahoo. Microsoft utilisera également le personnel travaillant pour le moteur de recherche en ligne et pour les annonces liées à ces recherches de Yahoo. Microsoft deviendra le fournisseur exclusif de résultats de recherche en ligne de Yahoo et d'annonces liées à ces recherches. En contrepartie, Microsoft conservera 12 % des recettes générées par les recherches effectuées sur les sites de Yahoo et de ses partenaires pendant les cinq premières années des accords et reversera 88 % de ces recettes à Yahoo au titre des coûts d’acquisition de trafic.

Dans l'EEE, les activités de recherche en ligne et des annonces liées à ces recherches de Microsoft et de Yahoo sont très limitées et leurs parts de marché cumulées demeurent généralement inférieures à 10 %. À l'inverse, Google détient généralement des parts de marché supérieures à 90 %.

Selon Microsoft, le fait d'acquérir les activités de recherche en ligne de Yahoo et d'augmenter ainsi sa taille dans le domaine des annonces liées à ces recherches lui permettra de concurrencer Google d'une manière plus crédible et d'apporter une plus grande valeur ajoutée aux annonceurs. L'enquête de marché de première phase menée par la Commission a montré que la taille est un élément important pour être un concurrent crédible en matière d'annonces liées aux recherches en ligne.

La Commission a également examiné l'incidence éventuelle de cette concentration sur les différents acteurs du marché, notamment les utilisateurs de moteurs de recherche en ligne, les annonceurs, les éditeurs en ligne et les fournisseurs de technologies de recherche. L'enquête de marché de première phase menée par la Commission a montré que non seulement ces opérateurs n'attendent pas d'effets négatifs de ce rachat sur la concurrence ou sur leurs activités, mais qu'ils en espèrent au contraire un renforcement de la concurrence dans le domaine de la recherche en ligne et des annonces liées à ces recherches en permettant à Microsoft de concurrencer plus efficacement Google.

L’opération a été notifiée à la Commission en vue de son autorisation le 15 janvier 2010.

De plus amples informations sur cette affaire sont disponibles à l’adresse suivante.


, , , , , ,