dimanche 23 novembre 2008

Alltop spamme Twitter !

Alltop spamme Twitter !

C'est une première ! En tout cas pour moi. Le flux de Alltop.com vient spammer les updates de mon compte Twitter. Il suffit que j'envoie un message sur Twitter pour que dans l'heure qui vienne il passe au second rang, phagocyté par une mise à jour automatique d'Alltop. Et je précise que ça se passe bien sur le compte Twitter, directement, et non pas sur le widget, qui ne fait qu'afficher les updates.

À moins que ça ne vienne pas d'eux. Mais de qui alors ? Et comment est-ce possible ?

Soit Alltop m'a fait cliquer sur un lien pour me piéger, soit je n'ai rien cliqué du tout, mais le résultat est le même : ils me spamment !

Voici deux captures d'écran : regardez les heures, et vous verrez que dès que je poste un message ils arrivent derrière pour se mettre en première position. J'avais effacé tous les précédents, mais ça ne sert à rien, puisque si je ne résous pas le problème à la racine, ils vont me polluer à n'en plus finir.



Tiens, je m'en vais toucher deux mots à Guy...


Partager sur Facebook

, , , , , ,

Dimension sociale de la traduction

Le travail de traducteur n’est pas uniquement individuel, mais aussi social, bien que nombreuses et nombreux soient les réfractaires à une mise en réseau des compétences, des expériences, des ressources…

Des ressources disséminées à travers le Web qui gagneraient certainement à être catégorisées et centralisées derrière un nombre restreint de points d’accès, c’est-à-dire à l’opposé de la situation actuelle, où l’éparpillement règne et rend leur détection difficile.

Car dans l’océan planétaire d’Internet, les mots – ou les termes, si vous préférez – sont les données non structurées par excellence, de par la multiplicité des domaines, des langues, des formats de documents, des publics destinataires et ainsi de suite.

Donc regrouper tout cela sous l’appellation générique de traduction, voire de localisation, ne rend pas justice à la diversité des situations, des contextes, des nécessités, etc.

Sans compter ce que nous appellerons le Web terminologique invisible, notamment les disques durs des traducteurs et des clients qui regorgent de trésors terminologiques enfouis, ne demandant qu’à être découverts.

Naturellement, la confidentialité vis-à-vis de ses données et de ses clients est une chose sérieuse, déontologie oblige, mais tout n’est pas confidentiel, tout n’est pas secret.

Et à force de ne jamais vouloir rien révéler de son travail, on en finit par cacher aussi ce qui pourrait être partagé ! C’est ainsi que le moteur Translation 2.0 est né d’une collection de favoris : près de 5 000 ressources riches en terminologie multilingue, accumulées depuis plus d’une décennie de recherches sur le Web.

Autant en faire profiter d’autres plutôt que de tout conserver stérilement sur mon PC !

Pour citer un autre exemple connu, il suffit de penser aux très riches glossaires multilingues de Microsoft, qui aurait fort bien pu les considérer comme un actif propriétaire et tout garder au seul bénéfice de ses employés. Au contraire, en les mettant gratuitement à la disposition de tous, ce sont plus de 12 000 termes anglais traduits dans près de 60 langues en libre accès !

Donc, pour en revenir à cette fameuse dimension sociale, elle est indispensable à tous les aspects professionnels du métier : chacun/e devant impérativement faire du networking pour se former, s’informer, se mettre à jour, s’entraider, demander conseil, travailler en mode croisé – traducteur + relecteur –, voire organiser des équipes sur les projets complexes, trouver les bonnes ressources, techniques ou terminologiques, échanger des dictionnaires, de la documentation de référence, ou, surtout, pour celles et ceux qui vivent à l’étranger, rester en contact avec leur langue et les implications socioculturelles qu’elle véhicule…

Ce sera en partie l'objet d'une présentation sur l'employabilité des traducteurs que je ferai la semaine prochaine à Hammamet, intitulée « LA TRADUCTION : DE LA FORMATION À L'EMPLOI - Comment utiliser Internet pour une transition réussie ? »

Concluons en disant que la traduction ne concerne pas que les traducteurs de métier, mais plus largement celles et ceux qui s’intéressent aux langues et à leur dimension sociale : comment apprendre à se comprendre au-delà des barrières linguistiques, pour mieux communiquer et partager.

Autrement dit, les internautes de tous pays et de toutes cultures !


Partager sur Facebook

, , , , , ,

jeudi 20 novembre 2008

Large-Scale Translation Memories (Google)

"Large-Scale Translation Memories" by Google, ou les mémoires de traduction à (très) grande échelle...

Après une brève, une longue...

Ce que j'ai appelé "mémoire de traduction universelle", Google l'appelle probablement "very large-scale translation memory". J'ai découvert ça dans mes référents le mois dernier : en cherchant "large-scale translation memories" dans le moteur, un Googler est arrivé sur la version anglaise de mon billet intitulé Google and the Universal Translation Memory !

large-scale translation memories
Expression clé qui ne produit telle quelle aucun résultat aujourd'hui, et tout juste cinq dans sa version au singulier, dont trois uniques :
  1. a soon to be introduced "large-scale Translation Memory" server
  2. a "large scale translation memory" database
  3. implementation of Xerox's XTM "large scale translation memory" system
large-scale translation memory in SERPs
Voilà. Donc à présent rien n'existe qui serait proche de la notion de "mémoire de traduction universelle" telle que la conçoit Google avec son Centre de traduction, pour l'instant encore en version de bêta-test réservée à des testeurs invités.


D'ailleurs si quelqu'un sait comment avoir une invitation, pensez à moi, ce serait sympa !

Pour l'heure, ces Large-Scale Translation Memories, ces mémoires de traduction à grande échelle ne sont implémentées que par de très grosses organisations (Xerox, Union européenne, etc.) et par des LSP d'envergure mondiale. Je me limiterai à mentionner Logoport de Lionbridge, voir ici pour plus de détails.

Cependant, outre qu'elles se confinent au technique (si l'on peut dire), ces mémoires ont le - très - gros défaut d'être propriétaires. En ce sens que lors d'une traduction effectuée sur ces systèmes, la propriété de la mémoire est phagocytée par l'agence, les traducteurs n'ayant plus aucun contrôle sur ce qu'ils produisent...

Idem pour les solutions de traduction automatique déployée en entreprise, dont la mise à disposition de la mémoire, quand elle a lieu, se limite au courtage.

Et même si une initiative open source comme GlobalSight, lancée par Welocalize (qui fait partie de TAUS), devrait voir le jour en janvier 2009, avec Google on change d'échelle. Et de modèle économique (notamment sur les questions de propriété intellectuelle)...

Dans ce cadre, les seules notions de mémoire approchantes qui existent sont, à ma connaissance, les projets TAUS et VLTM, le premier se distinguant davantage par sa portée potentielle, vu le nombre (une quarantaine de membres fondateurs plus une soixantaine de candidats en attente, outre l'implication probable de la Commission européenne) et la qualité des acteurs impliqués, et le deuxième par sa philosophie "libre", plus "grand public" dirons-nous.

* * *

TAUS, Translation Automation User Society, a pour vision et pour mission, via la TAUS Data Association, des objectifs ambitieux, davantage détaillés dans son business plan :
  1. Legitimate and secure platform for storing, sharing and leveraging language data.
  2. Access to large volumes of trusted language data for increased translation automation.
  3. Industry collaboration to promote harmonization of multilingual terminology.
Pour vous donner une idée du sérieux de l'affaire, on compte parmi les membres du Comité de pilotage des représentants de Microsoft, Intel, Sun Microsystems, Welocalize, Adobe et le Bureau de la Traduction du Gouvernement canadien.

Les données linguistiques, ou pour mieux dire, les "actifs linguistiques" seront sélectionnés et centralisés par les membres de l'Association : « TDA will give free access to its databases for the look-up of translations of terms and phrases. Members will be able to select and pool data to increase translation efficiency and improve translation quality. »

Sur la liberté d'accès à tous, il semble plutôt que le portail permettra à l'internaute lambda d'obtenir quelques infos essentielles sur la base, juste histoire de lui donner envie de payer pour pouvoir utiliser les données. Il faudra donc voir la version "live" à l'usage pour juger sur pièce, mais en clair, cette apparente gratuité ne sera qu'un "produit d'appel" pour passer à la caisse...

C'est d'ailleurs pourquoi l'initiative de Google ne laisse pas TAUS indifférent :


Article à lire...

* * *

Par rapport à TAUS, à vocation plus "industrielle", le projet VLTM (Very Large Translation Memory) de Wordfast est davantage "artisanal", puisqu'il suppose l'utilisation du logiciel de TAO, excellent mais quasi exclusivement réservé aux traducteurs de métier.

Ce serait d'ailleurs bien qu'Yves Champollion, que j'ai le plaisir de connaître, communique davantage sur le projet, sur sa philosophie, et donne peut-être quelques stats sur son utilisation.

Pour autant, l'initiative est tout aussi sérieuse que la précédente, parole de Champollion, bon sang ne saurait mentir ! Puisque Jean-François, son aïeul illustre, réussit à déchiffrer les hiéroglyphes grâce à la pierre de Rosette, découverte pendant la campagne d'Égypte, une stèle qui est à proprement parler l'ancêtre des mémoires de traduction (même si maintenant c'est un peu plus compliqué...) !


En effet, cette pierre aligne en parallèle trois inscriptions d'un même texte, dont deux en langue égyptienne et la troisième en grec, langue connue, ce qui a permis le déchiffrement.

* * *

Donc je le répète, et j'insiste lourdement là-dessus, ce qu'il y a de nouveau avec Google dans ce domaine, c'est à la fois l'échelle, superlative, et la rupture totale des modèles économiques pré-existants.



Car comme l'explique fort bien Franz Josef Och, Responsable recherche et traduction automatique, la clé des modèles de traduction selon Google, perpétuel apprenant, c'est de pouvoir disposer, d'une part, d'énormes quantités de données linguistiques (very large amounts of datas), et de l'autre, d'une phénoménale puissance de calcul qui traite à très grande vitesse des milliers de milliards de mots (aussi bien données textuelles que vocales...) dans pratiquement toutes les langues, puisque plus vous alimentez vos modèles statistiques en données, plus la qualité des modèles s'améliore !

Il précise d'ailleurs les deux principaux enjeux pour Google dans la traduction automatique :
  1. augmenter la qualité de sortie, grâce au binôme quantité de données / puissance de calcul, ce qui explique clairement pourquoi la qualité est meilleure pour les couples de langues plus représentées ;
  2. augmenter en conséquence le nombre de langues (et donc de couples de langues) et de fonctionnalités offertes (comme les recherches croisées : je saisis un terme en français pour une recherche sur le Web chinois, et en sortie j'obtiens une page avec les résultats chinois à gauche et en vis-à-vis leur traduction française à droite), etc.
Alors au bout du compte on finira par obtenir ce que j'expliquais dans Google et la traduction, à savoir la mémoire de l'humanité :
...En nous livrant à un bref exercice de prospective, on peut très facilement imaginer que ... Google pourra ... puiser pratiquement tous les termes du langage humain, dans toutes les langues, au fur et à mesure que sa notre mémoire de traduction universelle prendra forme.

Alimentée autant par les traducteurs humains qui utiliseront les outils de Google pour traduire, que par ses technos automatisées à grande échelle (...), voire par la mise en parallèle des œuvres littéraires qui appartiennent au patrimoine de l'humanité et sont déjà traduites dans de nombreuses langues.

Pour les profanes, mettre en parallèle un texte c'est prendre Les Misérables de Hugo ou votre livre préféré, le segmenter et mettre en parallèle les segments du texte original avec les segments correspondants traduits dans la ou les langues de votre choix (à noter qu'un segment ne correspond pas forcément à une phrase, découpée en plusieurs segments si elle est trop longue, par exemple). Vous faites ça avec français-anglais, et vous avez la mémoire français-anglais des Misérables. Ensuite vous faites de même avec anglais-italien, espagnol-allemand, russe-chinois, etc., et vous obtenez autant de mémoires que de langues dans lesquelles l'ouvrage a été traduit.

La pierre de Rosette est un parfait exemple de textes mis en parallèle. Et pour me limiter à n'en mentionner qu'un seul autre, pensez aux milliers de traductions de la Bible qui existent déjà...

Donc ajoutez-y tous les grands classiques mondiaux déjà numérisés, construisez les mémoires de traduction correspondantes dans les couples de langues dont vous disposez, et vous comprendrez aisément qu'on n'est pas loin de pouvoir mettre en parallèle pratiquement l'ensemble du langage humain, à toutes les époques.

Depuis l'aube de l'humanité, nul n'a jamais été en mesure de faire ça. Jusqu'à Google...
Qui n'aura donc plus besoin de chercher "Large-Scale Translation Memories" dans ... Google, en laissant le pluriel aux autres, puisque la société de Mountain View disposera enfin de la très singulière "Very Large-Scale Translation Memory", j'ai nommé The Universal Translation Memory, ou par chez nous LA mémoire de traduction universelle...

Non, vous ne rêvez pas, c'est pour bientôt...


Partager sur Facebook

, , , , , , , , ,

Europeana est en ligne

Europeana est en ligne (brève)

Annoncée il y a trois mois, la bibliothèque numérique pour l'Europe est ouverte aujourd'hui (site peu accessible pour l'heure, probablement victime de son succès). Voir ici pour davantage de détails.

Ce portail électronique devrait donner l'accès, dans un premier temps, à environ 2 millions de documents, avant de dépasser 6 millions (ou 10 millions ?) en 2010, « lorsque la mise en réseau des collections numérisées de l'ensemble de l'Union deviendra pleinement opérationnelle ».


Google Books n'a qu'à bien se tenir ! Alors Olivier, es-tu toujours d'avis qu'Europeana est la mal-nommée ou que la France fait preuve d'impérialisme culturel ? Ce qui est quand même le comble ! (Merci Claude, d'avoir signalé le lien en commentaire).


Partager sur Facebook

P.S. Vu les problèmes d'accès au site pour l'instant, il m'est impossible de voir de plus près les fonctions recherche et consultation (voire téléchargement) que le portail met à disposition, mais ce n'est que partie remise...

, , , ,

vendredi 14 novembre 2008

Fin du Domain Tasting !


English version

En juin dernier, l'ICANN a décidé de mettre un frein au tasting (ou kiting, si vous préférez) en approuvant l'application de sa commission de 0,20 cent par nom enregistré, même s'il était supprimé durant l'AGP.

Ça n'a l'air de rien, 0,2 cent, mais sur plus d'1,25 milliard de domaines testés durant la période des « trois glorieuses » (juin 2005 - juin 2008), cela aurait représenté des recettes supplémentaires dépassant 250 millions de $ pour l'ICANN !

Bon, ça reste théorique, puisqu'en fait l'ICANN a introduit cette mesure en juin, et de juin à juillet 2008, le tasting a baissé de 84% sur le .COM, et de +85% sur le .NET !!! Il est même probable que ça s'est réduit à peau de chagrin depuis, nous le saurons lors des prochains rapports publiés par Verisign. En tout cas, celui de juillet est très clair, puisque l'on est passé d'un mois sur l'autre de 17 598 456 à 2 733 911 domaines testés. Sans compter que les registres ont jusqu'en mars 2009 pour mettre en place cette mesure. La phase des commentaires est d'ailleurs encore en cours, jusqu'à jeudi prochain (via Stephane Van Gelder).

Il aura donc fallu trois ans et demi pour résoudre ce problème, durant lesquels les "testeurs" s'en sont mis plein les poches ! (billet expliquant dans le détail le fonctionnement du tasting et donnant une idée des enjeux financiers énormes)...

Mais puisqu'un graphique vaut plus que mille mots :-)


On voit bien que ça part tout doucement fin 2004, époque à laquelle Bob Parsons avait dénoncé cette pratique, pour progresser discrètement en 2005 (141 598 850 domaines testés), prendre un régime de croisière en 2006 (399 632 387 domaines testés), connaître l'apothéose en 2007 (596 871 580 domaines testés), puis retomber enfin durant le premier semestre 2008 (115 560 938 domaines testés) jusqu'au brusque coup d'arrêt de juillet, suite à la décision "historique" de l'ICANN.

Ceci dit, de janvier 2005 à Juin 2008, 1 253 663 755 domaines ont été testés, avec les moyennes mensuelles suivantes :
  • 11 799 904 domaines/mois en 2005
  • 33 302 699 en 2006
  • 49 739 298 en 2007 !
  • 19 260 156/mois sur le premier semestre 2008

Voici les chiffres en détail, repris sur les rapports de Verisign pour les .COM et les .NET :


Le pic a été atteint en juillet 2007, avec 62 488 234 domaines testés dans le mois !

Il semblerait donc aujourd'hui que cette pratique soit sur le point de disparaître, encore un sujet qui finira dans les livres d'histoire d'Internet, où l'on désignera 2007 l'année du Domain Tasting : presque 600 millions de domaines testés sur 12 mois !



Partager sur Facebook

, , , , , , , ,

R.I.P Domain Tasting!

R.I.P Domain Tasting!

French version

On January 29th, 2008, Jay Westerdal said Domain Tasting will die in 2008! Well said, Jay!

Now with domain tasting down 84% on dot-com since ICANN implemented its 20 cent fee, and a percentage drop over 85% on dot-net, this time Domain Tasting will definitely end, as we can see it on the diagram below:


And here are the detailed figures according to Verisign monthly reports:


Note the peak of more than 60 million tasted domains in July 2007, and globally more than 1,25 billion drops during 3 years and a half.

With the success of the new ICANN policy aiming to end domain tasting, each registrar will have a testing limit of drops in the AGP and won't be able to claim refunds on domains less than 5 days old if the claim is for 50 domains or more than 10% of the registrar's monthly registration volume, whichever is greater.

According to ICANN:
Beginning on [1 March 2009], Operators may no longer provide refunds to Registrars for AGP deletes that exceed the threshold limits set by the Policy unless an exemption has been granted by an Operator. The Operator will be responsible for payment of registry-level fees to ICANN for any transactions that do not result in a refund of the registration fee.




Partager sur Facebook

, , , , , ,

mercredi 12 novembre 2008

Top 20 main translation workplaces

Top 20 of main Translators & Translation Workplaces & Marketplaces

Source : Google Trends - Daily Unique Visitors (average)
  1. Proz : 80,000
  2. ForeignWord.com (+ .BIZ) : 15,000
  3. Tanslators Café : 10,000
  4. Cucumis : 8,000
  5. Word2Word : 4,500
  6. Language123 : 4,000
  7. TRADUguide : 3,000
  8. Translatorsbase : 2,000
  9. GlobTra : 2,000
  10. Go Translators : 1,500

Top 10 of main Translators & Translation Workplaces & Marketplaces
From 11 to 20 (alphabetical order, no traffic data available) :
* * *

Here is what these sites are saying of themselves:

1. Welcome to ProZ.com, the world's leading enabling and sourcing platform for language professionals. ProZ.com's unique online workplace provides tools and opportunities for its members to network, collaborate on projects and terms, expand their businesses, do better work and have more fun. Plus ProZ.com enables companies and organizations to rapidly search, find, qualify, evaluate and interact with the translators, interpreters and linguists they need.
See some stats.

2. While at Foreignword.com you find all your favorite online translation tools, the Eurêka database and the hundreds of language links, Foreignword.biz is dedicated to our software products as well as the Foreignword Translators Directory.

3. Welcome to TranslatorsCafé.com — Directory of translators, interpreters and translation agencies!
4206 translation agencies
81033 registered members

4. Cucumis is a community of translators who share their linguistic knowledge and help each other online.
Members : We have 149277 registered users

5. Word2Word Language Resources is dedicated to breaking down of language barriers and assisting the users who have the desire to learn a language, a need to communicate between languages, and for those who work with languages as a profession.

6. Language123 : The translation marketplace

7. TRADUguide - Your Guide to Translators and Translation Agencies

8. Translatorsbase is the leading provider of translation services via network of global high quality service providers. Translatorsbase.com is a source of translation jobs and provides tools and services to help you bring your translation business to the next level.

9. GlobTra is a free and open international community of professional translators, which lets you find jobs, promote your services and help each other. Make your business grow, while you have fun. This is your site!
Need a translator? Here's 12000! Are you a translator? Find work, friends and help.

10. Go Translators : the top tool for bringing specialist translators and their commercial or institutional clients closer together.
Freelance translators and specialist agencies publicise their skills to the millions of companies and private individuals who use the Internet.

11. Aquarius is the longest standing online marketplace for translation and localization projects. Since February 1995 we help translation vendors find clients and assist businesses in locating reliable localization specialists. This site is a public beta. Click here to access the old Aquarius website. Facts and figures:
28568 freelance members, 4904 corporate members, 40134 translators, 7866 interpreters, 7743 subtitlers, 2058 multilingual copywriters, 949 localization engineers, 1358 multilingual DTP specialists from 136 countries.
5331 projects were outsourced through Aquarius in 2007.

12. Welcome to GLTJobs.com, the specialist job board for all the best job opportunities in Globalization, Localization and Translation across the World.
The site connects industry professionals with globalisation, localisation and translation jobs in Europe, The Far East and America. Registration is simple and takes only a few moments.

13. LinguistFinder has thousands of professional translators, interpreters, and tutors worldwide, offering any language translation and localization services at cost price.
No Obligation Language Translation Quotations From 1000's of Professional Translators, Interpreters, & Tutors

14. Trally : Are you in need of professional translation services?
We are here to help you with more than 53,000 registered Freelance Translators and Translation Agencies !

15. TranslationStaffFinder is now probably the fastest growing global translation employment website dedicated to the Translation sector. Translation Staff Finder is a specialist translation job site for those looking for jobs and employment in the Translation industry and for companies looking to resource and hire personnel with multilingual, linguistic and associated skills.

16. Translationzone : The official home for SDL TRADOS - The leading freelance translation software
Providing support and resources to a global community of over 170,000 users!

17. Translator Planet is a portal for Online Translator and online auction for language translator projects. Demo.

18. Translator.search-in.net (translatordatabase.net) - Worldwide Translator/Interpreter Database

19. TranslatorPub / Stats
Total Jobs : 12 226
Open Jobs : 2 904
Total Notifications : 1 741 021
Job Views : 405 880
Welcome!

20. TransRef - Directory of translators
There are currently 8549 translators in the Directory.


Partager sur Facebook

P.S. I took Translation Directory off the list because of this Google advisory:
Of the 19 pages we tested on the site over the past 90 days, 7 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2008-11-12, and the last time suspicious content was found on this site was on 2008-11-12.
Malicious software includes 12 exploit(s). Successful infection resulted in an average of 3 new processes on the target machine.



, , ,