ActuDoc - Information, documentation et technologies web

cms, base de données, web profond, agent intelligent, outil de veille, rss, moteur de recherche, stratégie de recherche, web 2.0

24 août 2009

Yauba, recherche sémantique et anonymat

Yauba_Tagcloud_semantiquehttp://www.yauba.com

"Yauba est basé sur plus de 25 années de recherche de pointe à l'Indian Institute of Technology, l'Université de Delhi, le Massachusetts Institute of Technology, l'Université de Harvard et l'Université de Californie à Berkeley. Pour cette raison, Yauba offre les caractéristiques, les innovations et les technologies parmi les plus avancées au monde"(1). En lisant ces lignes sur le site du moteur, j'ai voulu en savoir plus. Assurément la carte de visite est plutôt jolie.

En effet, le moteur se démarque de bien d'autres moteurs par une combinaison pertinente de fonctionnalités : algorithmes pour éliminer l'ambiguïté des termes de recherche, regroupement des résultats par type de contenu, surf anonyme et recherche parmi les sources web 2.0.

1. Un moteur pour une recherche sémantique. Yauba se concentre sur la sémantique des concepts (et non sur la fréquence) des termes de recherche. Un terme entré dans un moteur peut parfois recouvrir plusieurs sens. Par exemple le terme "golf" peut désigner le sport ou la voiture. La plupart des outils ne font pas la distinction. D'où l'intérêt d'utiliser un moteur qui "comprend" ce que vous cherchez. Dans ses versions anglophones, Yauba vous demande de préciser le sens du terme entré en affichant d'autres significations. Vous chercherez donc dans un corpus plus restreint. Testez-le avec des termes comme "sun", "java" ou "intelligence".

2. Regroupement des résultats. Sans avoir sélectionné de source, votre recherche générale vous présentera les 5 meilleurs résultats pour les sites, images, pdf, réseaux sociaux, etc. Les résultats sont pertinents et regroupés dans des panneaux successifs. Vous avez la possibilité de fermer un ou plusieurs panneaux pour faciliter la consultation des résultats. 

3. Sécurité et anonymat. Yauba est réellement conseillé comme outil de surf qui protège votre vie privée, comme on peut le lire sur cette page de l'Internet Privacy Forum. Leur politique de confidentialité est très claire: "(...) nous avons une obligation morale de protéger la confidentialité et la sécurité de nos utilisateurs. (...) nous n'utilisons pas du tout de cookies." Et ils ne conservent aucune information qui identifie l'utilisateur personnellement. En regard de chaque résultat se trouve un lien "Visiter de manière anonyme", votre navigation apparaît alors dans un frame et vous assure l'anonymat. On sait aujourd'hui que pour améliorer leurs services, les moteurs de recherche dont Google essayent d'en apprendre le plus possible sur leurs utilisateurs, voir le Google Privacy Center. C'est donc une démarche à contre-courant de la tendance actuelle. Cette approche sera bienvenue pour les spécialistes en veille et les courtiers en information.

4. Mise en valeur des sources web 2.0. Vous pouvez faire une recherche prenant en compte non seulement les sites web mais aussi les sites "temps réel" de microblogging comme Twitter, les médias traditionnels, les "social news" comme Digg, les blogs bien sûr, les "réponses" du genre Wiki Answers ou Yahoo! Answers, les réseaux sociaux comme LinkedIn et enfin les images, vidéos, PDF, Word et PowerPoint. Selon la source Web 2.0 choisie, vous pourrez également trier les résultats par source, date de parution, journaliste/agence, etc. 

Pourquoi j'utilise Yauba ?

Même si l'outil n'est pas comparable à Google en terme de taille d'index, ce moteur m'offre les avantages suivants :

- Recherche sémantique pour affiner les résultats (diminution du bruit)
- Mise en évidence des suggestions de recherche et biographies de personnes connues (cerner un sujet)
- Recherche combinée parmi les sites, images, vidéos, réseaux sociaux, ... (ne plus interroger plusieurs sites)
- Recherche en "temps réel" de sources plus rapidement à jour que Google (indexation du contenu Twitter)

Mes impressions à l'utilisation

Si vous cherchez un terme comme "golf", le moteur référence près de 3 milliards de résultats pour les sites web. Mais le moteur vous présente les différents sens possibles. Si vous souhaitez en savoir plus sur la voiture, cliquez sur le lien "Volkswagen Golf". Parmi les résultats, vous pouvez ne voir que les sites web en choisissant cette option dans la liste déroulante. Yauba vous propose alors une liste de mots-clés pour affiner votre recherche. En choisissant "Hatchback", vous ne consultez plus que 6 résultats.

D'autre part, si vous cherchez de l'information sur une personnalité connue, vous obtiendrez un encart biographique, essayez par exemple "Steve Jobs". J'ai voulu interroger le moteur avec quelques grands esprits de notre époque comme "Tony Buzan", "Alvin Toffler" ou "Ray Kurzweil". Le comportement du moteur m'a favorablement impressionné. Les résultats pour les sites web sont sensiblement identiques à Google mais j'ai apprécié que le moteur me propose parfois une petite biographie. Yauba donne systématiquement le site officiel de la personne recherchée comme premier résultat. Contrairement à Google, Yauba ne remplit pas l'écran de résultats par des liens commerciaux, ou encore ne reprend pas en premier un lien wikipedia. Autre avantage, très appréciable, un encart reprend des propositions de recherches alternatives utiles ("Try these searches" ou "Essayez aussi" dans sa version française). En un coup d'oeil, je peux ainsi cerner mon sujet grâce à cet encart tout en élargissant ma recherche. Essayez par exemple de chercher sur "Stephen Hawking", vous verrez que les suggestions de recherche de Yauba sont bien plus intéressantes que les "recherches apparentées" proposées en fin de page par Google.

Le nombre de vidéos retrouvées est similaire au nombre de résultats dans Youtube, même si Yauba ne se limite pas à ce site de partage de vidéos. Autre point positif, les miniatures des vidéos et des images sont disposées dans une matrice plutôt que l'une en-dessous de l'autre, ce qui implique que l'ergonomie a été réfléchie.

A essayer de toute urgence

Yauba est un moteur rapide, pertinent et doté de nombreuses fonctionnalités utiles. Tout comme Google, il se décline par pays. Yauba est à conseiller à de nombreux utilisateurs professionnels ou non. Par ses atouts, il rappelle un peu les metamoteurs de recherche, je pense à un outil comme Clusty qui catégorise les résultats après avoir éliminer les doublons venant de différents moteurs de recherche. Pour moi, Yauba constitue une excellente alternative à Google.


Pour en savoir plus :


- Voir la vidéo introductive de Yauba
- Lire la description des fonctionnalités du moteur
- Yauba, le moteur de recherche anonyme
- Yauba, moteur innovant et anonymisant
- L'opinion de TechCrunch
- Comparatif de 14 moteurs de recherche temps réel
- Lien wikipedia sur l'analyse sémantique

(1) Yauba posséderait même des « technologies avancées d’intelligence artificielle ». Ayant eu le plaisir d’échanger récemment avec Jean-Claude Heudin, je lui ai demandé s’il s’agissait réellement d’une IA. Voici sa réponse : Même si « les algorithmes dont on parle ici sont tous nés dans cette mouvance de recherche », « (…) On ne peut pas assimiler un moteur de recherche aussi sympathique soit-il à une « véritable » IA, c’est-à-dire une entité douée de certaines propriétés que l’on attribue généralement à un humain ou aux êtres vivants ». (…) « Yauba est selon moi une IR (intelligence restreinte), grosso modo un « programme intelligent », et non une IA ».

Posté par actudoc à 06:00 - Recherche - Commentaires [0] - Rétroliens [0] - Permalien [#]
Tags : , ,


10 février 2009

e-Reputation: Tout ce que vous direz pourra être retenu contre vous!

Mon Dieu, voilà un titre qui fait peur! On aurait pu dire aussi: les mots s'envolent, les écrits restent. Car c'est bien de cela qu'il s'agit: Google, le plus utilisé des moteurs de recherche, en "sait" beaucoup sur vous: votre présence sur les réseaux sociaux, vos interventions dans les forums et les blogs, vos photos sur Flickr, vos activités sur Twitter, vos commentaires sur Amazon, etc. Et voilà qu'il devient possible de dresser un portrait assez complet de votre personnalité à partir de ces bribes d'informations indexées depuis des années: des détails de votre temps libre à votre dernière mission professionnelle. C'est beau la technologie!

Le web 2.0 donne à tout un chacun plus de possibilité de s'exprimer ou de laisser des informations parfois très personnelles sur ces services, il convient donc d'y être attentif. Vous en conviendrez avec moi, il est largement temps de penser aux traces qu'on laisse sur le web. Pour ce qui est du passé, le moteur vous rappellera vos bourdes et autres activités dont vous n'êtes pas fier. Et quand bien même cette information n'apparaîtrait plus dans les premières pages de résultat, la Wayback Machine peut afficher le web tel qu'il était à ses débuts. Pourquoi compromettre ses chances d'embauche ou être mal noté à cause d'une photo ou d'un commentaire inconsidéré ? Alors, pensez à votre réputation numérique ou e-Reputation.

Quelques suggestions:

  1. Outil: choisissez Firefox comme navigateur, il est moins indiscret que son concurrent Internet Explorer. Il permet d'effacer vos traces ou cookies après chaque surf;

  2. Certificat: utilisez par exemple ClaimID pour centraliser l'information sur votre parcours professionnel et constituer des listes reprenant vos publications, les sites que vous conseillez, etc. Ce service délivre un certificat permettant d'authentifier l'utilisateur;

  3. Profession: inscrivez-vous de préférence sur un réseau social comme LinkedIn afin de décrire, selon vos propres critères de complétude, votre profil professionnel et les aspects de votre cursus sur lesquels vous souhaitez insister. Invitez vos clients à laisser une recommandation afin d'améliorer votre réputation;

  4. Réputation: Pour les entreprises, vérifiez si on parle de vous ou de vos produits sur Technorati ou faites appel à des spécialistes comme Cymfony, afin d'analyser le comportement des internautes-consommateurs.

Remarquez que l'entreprise pourrait être plus attentive à l'image que les internautes lui donnent. Une étude de 2007 montrait que sur les 100 entreprises du classement Fortune 100, 29 étaient gratifiées de résultats au contenu "négatif" dès la première page de Google. Du travail en perspective donc.   

Pour terminer, je vous conseille la lecture d'un billet concis et pertinent de Fred Cavazza sur le sujet. En particulier, le graphique reprenant les différentes facettes de l'identité numérique. Et puis le dossier très complet proposé par Les Infostratèges. Enfin, le blog Personal Branding d'Olivier Zara.

Pour aller plus loin...

InternetActu nous gratifie d'un long billet sur le thème de la vie privée, une réflexion sur ses bouleversements actuels et futurs. A lire avec plaisir.
FIDIS est un réseau d'excellence de la commission européenne qui aborde l'ensemble des aspects relatifs à l'identité numérique.
ORM ou Online Reputation Management et ses effets sur l'individu ou le business.

Posté par actudoc à 06:00 - Concept - Commentaires [1] - Rétroliens [0] - Permalien [#]
Tags : , , , ,

28 mars 2008

William Gibson et Google

La revue Chronic'Art du mois de mars 2008 propose un portrait de William Gibson. Ecrivain américain, père du mouvement Cyberpunk, mouvement littéraire qui aurait pressenti le réseau. Il déclare dans cette interview : « Aujourd’hui, en écrivant, je me soucie beaucoup de la façon dont les gens peuvent chercher sur Google des lieux ou des noms apparaissant dans mon texte. Je rédige dorénavant avec la conscience que ce que j’écris sera sans doute Googler. C’est une prise de conscience et un potentiel narratif authentiquement inédit ». William Gibson ne dit pas précisément les conséquences concrètes de cette idée sur son écriture, mais il est clair que Google intervient ici directement sur une écriture réelle. C’est un peu comme si le monde réel se nourrissait de Google pour s’adapter à lui.

Posté par actudoc à 06:00 - Recherche - Commentaires [0] - Rétroliens [0] - Permalien [#]
Tags :

04 février 2008

SEO, Search Engine Optimization

Le référencement internet ou Search Engine Marketing (SEM) est une discipline
e-marketing qui permet à votre site web de ressortir en tête des résultats des principaux moteurs de recherche tels que Google, Yahoo! ou Live Search.

Ces techniques visent à apporter un maximum d'informations concernant le contenu d'une page web aux robots d'indexation des moteurs de recherche. Les résultats du référencement se traduisent par l’augmentation du volume et de la qualité du trafic sur votre site, l’augmentation de votre notoriété, de nouvelles opportunités commerciales, etc. On considère généralement que le positionnement d'un site est bon lorsqu'il est classé dans l'une des dix premières réponses d'une recherche sur des mots-clés correspondant précisément à sa thématique.

1. Le référencement naturel ou organique (Search Engine Optimization ou SEO) consiste à optimiser la structure et le contenu de votre site internet afin que celui-ci apparaisse en tête des résultats naturels ou organiques des moteurs de recherche.

Il existe des freins qui empêchent un référencement efficace par les moteurs. Certains de ces freins proviennent du design même du site, de la surabondance d’images cliquables en lieu et place de liens hypertextes, ou encore de la solution CMS utilisée.

2. L’achat de mots-clés ou Search Engine Advertising (SEA) permet de positionner un site internet dans les résultats de tête des liens sponsorisés, pour une durée et un budget déterminés. Cette technique est complémentaire au référencement naturel (Search Engine Optimization).

Le Search Engine Advertising se base sur 2 principes. Le premier est le "Pay per click". En d’autres termes, vous ne payez que quand un visiteur clique sur votre lien. Le second est le système des enchères qui consiste à acheter au plus offrant une annonce pour un mot-clé. Aussi celui qui propose le meilleur prix par clic augmente ses chances d’apparaître en tête des liens sponsorisés.

Google propose un manuel pour les SEO débutants. Voir aussi le précédent billet sur le référencement et la page Search Engine Tools.

Posté par actudoc à 06:00 - Recherche - Commentaires [0] - Rétroliens [0] - Permalien [#]
Tags :
« Accueil  1