Une plateforme de veille innovante Guide de l'utilisateur - Stratieo

12 sept. 2013 - l'annotation ou encore l'ajout de notes de bas de pages. ... de Scrapbook, qui permet d'enregistrer, stocker, gÃ©rer et annoter les pages Internet.

Télécharger le PDF

9MB taille 3 téléchargements 440 vues

commentaire

Report

Tutoriel TaDaweb

Auteurs

P.Degoul - F.Gaspard

Version

V2

Date

12/09/2013

Une plateforme de veille innovante

Guide de l’utilisateur

[email protected] Page 1 sur 105

Sommaire Introduction générale ................................................................................................. 4 

Logique de mise en place d’un dispositif de Veille ....................................... 4



La logique TaDaweb ........................................................................................ 5



Structure de la plateforme de Veille TaDaweb ............................................... 6

Organisation de l’information : TaDaweb Creator ................................................... 8 Introduction à TaDaweb Creator ............................................................................ 8 I.

Sources d’information : onglet "Source" ..................................................... 10 Source Web connue : module « URL » et fonction "Webclip" .................................... 11 Source RSS connue : module « RSS Feed » ..................................................................... 14 Recherche de source : module « Google Search » ......................................................... 15 Recherche de source : module « Yahoo! Search » ........................................................ 16 Recherche de source : module « Google+ Search »...................................................... 17 Recherche de source : module « Facebook Search » .................................................... 18 Recherche de source : module « Twitter Search ».......................................................... 19 Recherche de source : module "CrunchBase" ................................................................ 25 Recherche de source depuis votre navigateur : « Bookmarklet Web Clipper » ...... 27

II.

Extraction de l’information : onglet Extract ................................................. 29 Extraction depuis le Web : module « Extract Webclip » ................................................ 29 Extraction depuis un formulaire : module « Extract Form » ......................................... 30 Extraction sous forme de liste : module « Extract List » ............................................... 32 Extraction des liens : module « Extract Link » ................................................................. 33 Extraction sous forme de table : module « Extract Table » .......................................... 34 Extraction des fils RSS d’une page : Module « Extract RSS » ..................................... 35 Extraction des images d’une page : module « Extract Image » ................................... 36

III. Traitement et structuration de l’information : onglet « Transform » .......... 37 Sélection d’information : module « Tansform » ............................................................... 38 Filtrage de résultats : module « Filter » .............................................................................. 43 Agrégation de résultats : module « Merge » ..................................................................... 46 Division des résultats : module « Split » .......................................................................... 48 Comparaison de résultats : module « Compare » .......................................................... 53 Ciblage d’un lien : module « Navigate » ............................................................................. 59

[email protected]

Page 2 sur 105

Répétition d’une action : module « Loop »........................................................................ 65 Transformation puissante : module « Custom Text » .................................................... 73 Réutilisation de listes : module « Custom List » ............................................................. 80 Modalités d’utilisation d’un TaDa ............................................................................ 85 Synthèse des fonctionnalités (outils) associables de TaDaweb ....................... 85 Points communs aux diverses fonctionnalités .................................................. 87 Utiliser un même TaDa pour exploiter une nouvelle source .............................. 88 Utiliser un nouveau White Board pour créer un TaDa ....................................... 89 Utiliser le TaDa d’un autre utilisateur .................................................................. 89 Sauvegarder un TaDa ........................................................................................... 91 Consulter, modifier, réutiliser la structure d’un TaDa ........................................ 94 Mise en mémoire et enrichissement des informations d’un TaDa .................... 97 Partage et diffusion de l’information : site TaDaweb ............................................. 99 Public TaDas ......................................................................................................... 99 TaDas privés ....................................................................................................... 100 Signalement des ajouts ou modifications des pages Web surveillées ........... 105 Rechercher un mot ............................................................................................. 105

[email protected]

Page 3 sur 105

Introduction générale Logique de mise en place d’un dispositif de Veille

Nous devons constater que le point commun à tous les échecs est un manque de vision stratégique. Dans ce contexte, la mise en place d'une capacité de veille à haute valeur ajoutée s’avère nécessaire pour des décisions plus agiles, plus efficientes afin de parvenir aux objectifs de résultats. La veille stratégique est d'ailleurs de plus en plus souvent intégrée à la prise de décision en entreprise. L’expérience montre cependant qu’il n’est pas toujours facile pour les responsables, écartelés entre l’urgent et de l’important, de définir clairement l’information qui leur est le plus nécessaire ... et par suite de s’engager dans la mise en place d’une capacité de surveillance. Pour répondre à ces difficultés, la mise en place du dispositif de Veille doit être articulée autour des trois séquences itératives suivantes (voir sur notre site) :

Cadrage, pour traduire la volonté de performance en objectifs de Veille : thématiques à enjeux forts, Implémentation qui prend en compte le sourcing (où chercher) et débouche sur le paramétrage d’une plateforme de Veille pour automatiser collecte et diffusion. Nous nous appuyons sur la plateforme TaDaweb (web 2.0, collaborative, accessible partout depuis n’importe quel système d’exploitation) ... qui vient d’obtenir (juillet 2013) le prix de l’innovation au salon i-expo (Porte de Versailles).

[email protected]

Page 4 sur 105

Exploitation afin d’aller au-delà de l’information et la rendre utilisable pour la prise de décision. La finalité du dispositif étant d’aider les entreprises à réaliser avec pragmatisme, en temps et en heure, les nécessaires actions correctives.

La logique TaDaweb

La logique qui prévaut dans la conception de l’outil TaDaweb (www.tadaweb.com), consiste à reproduire les actions que nous exécutons manuellement lorsque nous recherchons une information sur le Web. Lorsque vous visitez un site Web, vous cliquez sur un lien ou vous copier-coller une information pertinente que vous avez préalablement sélectionnée sur une partie de la page Web en cours. De la même manière TaDaweb permet de réaliser la même succession d’actions à partir d’icônes, chacune 1

exécutant une action élémentaire. En associant ces icônes ou modules préprogrammés (API ), nul besoin d’être un informaticien et de maîtriser le code pour créer le chemin de collecte-sélection, on dit aussi algorithme de veille, qui vous convient. Le processus réalisé à la main est reproduit exactement par TaDaweb, vous permettant de gagner beaucoup de temps. Une fois que vous avez « appris » à TaDaweb quelle information précise vous souhaitez obtenir à partir des sites Web fréquemment consultés, il va effectuer le processus automatiquement, à chaque fois que vous le désirez. De la même façon que manuellement diverses possibilités s’offrent à vous pour atteindre un résultat de recherche sur le Web, le choix des modules TaDaweb à utiliser et leur mode d’assemblage est très flexible et dépend des résultats auxquels vous souhaitez aboutir. Votre marge de manœuvre ne dépend que de votre créativité, à la manière de l’assemblage des pièces d’un jeu de mécano. Si l’algorithme créé ne donne pas les résultats escomptés, diverses possibilités s’offrent à vous pour élaborer l’algorithme débouchant exactement sur le résultat que vous attendez. Vous pouvez alors vous détendre : TaDaweb "bosse" pour vous !

1

Module préconfiguré ou API : API (Application Programming Interface ou interface de programmation) est une brique logicielle qui offre des fonctionnalités à un autre logiciel grâce à son interface de liaison lui permettant d’interagir avec celui-ci. C’est un module fonctionnel préprogrammé.

[email protected]

Page 5 sur 105

Structure de la plateforme de Veille TaDaweb

TaDaweb (www.tadaweb.com), est une plateforme collaborative de Veille « dans le cloud », permettant l’extraction, l’organisation et la publication d’informations à partir de sources Web et de remontées d’informations terrain. Ce nouvel outil a été créé par la compagnie TaDaweb (François Gaspard) en juillet 2012. Elle a obtenu le prix de la start-up la plus innovante au salon i-expo en juillet 2013, saluée comme offrant une « solution innovante », aux « fonctionnalités étonnantes ». Elle propose en natif la plupart des fonctions attachées à une plateforme et ce de façon ergonomique et intuitive. Basé sur une logique simple et agréable, cet outil est composé de deux parties qui seront étudiées plus loin : 1. TaDaweb Creator, qui est un logiciel-client, gratuit, installé sur le PC du veilleur. Creator peut être téléchargé ici. Il comprend trois groupes de fonctionnalités : « Source » (collecte), Extract (extraction) et Transform (traitement), chacune comprenant divers modules permettant d’aboutir à une présentation structurée et communicante de l’information.

Les modules fonctionnels de TaDaweb Creator

[email protected]

Page 6 sur 105

2. Un site Internet pour communiquer et partager l’information (les résultats de la Veille)

L’interface du site Web de TaDaweb

Le logiciel TaDaweb peut être comparé à l’outil Yahoo Pipes, déjà présenté sur notre site, au niveau de ses fonctionnalités, mais en moins rébarbatif. A l’usage il apparaît beaucoup plus facile à mettre en œuvre et à utiliser et permet à tout veilleur de se familiariser de façon aisée aux fonctionnalités d’une plateforme de Veille.

[email protected]

Page 7 sur 105

Organisation de l’information : TaDaweb Creator Introduction à TaDaweb Creator Cette première partie de l’outil, se présente comme un logiciel à installer qui permet d’organiser la Veille grâce aux différents modules fonctionnels proposés, débouchant sur une présentation structurée et actualisée de l’information collectée, appelée « TaDa ». Un TaDa désigne donc tout à la fois la structure de collecte-traitement, l’information collectée et sa présentation structurée pour consultation–diffusion par le site Web. TaDaweb Creator et composé de trois parties : un navigateur, un espace de travail ou Whiteboard et une barre latérale d’outils. 

Navigateur. Situé dans la partie droite de la fenêtre de TaDaweb Creator, il comprend une barre d’adresse et un espace de présentation de l’URL demandé.



Whiteboard. Situé au milieu, il s’agit d’un espace qui permet d’installer l’environnement de travail : collecte, sélection et traitement de l’information.



Barre latérale. Située sur la gauche, elle regroupe les fonctions et outils permettant de configurer la Veille. Trois onglets permettent de collecter (Onglet « Source »), et de sélectionner, trier, combiner, comparer les informations (Onglets « Extract et Transform »). Un quatrième onglet « TaDa » permet de retrouver les TaDas créés et enregistrés.

L’ interface de TaDaweb Creator : barre d’outils, Whiteboard et navigateur

[email protected]

Page 8 sur 105

Ce logiciel installé constitue le module de travail destiné à la « création » du chemin de veille, comme l’indique son nom « Creator ». L’ordre de présentation des trois onglets « Source », « Extract » et « Transform » suit les trois étapes de manipulation des données. Chacun d’eux regroupent différents modules permettant le sourcing, l’extraction et la pré-exploitation de l’information. Ces outils peuvent être interconnectés sur le White Board comme nous le verrons plus loin, afin de combiner et compléter les fonctionnalités (sous certaines réserves).

[email protected]

Page 9 sur 105

I.

Sources d’information : onglet "Source"

Pour créer une veille, il est nécessaire de définir une source : il peut s’agir d’une page Web (URL), d’un flux RSS (RSS Feed) ou de résultats de recherche issus de Google, Yahoo!, Google+, Twitter ou Facebook, ou encore de Crunchbase. L’onglet Source du logiciel TaDaweb Creator propose ainsi huit types de sources à utiliser pour commencer sa veille (voir barre latérale gauche).

Pour accéder aux fonctionnalités de chacune d’elle, il suffit de "Glisser-Déposer" l’icône désirée sur l’espace de travail, comme indiqué ci-dessous. Lorsqu’il s’agit d’un site Web, il faut tout d’abord entrer l’URL du site dans le navigateur (ici celle du site Les Echos). Puis, en déplaçant l’icône Source "URL" dans l’espace de travail, l’adresse de la page apparaît automatiquement sous celle-ci (comme indiqué ci-dessous).

Glisser-déposer des icônes (modules fonctionnels) sur le Whiteboard

Par contre les adresses des flux (pour la source "RSS Feed") et les requêtes (pour les moteurs de recherche, les média sociaux ou pour CrunchBase) doivent être entrés dans la fenêtre qui apparaît dès que l’une de ces icône est déposée sur l’espace de travail.

[email protected]

Page 10 sur 105

Source Web connue : module « URL » et fonction "Webclip"

En passant le curseur sur l’icône "URL" placée sur le Whiteboard, une main apparaît (permettant son déplacement dans l’espace de travail) avec deux symboles. 

Le premier (triangle noir vers le bas), comprend trois

options : -

"Description", qui permet d’affecter un titre pour

décrire la page du site. Dans le cas illustré ici, nous pouvons indiquer que nous avons demandé la page « Intelligence économique » du site Les Echos.

-

"Display Webpage", qui permet de réafficher la page correspondant à l’URL de l’icône, lorsqu’on revient sur un TaDa (le TaDa 2) depuis un autre TaDa (le TaDa 1 par exemple – voir les onglets TaDas situés en haut à gauche, sur la même ligne que la barre d’adresse URL),



"Keep Look&Feel", qui permet de garder la disposition des éléments de la page.

Le second (croix rouge) permet de supprimer l’icône URL du Whiteboard. A noter qu’on peut également supprimer un groupe d’icônes à l’aide du bouton « supprimer » (schématisé par une poubelle) en haut du WhiteBoard.

Pour sélectionner une partie que l’on souhaite collecter ou dont on souhaite surveiller les mouvements dans la page Web affichée, cliquer sur l’icône URL (située dans le Whiteboard) pour rendre actif le pictogramme « cible » : fonction Webclip, situé en haut de cet espace. Sa couleur passe alors du rose au vert.

[email protected]

Page 11 sur 105

En cliquant sur ce pictogramme, la page surveillée devient ombrée. Il suffit alors de déplacer le curseur sur la zone ombrée pour mettre en clair (blanc) la partie présentant un intérêt (voir copie d’écran ci-dessous). Une fois la zone choisie par la mise en surlignage clair, il suffit de cliquer sur le bouton

pour

extraire les informations sélectionnées

vers

Whiteboard

(ou

le de

double cliquer sur le bloc à extraire).

Sélection des informations dans une page Web Le chemin de sélection est alors automatiquement représenté par deux nouvelles icônes, la première présentant l’action créée « Extract Webclip » et la deuxième le résultat de la sélection, l’extrait ou « Webclip ». A chacun des niveaux représentés, il est possible comme précédemment d’affecter une description (cf. texte en bleu sous-titrant le texte proposé par TaDaweb Creator). Pour l’extrait en soi, le Webclip propose en plus de "Description" qui permet d’affecter un titre, une option supplémentaire "Show" qui permet de visualiser l’extrait choisi (voir ci-dessous) qui sera consultable en ligne via le site Web.

Il est possible de sélectionner

un

autre article de la même

page,

de

façon indépendante à

la

première

sélection en cliquant une nouvelle fois sur l’icône URL pour rendre actif le pictogramme « cible ». Dans l’exemple cidessous nous avons ainsi sélectionné l’article (« Du nouveau dans Drive : créez, partagez et éditez des cartes mentales ») et même l’ensemble des 10 articles les plus récents (ici au 7 avril 2013) présentés sur la page Web. Comme précédemment, il est possible d’affecter des descriptions aux nœuds du processus. A chaque fois, il est possible d’accéder aux extraits sélectionnés en cliquant sur le bouton « show » visible lorsque le curseur passe sur le triangle noir associé au Webclip.

[email protected]

Page 12 sur 105

Certaines des informations extraites concernent des données ou un texte « figé » (peu susceptible de modifications

ultérieures)

qui

seront

ensuite

regroupées dans un « journal » créé sur le Dashboard en ligne, en vue d’en diffuser le contenu à d’autres utilisateurs. Dans

le schéma ci-contre, ce type

d’information correspond aux Webclip A et B. D’autres

informations

extraites,

fréquemment

modifiées, doivent faire l’objet d’une surveillance : ce type d’information correspond au Webclip C puisqu’il s’agit d’une page qui est amenée à évoluer selon l’actualité des articles. L’organisation de la surveillance sera présentée plus loin.

Nota : la fonction Webclip peut aussi être mise en œuvre à la volée, sur une page Web avec le Web Clipper qui peut être installé directement sur votre brower (Firefox, Safari, Chrome, Internet Explorer)

[email protected]

Page 13 sur 105

Source RSS connue : module « RSS Feed »

Cet outil a pour but de faciliter l’extraction d’informations via l’utilisation d’un flux RSS. A la différence de l’outil URL qui permet d’extraire des informations à partir d’une URL quelconque, l’outil « RSS Feed » permet de suivre spécifiquement les fils d’information proposés par un site. Pour utiliser cet outil, il suffit d’un glissé-déposé sur le Whiteboard. Ce faisant, le logiciel ouvre une fenêtre dans laquelle l’utilisateur entre les adresses des flux RSS à surveiller.  Soit

la

dispose

d’un

page flux

RSS. C’est le cas de l’exemple

de

la

newsletter

du

site

Easi-ie. Il suffit de cliquer sur l’icône (voir ci-contre). En cliquant sur cette icône, il suffit de copier l’adresse qui apparaît dans la barre d’adresse du Navigateur puis de la coller dans l’interface d’entrée de l’outil « RSS Feed » comme ci-dessus. Après avoir finalisé l’extraction des données liées au flux RSS, l’utilisateur obtient alors une liste de données, consultable par clic. Notons que les résultats de sortie de plusieurs flux sont triés automatiquement. Nota : pour repérer et extraire plus aisément la présence de flux RSS sur une page présentant un intérêt, utiliser l’outil « Extract RSS » présenté plus loin. 

Soit le site ne contient pas de flux RSS. Pour créer le flux RSS d’une page spécifique, utiliser l’outil « Diphur », présenté ici sur notre site. Mentionnons que l’on peut aussi utiliser l’outil « Extract list » de TaDaweb (voir-ci après) qui permet de traiter l’information d’une page, « presque » comme un flux RSS.

[email protected]

Page 14 sur 105

Recherche de source : module « Google Search »

A la différence des précédents outils qui pointent vers une URL spécifique, cet outil permet de surveiller les résultats obtenus sur une thématique donnée grâce à un groupe de mots-clés pouvant mettre en œuvre l’algèbre booléenne ainsi que les autres opérateurs traditionnels de Google (guillemets, recherche par formats, etc). Comme les précédents modules, il s’utilise en le déposant sur le Whiteboard. S’ouvre une interface d’entrée libre permettant à l’utilisateur de définir les mots-clés avec lequel il souhaite surveiller les sources et documents correspondants. L’utilisateur pourra restreindre les résultats de sa recherche à un format de document donné (tous, PDF, documents, ou xls). Le bouton « Search », permet d’accéder aux 10 premiers résultats de la recherche. (10 étant une entrée par défaut non modifiable). Le logiciel créé le résultat sous forme de liste se composant des titres des 10 premiers résultats de la recherche. Cette liste est consultable par double clic ou en choisissant l’option « Show List » par clic droit sur l’icône « List ». Pour une recherche sur les motsclés « E-réputation AND RSS», l’outil prend en compte la demande formulée par les opérateurs booléens et donne alors un résultat précis (voir ci-dessous). Remarque: Les résultats obtenus par les outils Google Search et Yahoo Search de

TaDaweb

peuvent

présenter

des

différences par rapport à ceux obtenus par la même requête posée directement dans ces moteurs. En effet, leurs algorithmes utilisent en plus des critères "in the page" (mots clés et position /fréquence dans la page), des critères "off the page" (usage de la page par les internautes : temps passé, liens, habitudes de recherche, situation géographique, ...) qui ne sont pas pris en compte avec TaDaweb. Les résultats retournés par Google Search et Yahoo Search ne sont pas biaisés par l’historique de navigation de l’utilisateur, et donc les résultats présentés ici par TaDaweb montrent exactement les sites qui ont le meilleur ranking dans Google, contrairement à une recherche directe sur ces navigateurs.

[email protected]

Page 15 sur 105

Recherche de source : module « Yahoo! Search »

Ce module s’utilise de la même façon que l’outil Google Search. Il contient plus d’options (restriction, précision). Après avoir glissé-déposé l’icône sur le Whiteboard, le logiciel ouvre l’interface d’entrée de motsclés. Il est possible ici d’affiner sa recherche en précisant le format du document (tous, PDF, Microsoft office), mais il se différencie de son concurrent en permettant de préciser le type de ressource à trouver (« service ») ou encore en modifiant le nombre de résultats à obtenir. En choisissant les services « News » ou « Blog », l’outil propose également d’affiner la recherche par un critère d’actualité. En prenant l’exemple d’une recherche sur « Outils AND agrégateurs», l’utilisateur obtient une liste des résultats les plus pertinents. Cette liste est consultable par les mêmes moyens que ceux employés plus haut pour l’outil « Google Search » (voir ci-dessous).

Dans un travail de veille, ces outils peuvent être utilisés pour comparer les premiers résultats de recherche des différents moteurs Google et Yahoo. Dans l’exemple utilisé ci-dessus, les résultats

trouvés

par

les

différents

moteurs sont totalement différents. Pour une comparaison optimale des résultats, utiliser l’outil « Compare » présenté plus loin.

Remarque : Voir ci-dessus à propos de Google, les écarts qui peuvent être constatés entre les résultats d’une même requête posée dans l’outil Yahoo de TaDaweb et sur le moteur Yahoo!

[email protected]

Page 16 sur 105

Recherche de source : module « Google+ Search »

Cet outil permet de surveiller à l’aide de mots-clés, différents types d’informations à travers le réseau social de Google, « Google + ». Dans un premier temps, glisser l’icône de l’outil « Google + Search » sur le Whiteboard. Le logiciel ouvre alors automatiquement une fenêtre de saisie libre. Les utilisateurs pourront alors choisir le type de ressources à rechercher avec l’option « Service » : « Post », recherche les Posts publics, tandis que « User » (page) ou « Community » permettent de surveiller une page en particulier, par exemple celle qui concerne les compétiteurs. Le nombre d’informations à extraire est donné par « #Results » ainsi que le type de résultat « Result Type » (les plus récents ou les meilleurs). Prenons l’exemple d’une recherche sur le sujet des plateformes de curation. Les informations recherchées étant, comme ci-contre, une dizaine de posts des différents utilisateurs, contenant les mots « plateforme curation »

et

étant

catégorisé

comme

« Recent ».

Le logiciel obtient alors les données demandées et les restituent sous forme de liste (image ci-contre). Ici, le nombre de résultat demandé est de 10, mais la liste finale ne contient que 7 résultats, le nombre d’informations trouvées étant inférieur à 10. En double-cliquant sur la « List », l’utilisateur peut avoir un aperçu des informations extraites.

[email protected]

Page 17 sur 105

Recherche de source : module « Facebook Search »

Cet outil permet de surveiller les résultats obtenus sur un mot ou groupe de mots-clés publié(s) dans le réseau social Facebook. Les mots-clés entrés via cet outil peuvent être recherchés 

en choisissant « Post », lorsque le mot-clé est présent dans les posts publics (recherche similaire à la recherche de posts publics depuis facebook),



en choisissant « Page », pour rechercher une page précise sur Facebook (page publique d’une marque comme par exemple https://www.facebook.com/nespresso ou d’un utilisateur par exemple). Comme pour les précédents outils, il s’utilise en le déposant sur le Whiteboard. S’ouvre alors une interface d’entrée libre permettant à l’utilisateur de définir les mots-clés qu’il souhaite surveiller.

Le logiciel présente les données correspondant à la requête sous forme d’une icône « List ». Cette liste, consultable par clic, donne le résultat ci-dessous (Résultat obtenu via l’outil Facebook Search - concerne le côté droit de la page).

En utilisant cet outil, on obtient les résultats du post le plus récent au plus ancien. Les commentaires et autres posts directs sur le mur de TaDaweb (encadrés bleus à gauche de la page) ne sont pas restitués par l’outil Facebook Search.

[email protected]

Page 18 sur 105

Recherche de source : module « Twitter Search »

Objet Twitter ouvre sur une grande diversité de sources d’information et apporte spontanéité (instantanéité) et simplicité (un clic pour accéder à sa timeline, scroll, bookmark des tweets intéressants). L’outil permettant de cibler les sources est « Twitter Search » (module préconfiguré). Tout comme l’outil « Facebook Search » et « Google+ Search », ce module permet de surveiller soit les messages publics, soit une page précise (un Profile).

Présentation Commencer par glisser l’icône de l’outil « Twitter Search » sur le Whiteboard. Le logiciel ouvre alors automatiquement une fenêtre de saisie libre. Trois options sont accessibles :  "Service", qui permet de faire des recherches sur un tweet, un nom d’utilisateur (personne, marque, ...), ou un 2

hashtag ,  "# Results", qui permet de sélectionner le nombre de résultats souhaité,  "Result Type", qui permet de sélectionné les résultats les plus récents, les plus populaires ou les deux (All).

2

Hashtag débute par le signe typographique croisillon « # » (appelé hash en anglais) suivi d’un ou plusieurs mots accolés sans espace (le tag ou étiquette) Ex. #WikipediaEnFrançais. Il permet de marquer un contenu avec un mot-clé, d’identifier une thématique sur les réseaux sociaux Sur Twitter les hashtags sont interprétés comme des liens hypertextes menant à une page de résultats recensant tous les tweets contenant le hashtag.

[email protected]

Page 19 sur 105

Recherche de Tweets Recherchons ce qui se dit sur la Sté Danone à travers tous les Tweets. Pour ce faire il suffit de sélectionner dans « Service » l’onglet « Tweet » et demander par exemple 50 résultats. En cliquant sur « Search » on obtient les 50 premiers Tweets évoquant Danone.

Recherche d’utilisateurs Si maintenant nous souhaitons obtenir l’avis d’utilisateurs sur Danone, nous devons cliquer sur l’onglet « User ». En cliquant sur « Search », nous obtenons un second écran avant de pouvoir lancer la recherche. Cet écran propose des noms d’utilisateurs, parmi lesquels nous

[email protected]

Page 20 sur 105

devons choisir celui qui convient le mieux, compte tenu de notre objectif de recherche.

En choisissant Danone Group nous obtenons ainsi 100 Tweets officiellement publiés par Danone.

[email protected]

Page 21 sur 105

Utilisation en situation : filtrage des Tweets Si maintenant nous souhaitons filtrer les Tweets émis par Danone Group pour ne garder que ceux qui concernent un sujet particulier : par exemple les acquisitions du groupe, plusieurs possibilités s’offrent à nous en reliant l’icône Tweeter Search à un module de l’onglet « Transform ». Filtrage par l’outil « Transform » Faire glisser l’outil Transform sur le Whiteboard et dans « Transformation on Line or Column » choisir l’option « Keep Line containing ». En cliquant sur « Execute » après avoir insérer le mot-clé « Acquisition », on obtient 3 Tweets contenant ce mot sur les 100 de la liste.

[email protected]

Page 22 sur 105

Filtrage par l’outil « Filter » Faire glisser l’outil Filter sur le Whiteboard et dans la fenêtre qui s’ouvre entrer le mot « acquisition ». Relier l’icône Filter à l’icône « List (100) ». S’assurer en cliquant deux fois sur l’icône Filter que la règle de filtrage concerne bien « Lines containing at least one keyword ».

On obtient bien entendu la même liste des 3 tweets précédente. Mais avec l’outil Filter on peut étendre le concept contenu dans le mot-clé « Acquisition », en ajoutant par exemple les mots clés « Acquired » et « Growth » détectés en parcourant la liste initiale des 100 tweets. Une liste de 17 tweets est alors proposée.

Pour relier deux icônes,

il

est

nécessaire d’utiliser l’icône de connexion

situé en haut à droite

sur

le

Whiteboard.

[email protected]

Page 23 sur 105

Mise en mémoire et veille Si nous souhaitons maintenant avoir une alerte lorsque Danone Group publiera un Tweet sur le sujet, nous devons tout d’abord sauvegarder ce TaDa « Save TaDa », puis demander d’être alerté par mail.

[email protected]

Page 24 sur 105

Recherche de source : module "CrunchBase"

Cet outil a pour but de faciliter l’extraction d’informations depuis la base de Techcrunch. Techcrunch est un blog spécialisé dans les startups Internet. Ce blog et tous ses sites et activités annexes ont été rachetés par AOL en sept. 2010. CrunchBase est la base de données gratuite d'entreprises de technologie, des hommes qui les dirigent et des investisseurs Pour utiliser cet outil, il suffit d’un glissé-déposé sur le Whiteboard. Ce faisant, le logiciel ouvre une fenêtre dans laquelle il entre le nom de la société (plutôt US) sur laquelle des informations sont recherchées. Plusieurs options sont proposées :

 "Service" qui comprend à son tour 3 options : -

"Company", qui permet d’accéder aux

données concernant l’entreprise -

"Person",

qui

permet

d’accéder

aux

données concernant les dirigeants -

"Fin. Org.", qui permet d’accéder aux

données financière de l’organisation Selon l’option choisie, les options accessibles dans le champ suivant "Fields" sont automatiquement surlignées.

 "Fields" qui comprend une série d’options conditionnées par le choix du "Service". Les options accessibles sont surlignées. Plusieurs options peuvent être simultanément choisies. Nous sommes intéressés par les investissements et les acquisitions de Apple En cliquant sur « Search » une nouvelle fenêtre s’ouvre permettant de sélectionner l’entreprise du groupe que l’on souhaite étudier. Ici, nous choisissons d’étudier la compagnie Apple.

[email protected]

Page 25 sur 105

En cliquant sur « Search » nous obtenons deux tables, l’une pour les acquisitions et l’autre pour les investissements. Chacune de ces tables donnent le nom, la date de la transaction et le montant. La

première

donne

les

37

acquisitions

réalisées depuis 2008

La seconde table donne les 4 investissements effectués. En cliquant sur une colonne, celle contenant le nom des entreprises par exemple (ou sur une ligne) le module "Split" est automatiquement activé et une liste est extraite du tableau. Si nous souhaitons obtenir des listes séparées pour chaque colonne, il faut alors glisser-déposer l’icône Split et le relier à une table. Puis en double cliquant sur cette icône, les différentes listes sont alors automatiquement proposées (voir ci-dessus, partie droite de la copie d’écran).

[email protected]

Page 26 sur 105

Recherche de source depuis votre navigateur : « Bookmarklet Web Clipper »

Le Webclip permet de découper une partie d’un page relative à votre centre d’intérêt sur une source déjà répertoriée. Mais il est très utile de pouvoir découper une partie d’une page consultée, à la volée, lors d’un « surf », c'est-à-dire lors d’une exploration du Web sur un sujet donné. 3

Un Bookmarklet dénommé « Web Clipper » permet d’extraite rapidement des Webclips directement depuis votre navigateur Internet. Cette fonction est dynamique : elle ne stocke pas de façon statique et définitive. L’information ainsi collectée va pouvoir être mise à jour lors des modifications ou ajouts faits sur le « clip » (l’extrait) sélectionné, assurant ainsi une veille automatique. Menu Explore. Le Web Clipper est accessible en cliquant

sur

le

menu

« Explore » du site en ligne (en haut à droite), puis sur l’option

« Tools ».

Un

simple glisser –déposer sur la barre d’outils (toolbar) du navigateur rendre

permet active

de cette

fonctionnalité (voir schéma suivant)

Une fois le Web Clipper dans la barre d’outils, il suffit de cliquer sur « +Clip a TaDa » pour obtenir en bas de page la fonctionnalité. Pour sélectionner directement tout ou partie de la page il suffit de cliquer sur « Select » puis sur « Expand » pour élargir la zone de sélection. « Save » permet ensuite de créer un TaDa à la volée (voir ci-dessous, page suivante) et intégrer automatiquement à votre « Profile ».

3

Un bookmarklet est un (petit) programme JavaScript pouvant être stocké dans la barre des favoris de votre navigateur

[email protected]

Page 27 sur 105

[email protected]

Page 28 sur 105

Extraction de l’information : onglet Extract

II.

Après avoir ciblé précisément la source à surveiller, le logiciel propose de choisir le type d’information à extraire à l’aide du deuxième onglet « Extract ». Cet outil offre la possibilité d’extraire différentes formes d’informations, telles que du texte, des listes, des images ou encore des tableaux. (Voir ci-contre les différents formats de données pouvant être extrait). Pour utiliser la commande d’extraction, il faut tout d’abord préciser la source dont on va extraire les données : URL, RSS. Remarque : Certaines formes de données comme des tableaux, peuvent être extraites directement depuis une source URL ou RSS ou mêmes depuis des sources telles que « Google Search », « Yahoo Search », « Google+/Twitter/Facebook Search ».

Extraction depuis le Web : module « Extract Webclip »

Dans l’onglet d’extraction, l’utilisateur pourra retrouver l’outil « Extract Webclip », le Web Clipper déjà présenté ci-dessus. L’une des particularités de TaDaweb est qu’à travers ces différents onglets ou modules, l’utilisateur peut utiliser différentes manières pour arriver au même résultat, en reliant les modules glissés sur le Whiteboard grâce à l’icône de connexion. Avec TaDaweb il y a toujours plusieurs façons pour réaliser une fonctionnalité. Par exemple, sur un site web, vous pouvez utiliser -

soit l’Extract Webclip,

-

soit l’Extract List

pour extraire la même information. La différence sera que, dans ce dernier cas, la liste sera structurée et pourra être filtrée. Les divers modules peuvent être vus comme des pièces de mécano qu’on assemble pour réaliser une opération : différents outils pouvant être associés pour réaliser la même opération finale.

[email protected]

Page 29 sur 105

Extraction depuis un formulaire : module « Extract Form »

Comme nous l’avons mentionné dans l’introduction, TaDaweb reproduit exactement ce que vous devez faire lorsque vous entrez un login ou un mot de passe. Extract Form a pour principale utilité de cibler tous les champs d’un formulaire présent dans une page Web. Beaucoup de pages Web contiennent par exemple des barres de recherche ou encore des cadres pour que l’utilisateur puisse s’enregistrer et se connecter ou rechercher un type d’information. Ce module permet donc de trouver tous ces formulaires et d’en choisir l’entrée adaptée à votre besoin.

Prenons l’exemple du site Les Echos. Pour se diriger vers une page précise à l’aide de la barre de recherche, entrer l’adresse du site désiré dans le navigateur et utiliser la source « URL » (dans l’onglet source). Glisser l’outil « Extract form » sur le Whiteboard pour le relier à l’icône URL à l’aide de l’outil de lien (étapes 2 et 3 ci-contre)

Le logiciel ouvre une fenêtre proposant à l’utilisateur les différents formulaires trouvés sur la page du site exploré. Pour regrouper les différentes pages sur un sujet donné, entrer les mots-clés désirés dans le formulaire de recherche (ici, Intelligence économique).

Le site recherche tous les articles sur le site correspondant au(x) mot(s) utilisé(s). Pour finaliser la recherche, appuyer sur le bouton « Execute ». 

Sur le Whiteboard, le logiciel charge les données recherchées et leur attribut une nouvelle adresse URL comme ci-contre (Intelligence économique).



Sur le Navigateur, le logiciel charge la nouvelle page correspondant à la requête. L’utilisateur peut alors extraire de nouvelles informations sur la page précise qu’il a demandé.

[email protected]

Page 30 sur 105

Lorsque la recherche concerne un site demandant identification (l’utilisateur ayant un compte créé auparavant), TaDaweb permet d’extraire le formulaire d’authentification. Entrer l’adresse du site désiré dans le navigateur et glisser l’outil source «URL » sur le WhiteBoard. Relier ce dernier à l’outil « Extract Form ». S’ouvre alors une interface dans laquelle l’utilisateur peut entrer ses identifiants. En cliquant sur « Execute », le logiciel va charger sur le Whiteboard une nouvelle URL avec les informations demandées. Le Navigateur chargera la nouvelle page, montrant le nouveau contenu auquel l’utilisateur peut dorénavant accéder.

Remarque : La sauvegarde du TaDa ne permet pas de publier cette action et de la retrouver en ligne puisqu’à cette étape,

aucune

information

n’a

été

extraite.

[email protected]

Page 31 sur 105

Extraction sous forme de liste : module « Extract List »

Ce module très simple permet d’identifier automatiquement et d’extraire directement sous forme de liste un résultat de recherche (tout résultat de recherche est présenté sous forme de liste) (cf. Vidéo). Pour cela, relier l’icône URL comportant l’adresse du site contenant les listes à extraire, à l’icône Extract List. Ici, un exemple d’extraction de liste sur la source Les Echos. Toutes les listes sont alors extraites automatiquement par le logiciel sous l’icône dénommée « Smart List ». Les différentes informations regroupées dans cette icône peuvent être consultées en cliquant une première fois sur l’icône, puis en cliquant sur « Show List ».

Exemple de résultat de liste ci-contre. Ces listes pourront ensuite être retravaillées avec les différents outils de transformations en vue d’en optimiser la visualisation et de ne garder que les informations jugées pertinentes.

Mentionnons que ... -

L’outil Extract List est un des outils les plus puissants de TaDaweb puisqu’il reconnaît automatiquement des listes présentes sur un site Web ... ce qui permet de simuler « presque » un flux RSS sur des sites qui n’en possèdent pas.

-

Pour extraire une liste précise sur une page Web, il faut tout d’abord créer un Webclip, puis connecter un Extract List à ce Webclip.

[email protected]

Page 32 sur 105

Extraction des liens : module « Extract Link »

De la même manière que pour l’extraction de listes, TaDaweb Creator propose dans un premier temps 

d’identifier tous liens se trouvant sur une page web précise



de regrouper ces différents liens sous forme de liste.

Pour extraire ces différents liens sous forme d’URL, l’utilisateur doit relier l’outil « URL » à « Extract Link ». Ici, la source est le site Les Echos. Aucune entrée n’est alors demandée et l’extraction se fait automatiquement. Le nombre de liens exportés est précisé entre parenthèse sous la liste créée. Cette liste est consultable en double cliquant et peut être nommée via l’option « Description » comme ci-contre.

Notons que le module Extract link

peut aussi extraire des liens

concernant les images. Enfin Extract Link peut être utilisé pour extraire les liens à partir de n’importe quelle source : URL ou moteurs de recherche ou média sociaux comme présenté ci-dessous. Cependant, à la différence de l’URL, Extract Link ne peut être appliqué directement sur ces sources : une liste doit préalablement être extraite.

[email protected]

Page 33 sur 105

Extraction sous forme de table : module « Extract Table »

TaDaweb Creator propose de simplifier la tâche du veilleur avec l’outil « Extract Table ». Cet outil est capable d’identifier les différents tableaux d’une page web et d’extraire le tableau souhaite sous sa forme initiale. En reliant l’icône « Extract Table » à l’icône de source « URL », le logiciel cherche automatiquement les différents tableaux pouvant se trouver sur le site. Dans un premier cas, le logiciel ne trouve qu’un seul tableau, comme dans l’exemple du site outilsfroids.net. Le logiciel montre le tableau qu’il extrait. Voir image ci-dessous

 Si une seule ligne ou colonne du tableau semble pertinente à utiliser, cliquer sur le numéro de la ligne ou colonne (gauche ou haut) de la donnée voulu et cliquer sur « Extract ». La ligne ou colonne est extraite séparément du reste, non plus sous forme de tableau mais de liste comme ci-contre.  Si le tableau entier semple pertinent à garder, cliquer sur « Cancel ». Dans un deuxième cas, le logiciel trouve plusieurs tableaux sur la page. L’utilisateur doit préciser quel tableau conserver en cliquant sur la ligne correspondant comme dans l’exemple ci-dessous. Pour finaliser le choix du tableau, cliquer sur « Extract ». En double cliquant sur l’icône « Table », l’utilisateur peut choisir une seule ligne ou colonne

à

conserver

en

cliquant sur son numéro. Cette extraction se fait alors sous forme de liste comme précédemment.

[email protected]

Page 34 sur 105

Extraction des fils RSS d’une page : Module « Extract RSS »

Le module Extract RSS a pour but de faciliter l’extraction d’informations via l’utilisation d’un flux RSS. Comme indiqué dans l’introduction, TaDaweb permet de réaliser une action de différentes façons. A la différence de l’icône Source « RSS Feed » qui demande à l’utilisateur d’entrer lui-même l’adresse du flux RSS à surveiller, l’outil Extract RSS permet de trouver tous les fils d’information proposés sur une page Web et de choisir quel flux surveiller. Prenons pour exemple ici l’extraction de flux RSS du site Easi-ie. Après avoir indiqué l’adresse du site dans la barre de recherche de la partie droite, glisser l’outil « URL » sur le Whiteboard. Faire de même avec l’outil « Extract RSS » (étape 1), choisir l’icône représentant un lien

(étape 2), pour l’étendre de l’icône « Extract RSS » à

l’icône URL : la connexion entre la source et le module d’extraction est alors réalisée.

Une fois le lien créé, le logiciel propose un encadré demandant quel flux RSS surveiller en particulier (image ci-contre). Il suffit alors à l’utilisateur de sélectionner le flux RSS qu’il désire suivre en cliquant dessus. Cette possibilité d’extraction de fils RSS est également

possible

avec

les

autres

modules. En effet, si plusieurs tableaux, liens ou encore images sont disponibles sur la page Web (ou la partie de page) consultée, l’outil propose à l’utilisateur de choisir les flux qui l’intéresse. Cette possibilité n’existe pas pour le module Extract List.

[email protected]

Page 35 sur 105

Extraction des images d’une page : module « Extract Image »

La dernière forme d’extraction directe proposée par le logiciel TaDaweb est celle d’images se trouvant sur une page Web. Ce module permet de cibler une image contenue sur la page Web en cours et d’extraire celle-ci ou encore d’extraire toutes les images contenues sur la page ciblée. Une fois l’icône Extract Image reliée à la source (ici Scoop it), une interface s’ouvre, présentant l’ensemble

des

images

présentes de la page (comme ci-contre). En cliquant sur « Select All », toutes

les

images

sont

extraites. Si

une

seule

image

est

souhaitée, cliquer sur celle que l’on souhaite extraire (ici le personnage schématisé). Le module crée alors une nouvelle

icône

contenant

l’image

sélectionnée

ou

l’ensemble des images. Si

l’utilisateur

désire

extraire

deux

images

différentes se trouvant sur la même page, il devra faire apparaître deux fois l’icône « Extract image » sur le Whiteboard et les relier à la source comme cicontre. Après avoir cliqué sur la flèche noire associée à l’icône Extract Image, cliquer sur le bouton « Extract image » :

l’interface

se

ferme,

finalisant

alors

l’extraction de l’image sélectionnée. Si l’utilisateur souhaite extraire toutes les images contenues sur la page, il devra alors faire un clic droit sur l’icône « Extract Image » pour obtenir le résultat ci-contre. En choisissant « Extract Image », le logiciel va recharger l’extraction de l’image choisie. En sélectionnant « Select an other image », le logiciel rouvrira l’interface permettant de choisir l’image à extraire.

[email protected]

Page 36 sur 105

III. Traitement

et

structuration

de

l’information

:

onglet

« Transform »

Une fois les sources et les données à extraire ciblées, l’utilisation du logiciel entre dans sa troisième phase, celle de la « transformation » des informations.

La troisième phase que met à notre disposition le logiciel est la plus importante en regard de l’output de la veille. Grâce à ce module il sera alors possible de créer certaines règles qui permettront d’ajouter ou supprimer un contenu automatiquement en fonction des besoins de l’utilisateur. Il existe en tout 9 modules différents visant à transformer le flux d’information. (Voir schéma ci-contre).

[email protected]

Page 37 sur 105

Sélection d’information : module « Tansform »

Objet L’outil « Transform » sert à sélectionner des informations dans les textes, listes et tableaux obtenus lors de la mise en œuvre des outils « Extract List », « Extract Table » ou « Extract Webclip ».

Obtention d’une liste Nous cherchons par exemple à établir et à suivre la liste des projets de recherche et des projets industriels conduits par le pôle de compétitivité Vitagora en 2010 et 2011. Nous devons tout d’abord dans la partie droite de la fenêtre de TaDaweb Creator, inscrire l’identifiant du site dans la barre d’adresse et valider.

Comme souvent nous remarquons que la liste des projets s’étend sur plusieurs pages (de 1 à 6). Après vérification, seules les pages 1 et 2 concernent les années 2010 et 2011. Pour sélectionner la partie que l’on souhaite collecter dans chacune de ces pages ou dont on souhaite surveiller les mouvements, glisser-déposer l’icône Source « URL » sur le Whiteboard pour rendre actif le pictogramme « cible » : fonction Webclip, situé en haut de cet espace. Sa couleur

[email protected]

Page 38 sur 105

passe alors du rose au vert. En cliquant sur ce pictogramme, la page surveillée devient ombrée. Il suffit alors de déplacer le curseur sur la zone ombrée pour mettre en clair (blanc) la partie présentant un intérêt. Comme souvent, le Webclip obtenu comporte en première ligne et en dernière ligne des informations qui concernent le site mais pas l’information recherchée (ici, en première ligne nous avons le mode de sélection des pages consultables). Il est souhaitable de les éliminer pour obtenir une liste propre.

Utilisation du module « Transform » Pour éliminer la première et la dernière ligne du Webclip nous allons mettre en œuvre l’outil « Transform ». Ce module ne s’applique que sur une liste, une table ou un texte formaté. Il est donc nécessaire ici de relier le Webclip ainsi obtenu à un module d’extraction « Extract List » afin d’obtenir une liste formatée ou « Smart List ». Reconduire l’opération pour la page 2 depuis un nouvel icône Source « URL ». Relier la Smart List que l’on vient de créer à l’outil « Transform ». Une fois ces deux éléments reliés, le logiciel ouvre une nouvelle interface permettant à l’utilisateur de trier les informations et de ne garder que les pertinentes.

[email protected]

Page 39 sur 105

Pour confirmer la transformation souhaitée, cliquer sur

en bout de ligne.

L’interface enregistre la modification effectuée par l’utilisateur dans la partie « Transformations History » et réalise l’action demandée. Dans le cas d’une erreur de modification, l’utilisateur peut annuler toutes les modifications effectuées en appuyant sur le bouton

en bas de l’interface.

Si l’utilisateur à créé plusieurs modifications et ne veut en supprimer qu’une, sélectionner d’un clic la modification concernée dans la partie « Transformations History » et cliquer sur

. Cette

opération ne supprimera que la modification indiquée. Une fois toutes les transformations validées, cliquer sur le bouton

.

Le logiciel créé une nouvelle liste comportant le résultat issu de toutes les modifications effectuées par l’utilisateur.

[email protected]

Page 40 sur 105

Utilisation en situation du module « Transform » Dans le cas traité ici, nous pouvons assembler ces deux listes filtrés à l’aide du « Merge »

module en

choisissant l’obtient liste (et non pas tableau) afin d’avoir les projets les plus récents en tête de liste

[email protected]

Page 41 sur 105

Mise en mémoire et veille

En enregistrant ce TaDa il devient possible d’établir une Veille sur les nouveaux projets.

[email protected]

Page 42 sur 105

Filtrage de résultats : module « Filter »

Objet Le module Filter comme son nom l’indique permet de créer un filtre à partir de mots-clés. Ces « motsclés » vont ensuite pouvoir être associés au sein d’une syntaxe afin de garder ou éliminer les documents recueillis.

Utilisation du module Filter Pour utiliser cet outil, il suffit comme pour les autres de le déposer sur le Whiteboard. Automatiquement l’icône « Filter » fait apparaître deux nouvelles icônes qui lui sont reliées : "Keyword list" sur le côté et une icône située en dessous qui contiendra les résultats trouvés lorsque Filter sera relié à un module source (pour l’instant nous n’avons que « No Data found »). En double cliquant sur l’icône « Keyword list », une nouvelle interface apparaît où l’on peut entrer un ou plusieurs mots clés Avec cette interface, l’utilisateur peut définir les mots-clés en les tapant dans la zone de texte libre. Une fois le mot-clé écrit dans la zone de texte, appuyer sur la touche « Add » pour l’ajouter à la liste de mots-clés à surveiller. Si l’un des mots se trouvant dans la liste ne doit pas être utilisé lors du filtrage, l’utilisateur devra alors le désélectionner en cliquant sur « Remove ». Le motclé est alors supprimé de la liste. Pour que le filtrage sur la liste soit toujours effectué avec ces mots-clés, la case « Permanent Data » est cochée par défaut. Lorsqu’elle est décochée, vous pourrez utiliser la liste pour une autre source (filtrage dynamique). Nous avons utilisé pour icône Source « RSS Feed » chargé ici avec 8 flux RSS venant de blogs

de

spécialistes de la veille. Cet ensemble de flux débouche sur 107 résultats (voir ci-contre). Si

parmi

cet

ensemble

de

résultats,

notre

préoccupation concerne les RSS (agrégateurs, ...), nous devons entrer le mot clé « RSS » dans la Keyword list: 10 résultats sont sélectionnés.

[email protected]

Page 43 sur 105

Mais nous pouvons rajouter autant de mots clés que notre préoccupation l’exige. Ainsi par exmple en ajoutant un autre mot clé : « moteur », nous obtenons l’ensemble des résultats concernés par ces deux mots-clés (15 résultats).

La syntaxe de la requête est construite à partir d’une nouvelle interface en double-cliquant sur le module « Filter » déposé sur le Whiteboard, relié à la source. Différentes options de filtrage sont proposées : 6 en tout. Le premier mode de filtrage, qui est utilisé par défaut, est le filtre permettant de sélectionner les résultats qui comportent soit dans le titre soit dans le corps du texte le mot-clé désigné (ou les mots clés). La partie sur laquelle s’applique le filtre est dénommé

« lines »

par

TaDaweb. Nous devons bien comprendre la logique de ce filtrage : à chaque

fois

que

les

flux

surveillés vont mentionner une nouvelle information contenant l’un ou l’autre des mots-clés entrés

dans

la

liste,

cette

information sera envoyée sur la liste des résultats filtrés.

[email protected]

Page 44 sur 105

Un second mode de filtrage (situé sous le premier) fait l’inverse et supprime les lignes comportant le /les mots clés. Les autres options de filtre sont réalisées sur le nombre de mots-clés utilisés (un ou tous) avec respectivement en partant de la gauche et du haut de la fenêtre de sélection du mode de filtrage : 

Garder tout si le texte contient l’un des mots



Garder tout si le texte contient tous les mots



Supprimer tout si le texte contient l’un des mots



Supprimer tout si le texte contient tous les mots Pour illustrer cette fonctionnalité, prenons le cas d’une recherche menée avec le mot-clé : « agrégateurs de flux », sur le site Outils froids. Faire glisser l’icône « RSS Feed » sur le Whiteboard et entrer l’adresse du flux RSS. Déposer l’outil « Filter » sur le Whiteboard. Une interface s’ouvre automatiquement, proposant à l’utilisateur d’entrer les mots-clés à surveiller. Valider la liste en cliquant sur « Save » (voir la Keyword liste représentée ci-contre).

Relier ensuite l’icône « List Outils froids » à l’icône « Filter ». L’utilisateur obtient alors une nouvelle « List » ne regroupant que les 12 informations répondant au filtre des mots-clés. Dans cet exemple, sur 187 articles à la base, il ne reste après filtrage que 12 articles en rapport avec le sujet défini. A chaque fois qu’un nouveau billet contiendra l’un ou l’autre de ces mots-clés, il sera ajouté à la liste filtrée des 12 résultats. Remarque : Possibilité d’enregistrer la liste de mots-clés pour la réutiliser sur une autre source (cf. ciaprès). De même la syntaxe est réutilisable pour d’autres thèmes de veille. L’outil Filter ne peut être appliqué qu’à certains résultats. On pourra par exemple appliquer cet outil sur un résultat sous forme de liste ou de tableau, mais pas sur un résultat de type Webclip puisque celui –ci est considéré comme un tout (un texte en soi). Ainsi, par exemple, en appliquant un filtre visant à supprimer une ligne contenant le mot « information », si ce mot apparaît dans le résultat du Webclip, tout sera supprimé, car le logiciel voit le résultat comme un tout indivisible.

[email protected]

Page 45 sur 105

Agrégation de résultats : module « Merge »

Cet outil permet de regrouper des données provenant de sources différentes. Prenons par exemple les flux RSS : l’outil TaDaweb permet de surveiller divers flux RSS distincts. Si dans sa veille, l’utilisateur veut pouvoir suivre deux flux RSS différents puis les regrouper, il le peut grâce au module Merge. Il peut ensuite avec ce même outil, présenter les différentes données regroupées sous forme de liste ou encore de tableau. Comme exemple ici, le site demainlaveille.fr. Utiliser deux fois l’outil « Extract RSS » pour suivre les différents flux de ce site. Relier ces deux outils à la source.

Après avoir reliés ces différents modules, une interface s’ouvre, laissant choisir quel flux RSS suivre. Pour le Premier module « Extract Rss », suivre par exemple le flux de commentaires. En double-cliquant sur le deuxième module « Extract RSS », la même interface s’ouvre. Choisissons un autre flux à suivre, comme celui de motsclés. Nous obtenons une liste différente pour chaque module d’extraction.

Pour regrouper ces différentes listes, en seul flux, l’utilisateur devra faire glisser le module « Merge » et le relier aux deux « List » par l’icône

. L’outil propose alors

à l’utilisateur de gérer la forme de ce regroupement selon la position dans la matrice : soit sous forme de tableau (placement sur l’axe l’horizontal), soit sous forme de liste (placement sur l’axe vertical). Dans ce dernier cas un positionnement supérieur ou inférieur permet de prendre en compte l’ordre d’apparition des résultats des 2 listes.

[email protected]

Page 46 sur 105

En

choisissant

regrouper

ces

de

données

sous forme de liste, on obtient le résultat ci-contre. Tandis qu’en regroupant les données sous forme de tableau,

on

obtient

le

résultat ci-dessous. Le module Merge peut être utilisé sur d’autres formats de données comme les images

ou

encore

les

extraits de pages.

Notons que l’outil Merge va automatiquement trier la liste finale de deux flux RSS.

[email protected]

Page 47 sur 105

Division des résultats : module « Split »

Objet L’outil Split est un module ayant pour objet de séparer une liste ou un tableau en plusieurs listes. En quelques sortes, il est l’outil inverse de « Merge ». La principale fonction de cet outil est de simplifier la lecture pour une meilleure visibilité et permettre l’exploitation sur les seules données utiles. Il permet de diviser un groupe de résultats en plusieurs sous-groupes distincts, plus aisés à exploiter.

Présentation Faire glisser l’icône de l’outil « Split » sur le Whiteboard. En cliquant sur la flèche noire associée à cette icône, trois options apparaissent.  « Description » permet d’affecter un titre à l’icône,  « Select element to split », permet de désigner une colonne (ou une ligne) à isoler d’un tableau pour la transformer en une seule liste.  « Split », a pour effet de faire éclater l’ensemble du tableau en autant de listes que de colonnes (ou de lignes, en désignant au préalable les lignes dans le tableau), parmi lesquelles nous devrons sélectionner celles qui nous intéressent (voir ci-dessous).

Exemple : Obtention d’une liste des noms d’inventeurs de brevets Problématique Nous recherchons les inventeurs des derniers brevets publiés (2012, 2013 ... et 2014 pour les publications à venir), sous le nom du demandeur « Danone », dans la base Worldwide (demandes de brevet publiées, issues de plus de 90 pays, interrogeable en anglais, accessible sous Esp@cenet INPI). Nous sommes seulement intéressés par l’intitulé (titre), l’inventeur et la date de priorité. La page affichée dans le navigateur de TaDaweb montre une structure complexe (cf. l’extrait suivant).

[email protected]

Page 48 sur 105

Mise en œuvre Commencer par faire glisser l’icône Source « URL » sur le Whiteboard : il charge automatiquement l’adresse du site INPI. Comme l’outil Split ne fonctionne que sur des listes ou des tableaux, nous n’allons pas utiliser la fonction Webclip. Nous allons directement utiliser l’outil « Extract Table » étant donné la structure en tableau de la page Web.

Nota : parfois « Extract table » ne fonctionne pas directement. Il peut alors être utile de réaliser un Webclip au préalable. Cette table comprend 7 colonnes relatives aux 7 attributs de la page Web : Titre, Inventeur, Demandeur, CPC, CIB, Publication, Priorité. Pour isoler les colonnes qui nous intéressent, il suffit de glisser l’outil « Split » sur le Whiteboard et le relier à l’icône « Table ».

[email protected]

Page 49 sur 105

Dans notre cas, comme nous souhaitons obtenir trois listes : Titre, Inventeur, date de priorité, nous devons sélectionner « Split » qui a pour effet de faire éclater l’ensemble du tableau en autant de listes que de colonnes (ou de lignes, en désignant au préalable les tableau),

parmi

lignes

dans

lesquelles

le

nous

devrons sélectionner celles qui nous intéressent (encadrées en rouge dans notre cas).

Mise en forme Nous devons maintenant « nettoyer » ces listes qui comprennent des lignes vides ou contenant des symboles ou des (parties) de textes qui ici ne nous sont d’aucune utilité. Pour la liste des titres des brevets, nous pouvons utiliser l’outil « Loop » qui permet de sélectionner les attributs qui nous intéressent : ici le titre seul, d’où une liste non bruitée.

[email protected]

Page 50 sur 105

Pour la liste des inventeurs, qui comprend des lignes vides et le mot « Inventeur » à chaque ligne, nous pouvons utiliser l’outil « Transform » pour obtenir une liste « propre » comme indiqué ci-dessous (voir « l’historique des transformations »).

De même pour la liste des dates de priorités, l’outil « Transform » permet d’éliminer lignes vides et le terme « date de priorité : ».

Il nous reste à regrouper ces 3 listes en un tableau à 3 colonnes : Titre, Inventeurs, Date

de

priorité

en

utilisant

l’outil

« Merge » à deux reprises. La fin du « chemin de veille » du Tada est présentée ci-contre.

Mise en mémoire et veille Après avoir enregistré de façon à ce que ce TaDa soit public, le résultat accessible sur le site web est présenté page suivante.

[email protected]

Page 51 sur 105

[email protected]

Page 52 sur 105

Comparaison de résultats : module « Compare »

Objet

Le module « Compare » permet de comparer les résultats obtenus par divers modules (ou outils) proposés par TaDaweb. Il peut être appliqué sur les listes et tableaux, mais aussi sur des résultats de requête posée sur Google et Yahoo par exemple.

Présentation

Dans l’exemple ci-dessus, une recherche sur les mots-clés « Soudage haute fréquence » avec les outils « Google Search » et « Yahoo Search » a été mise en place. Après avoir glissé les icônes des deux outils sur le Whiteboard et poser la même requête sur chacun des deux outils, cela abouti à la création de deux listes, chacune d’elle regroupant respectivement les résultats de recherche de Google et de Yahoo. Pour comparer les résultats de ces deux recherches, il faut relier chacune de ces listes à l’outil « Compare ». Le logiciel ouvre alors une fenêtre visant à choisir le mode de comparaison des données. La première colonne (à gauche) présente les résultats de « Google Search », la deuxième colonne (celle du milieu) les résultats de « Yahoo Search ». La comparaison effectuée par le logiciel est toujours réalisée de la première colonne vers la deuxième. Elle porte sur la totalité du texte. Le symbole

qui les sépare permet d’inverser les deux colonnes, ce qui peut avoir pour effet de

modifier l’ordre des résultats de la comparaison obtenu dans la troisième colonne (celle de droite) afin de choisir l’ordre de présentation que l’on souhaite y voir.

[email protected]

Page 53 sur 105

Principe d’utilisation

Recherche des correspondances exactes Dans le cas de figure présenté ci-dessus, nous avons choisi de refuser le « Smart Match? » en positionnant le curseur sur « No ». Le logiciel recherche alors les correspondances exactes de texte (Exact Match : texte identique), puisque le curseur de « Result » a été positionné sur « Same » : il n’y en a aucune entre les deux colonnes (la colonne 3 des résultats de la comparaison est vide). Notons que par défaut le tableau affiche 2 lignes par résultats. Mais il est possible d’étendre le nombre de lignes du descriptif en positionnant le pointeur sur la ligne inférieure dans la colonne des numéros des résultats (ici la ligne du résultat N°1 colonne 1 de « Google Search » et la ligne du résultat N° 10 colonne 2 de « Yahoo Search »). Ce qui permet de vérifier, malgré des similitudes apparentes, qu’il ne s’agit pas de la même source (une légère différence apparait au niveau de la troisième ligne de ce résultat). Toujours en refusant le « Smart Match? » : curseur positionné sur « No », mais en glissant le curseur de « Result » sur « Different », le logiciel sélectionne dans ce cas les résultats dont le texte diffère en tout ou partie. Cette fois-ci, comme on pouvait s’y attendre, la colonne trois présente les 20 résultats issus de la fusion des colonnes un et deux.

[email protected]

Page 54 sur 105

Notons que les résultats obtenus dans la troisième colonne, dans l’un et l’autre cas, ne sont pas modifiés lorsqu’on inverse la position des colonnes un et deux.

Recherche des correspondances approchées En choisissant de positionner le curseur de « Smart match? » sur « Yes », avec « Result » positionné sur « Same », le logiciel recherche les résultats de chacune des deux colonnes dont les textes sont très proches et présentent des mots communs (mais dont l’ordre peut être inversé par exemple).

Ici il est intéressant de voir que les deux moteurs de recherche ont 9 résultats en communs parmi leurs 10 premiers résultats, dont certains concernent la même information ... on n’est pas loin du dédoublonnage, mais l’outil n’assure pas par lui-même l’élimination des doublons. En choisissant de positionner le curseur de « Smart match? » sur « Yes », mais avec « Result » positionné sur « Different », le logiciel révèle les résultats qui diffèrent. Dans l’exemple donné, 4 résultats sont franchement différents (voir ci-après page suivante).

Pour valider cette comparaison, cliquer sur le bouton « ok ». Le logiciel

conçoit

automatiquement

une

liste

ne

regroupant

seulement que les résultats communs ou différents selon le besoin de l’utilisateur.

[email protected]

Page 55 sur 105

Utilisation du module « Compare » en situation : amélioration de la liste de résultats Quelques exemples d’utilisation de l’outil « Transform ». Si l’on souhaite affiner par exemple la liste dans les résultats obtenus avec « Smart Match » et « Same », et éliminer les deux dernières lignes concernant le fabricant Franic et Transtec (offre d’emploi), il faut entrer le nombre de dernières lignes de la liste à éliminer (ici 2)

[email protected]

Page 56 sur 105

Si l’on souhaite de plus éliminer les résultats issus de Wikipédia (trop général), il faut entrer ce mot dans « Delete line » : 6 résultats alors restent dans la liste.

Mais en réalité, si nous nous intéressons au soudage de tubes par haute fréquence : inscrire le mot clé dans « Keep line », puis « Execute » : nous obtenons 4 résultats

[email protected]

Page 57 sur 105

Mise en mémoire et veille En sauvegardant ce TaDa, une veille peut être mise en place avec alertes mail lorsqu’un nouveau résultat sera proposé sur Google ou Yahoo.

[email protected]

Page 58 sur 105

Ciblage d’un lien : module « Navigate »

Objet Le module Navigate permet de cibler un élément d’une liste, d’un tableau, d’une image ou d’un texte, et de créer un lien direct vers cette partie, exactement comme vous le feriez manuellement. Ce module ne peut pas s’utiliser tout seul dans le sens où il n’extrait pas réellement de données : Il donne une URL. C’est donc un module complémentaire aux autres modules destiné à cibler une partie de la source.

Présentation Il est important de bien comprendre qu’en utilisant TaDaweb, tout ce que vous faites manuellement peut être reproduit par le logiciel. Le module Navigate permet ainsi de sélectionner les liens (par exemple) qui vous intéressent dans une page Web, exactement comme vous le feriez manuellement. Par défaut, lorsque vous connectez l’icône Navigate à votre information sous forme de liste, tableau, image ou texte, Navigate cliquera sur le premier lien accessible. Le logiciel TaDaweb va alors automatiquement présenter la page correspondant au lien cliqué dans son navigateur et dans le même temps faire glisser sous l’icône Navigate, une nouvelle icône URL présentant l’adresse correspondant de la page présentée. Cette nouvelle page peut être traitée exactement comme une nouvelle source Web originale, avec des informations qui peuvent en être extraites. Si vous souhaitez cliquer sur un autre lien (en milieu de liste par exemple), il est nécessaire au préalable d’isoler ce lien, puis de réaliser la connexion avec Navigate. L’outil Navigate a pour principale utilité de combler un certain manque que l’on rencontre avec l’outil LOOP. En effet, avec l’outil LOOP on ne peut extraire qu’un type d’informations, retranscrit dans la liste d’extraction, tandis qu’en utilisant l’outil Navigate en complément de l’outil LOOP, on peut extraire un type d’informations directement sur une page

Utilisation en situation du module Navigate : couplage aux modules « source URL » et « Extract List » Dans l’exemple donné, nous cherchons à extraire une liste des brevets détenus par IBM à partir de la base USPTO. Une fois la page chargée dans le navigateur, faire glisser l’icône Source URL sur le Whiteboard.

[email protected]

Page 59 sur 105

Nous observons que le premier lien de cette page est « Home » (voir encadré fléché dans la copie d’écran ci-dessus). Si nous faisons glisser l’icône Navigate et la relions directement à l’icône Source, nous observons que, effectivement, c’est cette nouvelle page qui est retenue par Navigate et présentée dans le navigateur (voir ci-dessous).

Pour extraire les informations recherchées sur les brevets (titre, demandeur, date, abstract, ...), nous devons donc au préalable générer une liste formatée des brevets. Pour ce faire glisser-déposer l’icône « Extract list » et la relier à l’icône Source URL.

[email protected]

Page 60 sur 105

Nous pouvons observer que la « Smart

List »

générée

ne

comprend plus que la liste des 51 premiers brevets déposés par IBM. Cette liste, comme indiqué cicontre, comprend en première ligne l’intitulé de la lsite (PAT. NO. Title), puis sur chacune des lignes suivantes le numéro et le titre du brevet. Lorsque

nous

faisons

glisser

l’icône Navigate sur le Whiteboard et la relions à la Smart List ainsi créée (voir ci-dessous), nous pouvons observer que la page correspondant au premier lien (le premier brevet de la liste dont le titre est : « Method and system for navigating ... » est affichée dans le navigateur et que son adresse est inscrite automatiquement sous l’icône URL déroulée sous l’icône Navigate (le titre de la liste correspondant à la première ligne, ne contenant pas de lien, étant ignoré).

[email protected]

Page 61 sur 105

Remarque : le temps de traitement sur TaDaweb étant limité à 30 secondes afin de ne pas saturer le logiciel, il est nécessaire de limiter le nombre de ligne de la liste à 10 au maximum pour que les traitements ultérieurs (avec le module Loop voir ciaprès) ne risquent pas d’atteindre, voir dépasser, cette allocation de temps. Du fait de cette limitation, il est nécessaire de transformer

la

liste

pour

ne

garder

que

10

informations au maximum. Pour cela, déposer l’outil « Transform » sur le Whiteboard et ne garder par exemple que les 5 premiers brevets. On obtient alors une

liste

ne

contenant

plus

que

5

lignes,

correspondant à ces 5 brevets (voir ci-dessous). Renouveler la démarche pour les 10 brevets suivants, et ainsi de suite.

[email protected]

Page 62 sur 105

Utilisation en situation du module Navigate : couplage au module Loop et utilisation du module Webclip Si nous souhaitons cliquer automatiquement sur chacun des liens de la liste en vue d’extraire l’information pertinente recherchée (par exemple dans le cas de la liste de brevets ci-dessus : auteur, date et abstract), l’outil « For Each » de la partie « Start loop » du module Loop doit être utilisé, afin de pouvoir réaliser la même action sur chacun des éléments de la liste. Connectons l’icône For each (voir page suivante) à la liste des 5 brevets et relions l’icône Navigate (glissé sur le Whiteboard) à l’icône « List Element » (voir copie d’écran N°1) qui apparaît automatiquement sous l’icône « For each ». Comme précédemment, le navigateur affiche alors la page Web décrivant le premier brevet de la liste et un nouvel icône URL (celui de la page affichée) apparaît en dessous (voir partie droite du schéma général présenté ci-dessous). Pour extraire le nom d’auteur et la date nous utilisons le module d’extraction « Webclip » (Extract Webclip) en sélectionnant à l’aide l’icône cible situé en haut du Whiteboard la ligne nom d’auteur et date. Nous obtenons le Webclip correspondant (voir copie d’écran N°2). Relions ce dernier Webclip à l’outil « add » de la partie « End loop » du module Loop. En cliquant 2 fois sur l’icône « add », la boucle de sélection est mise en œuvre successivement pour chacune des 5 lignes de la liste des 5 brevets et la liste correspondante est déroulée automatiquement (voir copie d’écran N°3). Sur la partie gauche du schéma, nous avons reproduit la même logique de sélection pour isoler l’abstract. La liste des 5 abstracts est alors associée avec celle des auteurs-date précédente avec l’outil « Merge » pour déboucher sur le tableau final (voir copie d’écran N°4).

[email protected]

Page 63 sur 105

[email protected]

Page 64 sur 105

Répétition d’une action : module « Loop »

Objet Le module « Loop » n’est utilisable que sur des données présentées sous forme de liste. Il permet de définir une règle de sélection des attributs à retenir parmi ceux qui caractérisent chaque élément de la liste. En effet, les éléments d’une liste présentent toujours la même structure, constituée d’une suite d’attributs telle que par exemple : titre, auteur, date, liens, mots-clés, ... Le module « Loop » permet de choisir sur le premier élément de la liste, ceux des attributs que nous souhaitons conserver (par exemple le titre ou la date) et va créer des boucles pour appliquer la règle ainsi définie à l’ensemble (des éléments) de la liste.

Présentation Après avoir fait glisser sur le Whiteboard l’outil « Loop », deux icônes apparaissent « Start loop » (for each ... sous entendu pour chacun des éléments de la liste) et en dessous « End loop » (add ... sous entendu à l’outil Loop). Ces deux icônes sont reliées par une flèche en tirets grisés mettant en évidence la fonction boucle. En reliant Start Loop à une « Smart List » une nouvelle icône « List Element » apparaît (voir ci-après)

Utilisation en situation du module Loop : obtention d’une liste bibliographique

Problématique. Nous recherchons les livres publiés dans le domaine de la « Stratégie d’Entreprise ». Une source bien connue pour rechercher un livre sur une thématique donnée est le site http://www.amazon.fr/. Dans la partie droite de la fenêtre de TaDaweb Creator, inscrivons l’identifiant du site dans la barre d’adresse et validons. Sur le site, dans la catégorie « Livres en français », entrons les mots de la requête : une liste de livres avec l’image de leur page de garde est proposée. Nous

souhaitons

obtenir

une

bibliographie

simplifiée comportant : le titre, l’auteur et la date de parution. Nous ne souhaitons pas, pour l’instant, retenir les autres indications : éditeur, nombre de pages, prix, délais de livraison, commentaires, ...).

[email protected]

Page 65 sur 105

Obtention d’une « Smart List » Commencer par faire glisser l’icône Source « URL » sur le Whiteboard et sélectionner les titres des livres avec la fonction Extract Webclip : nous obtenons une liste de 13 livres. La relier au module d’extraction « Extract List » pour obtenir une liste formatée ou « Smart List » des 13 ouvrages.

Mise en œuvre de l’outil « Loop » Après avoir fait glisser sur le Whiteboard l’outil « Loop », deux icônes apparaissent « Start loop » (for each ... sous entendu pour chacun des éléments de la liste) et en dessous « End loop » (add ... sous entendu à l’outil Loop). Ces deux icônes sont reliées par une flèche en tirets grisés mettant en évidence la fonction boucle. Relier la Smart Liste des 13 résultats à « Start loop ». Une

nouvelle

icône

apparaît

« List

Element » :

en double cliquant sur cet icône on voit le premier élément de notre liste (comparer la copie d’écran ci-contre à la liste ci-dessus). C’est sur ce premier élément, qui constitue en quelques sortes un échantillon modèle de la liste, que nous allons pouvoir préciser quel type d’attributs garder. Pour ce faire nous devons surligner à l’aide du pointeur de la souris (et non, pas simplement désigner) l’attribut à conserver. L’opération se fait en deux passes dans notre cas : -

Surlignage du titre complet, pour obtenir un Webclip « Extraction du titre »

-

Surlignage du nom d’auteur et de la date de parution de l’ouvrage, pour obtenir un Webclip « Extraction de l’auteur et de la date ». Pour terminer la boucle, il suffit de relier chacun de ces deux derniers Webclips à l’icône « End loop ». Le logiciel déroule alors automatiquement une « Table » qui reprend les éléments demandés (voir

[email protected]

Page 66 sur 105

ci-dessous).

Obtention de sous listes thématiques Comme on peut le remarquer, un onglet « Extract » en bas de tableau est destiné à extraire un sous ensemble de ce tableau en fonction des besoins : une colonne (ou un groupe de colonnes), ou une ligne (ou un groupe de lignes). Ainsi en surlignant la colonne 1 et en cliquant sur « Extract », le module « Split » est activé et produit uniquement la liste des titres.

Mise en mémoire et veille En mettant en mémoire ce TaDa, nous pouvons être alertés pour toute parution de livre nouveau.

[email protected]

Page 67 sur 105

Utilisation en situation du module Loop : obtention d’une liste de hashtags

Problématique La problématique que nous souhaitons aborder ici consiste connaître la façon dont un acteur du Web (le pôle de compétitivité Vitagora dans le cas traité) se qualifie, c’est-à-dire à quels hashtags (mots clés) il s’associe lui-même sur Twitter et finalement quelle image il donne de lui-même. 4

Nous souhaitons obtenir la liste des Hashtags sous lesquels Vitagora se présente sur Twitter et non pas la liste de tous les liens associés aux tweets postés par d’autres utilisateurs non officiels.

Obtention d’une liste générale des hashtags Pour ce faire commençons par glisser l’icône « Twitter Search » sur le Whiteboard. Le logiciel ouvre alors automatiquement une fenêtre de saisie libre. Comme nous souhaitons obtenir le point de vue utilisateur, nous devons cliquer sur l’onglet « User » et demander 100 résultats (le filtrage sur 10 résultats est aisément fait manuellement). En cliquant sur « Search », nous obtenons un second écran avant de pouvoir lancer la recherche. Cet écran propose des noms d’utilisateurs, parmi lesquels nous devons choisir celui

qui convient le mieux, compte tenu de l’objectif de la recherche et du fait que les plus satisfaisants sont proposés en tête de liste. Nous choisissons donc ici le Pôle lui-même et obtenons

une

nouvelle

liste

de

100

tweets

officiellement lancés par Vitagora lui-même, sur laquelle nous allons appliquer l’outil « Loop ». 4

Hashtag débute par le signe typographique croisillon « # » (appelé hash en anglais) suivi d’un ou plusieurs mots accolés sans espace (le tag ou étiquette) Ex. #WikipediaEnFrançais. Il permet de marquer un contenu avec un mot-clé, d’identifier une thématique sur les réseaux sociaux

[email protected]

Page 68 sur 105

Mise en œuvre de l’outil « Loop » Après avoir fait glisser sur le Whiteboard l’outil « Loop », deux icônes apparaissent « Start loop » et en dessous « End loop » reliées par une flèche en tirets grisés.

Relier la liste des 100 résultats (Tweets) à « Start loop ». Un nouvel icône apparaît « List Element » : en double cliquant sur cet icône on voit le premier élément de notre liste (comparer l’extrait ci-dessous à la liste des Tweets présenté ci-dessus).

C’est sur ce premier élément, qui constitue en quelques sortes un échantillon modèle de la liste de Tweets, que nous allons pouvoir préciser quel type d’attributs garder. Ce premier élément de la liste comporte un certains nombre de liens, comme les autres Tweets qui suivent, que nous devons rendre explicite.

Pour extraire ces liens, nous devons connecter le module « Extract Links » à l’icône « List Element ». On obtient la liste des liens contenus dans le Tweet (ici 8 liens).

[email protected]

Page 69 sur 105

Sélection des hashtags. Nous savons par ailleurs que sur Twitter, les hashtags sont interprétés comme des liens hypertextes menant à une page de résultats recensant tous les Tweets contenant le hashtag. Puisque chaque hashtag débute par le symbole « # », nous devons filtrer la liste de liens sur le caractère « croisillon » pour extraire ces hashtags. Pour se faire, nous ne pouvons utiliser le module « Filter » puisque cet outil ne filtre que sur le mot-clé exact. Nous devons utiliser le module « Transform » qui permet avec l’option « Keep Line ... containing word » de ne garder que les liens contenant (débutant par) le croisillon – voir cidessous. On

obtient

résultats

une

liste

(liens),

qui

de

2

seuls

contiennent des hashtags.

L’action étant terminée, nous devons connecter cette liste de 2 hashtags à l’icône « Add » (end loop) pour que cette opération puisse s’effectuer de façon analogue sur la liste des 100 tweets.

[email protected]

Page 70 sur 105

Nous obtenons une liste de 152 éléments contenant tous les hashtags présents dans la liste originale des 100 tweets (voir page suivante). Cependant cette liste contient des doublons comme nous pouvons le constater ci-dessous. Pour les éliminer nous allons à nouveau utiliser le module « Transform », mais en appliquant cette fois-ci l’option « Remove Duplicate ». La liste finale de hashtags dédoublonnés contient 121 éléments.

[email protected]

Page 71 sur 105

Mise en mémoire et veille En sauvegardant ce TaDa, nous pourrons visualiser la liste par laquelle Vitagora se décrit et mettre une alerte sur ce TaDa afin d’être informé de toute nouvelle orientation de Vitagora.

[email protected]

Page 72 sur 105

Transformation puissante : module « Custom Text »

Objet

« Custom Text » permet de personnaliser, à partir de

vos

mots-clés,

les

requêtes

posées

simultanément dans les diverses sources que vous souhaitez exploiter.

Mais il réalise aussi d’autres

fonctions

Présentation De ce fait, ce module de transformation est le plus souvent utilisé avant de glisser-déposer toute icône Source sur le Whiteboard. Dès que l’icône Custom Text est déposée sur Whiteboard, une fenêtre s’ouvre demandant (le) les mots-clés à utiliser. Puisque cet outil permet la recherche par mots-clés, il n’est utilisable que via les sources réseaux sociaux « Twitter Search », « Facebook Search » et « Google+ Search » et via les moteurs de recherche « Google Search » et « Yahoo! Search ». Remarquons que la case « Permanent Data » est cochée par défaut. Cela permet d’exploiter la même requête sur les diverses sources déposées sur le Whiteboard. Lorsque cette case est décochée, cela permet de réutiliser le TaDa une fois créé et sauvegardé : mêmes modules Source et même algorithme (le même chemin de collecte-sélection-traitement), pour réaliser un nouveau TaDa à partir d’une nouvelle sélection de mots clés.

Utilisation en situation du module Custom Text Une fois entré le mot clé sur lequel vous souhaitez baser votre requête, glisser-déposer les icônes Source que vous voulez utiliser et relier les à Custom Text. Chacune des icônes source

est

alors

simultanément

et

automatiquement chargée avec le mot clé choisi, et va fournir une sortie répondant à cette requête. On peut ainsi rapidement tester une même requête sur différentes sources à partir du même mot-clé.

[email protected]

Page 73 sur 105

En cliquant sur « Save », vous obtenez alors le résultat de la recherche faite simultanément sur les deux sources. Le veilleur obtient ainsi deux listes correspondant aux recherches effectuées avec les mêmes mots-clés sur les deux sources (ici TaDaweb est le mot clé entré).

Mais les fonctionnalités de l’outil Custom Text ne s’arrêtent pas à la mise en commun d’une recherche sur deux ou plusieurs sources.

Cet outil permet également :

◦

Utilisation de la sortie (output) d’une source comme input de Custom Text.

Supposons que nous nous intéressions au marché des ingrédients laitiers et, dans ce cadre, que nous explorions le site Lactalis : n°1 européen et n°2 mondial du lait derrière Nestlé. En parcourant la page des ingrédients laitiers de ce site, nous souhaitons approfondir les données concernant les « Produits Nutrition et Santé » qui concernent le marché plus spécifique du bien-être. Nous extrayions donc le Webclip correspondant (voir ci-dessous).

[email protected]

Page 74 sur 105

Si nous connectons ce Webclip à l’icône Source « Google Search », ce

module

Source

va

automatiquement entrer comme sujet de recherche, le texte du Webclip (voir ci-desous). Nous obtenons une liste de 10 résultats concernant ce sujet. Si

maintenant

nous

souhaitions

effectuer

cette

recherche sur plusieurs sources : Google Search, Yahoo Serach et Crunchbase (afin par

exemple

d’identifier

des

entreprises "Competitors" aux USA), nous devons utiliser le module Custom Text et le connecter en amont au Webclip et en aval à ces trois sources. Nous obtenons les résultats présentés ci-dessous.

[email protected]

Page 75 sur 105

◦

Transformation en bloc de texte. N’importe quel élément : liste, tableau, Webclip ou même URL peut être transformé en bloc de texte avec Custom Text.

◦

Recherche avec valeur dynamique. En reliant Custom Text à divers outils-source (voir cidessous) et en omettant de cocher la case « Permanent Data », il devient possible de réutiliser le TaDa créé et sauvegardé (ayant pour sujet la Sté TaDaweb dans l’exemple donné), pour effectuer la recherche sur les mêmes sources mais sur un nouveau sujet (sur la Sté Easi-ie dans l’exemple donné).

En effet lorsqu’on exécute le TaDa, le Custom Text redemande avec quelle valeur l’action doit être effectuée, puisque la case Permanent Data n’a pas été cochée. De la même façon, Custom Text permet d’effectuer la même action sur le formulaire d’un site proposant plusieurs options ou mots-clés de recherche, sans avoir à recommencer le processus d’authentification.

[email protected]

Page 76 sur 105

◦

Transformation en bloc de texte. N’importe quel élément : liste, tableau, Webclip ou même URL peut être transformé en bloc de texte avec Custom Text. Dans l’exemple ci-contre, l’utilisation de Custom Text permet de retravailler la liste des 10 résultats donnés par le flux RSS du blog Actulligence, en transformant cette liste incrémentale en un seul texte (voir ci-dessous).

◦

Ajout d’un élément statique. En reliant Custom Text avec l’outil Webclip et l’outil Extract List, il devient possible d’ajouter un élément statique à la liste, par exemple un en-tête. L’exemple suivant montre comment récupérer le logo du colloque des journées européennes de mécatronique pour illustrer par exemple la TaDa « Veille mécatronique »

[email protected]

Page 77 sur 105

◦

Recherche avec valeur dynamique. En reliant Custom Text à divers outils-source (voir cidessous) et en omettant de cocher la case « Permanent Data », il devient possible de réutiliser le TaDa créé et sauvegardé (ayant pour sujet la Sté TaDaweb dans l’exemple donné), pour effectuer la recherche sur les mêmes sources mais sur un nouveau sujet (sur la Sté Easi-ie dans l’exemple donné).

◦

Création d’un outil de recherche spécifique à un site donné en reliant Custom Text a un formulaire (recherche avec valeur dynamique).

En procédant ainsi et après avoir sauvegardé le TaDa correspondant, le formulaire peut être ré-exécuté avec une nouvelle valeur pour faire une recherche avec un nouveau mot-clé sur le site Les Echos (voir schéma ci-dessous où la recherche BCE est remplacée par Banque de France). Au final, si TaDaweb offre directement et simultanément un accès à Yahoo, Google, Facebook et Twitter, grâce aux outils : Extract Form + Custom Text, l’utilisateur peut de plus créer un outil de recherche adapté à n’importe quel site.

[email protected]

Page 78 sur 105

[email protected]

Page 79 sur 105

Réutilisation de listes : module « Custom List »

Objet « Custom List » permet de personnaliser les requêtes posées simultanément dans les diverses sources que l’on souhaite exploiter et d’automatiser les fonctions des modules de transformation.

Présentation De ce fait, ce module de transformation est le plus souvent utilisé avant de glisser-déposer toute icône Source sur le Whiteboard. Dès que l’icône Custom List est déposée sur le Whiteboard, une fenêtre s’ouvre demandant (le) les éléments de la liste à insérer. Puisque cet outil permet de créer une liste, il peut être utilisé avec les icônes Sources : réseaux sociaux « Twitter Search », « Facebook Search » et « Google+ Search » et via les moteurs de recherche « Google Search » et « Yahoo! Search », mais il peut aussi être utilisé avec l’ensemble des icônes de transformation. Remarquons que la case « Permanent Data » est cochée par défaut. Cela permet d’exploiter la même requête sur les diverses sources déposées sur le Whiteboard. Lorsque cette case est décochée, cela permet de réutiliser le TaDa une fois créé et sauvegardé : mêmes modules Source et même algorithme (le même chemin de collecte-sélection-traitement), pour réaliser un nouveau TaDa à partir d’une nouvelle sélection de mots clés par exemple.

Utilisation en situation du module Custom List : création d’une liste de flux RSS Problématique Il arrive que dans un domaine donné, nous disposions d’une liste de sources que l’on souhaite pouvoir réutiliser pour surveiller telle ou telle thématique précise couverte par tout ou partie de ces flux. Par exemple si l’on dispose d’une liste de 16 flux issus de blogs et de sites spécialisé sur la veille, il est intéressant de pouvoir réaliser diverses veilles sur ces flux, chacune orientée vers un sujet particulier : les moteurs de recherche généralistes, les agrégateurs de flux, les moteurs verticaux ou thématiques, ... Dans chacun de ces cas l’algorithme de recherche est construit à partir de la même liste de flux RSS. Il est donc intéressant de pouvoir la réutiliser sans avoir à rentrer les 16 URL à chaque fois.

[email protected]

Page 80 sur 105

Création d’une liste de sources RSS et mise en mémoire Dans l’interface de la Custom List présenté ci-dessus, entrons successivement les 16 adresses de flux.

Une fois les sources entrées, nous devons enregistrer la Custom List : cliquer sur le bouton « Save » de son interface. Pour pouvoir réutiliser cette liste, nous devons l’enregistrer sous forme d’un Tada : cliquer sur le bouton « Save TaDa! », en haut à droite du Whiteboard. S’ouvre alors une nouvelle fenêtre (voir ci-contre) : remplir

les

champs

nécessaires.

Grâce

à

l’ascenseur de la rubrique « Category » nous sélectionnons la rubrique « Market Watch » (par exemple), puis « Save ». Cette liste est ainsi enregistrée comme un TaDa réutilisable. Ce TaDa n’apparaîtra pas sur le site Web puisque sous cette forme, il n’y a aucune source, ni information extraite.

Nous pouvons alors réutiliser à volonté la liste des 16 sources. Il suffit de cliquer sur l’onglet « TaDa » de la barre d’outils située à gauche du Whiteboard, puis de faire glisser le TaDa « Liste de 16 flux RSS ». En cliquant sur « Edit TaDa » l’icône Custom List apparaît et vient remplacer l’image de l’araignée

accompagnée

de

ses

deux

options. En cliquant sur le bouton « Execute », on obtient la liste des 16 flux utilisés (voir cicontre).

[email protected]

Page 81 sur 105

Utilisation de Custom List avec le module Source : « RSS Feed » Pour alimenter la source RSS Feed avec les 16 flux RSS de la Custom List, il suffit de faire glisser son icône sur le Whiteboard. Cliquer sur le bouton « Cancel » de l’interface qui s’ouvre, puis relier l’icône Custom List à l’icône RSS Feed à l’aide de l’outil « Liaison » situé en haut du Whiteboard : le module RSS Feed va être chargé automatiquement par la liste des 16 flux. Une icône se glisse alors sous l’icône RSS Feed, présentant les 278 résultats collectés qui peuvent être parcourus en cliquant sur « List (278) » (voir ci-dessous).

Notons

que

nous

pouvons

arriver au même résultat en utilisant le module « Loop » (voir partie droite de la copie d’écran ci-dessous). En connectant l’icône RSS Feed à l’icône List Element associé à Start

Loop,

TaDaweb

on

de

demande

rechercher

à les

informations contenues dans le premier flux de la liste : 5 résultats

sont

détectés.

En

reliant cette liste de 5 résultats à l’icône

End

Loop,

TaDaweb

reconduit la même opération sur l’ensemble des éléments de la

Custom List. On obtient effectivement la même liste de 278 résultats.

[email protected]

Page 82 sur 105

Utilisation de la Custom List : création d’une liste de mots-clés Problématique Lorsque nous menons une recherche sur diverses sources, nous devons très fréquemment filtrer la liste obtenue du fait du nombre important de résultats. Pour une thématique de veille donnée, il est intéressant de pouvoir construire une liste de mots-clés permettant de ne retenir que les résultats correspondants à la thématique d’intérêt. Par exemple, dans la liste précédente des 278 résultats obtenus à partir de la surveillance des 16 flux RSS sur la veille, nous souhaitons sélectionner ceux des résultats qui concernent les moteurs de recherche généralistes. Utilisation du module « Filter » Partons de la liste de 278 résultats obtenus à partir des 16 flux RSS sur la veille (voir schéma précédent). Glissons l’icône Filter sur le Whiteboard et relions le à l’icône « List (278) ». Comme nous n’avons entré aucun mot-clé dans la « Keyword list » associée au module Filter, nous obtenons une liste filtrée vide comme indiqué ci-contre. Cliquons

sur

l’icône

Keyword

list

pour

l’interface

permettant

de

la

ouvrir d’entrer

successivement les mots-clés qui vont nous permettre de ne retenir que les résultats concernant les moteurs généralistes. Nota : selon le sujet traité, sa nouveauté, sa complexité, diverses approches peuvent être mises à profit pour sélectionner les mots-clés appropriés (réflexion logique issue du sujet traité, examen des premiers résultats, utilisation d’outils d’aide à la sélection de mots clés). En cliquant sur « Save » dans l’interface de la Keyword List, nous obtenons une liste filtrée de 23 résultats concernant les moteurs généralistes (comme indiqué ci-contre).

[email protected]

Page 83 sur 105

Utilisation du module « Custom List » pour créer une liste de mots-clés Si nous souhaitons réutiliser cette liste de mots-clés, nous devons glisser l’icône Custom List sur le Whiteboard, entrer les mots clés dans l’interface « Custom List » qui s’ouvre, puis après avoir cliqué sur le bouton « Save », enregistrer cette liste sous forme d’un TaDa, comme précédemment (cliquer sur le bouton « Save TaDa! », en haut à droite du Whiteboard et remplir les champs nécessaires). Cette liste est ainsi enregistrée comme un TaDa réutilisable. Ce TaDa n’apparaîtra pas sur le site Web puisque sous cette forme, il n’y a aucune source, ni information extraite. Reprenons le TaDa présentant l’extraction des 278 résultats issus des 16 flux RSS. Glissons l’icône Filter et dans l’interface de la Keyword List qui s’ouvre cliquons sur « Cancel » (aucun mot–clé n’est donc entré manuellement). Glisser-déposer alors le TaDa

« Liste

mots-clés »

sur

le

Whiteboard. Il déroule automatiquement en-dessous l’icône « List (5) » contenant les mots clés retenus. En reliant cette liste à la Keyword list du module Filter, celle-ci va se charger automatiquement avec les 5 mots clés et le module Filter va automatiquement dérouler la liste des 23 résultats, comme précédemment ... sauf que le TaDa Liste mots-clés est indéfiniment réutilisable. Ces résultats sont présentés ci-dessous

Mais Custom List permet aussi d’utiliser des entrées dynamiques, comme Custom Text ou de transformer une liste extraite sur Internet en tableau

[email protected]

Page 84 sur 105

Modalités d’utilisation d’un TaDa Synthèse des fonctionnalités (outils) associables de TaDaweb

[email protected]

Page 85 sur 105

Possibilités de mise en relation fonctionnelle entre les différentes étapes et outils de manipulation des sources En vert, les extractions possibles à partir d’une source donnée. Et inversement pour les croix rouges Certains modules ne permettent cependant de transformer que certains types de sources, c’est pourquoi la phase de transformation est celle qui requiert le plus d’attention. Ainsi : 

Le module « Merge » ne peut réunir que des listes, textes, tableaux et liens, pour déboucher sur une seule sortie,



« Split » est applicable aux listes, textes, tableaux et liens,



Le module « Compare » ne peut comparer que des listes ou des tableaux,



« Loop » est un module applicable seulement aux données sous forme de listes,



« Custom Text » ne peut être lié qu’aux différents réseaux sociaux et moteurs de recherche,



« Filter » ne peut fonctionner avec le « Webclip » - dont le résultat est considéré comme un seul texte par le logiciel et non comme une liste – Le Webclip doit donc être préalablement transformé en liste si on souhaite utiliser l’outil Filter. Pour ce faire utiliser l’outil « Extract list » sur le Webclip. Si le résultat ne donne rien, utiliser « Extract link » lorsque chacun des éléments contenus dans le Webclip supporte un lien.

[email protected]

Page 86 sur 105

Points communs aux diverses fonctionnalités Les « outils » de TaDaweb ne sont pas tous compatibles entre eux. Pour vérifier les capacités de mise en relation des divers outils, se référer aux deux tableaux du paragraphe précédent.

◦

Chacun des outils proposés crée automatiquement l’icône représentant l’action et le résultat de l’outil sur la source (un aperçu montrant les informations obtenues).

◦

Cependant, lorsqu’il y a d’absence de données, le logiciel fait apparaître une nouvelle icône remplaçant le résultat attendu. Dans ce cas, ce n’est pas une erreur de l’utilisateur, mais simplement une absence de données à l’instant T. Cette recherche peut tout de même être sauvegardée et une alarme peut être programmée pour que le veilleur soit averti lors de la mise en ligne des données attendues.

◦

Le nombre de données constituant une liste est toujours précisé, même si celle-ci n’en contient aucune, comme dans l’exemple cicontre ou l’outil « Extract Table » indique 0 document. On peut remarquer que les relations créées contenant des données et aboutissant à une liste

non

vide

sont

verts,

tandis

que

l’extraction créée n’aboutissant pas (« Extract Table ») faute de données, donne une relation orange. En cliquant sur l’icône « Table », le logiciel fait apparaître en bas du Whiteboard le message

pour signifier à l’utilisateur qu’elle ne contient aucune donnée.



« Execute » permet de réaliser une action ; « Edit » permet de la modifier

◦

Sélection d’un groupe d’informations dans un ensemble. Si plusieurs liens, tableaux ou encore images sont disponibles sur le site (ou la partie de site) consulté, l’outil Extract correspondant propose à l’utilisateur de choisir les données qui l’intéresse (lien, tableau, liste, image). Cette possibilité n’existe pas pour l’outil Extract List.

[email protected]

Page 87 sur 105

Utiliser un même TaDa pour exploiter une nouvelle source Pour exploiter une nouvelle source, il suffit de rentrer dans la barre d’adresse une nouvelle URL, puis d’afficher la page demandée dans l’espace Navigateur. Un glissé-déposé de l’icône URL permet de faire apparaître cette deuxième source sur le même TaDa. Pour procéder à l’extraction de tout ou partie des articles ou paragraphes, suivre la procédure décrite ci-dessus (fonction Webclip).

[email protected]

Page 88 sur 105

Utiliser un nouveau White Board pour créer un TaDa Pour ne pas surcharger en données ce premier TaDa (TaDa noté TaDa 1), l’utilisateur peut en créer un nouveau en cliquant sur le bouton

situé sur la même ligne que la barre d’adresse.

Un nouveau TaDa (TaDa 2) est alors ouvert pour créer de nouvelles requêtes sur d’autres sites. Le précédent TaDa et ses données restent toujours disponible en cliquant sur l’icône correspondant.

Utiliser le TaDa d’un autre utilisateur Il est possible pour un utilisateur de récupérer le TaDa créé par une autre personne et de l’intégrer à son interface Creator. Pour accéder aux TaDas crées par d’autres, aller sur le site Web en ligne et sélectionner le TaDa qui vous intéresse. Par exemple ici à gauche, nous souhaitons rapatrier dans notre Creator le TaDa créé par François Gaspard sur la veille brevets. Il suffit de cliquer sur l’onglet « +Add to your collection ». Ce TaDa apparaît alors dans notre liste de TaDa comme indiqué ici à droite. Ce faisant nous nous approprions non seulement les résultats de la veille réalisée par ce TaDa, mais aussi le chemin de collecte-traitement (l’algorithme) très élaboré que nous pourrons réutiliser (en cliquant sur « Edit TaDa ») dans nos propres TaDas (voir réutilisation d’un chemin de sélection ci-après).

[email protected]

Page 89 sur 105

« Public TaDas », cliquer sur le bouton

du TaDa voulu. Ce TaDa est alors mis à jour et « My

TaDas » est retiré de la plateforme. L’utilisateur peut alors retrouver le TaDa sélectionné dans l’onglet « TaDa » de Tadaweb Creator et peur en réutiliser le chemin de sélection comme bon lui semble (Voir réutilisation d’un chemin de sélection ci-après).

[email protected]

Page 90 sur 105

Sauvegarder un TaDa

Une fois les chemins de sélection définis et les données extraites, l‘utilisateur doit sauvegarder ceux-ci en appuyant sur le bouton « Save TaDa », pour pouvoir ensuite les réutiliser, les consulter ou encore les partager.

S’ouvre alors une interface permettant à l’utilisateur, de façon analogue à l’utilisation d’un document Word, de nommer et de structurer la présentation des différentes informations collectées en leur assignant des titres, sous-titres. On peut également illustrer la présentation en y ajoutant une image depuis l’ordinateur. Cette nouvelle fenêtre est composée de trois parties.

-

La première partie à gauche et composée des éléments qui regroupent les différentes informations présentent sur le TaDa (texte jaune sur fond vert à l’écran).

-

La deuxième partie au centre est l’espace de modifications permettant de combiner les informations (partie gauche, titres des sources sur fond vert) à des éléments de mise en page pour la présentation des résultats (partie droite, options sur fond bleu).

-

La troisième partie à droite regroupe les éléments permettant d’insérer, de classer et de positionner titres, divisions, synthèses, etc. dans l’espace de modification.

Tout d’abord, nous devons sélectionner dans la première partie à droite, les informations que le TaDa contiendra en cliquant sur le

correspondant. Les informations qui ne seront pas ajoutées par ce

moyen n’apparaîtront pas sur le TaDa final, c'est-à-dire sur l’output du TaDa. Ensuite, nous devons sélectionner des éléments dans la troisième partie regroupant les éléments de mise en page (bleu). Ne sélectionner que les éléments souhaités.

[email protected]

Page 91 sur 105

-

Les éléments « Title », « Section » ou encore « Subsection » permettent de regrouper et de nommer les différentes informations présentes dans la partie centrale à l’aide de titres et sous-titres. En choisissant ces éléments, le logiciel ouvre une petite interface permettant à l’utilisateur de donner un descriptif à la partie concernée. Les éléments sélectionnés se retrouvent dans la partie centrale. Ils peuvent être positionnés dans l’ordre voulu à l’aide des flèches et leur titre modifié à l’aide du crayon

-

ou supprimés

.

L’outil « Paragraphe » permet de rédiger manuellement un texte à insérer dans le TaDa. Il peut par exemple s’agir d’une introduction, d’une synthèse ou d’une remontée d’information terrain.

-

L’élément « Logo » permet d’ajouter dans le TaDa une seule et unique image venant de votre ordinateur.

-

L’élément « Table of Contents » quant à lui, est un outil permettant d’insérer une table des matières pour une meilleure visibilité de la structure choisie pour le contenu du TaDa. Cette Table des matières regroupe automatiquement tous les noms de parties, ou sous parties nommées par l’utilisateur (cliquables).

Une fois les modifications terminées, le bouton « Preview » (voir ci-dessus au bas de l’avant dernière copie d’écran) permet de visualiser la structure choisie afin de la modifier éventuellement avant la sauvegarde (« Done »).

[email protected]

Page 92 sur 105

La table des matières permet d’accéder aux documents contenus dans le paragraphe grâce à des liens hypertexte créés automatiquement. Un bouton « Reset » permet de supprimer toutes les modifications effectuées dans l’espace central. Lorsque le résultat est jugé satisfaisan, il est validé par le bouton « Done ». A ce stade, on accède alors à l’interface présentée ci-dessous.

Le logiciel ouvre donc une nouvelle interface permettant à l’utilisateur de valider la sauvegarde du TaDa et de configurer son accès.

Dans cette fenêtre, un nom ainsi qu’une description peuvent être assignés au TaDa créé comme dans l’exemple ci-contre. L‘étape de la sauvegarde permet également d’insérer votre TaDa dans une « Category » prédéfinie par TaDaweb. L’onglet « Visibility » fait référence à l’accessibilité du TaDa (public ou privé). Un TaDa privé pourra néanmoins être partagé sous forme de journal avec un groupe de personne spécifique qui doit être précisé (cf. ci-après).

Une fois ces données renseignées, appuyer sur « Save » pour sauvegarder ou « Cancel » pour annuler toute la sauvegarde. Le TaDa sauvegardé devient alors disponible sur le logiciel TaDaweb Creator (voir paragraphe ci-dessous) et sur le site en ligne sous la forme présentée ci-contre.

[email protected]

Page 93 sur 105

Consulter, modifier, réutiliser la structure d’un TaDa Lorsque l’utilisateur souhaite consulter ou modifier un TaDa déjà enregistré, il doit récupérer ce TaDa dans le dernier onglet de la barre d’outils de TaDaweb Creator, dénommé « TaDa ».

► Consultation des TaDas Dans l’onglet « TaDa » de la barre d’outil, choisir le TaDa à consulter. En glissant le TaDa sélectionné sur le Whiteboard (« Collecte de l’information » dans le cas de figure), l’utilisateur obtient la possibilité de : 

Visualiser la présentation du TaDa (sa sortie) qui donne le résultat de veille (à partir du chemin de sélection créé) en cliquant sur « Execute TaDa ».



Visualiser et modifier le chemin de sélection du TaDa (mode "édition" permettant de modifier la structure du TaDa) en cliquant sur « Edit TaDa ».

Sortie du « Execute TaDa » Présentation su résultat

Mode édition du TaDa - Présentation développée permettant des modifications

Notons ici que les TaDas peuvent être assemblés comme des poupées russe : un TaDa pouvant en contenir un autre et ainsi de suite. La "sortie" du TaDa sous sa « forme Execute » permettant d’encapsuler des TaDas les uns dans les autres. En quelque sorte, il est possible de continuer la construction d’un TaDa à partir de la sortie d’un TaDa d’origine, il s’agit cependant d’un nouveau TaDa dans ce cas. Quant au mode "édition" (la « forme développé »), il va va garder le Look & Feel (la mise en page) créé lors du "Save" du premier Tada (tandis que la "sortie" du TaDa sous sa « Execute Tada » est considéré comme un nouveau TaDa.

[email protected]

Page 94 sur 105

► Modification du TaDa Pour utiliser cette option, il est nécessaire de partir de la vue obtenue par l’option « Edit TaDa » (forme développée) qui permet de visualiser les différentes actions créées sur la source (voir ci-dessus). -

Pour supprimer l‘une de ses actions, il suffit de cliquer sur la croix rouge de l’icône ou encore, s’il s’agit d’une source dans une liste, d’ouvrir la liste, de sélectionner la source à supprimer et de cliquer sur « Remove » (ci-contre, suppression de la source RSS Feed « ZDnet»). Cette action disparaît alors, modifiant le reste du chemin de sélection.

-

Pour ajouter une action procéder comme indiqué ci-avant.

Pour que ces modifications soient prises en compte, cliquer sur le bouton « Save TaDa » du Whiteboard (reprendre étape de sauvegarde ci-dessus). Les modifications du TaDa sont alors sauvegardées, gardant tout de même l’ancien chemin de sélection du TaDa.

► Réutilisation d’un chemin de sélection Fréquemment le chemin de sélection, caractérisé par une certaine succession de fonctionnalités, se répète d’une source à l’autre : extraction d’une partie de texte (Webclip), d’une image, d’une liste, d’un tableau de données,…. Il est donc avantageux de réutiliser ce chemin de sélection pour les nouvelles sources concernées. Pour cela, choisir dans le bandeau gauche (onglet TaDa) le TaDa dont les fonctionnalités serviront de « patron ». Glisser le TaDa sélectionné sur le Whiteboard. A l’aide de l’option « Edit TaDa » décrite plus haut, développer entièrement le TaDa comme ci-dessous. Dans un premier temps, Il suffit alors de remplacer la source par une autre. Dans le cas d’une source URL, supprimer l’icône de la source à remplacer, taper la nouvelle adresse dans la barre du navigateur, et redéposer une nouvelle icône URL sur le Whiteboard. En liant cette nouvelle icône aux outils d’extractions du TaDa patron, le logiciel recharge alors les nouvelles données en fonction de la nouvelle source. Dans le cas d’un flux, changer directement l’adresse en double cliquant sur l’icône de la source. Dans cet exemple, nous allons récupérer le TaDa « Collecte de l’information » et remplacer la source du flux d’Easi-ie par celui de Veille ie and co. Double cliquer alors sur l’icône RSS Feed.

[email protected]

Page 95 sur 105

S’ouvre alors l’interface de gestion des flux RSS à surveiller comme cidessous. Sélectionner l’adresse à supprimer (ici Easi-ie) et cliquer sur « Remove ». Entrer ensuite la nouvelle adresse à surveiller (ici, celle de veille ie and co) En cliquant sur « Save », le logiciel charge automatiquement les résultats en fonction du nouveau site. Ces étapes terminées, il ne reste donc plus qu’à sauvegarder ce nouveau TaDa en utilisant les mêmes outils que le TaDa « patron ». Remarque : Réutiliser la base d’un ancien TaDa permet avant tout un gain de temps, puisque l’utilisateur n’aura plus la nécessité de glisser-déposer et relier les différents outils.

Rappelons qu’il est plus simple d’utiliser Custom Text ou Custom List. pour pouvoir changer les données à la volée.

[email protected]

Page 96 sur 105

Mise en mémoire et enrichissement des informations d’un TaDa ◦

Sauvegarde de l’information collectée Si le chemin de collecte et de sélection de l’information est mémorisé pour chaque TaDa par l’outil lui-même, les informations contenues, actualisées au fur et à mesure des mouvements de la source, ne sont elles-mêmes pas mémorisées lorsqu’elles subissent une modification. -

Toute modification d’un document vient « écraser » la version précédente du document dans le TaDa.

-

Par contre, lorsqu’une nouvelle information (document, donnée, ...) est émise par la source, elle vient simplement s’ajouter à celles précédemment collectées. De même, les informations des sources non mouvementées restent en l’état jusqu’à modification.

Ce mode de fonctionnement implique, pour ceux qui le souhaitent, de disposer d’un outil annexe permettant de sauvegarder sur la période souhaitée la sortie d’un TaDa à un instant T. Tel est l’objet de la fonction PDF proposée dans les abonnements « avancés ». Les PDF peuvent ensuite être collectés dans un e-book par exemple (voir ci-dessous). ◦

Annotations des documents sélectionnés Le veilleur comme l’utilisateur des résultats de la Veille doit pouvoir travailler directement sur les documents recueillis, à savoir : sur-lignages, annotations, notes de bas de page, ...

Pour faciliter la consultation de l’information sauvegardée, il nous est apparu intéressant de penser au format e-book qui vient s’insérer dans les routines de consultation des documents écrits et dans les tendances des sorties de la Veille. Dans cette optique, nous avons comparé les outils Yudu, Calaméo, Zinepal ou encore Feedjournal. Après tests de ces différents outils pour la gestion des résultats de la Veille de TaDaweb, nous avons arrêté notre choix sur l’application Yudu, consultable en ligne et multiplateforme (smartphone, tablette, PC).

Yudu permet en effet ... -

De lire le format (PDF) sous forme de magazine, livre ou autres,

-

D’exploiter l’information en proposant une recherche par mots-clés mais aussi en autorisant l’annotation ou encore l’ajout de notes de bas de pages.

-

De stocker l’information indéfiniment (jusqu’à 100 documents par semaine) jusqu’à suppression directe par l’utilisateur.

SCRAPBOOK. Une autre solution consiste à utiliser Scrapbook (voir tutoriel sur notre site stratieo.com), une extension gratuite de Firefox. Extrêmement aisée et intuitive à mettre en œuvre, cette application autorise une mise en mémoire sur le poste utilisateur et le classement familier en arborescence (type Windows) des diverses sorties de TaDaweb

[email protected]

Page 97 sur 105

L’avantage de Scrapbook, qui permet d’enregistrer, stocker, gérer et annoter les pages Internet d’intérêt, réside dans sa praticité : il installe un panneau latéral qui vient s’intégrer au navigateur Firefox. L’organisation des captures se fait par simple glissé-déposé depuis la barre d’adresse.

[email protected]

Page 98 sur 105

Partage et diffusion de l’information : site TaDaweb Public TaDas Afin de visualiser, partager et diffuser les TaDas créés, comme les TaDas créés par d’autres mais rapatriés dans son interface Creator, il est nécessaire de se connecter à son compte sur www.tadaweb.com. Après s’être enregistré ou avoir entré son login, on accède aux données publiques présentes sur la page d’accueil du site TaDaweb. Cette page (voir copie d’écran ci-dessous) présente les TaDas publics aléatoire,

de

manière

mais

il

est

possible de rechercher un TaDa par mot-clé ou par catégorie :

TaDaweb

proposant une liste de 13 catégories

(septembre

2013).

[email protected]

Page 99 sur 105

Sur cette page, l’utilisateur peut suivre une personne en particulier. Si par exemple, une personne publie régulièrement des TaDas publics susceptibles d’intéresser l’utilisateur, celui-ci pourra alors la suivre pour ne rien manquer de ce qu’elle publie. Pour cela, il suffit de cliquer sur la photo de la personne dont on veut suivre le flux d’information. Comme ci-contre. Ce faisant, l’utilisateur est alors redirigé vers le profil de la personne concernée et peut accéder aux informations la concernant, à ses TaDas catégorisés comme publics et aux personnes qu’il suit et qui le suivent (voir image ci-dessous). En cliquant sur le bouton « Follow », celui-ci passe alors au rouge

, vous permettant de ne

plus suivre cette personne.

TaDas privés Notons qu’à l’extrême droite de la page d’accueil, se trouve l’accès à votre « Profile », c'est-à-dire à votre espace personnel. En cliquant sur son nom, on accède à diverses options

[email protected]

Page 100 sur 105

L’option « My TaDas » permet d’accéder aux divers TaDas de son propre Creator. Ceux qui sont privés, n’apparaissent pas sur la page publique du site TaDaweb.

En haut de la page nous voyons le nombre de personnes suivant l’un de vos TaDas : les Followers. Il es possible de les identifier en cliquant sur la zone Followers. Il en est de même pour les Following, personnes que l’utilisateur suit. En plus de cet espace de suivis, l’utilisateur peut modifier son profil et le compléter s’il le souhaite. Pour cela, cliquer sur l’icône

. L’utilisateur pourra entrer de nouvelles informations le concernant

ou modifier les informations existantes.

[email protected]

Page 101 sur 105

Création d’une alerte (version « Premium ») Avec la version Premium, il est possible de créer une alerte par TaDa. Cliquer sur le bouton alarme du TaDa permet de paramétrer celle-ci. L’utilisateur pourra ainsi choisir la fréquence à laquelle son TaDa sera mis à jour et la date de début de surveillance du TaDa. L’utilisateur sera averti par mail lors de chaque modification de source surveillée.

Cliquer sur le bouton « Publier dans le journal » enverra le TaDa sélectionné vers le journal voulu. En cliquant sur ce

bouton,

une

interface

s’ouvre,

permettant de choisir à quel journal envoyer le TaDa (voir ci-dessous).

Création d’un « Journal »

Le

« Journal » regroupe les différents

TaDas. Ainsi, les TaDas créés sur le thème de la veille peuvent tous être regroupés dans un journal du même nom. Il constitue alors un véritable tableau de bord de la veille sur cette thématique. Le journal est un outil pratique visant à surveiller toutes les sources du même thème.

Un exemple des journaux créés est donné ci-dessous : trois journaux sont présentés

[email protected]

Page 102 sur 105

En cliquant sur le premier Journal, on accède à une interface qui présente les divers TaDas contenus

[email protected]

Page 103 sur 105

Chaque journal peut être partagé avec une personne ou groupe en appuyant sur le bouton

.

Vous pouvez également choisir de le partager sur différents réseaux sociaux ou encore partager le journal par email avec un groupe de personne donné. En cliquant sur l’option « Edit », l’utilisateur obtient alors la fenêtre ci-contre. Celle-ci permet de changer les métadonnées du journal, ainsi que sa fréquence de mise à jour. L’utilisateur peut également supprimer le journal en appuyant sur le bouton

Nota : même si un TaDa a une visibilité réservée (« Visibility : public »), si celui-ci est placé dans un

« Journal public », il devient visible.

[email protected]

Page 104 sur 105

Signalement des ajouts ou modifications des pages Web surveillées

TaDaweb signale les modifications des pages surveillées sur le Dashboard en ligne, en indiquant en haut à droite, dans un encadré vert « Show new content ». Il suffit alors de faire défiler le Tada : tous les ajouts depuis la dernière visite sont surlignés en vert. Pour faire disparaître ce surlignage il suffit de cliquer en haut à droite sur « Hide new content », ce qui fait réapparaître « Show new content ».

Rechercher un mot La fonction universelle recherches sur un TaDa ou un journal.

[email protected]

peut ête utilsiée pour des

Page 105 sur 105

Une plateforme de veille innovante Guide de l'utilisateur - Stratieo

des documents recommandant