Les types d’outils de veille (Extrait du mémoire du projet tutoré)
Les recherches que nous avons menées nous confirment qu’il n’existe pas une seule classification possible mais plusieurs qui sont plus ou moins similaires et convergentes vers les mêmes outils. Nous allons présenter celles qui nous paraissent intéressantes.
Nous présentons la classification définie par Aref Jdey :
- Aide au sourcing (gestion de favoris, bookmarks, …)
- Collecte d’informations (outils de recherche, outils de surveillance et aspirateurs de sites)
- Analyse et mise en forme (analyse de contenu, text mining, mind mapping, …)
- Progiciels de veille
Cette dernière catégorie d’outils est rapidement écartée de nos travaux de recherche pour deux raisons. Tout d’abord, ce type d’outil est en général proposé sous forme de solutions propriétaires et, ensuite, ces outils sont très complexes dans leur configuration, malgré leur grande performance et la multiplicité de leurs fonctionnalités.
Une seconde classification se présente sous forme plus pédagogique. Elle est présentée par Jean-Paul Pinte, Enseignant en Informatique - Multimédia - Veilles à l’Université Catholique de Lille , et classe les outils selon les quatre catégories suivantes, dont nous rappelons leur définition :
- Les répertoires et annuaires : « leur but est de répertorier les sites Web et de les classer dans des catégories thématiques pour faciliter leur identification par l’internaute. A partir d’un thème, une série de sous thèmes est proposée à l’utilisateur pour aboutir enfin à une liste de sites répondant à sa question » . Les plus connus sont : Yahoo, Voilà, Excite.
Ces outils offrent beaucoup moins de réponses que les moteurs de recherches, néanmoins la fiabilité de leurs résultats est confirmée.
- Les moteurs de recherches : « permettent de formuler des requêtes en utilisant des opérateurs classiques et parfois des critères de recherche plus complexes. (…) Cependant ils ne couvrent pas la totalité du Web et chacun a ses propres méthodes d’indexation » . Les plus connus sont Google et Altavista.
- Les métamoteurs de recherches : permettent de « réaliser une recherche simultanée sur plusieurs moteurs et annuaires et bénéficier, ainsi, des spécificités de chacun d’entre eux. Les métamoteurs disposent de fonctionnalités facilitant les données remontées : dédoublonnage, classement par pertinence… »
En plus de ses 3 catégories d’outils, généralement connus du grand public, vient s’ajouter une quatrième, aussi riche que les précédentes et qui concernent les agents intelligents.
- Les Agents intelligents : on peut deviner selon la classification donnée par Jean-Paul Pinte que tous les autres outils non cités jusque là (Autres agents de recherche, veille thématique, gestion de l’information récoltée, analyse des documents rapatriés et navigation off line) font partie de cette catégorie.
La définition qui nous semble la plus simple est celle donné par Carlo Revelli, PDG de Cybion, qui affirme « qu'un agent intelligent est une entité logicielle qui possède des attributs propres et qui agit dans le but d'accomplir un certain nombre de tâches au nom d'une autre entité (un autre agent ou une personne) » .
Selon la même source, la difficulté consiste à donner les attributs propres à un agent. D’ailleurs, plusieurs auteurs ont essayé d'identifier les principaux attributs censés caractériser tout agent intelligent : autonomie, capacité de collaboration, capacité d'apprentissage, flexibilité, mobilité.
Donc un agent intelligent doit pouvoir prendre des initiatives et agir sans intervention de l'utilisateur final.
Il peut être, dès lors supposé, qu’un agent intelligent pourrait, à partir de signaux faibles, donner des alertes pertinentes avec un haut degré de fiabilité. On considère alors, que les agents de recherche d’informations sont des logiciels intermédiaires entre les moteurs de recherche et les agents intelligents.
Par ailleurs cette classification montre ses limites car elle repartit plusieurs types d’agents de recherche dans trois catégories différentes (Répertoires et Annuaires, Moteurs de recherches et Métamoteurs de recherches) et regroupe dans sa quatrième partie (Agents intelligents) plusieurs outils dont les fonctionnalités diffèrent.
Une autre classification qui, selon nous, pourrait contribuer à la compréhension des différents types d’outils est celle présentée par l’INIST , elle est également répartie en quatre catégories :
- Outils de collecte dont les outils de recherche et les outils de surveillance
- Outils d’analyse contenant deux sous-catégories, les outils textuels et les outils de cartographie
- Outils de diffusion contenant les outils dits Push, qui renvoient l’information ciblée et les outils de Groupeware, qui offrent les fonctionnalités de travail de groupe.
- Outils intégrés qui regroupent les deux premières fonctionnalités de cette liste, c'est-à-dire la collecte et l’analyse.
Cela nous amène à la conclusion qu’un outil intégré, autrement dit Progiciel, peut être considéré comme un agent intelligent ce qui justifierait son coût exorbitant.
Si l’on ignore cette dernière catégorie, vue qu’elle reprend des éléments de la même liste (outils de collecte, d’analyse et de diffusion), il est intéressant de remarquer que cette classification a l’avantage de suivre exactement les étapes du cycle du renseignement. En revanche, et toujours selon le document de l’INIST, les fonctionnalités liées à la diffusion sont traitées à l’intérieur de chaque famille.
Ces outils peuvent également être classés en deux autres catégories :
- Les outils distants : utilisés à partir du réseau ou d’internet
(Exemple : www.googlealert.com, www.watchthatpage.com, www.snyke.com/agent.shtml, www.favoritoo.com, …).
- Les outils locaux : qui requièrent une installation sur le poste de travail
Critiques et conclusion
La classification retenue dans cette étude, est celle admise par Aref Jdey qui rejoint celle de Gilles Balmisse , deux spécialistes des outils de veille.
La dernière catégorie (Progiciels) ayant été écartée dès le départ, la cartographie ci-après peut être établie :

Figure 1 : Classification retenue
La première (Aide au sourcing) concerne la classification des favoris et la gestion des bookmarks. Ce type d’outil est généralement réalisé sur des sites et ne nécessite pas d’installation.
La collecte d’information est divisée en trois sous-catégories :
- Agents de recherche distants (Annuaires, Moteurs de recherches, Métamoteurs) ou à installer sur le poste de travail (Moteurs ou Métamoteurs de recherche)
- Agents de surveillance qui nécessite une installation sur le poste de travail (crawlers, agrégateurs de flux RSS, …)
- Aspirateurs de sites qui permettent de copier intégralement un site Web sur le disque dur. L’intérêt est de l’analyser ensuite par d’autres outils (analyseur sémantique, cartographie) .
Quant à la troisième catégorie (Analyse et mise en forme), elle est divisée en plusieurs sous-catégories : logiciels de classifications, résumé automatique, extraction de connaissances, analyse de contenu, text mining et mind mapping.
Dans ce projet tutoré, nous centrons nos recherches sur la seconde catégorie (collecte d’informations) afin de ne pas tabler sur la multitude d’outils existants, ce qui représenterait, alors, un volume de temps de travail bien plus conséquent. Cependant, il nous semble intéressant de ne pas écarter les outils de mind mapping (ou cartographie), car ils peuvent être utiles dans chaque étape d’un processus de réflexion.
Par ailleurs, nous choisissons des logiciels (installation sur poste de travail) plutôt que des outils distants car ces derniers sont, en général, moins performants et comportent un risque de non confidentialité.
Aucune classification ne peut être considérée comme définitive car selon les besoins exprimés, la vision peut changer.
De plus, avec l’évolution technologique, de nouveaux outils verront le jour et remettrons probablement en cause ces catégorisations.
Les types d’outils de veille (Extrait du mémoire du projet tutoré)
Les recherches que nous avons menées nous confirment qu’il n’existe pas une seule classification possible mais plusieurs qui sont plus ou moins similaires et convergentes vers les mêmes outils. Nous allons présenter celles qui nous paraissent intéressantes.
Nous présentons la classification définie par Aref Jdey :
- Aide au sourcing (gestion de favoris, bookmarks, …)
- Collecte d’informations (outils de recherche, outils de surveillance et aspirateurs de sites)
- Analyse et mise en forme (analyse de contenu, text mining, mind mapping, …)
- Progiciels de veille
Cette dernière catégorie d’outils est rapidement écartée de nos travaux de recherche pour deux raisons. Tout d’abord, ce type d’outil est en général proposé sous forme de solutions propriétaires et, ensuite, ces outils sont très complexes dans leur configuration, malgré leur grande performance et la multiplicité de leurs fonctionnalités.
Une seconde classification se présente sous forme plus pédagogique. Elle est présentée par Jean-Paul Pinte, Enseignant en Informatique - Multimédia - Veilles à l’Université Catholique de Lille , et classe les outils selon les quatre catégories suivantes, dont nous rappelons leur définition :
- Les répertoires et annuaires : « leur but est de répertorier les sites Web et de les classer dans des catégories thématiques pour faciliter leur identification par l’internaute. A partir d’un thème, une série de sous thèmes est proposée à l’utilisateur pour aboutir enfin à une liste de sites répondant à sa question » . Les plus connus sont : Yahoo, Voilà, Excite.
Ces outils offrent beaucoup moins de réponses que les moteurs de recherches, néanmoins la fiabilité de leurs résultats est confirmée.
- Les moteurs de recherches : « permettent de formuler des requêtes en utilisant des opérateurs classiques et parfois des critères de recherche plus complexes. (…) Cependant ils ne couvrent pas la totalité du Web et chacun a ses propres méthodes d’indexation » . Les plus connus sont Google et Altavista.
- Les métamoteurs de recherches : permettent de « réaliser une recherche simultanée sur plusieurs moteurs et annuaires et bénéficier, ainsi, des spécificités de chacun d’entre eux. Les métamoteurs disposent de fonctionnalités facilitant les données remontées : dédoublonnage, classement par pertinence… »
En plus de ses 3 catégories d’outils, généralement connus du grand public, vient s’ajouter une quatrième, aussi riche que les précédentes et qui concernent les agents intelligents.
- Les Agents intelligents : on peut deviner selon la classification donnée par Jean-Paul Pinte que tous les autres outils non cités jusque là (Autres agents de recherche, veille thématique, gestion de l’information récoltée, analyse des documents rapatriés et navigation off line) font partie de cette catégorie.
La définition qui nous semble la plus simple est celle donné par Carlo Revelli, PDG de Cybion, qui affirme « qu'un agent intelligent est une entité logicielle qui possède des attributs propres et qui agit dans le but d'accomplir un certain nombre de tâches au nom d'une autre entité (un autre agent ou une personne) » .
Selon la même source, la difficulté consiste à donner les attributs propres à un agent. D’ailleurs, plusieurs auteurs ont essayé d'identifier les principaux attributs censés caractériser tout agent intelligent : autonomie, capacité de collaboration, capacité d'apprentissage, flexibilité, mobilité.
Donc un agent intelligent doit pouvoir prendre des initiatives et agir sans intervention de l'utilisateur final.
Il peut être, dès lors supposé, qu’un agent intelligent pourrait, à partir de signaux faibles, donner des alertes pertinentes avec un haut degré de fiabilité. On considère alors, que les agents de recherche d’informations sont des logiciels intermédiaires entre les moteurs de recherche et les agents intelligents.
Par ailleurs cette classification montre ses limites car elle repartit plusieurs types d’agents de recherche dans trois catégories différentes (Répertoires et Annuaires, Moteurs de recherches et Métamoteurs de recherches) et regroupe dans sa quatrième partie (Agents intelligents) plusieurs outils dont les fonctionnalités diffèrent.
Une autre classification qui, selon nous, pourrait contribuer à la compréhension des différents types d’outils est celle présentée par l’INIST , elle est également répartie en quatre catégories :
- Outils de collecte dont les outils de recherche et les outils de surveillance
- Outils d’analyse contenant deux sous-catégories, les outils textuels et les outils de cartographie
- Outils de diffusion contenant les outils dits Push, qui renvoient l’information ciblée et les outils de Groupeware, qui offrent les fonctionnalités de travail de groupe.
- Outils intégrés qui regroupent les deux premières fonctionnalités de cette liste, c'est-à-dire la collecte et l’analyse.
Cela nous amène à la conclusion qu’un outil intégré, autrement dit Progiciel, peut être considéré comme un agent intelligent ce qui justifierait son coût exorbitant.
Si l’on ignore cette dernière catégorie, vue qu’elle reprend des éléments de la même liste (outils de collecte, d’analyse et de diffusion), il est intéressant de remarquer que cette classification a l’avantage de suivre exactement les étapes du cycle du renseignement. En revanche, et toujours selon le document de l’INIST, les fonctionnalités liées à la diffusion sont traitées à l’intérieur de chaque famille.
Ces outils peuvent également être classés en deux autres catégories :
- Les outils distants : utilisés à partir du réseau ou d’internet
(Exemple : www.googlealert.com, www.watchthatpage.com, www.snyke.com/agent.shtml, www.favoritoo.com, …).
- Les outils locaux : qui requièrent une installation sur le poste de travail
Critiques et conclusion
La classification retenue dans cette étude, est celle admise par Aref Jdey qui rejoint celle de Gilles Balmisse , deux spécialistes des outils de veille.
La dernière catégorie (Progiciels) ayant été écartée dès le départ, la cartographie ci-après peut être établie :

Figure 1 : Classification retenue
La première (Aide au sourcing) concerne la classification des favoris et la gestion des bookmarks. Ce type d’outil est généralement réalisé sur des sites et ne nécessite pas d’installation.
La collecte d’information est divisée en trois sous-catégories :
- Agents de recherche distants (Annuaires, Moteurs de recherches, Métamoteurs) ou à installer sur le poste de travail (Moteurs ou Métamoteurs de recherche)
- Agents de surveillance qui nécessite une installation sur le poste de travail (crawlers, agrégateurs de flux RSS, …)
- Aspirateurs de sites qui permettent de copier intégralement un site Web sur le disque dur. L’intérêt est de l’analyser ensuite par d’autres outils (analyseur sémantique, cartographie) .
Quant à la troisième catégorie (Analyse et mise en forme), elle est divisée en plusieurs sous-catégories : logiciels de classifications, résumé automatique, extraction de connaissances, analyse de contenu, text mining et mind mapping.
Dans ce projet tutoré, nous centrons nos recherches sur la seconde catégorie (collecte d’informations) afin de ne pas tabler sur la multitude d’outils existants, ce qui représenterait, alors, un volume de temps de travail bien plus conséquent. Cependant, il nous semble intéressant de ne pas écarter les outils de mind mapping (ou cartographie), car ils peuvent être utiles dans chaque étape d’un processus de réflexion.
Par ailleurs, nous choisissons des logiciels (installation sur poste de travail) plutôt que des outils distants car ces derniers sont, en général, moins performants et comportent un risque de non confidentialité.
Aucune classification ne peut être considérée comme définitive car selon les besoins exprimés, la vision peut changer.
De plus, avec l’évolution technologique, de nouveaux outils verront le jour et remettrons probablement en cause ces catégorisations.
Les types d’outils de veille (Extrait du mémoire du projet tutoré)
Les recherches que nous avons menées nous confirment qu’il n’existe pas une seule classification possible mais plusieurs qui sont plus ou moins similaires et convergentes vers les mêmes outils. Nous allons présenter celles qui nous paraissent intéressantes.
Nous présentons la classification définie par Aref Jdey :
- Aide au sourcing (gestion de favoris, bookmarks, …)
- Collecte d’informations (outils de recherche, outils de surveillance et aspirateurs de sites)
- Analyse et mise en forme (analyse de contenu, text mining, mind mapping, …)
- Progiciels de veille
Cette dernière catégorie d’outils est rapidement écartée de nos travaux de recherche pour deux raisons. Tout d’abord, ce type d’outil est en général proposé sous forme de solutions propriétaires et, ensuite, ces outils sont très complexes dans leur configuration, malgré leur grande performance et la multiplicité de leurs fonctionnalités.
Une seconde classification se présente sous forme plus pédagogique. Elle est présentée par Jean-Paul Pinte, Enseignant en Informatique - Multimédia - Veilles à l’Université Catholique de Lille , et classe les outils selon les quatre catégories suivantes, dont nous rappelons leur définition :
- Les répertoires et annuaires : « leur but est de répertorier les sites Web et de les classer dans des catégories thématiques pour faciliter leur identification par l’internaute. A partir d’un thème, une série de sous thèmes est proposée à l’utilisateur pour aboutir enfin à une liste de sites répondant à sa question » . Les plus connus sont : Yahoo, Voilà, Excite.
Ces outils offrent beaucoup moins de réponses que les moteurs de recherches, néanmoins la fiabilité de leurs résultats est confirmée.
- Les moteurs de recherches : « permettent de formuler des requêtes en utilisant des opérateurs classiques et parfois des critères de recherche plus complexes. (…) Cependant ils ne couvrent pas la totalité du Web et chacun a ses propres méthodes d’indexation » . Les plus connus sont Google et Altavista.
- Les métamoteurs de recherches : permettent de « réaliser une recherche simultanée sur plusieurs moteurs et annuaires et bénéficier, ainsi, des spécificités de chacun d’entre eux. Les métamoteurs disposent de fonctionnalités facilitant les données remontées : dédoublonnage, classement par pertinence… »
En plus de ses 3 catégories d’outils, généralement connus du grand public, vient s’ajouter une quatrième, aussi riche que les précédentes et qui concernent les agents intelligents.
- Les Agents intelligents : on peut deviner selon la classification donnée par Jean-Paul Pinte que tous les autres outils non cités jusque là (Autres agents de recherche, veille thématique, gestion de l’information récoltée, analyse des documents rapatriés et navigation off line) font partie de cette catégorie.
La définition qui nous semble la plus simple est celle donné par Carlo Revelli, PDG de Cybion, qui affirme « qu'un agent intelligent est une entité logicielle qui possède des attributs propres et qui agit dans le but d'accomplir un certain nombre de tâches au nom d'une autre entité (un autre agent ou une personne) » .
Selon la même source, la difficulté consiste à donner les attributs propres à un agent. D’ailleurs, plusieurs auteurs ont essayé d'identifier les principaux attributs censés caractériser tout agent intelligent : autonomie, capacité de collaboration, capacité d'apprentissage, flexibilité, mobilité.
Donc un agent intelligent doit pouvoir prendre des initiatives et agir sans intervention de l'utilisateur final.
Il peut être, dès lors supposé, qu’un agent intelligent pourrait, à partir de signaux faibles, donner des alertes pertinentes avec un haut degré de fiabilité. On considère alors, que les agents de recherche d’informations sont des logiciels intermédiaires entre les moteurs de recherche et les agents intelligents.
Par ailleurs cette classification montre ses limites car elle repartit plusieurs types d’agents de recherche dans trois catégories différentes (Répertoires et Annuaires, Moteurs de recherches et Métamoteurs de recherches) et regroupe dans sa quatrième partie (Agents intelligents) plusieurs outils dont les fonctionnalités diffèrent.
Une autre classification qui, selon nous, pourrait contribuer à la compréhension des différents types d’outils est celle présentée par l’INIST , elle est également répartie en quatre catégories :
- Outils de collecte dont les outils de recherche et les outils de surveillance
- Outils d’analyse contenant deux sous-catégories, les outils textuels et les outils de cartographie
- Outils de diffusion contenant les outils dits Push, qui renvoient l’information ciblée et les outils de Groupeware, qui offrent les fonctionnalités de travail de groupe.
- Outils intégrés qui regroupent les deux premières fonctionnalités de cette liste, c'est-à-dire la collecte et l’analyse.
Cela nous amène à la conclusion qu’un outil intégré, autrement dit Progiciel, peut être considéré comme un agent intelligent ce qui justifierait son coût exorbitant.
Si l’on ignore cette dernière catégorie, vue qu’elle reprend des éléments de la même liste (outils de collecte, d’analyse et de diffusion), il est intéressant de remarquer que cette classification a l’avantage de suivre exactement les étapes du cycle du renseignement. En revanche, et toujours selon le document de l’INIST, les fonctionnalités liées à la diffusion sont traitées à l’intérieur de chaque famille.
Ces outils peuvent également être classés en deux autres catégories :
- Les outils distants : utilisés à partir du réseau ou d’internet
(Exemple : www.googlealert.com, www.watchthatpage.com, www.snyke.com/agent.shtml, www.favoritoo.com, …).
- Les outils locaux : qui requièrent une installation sur le poste de travail
Critiques et conclusion
La classification retenue dans cette étude, est celle admise par Aref Jdey qui rejoint celle de Gilles Balmisse , deux spécialistes des outils de veille.
La dernière catégorie (Progiciels) ayant été écartée dès le départ, la cartographie ci-après peut être établie :
Figure 1 : Classification retenue
La première (Aide au sourcing) concerne la classification des favoris et la gestion des bookmarks. Ce type d’outil est généralement réalisé sur des sites et ne nécessite pas d’installation.
La collecte d’information est divisée en trois sous-catégories :
- Agents de recherche distants (Annuaires, Moteurs de recherches, Métamoteurs) ou à installer sur le poste de travail (Moteurs ou Métamoteurs de recherche)
- Agents de surveillance qui nécessite une installation sur le poste de travail (crawlers, agrégateurs de flux RSS, …)
- Aspirateurs de sites qui permettent de copier intégralement un site Web sur le disque dur. L’intérêt est de l’analyser ensuite par d’autres outils (analyseur sémantique, cartographie) .
Quant à la troisième catégorie (Analyse et mise en forme), elle est divisée en plusieurs sous-catégories : logiciels de classifications, résumé automatique, extraction de connaissances, analyse de contenu, text mining et mind mapping.
Dans ce projet tutoré, nous centrons nos recherches sur la seconde catégorie (collecte d’informations) afin de ne pas tabler sur la multitude d’outils existants, ce qui représenterait, alors, un volume de temps de travail bien plus conséquent. Cependant, il nous semble intéressant de ne pas écarter les outils de mind mapping (ou cartographie), car ils peuvent être utiles dans chaque étape d’un processus de réflexion.
Par ailleurs, nous choisissons des logiciels (installation sur poste de travail) plutôt que des outils distants car ces derniers sont, en général, moins performants et comportent un risque de non confidentialité.
Aucune classification ne peut être considérée comme définitive car selon les besoins exprimés, la vision peut changer.
De plus, avec l’évolution technologique, de nouveaux outils verront le jour et remettrons probablement en cause ces catégorisations.
ajouter un commentaire commentaires (1) recommander


