Les sources et la collecte d'information
LES SOURCES ET LA COLLECTE D’INFORMATIONS
I) Les sources
A) Le web invisible
Comme dit précédemment, les moteurs de recherche peuvent trouver jusqu’à 30% des informations sur le web.
Lorsqu’on se rend sur des sites spécialisés dans les actions financières par exemple, au bout d’un certain moment les informations sont archivées et par conséquent non exploitables et non trouvables par les moteurs de recherches. C’est le web invisible.
Certaines archives sont payantes (dates dépassées…). Le web invisible est le fait d’être sur un site payant avec des informations que l’on souhaite consulter mais qui ne sont plus accessibles. Le moteur de recherche s’arrête et ne peut par conséquent pas nous apporter de réponses. Tout ce qui est en interrogation direct n’est pas couvert par les moteurs de recherche.
NB : Un « favori » est un marque page. Une page peut être enregistrée en favoris de façon à y accéder plus rapidement.
B) Liste de diffusion et lettres d’informations
Liste de diffusion (mailing list) : un groupe (ex : apprentis 1 BTS NRC…) ou différentes personnes intéressées par un thème précis appartiennent à cette liste qui permet de diffuser une information à toutes les personnes concernées en même temps.
Attention ! Lorsque l’on répond à l’un de ces mails directement, il faut savoir que la réponse sera envoyée à toutes les personnes appartenant au groupe concerné !
Lettres d’infos (newsletters) : on les reçoit régulièrement dans notre boîte mail (bulletins d’infos…). Cependant, on ne peut pas y répondre !
Fil RSS : (Really Simple Syndication) est un format de description de données qui facilite la diffusion de fils d'informations, de façon automatisée, à l'intention des internautes, et qui favorise la syndication de contenus en permettant à d'autres sites de republier facilement tout ou partie de ces données.
II) Techniques de collecte
A) La location de fichiers