lundi 8 octobre 2007

votre cours "la recherche sur Internet"

Afin que vous ayez un accès facilité, voici le cours que vous avez eu en septembre mis ici sous forme de blog.

Dans la partie droite les "intitulés" en sont l'ossature.
Ils se mettent automatiquement soit par importance soit par ordre alphabétique, j'ai choisi par importance. Ceci vous explique que le sommaire du cours a donc été un peu remanié pour s'adapter à cette formule.

N'hésitez pas à vous servir des commentaires (modération a posteriori) pour ... ajouter une info complémentaire utile à tous, ... poser une question...
Il m'arrivera de mettre en commentaire un site trouvé depuis la fin du cours et qui peut vous intéresser.

Bon vent pour vos recherches, qu'elles vous soient fructueuses pour votre dossier multimédias.

Geneviève Le Blanc

les 10 commandements pour votre dossier multimédia

La recherche Internet de votre dossier multimédia va être l'application du cours.


1. analyser le sujet
le cerner en s'aidant éventuellement d'une encyclopédie en ligne ou d'un thesaurus pour
prendre en compte l'étendue du sujet à traiter
2. le traduire en mots clés
pensez aux synonymes, thesauri... pour interroger les outils de recherche
3. rechercher les documents
==> identifier les types de documents disponibles (papier, Internet, cédérom, dvd, film...)
==> penser aux bases bibliographiques (bibliothèques clermontoises ou en ligne) et pensez
au prêt interbibliothèque
==> ne pas hésiter à changer d'outil de recherche quand vous êtes sur le Net
==> localiser les documents (cote du livre ou du multimédia, structure du site, structure de
la page)...
==> penser à noter vos références webgraphiques au fur et à mesure
3. exploiter les informations
==> lectures exploratoire, repérage et intégrale (livres, sites, cd, vidéo...)
==> en cas de traduction, pensez au temps que cela prend
pour s'aider : http://www.woxikon.com/france/ -
http://mist.univ-paris1.fr/dico/glossaire-a-i.html#H -
http://www.google.com/language_tools
4. analyser les informations sélectionnées
noter et annoter les informations retenues
les recouper
5. vérifier la qualité des sites sur lesquels vous avez sélectionné des informations
fiabilité, niveau de l'auteur, dates création et/ou MAJ...)
6. agréger les informations retenues
les synthétiser et les hiérarchiser
s'assurer que l'on n'a rien oublié (méthode QQQOCP)
7. finaliser le plan
y a t'il osmose entre le plan prévu et les informations trouvées ou faut-il le retravailler ?
8. bâtir son dossier
reformuler les informations, les réunir en fonction du plan
respecter les consignes données
9. finaliser le dossier
monter son dossier multimédia
y intégrer sa webgraphie
pour les parties écrites, attention aux fautes d'orthographe et de grammaire : se relire et se
faire relire. Vous pouvez utiliser le Littré en ligne, vérifier votre conjugaison ou utiliser Lexilogos
10. communiquer le résultat
en respectant les consignes de présentation et de délai .
S'il y a soutenance, pensez à votre présentation (regarder le jury, sourire, parler
distinctement...)


_________________

pour approfondir

les 10 commandements de la recherche sur Internet

1 – s’assurer du bon choix des mots
2 – être dans le sujet et non hors sujet
3 – respecter le niveau retenu (novice, expert…)
4 – choisir l’outil le plus approprié
5 – ne pas hésiter à changer d’outil
6 – traiter ses sources (incontournables + …)
7 – recouper les informations (s’assurer de leur qualité)
8 – mémoriser les signets
9 – ne pas s’enliser ni s’entêter
10 – zapper intelligemment

__________
autre façon de voir les choses
http://vtech.canalblog.com/archives/2007/07/05/5528633.html

syndication ou fil d'actualités

Certaines pages web, certains blogs offrent la possibilité de syndiquer leur contenu par le biais de fils d'actualité dont les noms (RSS, Atom et xml) indiquent la technique utilisée pour se faire. C'est-à-dire de permettre à d'autres pages, d'autres blogs de faire apparaître automatiquement leurs informations (toutes ou en partie).
Ou simplement pour l'internaute intéressé d'être tenu au courant de leur actualité.

L'intérêt réside dans le regroupement de tous les fils que l'on veut suivre : la syndication permet de regrouper des contenus provenant de sources différentes et de les publier éventuellement sur un site web de façon automatisée.

Un fil d'actualisation est "un fichier contenant le titre de l'information, une courte description et un lien vers une page décrivant plus en détail l'information."

Ces fils sont réceptionnés dans un aggrégateur qui peut être
- votre messagerie (si elle offre cette possibilité) ou
- votre navigateur (Firefox, Opera)
- un logiciel spécialisé (certains de ces logiciels sont gratuits :Noopod, WeBull, ...).
L'aggrégateur nous informe ensuite des nouveautés qu'il vient de recevoir.

Lorsque l'on fait un lien entre sa page ou son blog et celle ou celui sur lequel on a trouvé l'information intéressante et que l'on veut signaler, sa mise en ligne permettra au lecteur de lire la suite de l'actualité en ligne sur le site concerné.

_______________

Si vous souhaitez approfondir le sujet, voir le site de l'ADBS
______________

sources de la définition
http://www.google.fr/url?sa=X&start=17&oi=define&q=http://www.e-citiz.com/spip.php%3Frubrique21&usg=AFQjCNHA0hDi98vioPC8Tz8B395MKNNyTg
pureblog.purefm.be/2006/09/le_lexique_du_b.html

wiki

« Un wiki est un système de gestion de contenu de sites qui rend les pages web librement et également modifiables par tous les visiteurs autorisés.
Les wikis sont utilisés pour faciliter l'écriture collaborative de documents avec un minimum de contrainte. »
(source : Wikipédia)


Exemple d’encyclopédie aux savoirs partagés : wikipedia

Exemple de bibliothèque commune : CiteULike

Partager ses signets est aussi une action wiki

La syndication est un outil du Web 2.0 qui permet de suivre l'actualité d'une page ou d'un blog. D'où son nom de "fil d'actualité".
Les évolutions permanentes des pages ou des blogs participatifs nécessitait la mise en place de cet outil.

Attention : ce n'est pas un gage de qualité des données mais cela permet de juger du rythme des mises à jour

la blogosphère

Le mot "blog" vient de la contraction des mots web et log.
Définition :
Site Internet se présentant sous la forme d'un journal, mis à jour de façon plus ou moins régulière par son ou ses auteurs et caractérisé par un format qui prend la forme de textes, de liens hypertextes et/ou d'images.
Le blog se particularise par une grande facilité d'édition et une navigation principalement basée sur l'historique.
Chaque information mise constitue un billet à propos duquel tout internaute peut mettre des commentaires.

Pour trouver trace de blogs dans les sujets qui vous intéressent :

En France blogonautes / annuaire -blogs / Google

__________
sources de la définition
webmsi.free.fr/Web-0601-GR9/lexique.htm
fr.wikipedia.org/wiki/Blog

web 2.0, dit aussi "web social"

Lors du cours en septembre, voici la définition (Wikipédia) que je vous avais donnée :
« Web 2.0 est un terme souvent utilisé pour désigner ce qui est perçu comme une transition importante du World Wide Web, passant d'une collection de sites web à une plate-forme informatique à part entière, fournissant des applications web aux utilisateurs. »

En voici une autre, plus simple et plus claire
"Web 2.0 est un terme évolutif qui décrit un ensemble d’améliorations au réseau World Wide Web. Généralement, les améliorations permettent d’accroître la collaboration et le partage de l’information." (source canadienne)

La caractéristique principale du Web 2.0 est la participation active possible des internautes sur le contenu de la page ==>
  • facilité à faire entrer ou sortir des informations du système (un simple navigateur suffit pour tout faire)
  • le ‘participateur’ reste propriétaire de ses propres données ;
  • le site doit permettre le partage des informations avec les autres internautes

Quels sont les apports du web 2.0 ?
- la blogosphère (blogs),
- le wiki (construction de pages en commun : encyclopédies, partage de signets,...),
- le réseau social (sites qui proposent d'établir des liens avec d'autres personnes à titre
personnel, professionnel, amical...) (*)
- la syndication (pour suivre les nouveautés)

________________

(*) ce point ne sera pas développé dans ce cours.
Définition : site web qui, dans un domaine quelconque, fédère des individus et facilite leurs échanges d'informations, d'images… (source : Diconet)
Quelques sites de ce type : Xing, Linkendin (en anglais), 6nergies et Ecademy (partie en français)

________________

Nota bene

Un libellé propre "web 2.0" a été créé sur ce blog pour permettre une approche directe du sujet. Mais celui-ci est bien à considérer comme un des éléments qui composent les sources d'information, comme il était mis dans le sommaire du cours.

De même je l'ai également intégré dans le B.A. BA d'Internet parce qu'il fait maintenant partie des éléments incontournables d'Internet

favoris ou marque pages ou signets ou bookmarks...

pour retrouver les sites que l'on veut garder en mémoire...

C'est vite l'invasion et bien que chaque navigateur propose de les organiser, la liste devient vite encombrante. (comment s'y prendre pour ceux qui ne l'ont jamais fait)

Conseil : ne garder que les essentiels dans son navigateur, ceux dont on se sert quotidiennement ou presque. Se faire une base de données pour les autres. Et mieux encore, les partager.

Base de données :
Jusqu'à l'arrivée du Web 2.0, il était possible de se faire une BdD personnelle ou d'utiliser des utilitaires (à télécharger).
Aujourd'hui, une autre possibilité est offerte par des sites qui permettent de mettre en ligne ses favoris, soit en accès réservé à soi-même ou à un groupe, soit ouvert à tout internaute.

A noter que c'est une bonne façon de retrouver des spécialistes sur le sujet qui vous intéresse : ceux qui ont mis le même signet partagent sans doute les mêmes intérêts. Voir les sites qu'ils ont sélectionnés permet de trouver d'autres pistes informatives.

Parmi les plus connus : delicious / bookmarks / blinklist / bookeetown
Attention à la fiabilité et à la longévité des sites nouveaux

Ils sont un outil de mémoire et d'élargissement vers d'autres sites pour améliorer sa propre webgraphie. Les plus partagés ne sont pas forcément et/ou absolument les plus qualifiés.

Lorsque vous devez faire une webgraphie, tous les sites dont vous avez extrait des données sont à signaler. Si nécessaire vous pouvez ajouter les sites que vous avez consulté mais que vous n'avez pas retenu, mais attention à ne pas alourdir la liste.
Bien évidemment, il faut être capable de justifier les choix de sélection.

listes de diffusion

But : échange & diffusion d’informations
Moyen : courrier électronique
Utilisateur : toute personne qui en fait la demande
Beaucoup de sites proposent maintenant leur propre liste de diffusion

Un message d'une liste peut être à signaler dans une webgraphie si l'on peut apporter la preuve de sa qualité

Quelques pistes pour les connaître :

==> les Francopholistes
==> sur celles concernant l’info-doc
==> les listes du C.R.U. (comité réseau des universités)

Quelques listes particulières
==> Parutions au J.O. http://www.droit.org/push/
==> le Sénat, etc...




annuaires

Quand un site web est-il un annuaire ?

  • il propose d'autres sites classés par sujets
  • il subdivise des sites par typologie
  • il valide & indexe ces sites non par le biais de robots mais par le biais de personnes.

Quelques annuaires connus :
- Yahoo, créé en 1994
- Indexa, spécialisé dans les entreprises

Pistes pour en trouver d'autres avec http://www.lesannuaires.com/
Si vous recherchez un thème particulier, pensez à questionner annuaire + nom du thème

portails

Définitions :
==> Les portails sont des "sites multiservices - généralement commerciaux - mettant à disposition un large ensemble de ressources et de services sous forme de liens".

==> Ils sont une page d’accueil d’un site Internet "mettant à la disposition de l’internaute un large ensemble de ressources et services intérieurs et extérieurs au site. Par extension, ce terme désigne aussi l’organisme qui fournit une telle page d’accueil".

Ils servent de guide à leurs utilisateurs pour

  • trouver l'information,
  • utiliser les services électroniques et
  • envoyer des questions et commentaires.

En voici quelques uns =
Yahoo Nomade MSN Wanadoo Dmoz Hotbot Excite Voila AOL Lycos Ask Jeeves ...

métamoteurs de recherche, différents types

Trois grands types de présentation des métamoteurs

==> cartographique tels que Kartoo MapStan Search Umap

==> textuel tels que Ariane6 / Ixquick /
et pour mémoire : Ask Jeeves, Debriefing, Dogpile, Infind, Metacrawler, Metafind...
Certains ont une analyse très complète des sites trouvés : Surfwax
D'autres sont accessibles hors ligne Copernic, Strategic Finder... et nécessitent d'installer un logiciel gratuit pour la version simple. Ils permettent une première ébauche de veille notamment en archivant les résultats

==> à clustérisation Clusty (Vivisimo) / QueryServer
La clustérisation est une classification des éléments, soit principalement par hiérarchisation, soit par nuées dynamiques

_________________

pour approfondir :

http://www.uhb.fr/urfist/Supports/ApprofMetamoteurs/ApprofMetamoteurs_traitementresultats.htm

à propos de la clustérisation : http://www.aiaccess.net/French/Glossaires/GlosMod/f_gm_cluster.htm

pour tout savoir sur Umap

métamoteurs de recherche

- ils consultent simultanément un certain nombre de moteurs,
- ils éliminent les doublons et résument les résultats.
- quelques uns présentent les résultats par moteurs consultés

==> Avantage =
plus grande couverture du contenu d'Internet étant donné son interrogation simultanée de plusieurs outils de recherche. C'est ce qui fait leur force.
==> Inconvénients =
1. ils n'utilisent pas toutes les capacités des différents outils : le métamoteur se restreint aux caractéristiques communes.
2. certains ne traduisent pas le langage des outils des moteurs qu'ils utilisent



vendredi 5 octobre 2007

moteurs de recherche spécialisés

En voici quelques uns

Spinoo, moteur de recherche dédié aux sites éducatifs institutionnels français

Blinkx, spécialisé dans les vidéos (recherche sur les titres ET les bandes sons)

Dans le cadre de votre dossier multimédia, Allcdcovers.com peut vous être utile : il fait la recherche de pochettes d'albums de musique, de DVD ou de jeux vidéos. Il propose tous les éléments constituant la jaquette, et non simplement la face avant. Les internautes peuvent enrichier eux-mêmes la base de données.

A propos des blogs, cf le billet "blog"

...Difficile de les citer tous. Rechercher "moteurs de recherche spécialisés" et rajouter éventuellement le sujet de votre recherche.

jeudi 4 octobre 2007

moteurs de recherche généralistes

Si vous cliquez sur le logo, vous accéderez au moteur lui-même.
N'oubliez pas sa version "recherche avancée" pour affiner votre question
Je vous propose de faire la même recherche sur chacun d'eux et de comparer les résultats...
Ne pas oublier qu'il existe des moteurs spécialisés qui peuvent être d'autant plus intéressants (traités dans le billet suivant)


Ses réponses sont basées sur les PageRank (indice de popularité calculé sur le nombre de liens pointant vers la page concernée).
Propose un correcteur orthographique de requête
A noter la fonction "copie cachée" qui permet d'accéder à des pages toujours indexées par Google mais supprimées par leur auteur depuis.
________________


Exalead est un éditeur de logiciels français qui vend sa technologie.
Notamment en matière de moteur à Yahoo et à AOL

Il Propose des termes associés, des catégories, des personnes, des lieux, des organisations en lien avec sa recherche.
Donne l'image des pages qu'il donne en réponse.
Suggère éventuellement un autre mot à la place de celui de sa recherche.
__________________


Ujiko, version 1
Ujiko, version 2

Ce moteur est développé par la société clermontoise KARKOO
C'est sa deuxième version (la 1e était plus simple)
Il propose de lui-même en visuel d'autres mots pour affiner sa recherche (cartographie), permet de trier les sites proposés en supprimant ceux qui n'intéressent pas ou de mémoriser ceux qui conviennent
Ouvre les pages sur un autre onglet
Les données sont mémorisées sur l'ordinateur
Pas de recherche avancée mais si vous tapez par ex. 'adoles' il sort des pages avec adolescence, adolescent, ado...
___________________

Moteur auvergnat en partenariat avec Google
Propose un accès à l'information whois sur les pages affichées.Propose de mettre en favori ou d'éliminer les sites qui n'intéressent pas
Propose l'historique en envoyant sur le site "archive.org" aux pages archivées du site concerné
Permet d'envoyer la page des résultats par messagerie

__________________
Alltheweb (sté Fast)




_________________

moteur de Microsoft
La recherche avancée est accessible dans la partie "options"
_________________

Ask (ex-Teoma) Propose plusieurs possibilités de mots lorsque l'on commence à taper sa recherche Met sur le côté de la page des images et des vidéos en lien avec la recherche Comme Google, propose de voir les pages "en cache" Propose d'aller faire une autre recherche sur Lycos
_____________

Yahoo.fr n'est plus seulement l'annuaire qu'il était, il est aussi moteur de recherche.
Point intéressant : lorsque l'on tape son mot-clé, il suggère d'autres possibilités.

________________

Propose des termes connexes
Utilise l'annuaire de Yahoo

_______________

Aol Search, Il utilise la technologie de l'analyse statistique pour extraire les réponses pertinentes A noter une recherche possible sur les dates de mises à jour Etait au départ un annuaire

_______________

Mais aussi : Hotbot (propose de choisir entre Ask ou MSN), Lycos, Netscape, Voilà et son annuaire Quiquoiou, Ask.com, ...

_____________
Vous pouvez approfondir ces informations sur le site d'Abondance

moteurs de recherche, définition


’Un moteur de recherche est un logiciel permettant de retrouver des ressources (pages Web, forums Usenet, images, vidéo, etc.) associées à des mots quelconques.

Certains sites Web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site lui-même.’’
(wikipédia)

les outils

  • moteurs de recherche
  • métamoteurs de recherche
  • portails
  • listes de diffusion
  • annuaires
  • favoris

s'assurer de la qualité des pages retenues

Pouvoir justifier de la sélection des sites consultés montre son professionnalisme et donc la fiabilité des informations que l'on transmet ou que l'on analyse.

Pour cela, toute webgraphie doit être justifiable.
Pour cela, un seul mot, la QUALITE des choix réalisés.


==> date de l'information
  1. date de mise à jour de la page lue est-elle signalée et est-elle récente ?
  2. fréquence des MAJ (attention selon les sujets, la périodicité des MAJ peut fluctuer)
==> l'auteur de l'information
  1. il est identifiable (soit parce que bien signalé sur la page soit l'on fait une recherche pour le trouver)
  2. son expertise est-elle décernable ? (spécialiste reconnu, professionnel en tant que tel ou particulier dont on connaît la profession, voire spécialiste amateur)
  3. s'agit-il d'un site institutionnel (ce qui contrebalance le nom d'un auteur en propre) ?
  4. y a t'il caution scientifique ou une responsabilité éditoriale ?
==> référencement de la page
  1. signalement de l'url par d'autres sites de qualité
  2. quels sont ses signets ?
==> sources
  1. les sources qui ont permis la rédaction de la page sont-elles bien signalées ?
  2. sont-elles de qualité ?
  3. s'agit-il de sources primaires ? secondaires ? ...
==> l'exposé et les données
  1. clarté de l'exposé
  2. le sujet est-il traité dans son ensemble ? s'agit-il seulement d'un point particulier mais replacé dans son contexte ?
  3. les données sont-elles confirmées, validées par d'autres sites ayant d'autres sources ?
==> objectif recherché de la mise en ligne
  1. est-il commercial ? (susceptible d'orienter ou de grésiller l'information)
  2. y a t'il des liens sponsorisés sur la page ?
  3. est-il de participer à la notoriété de l'auteur
==> stabilité du site
  1. s'agit-il d'une url sur un serveur fixe ou est-elle hébergée par une société d'hébergement ?
  2. qu'indique le suffixe de l'url (.com, .org, .fr ...)
  3. est-ce une page, un blog, un message dans une liste de diffusion, une participation à une discussion ?
  4. site institutionnel ? site d'une entreprise ou d'un organisme ? site personnel ?

newsgroups, organisation

Les noms des newsgroups français commencent par fr. (pour France) suivi des premières lettres du sujet traité par le newsgroup


alt. pour Alternatif : tous sujets non abordés ailleurs
biz. pour Business : produits, services, analyses
rec. pour Recreation : Sports, jeux, loisirs...
comp. pour Computer : matériel, logiciels, tendances...
sci. pour Sciences...
humanities. sur la littérature, beaux-arts, philosophie...
soc. sur la culture, problèmes sociaux...
misc. pour Miscallenous : Emploi, santé, vie quotidienne...
talk. sur les événements, débats, opinions...

Et pour la France : fr.reseaux / fr.petites-annonces / fr.usenet / …

Newsgroups

Il s'agit de groupes de discussion sur un thème précis, au classement hiérarchisé.
Chacun peut lancer librement un sujet ou contribuer à la discussion.

Ils sont hébergés sur le réseau des serveurs de newsgroups, appelé Usenet.

Usenet (liste des NG français)
Google
Tile Net

Une partie de discussion peut être à citer dans sa webgraphie. Mais là aussi il faut en justifier l'utilisation

mode 'push'

En mode 'push', l'internaute reçoit directement sur son ordinateur des informations en provenance de sites sur lesquels il s'est inscrit pour recevoir des informations.

Ces informations sont apportées à l'utilisateur par courriel, de façon automatique selon les critères qu'il a choisis. Ceci sous la forme

  • d’extraits de bases de données
  • de bulletins (Newsletters),
  • de listes de diffusion, etc.

les bases de données

Types de BdD = banques d’images, de textes, de catalogues, de statistiques ou de logiciels

L'Urfist de Lyon a fait une BdD sur... les bases de données

Ex. Ministère de la Culture / BNF / Union Européenne (ces trois déjà cités)
OCDE / Nations Unies / kompass (
Juridique : Légifrance jurisprudence
Voir aussi un aperçu de SPRINGER http://www.springerlink.com/home/main.mpx

L'utilisation de données extraites d'une BdD peut être signalée dans sa webgraphie, mais toujours être capable d'expliquer la qualité qui a justifié son choix
___________________

Pour plus d'informations sur le monde des bases de données, voir ce site

mercredi 3 octobre 2007

la presse en ligne

Un portail de la presse française par la FNPF

A propos des journaux sur le Net, voir le portail de Giga Presse

Penser aux revues de presse (généralistes / spécialisées)
exemple : en matière de pédagogie sur la Francophonie, l'Union Européenne, l'architecture, @rtflash

Pour trouver d'autres revues de presse, utiliser le métamoteur spécialisé en matière de revues de presse

Pour mémoire
Le site de l’ISSN propose son registre sous forme de base de données.
Pour cela, il faut donner son nom et son courriel. L’accès est libre pendant 30 jours.

Si un article est utilisé dans votre dossier documentaire, il faut être capable de justifier de votre choix (auteur, actualité, sources...)

les archives du web

Créée en 1996 aux USA, l'association Internet Archive a pour but de constituer, stocker, préserver et gérer une bibliothèque du web, en archivant la totalité d'Internet tous les six mois.
Depuis octobre 2001, Internet Archive met ces archives en accès libre sur le web. Et constitue des collections spécifiques ainsi que des collections numériques, toutes en consultation libre sur le web.

C'est une bonne piste pour retrouver une page disparue.

Les Archives nationales d'un certain nombre de pays participent à la construction de ces archives. Tels la Suède, la France

Le minima à savoir :
L’archivage de la Toile s’attache à la fois aux sites en tant qu’unités et aux liens qui tissent des relations entre les pages d’un site et entre les sites eux-mêmes. L’outil principal est constitué par des moteurs de recherche qui utilisent des robots destinés à la fois à parcourir ces liens et à collecter les contenus eux-mêmes (pages, fichiers encapsulés et liens) (source : la BNF)

les libraires et les éditeurs

Généralistes
librairies : Alapage / Amazon / Decitre / Fnac /
certaines permettent de recevoir par mail la liste des nouveautés dans les thèmes que l'on a choisi.
éditeurs : Nathan / Privat

Spécialisés
librairies : Foliomusic
éditeurs : Ed. Liaisons / Hermès / L’Harmattan / Lavoisier / Ed. d’Organisation
pour retrouver les éditeurs d'art

les centres spécialisés

  • votre université
  • organismes spécialisés dans un secteur
    syndicats prof., instituts, associations
    voir liste
  • réseaux spécialisés
    tels que l'Insee (niveaux national et régional), les chambres de commerce, le CNDP (aussi au niveau régional & départemental
  • professionnels
    personnes / réseaux / entreprises...

les bibliothèques & leurs catalogues

N'oubliez pas le prêt inter entre bibliothèques en allant à votre BU

  • bibliothèques publiques
    leur liste sur le site du Ministère de la Culture
  • bibliothèques universitaires
    le SUDOC rassemble tous les catalogues des bibliothèques universitaires et d'un grand nombre de grandes écoles
    la BCIU de Clermont-Fd
  • réseaux de bibliothèques
    exemples :
    le catalogue collectif de France ( bibliothèques municipales, BnF (BN-OPALE Plus) et SUDOC (bib. univ.))
    l'OCLC
  • bibliothèques spécialisées
    celles signalées par les signets de la BNF
    celles de Paris (dont les grandes écoles)
  • bibliothèques virtuelles
    exemples : celle de la BNF, Bibenligne (propre aux sciences humaines & sociales dans le champ des études méditerranénnes (mais pas seulement) avec accès aux documents)
    The European Library

Voir vos cours de bibliothéconomie.

autres pistes en matière culturelle

Dans le répertoire des bases de données du Ministère de la Culture, sont citées notamment

Ne pas oublier la liste des catalogues que vous a remis votre professeur M. Bayon

institutions culturelles

Présentation des bases Architecture et Patrimoine du Ministère de la Culture

  • La base Architecture - Mérimée
    recense des édifices
  • La base Mobilier - Palissy
    recense des objets mobiliers
  • La base Images - Mémoire
    contient des images fixes
  • La base Bibliographie - Archidoc
    contient des notices bibliographiques
  • La base Vocabulaires - Thésaurus
    fédère l'ensemble de ces bases par un vocabulaire commun (dénomination des oeuvres)
  • La base Vocabulaires - Auteurs
    recensent les orfèvres et peintres verriers cités ou non dans les bases Mérimée et Palissy
  • La base Vocabulaires - Sancti
    propose une approche iconographique des oeuvres étudiées dans Palissy.

sites institutionnels

  • Sites nationaux
    ministères, organismes publics…)
    site de base : Service Public
  • Sites locaux
    préfectures, mairies, centres d’information…
  • Sites européens (institutions, pays)
    sur le portail de l'Union européenne
  • Sites étrangers (cf Service Public)

les sources d'informations

  • organismes institutionnels
  • bibliothèques & méta bibliothèques
  • libraires & éditeurs
  • newsgroups
  • bases de données
  • presse en ligne
  • sites du web (pages, blogs, & techniques du web2.0)

pour ne rien oublier

n'hésitez pas à utiliser la méthode du QQQOCP


qui ?
quoi ?
quand ?
où ?
comment ?
pourquoi ?
vous serez certain(e) de ne rien oublier.

de quand date l'information ?

Une information sans date ne vaut rien. Sur Internet ou ailleurs.
C'est la date de mise à jour d'une page qui lui donne sa valeur.

Certains sites notent sur la page concernée la date de la MAJ (généralement en bas de page) (exemple).
D'autres regroupent sur une page toutes leurs MAJ (exemple)
D'autres encore signalent la dernière MAJ sur la page d'accueil, ce qui veut dire que la page qui vous intéresse est peut-être plus ancienne
Certaines pages sont "abandonnées" ; elles ne sont plus actualisées, mais laissées en place. Cela peut être signalé (exemple), mais pas toujours. Voir alors quelle est la dernière date signalée.

Tous les moyens sont bons pour dater une page :
  • y a t'il une précision apportée dans les métatags ?
  • le titre du fichier comporte t'il une date ?
  • quelle est la date la plus récente d'édition citée dans une bibliographie

métatags informatifs dans le code source des pages

Comment se présentent les métatags dans la page source ?

  • Author : nom de l'auteur du document
  • Description : elle apparaît parfois dans les moteurs de recherche. La phrase doit être courte, dense en mot-clés
  • Keywords : mots-clés pour compléter la description
  • Generator : Nom du programme qui a généré la page web

attention à la notoriété de l'auteur

question de base à se poser : qui a créé cette page ?

Autres questions importantes :
  • quelles compétences a t'il sur le sujet ? (spécialiste ? amateur éclairé ?)

  • quel est son objectif ? (commercial ? valorisation de ses compétences ?)

  • quelle est son objectivité ?

Pour y répondre
  • regarder les métatags dans le code source des pages (cf image ci-après qui explique où trouver le code source)
    Si le webmestre a bien fait son travail vous y verrez "author"
    Explications plus complète sur les métatags dans le billet suivant
  • utiliser le whois, service de recherche fourni par les sites des Registres Internet régionaux (RIR) permettant d'obtenir des informations sur une adresse IP ou un nom de domaine. Cet annuaire est consultable via des logiciels dédiés ou via de nombreux sites Web, tels que
    http://www.generic-nic.net/dyn/whois/
    http://www.raynette.fr/services/whois/

  • faire une recherche sur la personne dont on a trouvé le nom

  • faire une recherche sur l'organisme qui abrite la page. C'est un premier niveau d'auteur.

____________

image pour savoir comment accéder au code source de la page concernée dans son navigateur (ici Firefox (code source de la page), mais identique dans Explorer (source) et Opera (source))



_________________________
Sources à propos du whois
Wikipédia - Gandi

attention à la notion du temps

Elle concerne l'information elle-même et la pérennité du site



L'information :

Attention à la notion du temps : l'information recherchée est-elle un sujet nouveau, d'actualité, peu fréquent, dépassé ?
(*)(*) source du graphique : un powerpoint d'une étude concernant la détection de l'innovant sur le web déposé sur le site de l'@sic (archives ouvertes en Sciences de l'information)

mises en équation des mots

Comment forcer son navigateur (et parfois sa base de données) à prendre en compte les mots retenus ?

==> par la recherche avancée des moteurs de recherche
Ils proposent d'affiner en précisant des dates, le format des fichiers recherchés, la langue, la nature du site...
A noter qu'ils sont pour la plupart insensibles aux accents et aux majuscules, au singulier/pluriel. Mais parfois ...


==> par l'utilisation des booléens et leurs équivalents les opérateurs logiques compris par les moteurs de recherche lorsque la recherche avancée ne suffit pas (attention : variable selon les moteurs. Ici sont pris en compte Google, Exalead, MSN et Yahoo)

AND (op. logique +) permet d'affiner
NOT (op. logique -) permet d'éliminer en cas d'homonymie par exemple (ex. pull par rapport à push et non pas le vêtement)
NEAR pour la proximité (à utiliser avec Exalead)
OR pour prendre en compte des mots proches (à utiliser avec Google & Yahoo)
INTITLE pour ne prendre en compte que les mots dans le titre (à utiliser avec tous) intitle:
SITE pour une recherche seulement dans un site (à utiliser avec tous) insite:
DEFINE pour trouver la définition d'un mot (tous sauf Exalead) define:
INFO pour trouver des informations à propos d'un site (à utiliser avec Google)
guillements "" pour respecter la construction des mots mis (par ex. une partie de phrase)
étoile* comme troncature pour chercher tous les mots qui commencent ou finissent par les lettres mises (ex. chev* trouvera cheval chevalin chevauchée...)

la synonymie

Les synonymes aident non seulement en cours de rédaction pour éviter les répétitions et affiner le sens des mots utilisés pour améliorer son vocabulaire, mais aussi à trouver d'autres mots clés.

Conseil :
User et abuser du dictionnaire des synonymes de l’Université de Caen
Vous y trouverez également des antonymes.

Le lien vers le CNTRL (Centre national de ressources textuelles et lexicales) sur la définition du mot dans le dictionnaire permet - outre sa définition - de trouver des citations

thesauri : des pistes

Voir le répertoire RAMEAU de la BNF

Voir le thesaurus des BdD du Ministère de la Culture

A savoir qu'il existe une bibliographie sur les thesauri & catalogues

Un exemple de thesaurus en ligne, dans Ciclope, catalogue documentaire qui contient des références de documents destinés à l’information et à l’orientation des étudiants en lettres et sciences humaines de l'Université Marc Bloch à Strasbourg

Autres exemple de thesaurus,
==> celui du l'OIT (Office International du Travail)
==> tout en anglais, mais intéressant, celui du site "reference.com"

les thesauri, pour trouver d'autres mots

Un thesaurus est une sorte de dictionnaire hiérarchisé.
Il se compose d’un vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine.
L’important n’est pas tant la définition du mot et sa signification que les relations des termes.

Remonter dans les termes génériques permet d'élargir la portée des mots
Descendre dans les termes spécifiques permet d'affiner sa recherche

pour affiner sa réponse

==> observer dans les réponses qui paraissent insatisfaisantes les mots utilisés dans les pages
concernées et qui sont peut-être plus performants que ceux employés dans votre
recherche
Ex. question "déprime après une naissance" on peut chercher avec 'dépression' et dans les
réponses on peut lire 'baby blues', mot professionnel qui permettra des réponses serrées

==> Affiner sa technique de recherche en utilisant la recherche avancée de son navigateur

==> s’appuyer sur les mots de la définition du terme recherché
pour cela taper define: et mettre le mot)

exemples du poids des mots

exemples

Q. Y a-t-il une stratégie pour intégrer les jeunes dans le monde du travail ?
STRATEGIE = règles, politique,
JEUNES = diplômés, 20/25 ans
INTEGRATION = insertion
TRAVAIL = carrière, emploi

Q. = volume d’une sapinière ?
bateau Allier contenu
sapinières
batellerie Allier

le poids des mots, leur importance

Ne pas hésiter à
==> reformuler la question
==> déterminer les mots les plus importants
==> éviter les mots tels que cause condition conséquence effet situation tendances
==> utiliser des synonymes et consulter des thesauri



Plus vous agirez ainsi, plus vos réponses seront efficaces et au coeur de votre sujet.



L'objectif est de forcer votre navigateur ou une base de données à prendre en compte les termes de votre question



Pour mémoire :
par défaut, la plupart des moteurs sur le Web trouvent des pages contenant tous les mots inscrits dans la case de recherche. Il faut donc parfois modifier cet assemblage.
Exemple dans ce graphique (source GIRI, excellent guide d'informations sur la recherche sur Internet qui n'est malheureusement plus tenu à jour)






les bonnes questions

  • Quels termes choisissez-vous par rapport au sujet de votre dossier multimédia ?
  • Pourquoi ?
  • Avec quels outils ?
  • Combien de réponses ?
  • Est-ce suffisant ?
  • Pourquoi ?
  • Si pas suffisant, comment rebondissez-vous ?
  • Sur quels critères sélectionnez-vous les sites retenus ?

qu'entendre par qualité en matière de recherche sur Internet ?

Respect de la question

Importance des mots
Mise en équation


Qualité de la réponse
quelle réponse apporter à ces points :

dans quelle partie de son cycle de vie l’info se place t'elle ?
quel est l’auteur du site ?
quelle est la fraîcheur du site (fréquence des mises à jour, date de la dernière MAJ...)
quels metatags ont été retenus ?

problématique & méthodologie à développer pour votre dossier

==> définir et expliciter la problématique choisie
Démarche suivie : ce qui interpelle sur le sujet, où chercher (qui quoi), organisation suivie,

==> définir et expliciter la méthodologie mise en oeuvre
C'est la manière de "poser le problème".
Poser le problème, c'est essentiellement décider d'une orientation dès le départ.
C’est l’articulation d’un certain nombre de questions reliées entre elles par un lien logique

==> justifier le plan

Telles sont les consignes que vous avez reçues de M. Souleyroux.
Mais quelque soit le sujet à traiter, le cadre dans lequel vous êtes (études, vie professionnelle...) cette façon de faire est toujours indispensable.
N'oubliez pas de signaler le document de M. Souleyroux dans votre bibliographie.

chercher quoi pour votre dossier ? respect du sujet

Traiter les axes de votre enseignement

1 - Cinémas (fiction, documentaire, art, vidéo)
2 - Son – Musique
3 - Image fixe (photographie, peinture, etc...)
4 - Création Internet (pages ou sites)

Exigence : 3 répertoires et un outil par domaine

respect de la réponse

==> Respect de la question posée
(mais travail sur les mots, réinterrogation du demandeur si besoin)

==> Respect de la forme de la réponse
(grand public, spécialiste...)

qui est le demandeur ?

==> des ‘’praticiens’’
RH, juristes, rédacteurs, com., informaticiens, formateurs…
==> des ‘’utilisateurs de centres documentaires’’
collègues, adhérents, clients
==> des ‘’dirigeants’’
(informations stratégiques)
==> des enseignants

par quelle bout prendre la recherche ?

demandeur = élément de base de votre action de recherche

==> situation (spécialiste, ignare, risque juridique)
==> calendrier (respect / organisation)
==> Objectif (fiche explicative, article, rapport, voyage…)

<<<>>>

mardi 2 octobre 2007

comment retrouver les adresses intéressantes ?

Pour trouver les pages, on utilise des moteurs, métamoteurs, annuaires, portails, …
Nous allons étudier tout cela dans la partie du cours intitulée "les outils"

C'est par le biais d'un navigateur que l'on peut faire des recherches et lire les pages trouvées.
Trois grands navigateurs ont une interface qui se ressemble dans les grandes lignes avec :
- une zone d'affichage
- une barre de menus déroulants (favoris, commandes des fichiers, options de configuration...)
- une barre d'outils (barre d'adresse, boutons de navigation, ...)
- une barre d'état (comptes rendus d'afichage)


==> Explorer (Microsoft)
La page d'Explorer sur le site de Windows


==> Firefox (Mozilla, logiciel libre)
Page de téléchargement et d'explications


==> Opera (Opera, Norvège)
Ce navigateur est mis gratuitement à télécharger.
Sa réputation : être plus rapide que les autres.
Il permet de garder les fenêtres ouvertes lorsqu'on le ferme : pratique lorsqu'on est en cours de recherche sur plusieurs jours

le nommage géographique

Les codes nationaux (nous venons de parler de .fr) sont déterminés par un groupe d'experts des Nations Unies pour la normalisation des noms géographiques (GENUNG) selon la norme ISO 3166-1

le nommage français

Il est fixé par l'AFNIC (Association Française pour le Nommage Internet en Coopération)

outre .gouv et .edu ==>

.asso.fr pour les associations
.tm.fr pour les marques
.ac- pour les académies
.nom.fr pour les particuliers
.fr ouvert maintenant aux particuliers, signale qu'il s'agit d'un site français

pour certaines activités .presse.fr / .barreau.fr / .avocat.fr /
.medecin.fr

le code générique des extensions des url (international)

COM            ==>  activité commerciale
NET             ==> général (souvent pour les réseaux)
ORG             ==> organisations (généralement sans but lucratif)
EDU             ==> réservé aux écoles supérieures (=>4 années)
AERO          ==> industrie aéronautique  
BIZ              ==>  commerces
COOP          ==> coopératives   
INFO           ==> sans restriction    
MUSEUM   ==> musées 
NAME         ==> personnes
PRO             ==>   professions libérales 

et pour les USA en propre
GOV ==> Serveurs liés aux organismes gouvernementaux (US)
MIL  ==> réservé à l’armée américaine

la gestion du nommage des URL

code générique (nommage)


Les URL sont gérées par l’ICANN
(Internet Corporation for Assigned Names and Numbers),

C'est une organisation de droit privé à but non lucratif

le nom convivial de l'URL

Le nom convivial est le nom choisi par l’auteur suivi d’une extension (elle-même composée d’un point et de trois lettres)

La zone qui suit le point indique le thème concerné ou le pays d’origine

les URL, adresses des pages web

==> A l'origine, une série de chiffres :
C’est l’adresse IP ou numéro Internet de chaque ordinateur branché à Internet qui permet de rassembler les noeuds Elle est constituée d'une série de quatre chiffres, entre 0 et 255, séparés par des points.

==> une lisibilité améliorée par le serveur DNS
C'est le serveur DNS qui établit la correspondance entre les deux dénominations.
Serveur DNS = base de données liant adresse IP et nom convivial

==> Ce n'est que lorsqu'une machine devient serveur qu'il est utile de lui accorder un nom Internet.

La structure de l’adresse IP ou url unique (Uniform Ressource Locator) est la suivante :
protocole://serveur/chemin (répertoire/fichiers)

EXEMPLES
< http://www.bull.com/index.html >,
< http://129.199.115.254/index.htm > lorsqu'il n'y a pas eu de nom demandé
< http://fr.news.yahoo.com/photos/...>
ftp://ftp.cert.org/pub >

Internet et ses protocoles de communication

Pour communiquer, chaque fonction d’Internet a son propre protocole

L'architecture du système est celle du client-serveur qui a besoin de connaître le protocole concerné :

http = client ‘navigateur’ (HyperText Transfert Protocol)
ftp    = client ‘messagerie’
ntp   = client ‘temps’

‘Client’ désigne la machine, l’utilisateur ou le logiciel qui accède à un type de service sur une machine

l'architecture d'Internet

Communication des systèmes
Accès aux pages par des url
Navigateurs

définition d'Internet

Internet est un réseau d’ordinateurs qui communiquent en utilisant les mêmes langages et les mêmes protocoles quelque soit le lieu sur la planète.

(source : http://cours.sim.hcuge.ch/cfpg/i1-intro-internet.pdf)

l'historique d'Internet

les trois dates fondamentales :
1969 : USA, réseau ARPANET (années 1980 : séparation militaire/civil)
1972 : création du courrier électronique
1992 : le CERN créé le WWW (world wild web)

les différents aspects d'Internet

==> pages web sous forme de pages, de blogs, ou de wikis
==> courrier électronique : courrier, messagerie instantanée ou clavardage ==> téléphone (visioconférences)==> news groups…

les trois formes de l'information

==> unité matérielle ou virtuelle distincte renfermant un renseignement

==> lieu physique ou virtuel où sont entreposés les documents

==> personne ressource qui fournit une information

les quatre niveaux de l'information

document primaire : l’original

document secondaire : recense et décrit les documents primaires (bibliographie)

Document tertiaire : traite
==> les documents secondaires (bibliographie de bibliographies)
==> et la littérature grise
« document dactylographié ou imprimé, produit à l'intention d'un public restreint, en dehors des circuits commerciaux de l'édition et de la diffusion et en marge des dispositifs de contrôle bibliographiques ». (AFNOR)
Tels sont les rapports, notes de recherche, prépublications (mais pas les thèses, congrès, brevets et normes)
En font également partie
- les pages orphelines
dont il faut connaître a priori les adresses
- le contenu des BdD
Les universités, laboratoires de recherche et même les offices de brevets proposent leurs
bases de données en accès gratuit. Sachez que ces ressources sont mal signalées par les
moteurs de recherche car l'information est diffusée sous forme de pages dynamiques pas
toujours indexées par les robots.

document quaternaire : qui délivre des informations à valeur ajoutée (synthèse sur un sujet...).




l'information, c'est...

connaître : l’information est l’ ‘’élément de connaissance susceptible d’être représenté à l’aide de conventions pour être traité, conservé, communiqué’’ (Définition du JO du 17 janvier 1982.)

comprendre : procédure qui permet à quelqu’un de poser une question à la meilleure source possible

agir : réaliser / utiliser le produit (physique ou immatériel) résultant de sa demande