[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[pmb.user] Re: bug d'affichage Opac + indexation libre + exemplaireinvisible]
Pour continuer la discussion entamée à la table (et non entamés sous la
table ;-)) lors de la 1st belgian PMB convention (ou l 2nd d'ailleurs), je
replacerais ici le modèle que je connais le mieux et qui est très
spécifique: les outils dela National Library of Medicine à qui l'on doit
la base de données bibliographique MedLine, le thesaurus qui va avec (le
MeSH http://www.nlm.nih.gov/mesh/meshhome.html), une interface d'accès à
cette base et au thesaurus (PubMed
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&itool=toolbar) et,
enfin, la classification qui est cohérente avec le thesaurus (NLM
classification http://wwwcf.nlm.nih.gov/class/)
En gros, l'utilisateur lambda va sur le site pubmed et se trouve face à
une interface de recherche simple (google like, une case à remplir)
il tape sa requête (en anglais), mettons "breast cancer treatment" (les
AND sont implicites)
il obtient des résultats (78818 quand même)
s'il regarde l'onglet history, il voit ce qu'il a tapé
s'il regarde l'onglet details (les professionnels DOIVENT le faire), il
verra ceci
(("breast neoplasms"[TIAB] NOT Medline[SB]) OR "breast neoplasms"[MeSH
Terms] OR breast cancer[Text Word]) AND ("therapy"[Subheading] OR
("therapeutics"[TIAB] NOT Medline[SB]) OR "therapeutics"[MeSH Terms] OR
treatment[Text Word])
il se rendra (peut-être) compte (le professionnel surement) que le système
a travaillé pour lui en recherchant :
- à la fois les mots clés demandés dans les champs titre et abstract
(breast cancer[Text Word])
- mais aussi les descripteurs pertinents retrouvés grâce à la fonction
mapping basée sur des entry terms et, je pense, sur le texte de
description ("breast neoplasms"[MeSH Terms] )
- et en plus, qu'il réutilise les mots composant le descripteur comme mots
clés pour les notices non encore indexées, indexées pris ici au sens
documentaire du terme: sélection de termes descripteurs sur base de la
lecture de l'article entier par des spécialistes et encodage manuel dans
la notice (("breast neoplasms"[TIAB] NOT Medline[SB]))
Je n'ai aucune idée du travail informatique que cela représente (bon si,
quand même une idée), mais dans le cas où un thesaurus est encodé dans le
système (termes et description), je me dis qu'une fonction mapping
générique ne doit pas être si ardue que ça à développer, et que partant de
là, un algorithme de recherche tel que montré ci-dessus, à savoir mapper
les termes, et recherche dans tous les champs textes pertinents y compris
catégories et indexation libre ou pas, devrait suivre sans trop de
problème (c'est là qu'Eric, Gauthier et Florent mangent la table...)
qu'en pensez vous?
parce que pour ce qui est d'essayer de lister tous les termes entrés par
les utilisateurs et de les indexer (au sens informatique) dans le champs
indexation (libre ou pas?), je suis pas convaincu...
je pense qu'il faut aider l'utilisateur de manière transparente, mais il
faut également qu'il fasse le pas d'apprendre un minimum (comprende un
classement, voire un thesaurus n'est pas insurmontable) s'il veut utiliser
le système de manière vraiment performante...
patrice
PS1 Eric, pour obtenir le fichier MeSH, c'est ici
http://www.nlm.nih.gov/mesh/filelist.html
il s'agit apparemment de l'alphabetic list, et non du permuted index (
entry terms et headings) comme je le pensait au départ
PS2 je suis content d'avoir la confirmation que Rameau est bien un
thesaurus au sens ou je l'entendais, et tout aussi content de me rendre
compte (sisi) que j'emploie le terme thesaurus d'une façon incorrecte si
j'en croit la définition suivante "A la différence d'un thésaurus, la
liste d'autorité encyclopédique n'est pas constituée a priori mais au fur
et à mesure des besoins d'indexation et évolue sur la base des
propositions" trouvée ici http://wiki.crao.net/index.php/BiblioTicRameau
(pourtant, le site NLM parle bien de Thesaurus... différence culturelle?)
Il est intéressant de voir qu'il trouve son origine dans le thesaurus de
la LC (si j'en croit le premier googlisé) sachant que la classification
NLM est en fait dérivée de la classification LC ; et plus encore qu'il est
consultable gratuitement en ligne (ce que j'ignorais)...
en fait si l'on teste "cancer du sein", la notice boucle la boucle : j'ai
l'équivalent LCSH et MeSH ainsi que l'indication de classification LC
(610) qui me donne une indication pour le classement NLM
http://catalogue.bnf.fr:80/framesWEB.jsp;jsessionid=00004r6AY1zGOiG8aI8PNyhhnMf:-1?host=catalogue
ah oui, toujours sur le bibliotic, on constate que Rameau et la belgique,
c'est coulé dans les textes
''On rappellera que l'Arrêté du 14 mars 1995 du Gouvernement de la
Communauté française relatif à l'organisation du service public de la
lecture indique en son article 8 :
En ce qui concerne les livres, périodiques et documents, les bibliothèques
publiques doivent respecter les normes bibliothéconomiques suivantes :
- la D.B.I.N. et la norme AFNOR Z 44-073 pour la description
bibliographique;
- la C.D.U. pour le rangement ou tout autre système qui s'en inspire;
- le répertoire RAMEAU pour l'indexation par sujets.
Les bibliothèques publiques doivent travailler selon la dernière édition
ou la dernière mise à jour des normes bibliothéconomiques auxquelles il
est fait référence ci-dessus et, dans un délai raisonnable, adapter le
classement déjà réalisé à ses modifications.''
Bref, Rameau dans PMB, ça existe déjà?
Isabelle Le Mest <isabelle.lemest@free.fr>
Sent by: pmb.user_owner@pizz.net
05/04/2006 13:50
Please respond to pmb.user
To: pmb.user@pizz.net
cc:
Subject: [pmb.user] Re: bug d'affichage Opac + indexation libre + exemplaire
invisible]
Bonjour
Merci beaucoup, Patrice, pour la solution de l'underscore, le problème
est que la recherche pour le lecteur lambda est moins "naturelle" et
qu'il faut donner une petite explication sur la syntaxe des mots-clés
composés.
Mon problème est un peu le caractère redondant de l'indexation :
On a d'abord les "catégories",
puis on indexe en Dewey à la demande, (à partir de son propre manuel
Dewey), (entraînant la présence de la nouvelle indexation dans une liste
d'autorités Dewey, ce qui est une bonne chose évidemment).
Mais quelquefois on a des choses assez semblables... qui vont de
surcroît être recoupées par l'indexation libre !
Ce qui pose problème est l'indexation libre, sans liste d'autorités, car
le lecteur rentre ses mots clés au hasard, sans pouvoir choisir dans une
liste, d'une part, et surtout pendant le catalogage, on risque des
doublons, sur des variantes orthographiques fâcheuses (par ex sg. ou
pl.) , voire des erreurs de frappe (errare humanum). Pourquoi ne pas
faire une liste d'autorités des mots-clés "libres" ?
Pour ma part, j'en ai commencé une sur Excel, sinon on ne s'y retrouve
pas.
J'aurais aimé aussi un thesaurus plus consistant car je trouve
décevantes les "catégories". Avec Superdoc, j'utilisais Motbis, mais
c'est la propriété du CNDP et c'est quand même axé "enseignement". Donc
pourquoi pas Rameau, même si j'ai conscience qu'il s'agit là d'un
thesaurus complexe, à l'architecture et la hiérarchisation bien
spécifiques et dans lequel on ne peut pas trop improviser... Mais tout
s'apprend, et c'est malgré tout un thesaurus de référence.
Voilà seulement diverses interrogations sur l'aspect "indexation"
Par ailleurs la recherche multicritères avec les opérateurs booléens
(comme le "et") manque d'évidence, là encore, pour le lecteur lambda :
qu'en pensez-vous ?
A bientôt
Isabelle
BHBR (Bibliothèque des Hospitalisés de Brest et sa région)
------------------------------------------------------------------------
Patrice.Chalon@centredexpertise.fgov.be a écrit :
> Bonjour
>
> Dans notre cas, nous avons utilisé
> - l'underscore: cela est utile lorsque au départ d'une notice le
lecteur
> veut avoir toutes les notices indexées avec le même terme exple
Medical_ethics (pour par exemple mettre à profit à la fois le moteur de
recherche cher à
> Eric, et le travail de fourmi des bibliothécaires cher à myself - le
> meilleur des deux mondes quoi... qu'est ce qu'il dit lait-fraise?;-))
> - le tag html <br> c'est plus joli (mais prend plus de place)
>
>
> <br>Medical_technology_Moral_and_ethical_aspects <br>
> Medical_ethics <br>
> Nursing_ethics <br>
> Genetic_screening <br>
> Biomedical_Technology_Congresses <br>
> Bioethical_Issues_Congresses
>
> sera vu comme ceci
>
> Medical_technology_Moral_and_ethical_aspects
> Medical_ethics
> Nursing_ethics
> Genetic_screening
> Biomedical_Technology_Congresses
> Bioethical_Issues_Congresses
>
> Et si je clique depuis la notice sur Medical_ethics, je retrouve tous
les
> ouvrages indexé avec ce terme
>
> C'est pas l'idéal (astreignant à l'encodage), mais ça fonctionne (et ça
> continuera de fonctionner en .19)
>
> l'idéal serait en fait que l'indexation (au sens PMB) possède les même
> fonctionnalités que les catégories (au sens PMB) : titre et description,
> plusieurs termes possibles, see also disponible (il y a aussi
> Ethics,_Clinical ; Ethics,_Pharmacy
>
> [HS] de mon point de vue (biaisé par une expérience et un envirronement
> très particulier), il y a inversion entre indexation et catégories
> (classement) dans PMB, mais comme je n'ai pas une formation de
> bibliothécaire....
>
> Patrice
>
> Liste de diffusion pmb.user
> Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe
>
>
>
>
>
Liste de diffusion pmb.user
Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe
Liste de diffusion pmb.user
Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe