[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[pmb.user] Re: bug d'affichage Opac + indexation libre + exemplaireinvisible]



Pour continuer la discussion entamée à la table (et non entamés sous la 
table ;-)) lors de la 1st belgian PMB convention (ou l 2nd d'ailleurs), je 
replacerais ici le modèle que je connais le mieux et qui est très 
spécifique: les outils dela National Library of Medicine à qui l'on doit 
la base de données bibliographique MedLine, le thesaurus qui va avec (le 
MeSH http://www.nlm.nih.gov/mesh/meshhome.html), une interface d'accès à 
cette base et au thesaurus (PubMed 
http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=PubMed&itool=toolbar) et, 
enfin, la classification qui est cohérente avec le thesaurus (NLM 
classification http://wwwcf.nlm.nih.gov/class/)

En gros, l'utilisateur lambda va sur le site pubmed et se trouve face à 
une interface de recherche simple (google like, une case à remplir)

il tape sa requête (en anglais), mettons "breast cancer treatment" (les 
AND sont implicites)

il obtient des résultats (78818 quand même)

s'il regarde l'onglet history, il voit ce qu'il a tapé

s'il regarde l'onglet details (les professionnels DOIVENT le faire), il 
verra ceci
(("breast neoplasms"[TIAB] NOT Medline[SB]) OR "breast neoplasms"[MeSH 
Terms] OR breast cancer[Text Word]) AND ("therapy"[Subheading] OR 
("therapeutics"[TIAB] NOT Medline[SB]) OR "therapeutics"[MeSH Terms] OR 
treatment[Text Word])

il se rendra (peut-être) compte (le professionnel surement) que le système 
a travaillé pour lui en recherchant :

- à la fois les mots clés demandés dans les champs titre et abstract 
(breast cancer[Text Word])
- mais aussi les descripteurs pertinents retrouvés grâce à la fonction 
mapping basée sur des entry terms et, je pense, sur le texte de 
description ("breast neoplasms"[MeSH Terms] )
- et en plus, qu'il réutilise les mots composant le descripteur comme mots 
clés pour les notices non encore indexées, indexées pris ici au sens 
documentaire du terme: sélection de termes descripteurs sur base de la 
lecture de l'article entier par des spécialistes et encodage manuel dans 
la notice (("breast neoplasms"[TIAB] NOT Medline[SB]))

Je n'ai aucune idée du travail informatique que cela représente (bon si, 
quand même une idée), mais dans le cas où un thesaurus est encodé dans le 
système (termes et description), je me dis qu'une fonction mapping 
générique ne doit pas être si ardue que ça à développer, et que partant de 
là, un algorithme de recherche tel que montré ci-dessus, à savoir mapper 
les termes, et recherche dans tous les champs textes pertinents y compris 
catégories et indexation libre ou pas, devrait suivre sans trop de 
problème (c'est là qu'Eric, Gauthier et Florent mangent la table...)

qu'en pensez vous?

parce que pour ce qui est d'essayer de lister tous les termes entrés par 
les utilisateurs et de les indexer (au sens informatique) dans le champs 
indexation (libre ou pas?), je suis pas convaincu...
je pense qu'il faut aider l'utilisateur de manière transparente, mais il 
faut également qu'il fasse le pas d'apprendre un minimum (comprende un 
classement, voire un thesaurus n'est pas insurmontable) s'il veut utiliser 
le système de manière vraiment performante...

patrice

PS1 Eric, pour obtenir le fichier MeSH, c'est ici 
http://www.nlm.nih.gov/mesh/filelist.html 
il s'agit apparemment de l'alphabetic list, et non du permuted index ( 
entry terms et headings) comme je le pensait au départ

PS2 je suis content d'avoir la confirmation que Rameau est bien un 
thesaurus au sens ou je l'entendais, et tout aussi content de me rendre 
compte (sisi) que j'emploie le terme thesaurus d'une façon incorrecte si 
j'en croit la définition suivante "A la différence d'un thésaurus, la 
liste d'autorité encyclopédique n'est pas constituée a priori mais au fur 
et à mesure des besoins d'indexation et évolue sur la base des 
propositions" trouvée ici http://wiki.crao.net/index.php/BiblioTicRameau 
(pourtant, le site NLM parle bien de Thesaurus... différence culturelle?)

Il est intéressant de voir qu'il trouve son origine dans le thesaurus de 
la LC (si j'en croit le premier googlisé) sachant que la classification 
NLM est en fait dérivée de la classification LC ; et plus encore qu'il est 
consultable gratuitement en ligne (ce que j'ignorais)...

en fait si l'on teste "cancer du sein", la notice boucle la boucle : j'ai 
l'équivalent LCSH et MeSH ainsi que l'indication de classification LC 
(610) qui me donne une indication pour le classement NLM

http://catalogue.bnf.fr:80/framesWEB.jsp;jsessionid=00004r6AY1zGOiG8aI8PNyhhnMf:-1?host=catalogue

ah oui, toujours sur le bibliotic, on constate que Rameau et la belgique, 
c'est coulé dans les textes

''On rappellera que l'Arrêté du 14 mars 1995 du Gouvernement de la 
Communauté française relatif à l'organisation du service public de la 
lecture indique en son article 8 :

En ce qui concerne les livres, périodiques et documents, les bibliothèques 
publiques doivent respecter les normes bibliothéconomiques suivantes :
- la D.B.I.N. et la norme AFNOR Z 44-073 pour la description 
bibliographique;
- la C.D.U. pour le rangement ou tout autre système qui s'en inspire;
- le répertoire RAMEAU pour l'indexation par sujets.

Les bibliothèques publiques doivent travailler selon la dernière édition 
ou la dernière mise à jour des normes bibliothéconomiques auxquelles il 
est fait référence ci-dessus et, dans un délai raisonnable, adapter le 
classement déjà réalisé à ses modifications.''

Bref, Rameau dans PMB, ça existe déjà?






Isabelle Le Mest <isabelle.lemest@free.fr>
Sent by: pmb.user_owner@pizz.net
05/04/2006 13:50
Please respond to pmb.user

 
        To:     pmb.user@pizz.net
        cc: 
        Subject:        [pmb.user] Re: bug d'affichage Opac + indexation libre + exemplaire 
invisible]



Bonjour

Merci beaucoup, Patrice, pour la solution de l'underscore, le problème 
est que la recherche pour le lecteur lambda est moins "naturelle" et 
qu'il faut donner une petite explication sur la syntaxe des mots-clés 
composés.

Mon problème est un peu le caractère redondant de l'indexation :
On a d'abord les "catégories",
puis on indexe en Dewey à la demande, (à partir de son propre manuel 
Dewey), (entraînant la présence de la nouvelle indexation dans une liste 
d'autorités Dewey, ce qui est une bonne chose évidemment).
Mais quelquefois on a des choses assez semblables... qui vont de 
surcroît être recoupées par l'indexation libre !

Ce qui pose problème est l'indexation libre, sans liste d'autorités, car 
le lecteur rentre ses mots clés au hasard, sans pouvoir choisir dans une 
liste, d'une part, et surtout pendant le catalogage, on risque des 
doublons, sur des variantes orthographiques fâcheuses (par ex sg. ou 
pl.) , voire des erreurs de frappe (errare humanum). Pourquoi ne pas 
faire une liste d'autorités des mots-clés "libres" ?
Pour ma part, j'en ai commencé une sur Excel, sinon on ne s'y retrouve 
pas.

J'aurais aimé aussi un thesaurus plus consistant car je trouve 
décevantes les "catégories". Avec Superdoc, j'utilisais Motbis, mais 
c'est la propriété du CNDP et c'est quand même axé "enseignement". Donc 
pourquoi pas Rameau, même si j'ai conscience qu'il s'agit là d'un 
thesaurus complexe, à l'architecture et la hiérarchisation bien 
spécifiques et dans lequel on ne peut pas trop improviser... Mais tout 
s'apprend, et c'est malgré tout un thesaurus de référence.

Voilà seulement diverses interrogations sur l'aspect "indexation"

Par ailleurs la recherche multicritères avec les opérateurs booléens 
(comme le "et") manque d'évidence, là encore, pour le lecteur lambda : 
qu'en pensez-vous ?

A bientôt

Isabelle
BHBR (Bibliothèque des Hospitalisés de Brest et sa région)

------------------------------------------------------------------------

Patrice.Chalon@centredexpertise.fgov.be a écrit :
> Bonjour
>
> Dans notre cas, nous avons utilisé
> -  l'underscore: cela est utile lorsque au départ d'une notice le 
lecteur 
> veut avoir toutes les notices indexées avec le même terme exple 
Medical_ethics  (pour par exemple mettre à profit à la fois le moteur de 
recherche cher à 
> Eric, et le travail de fourmi des bibliothécaires cher à myself - le 
> meilleur des deux mondes quoi... qu'est ce qu'il dit lait-fraise?;-))
> - le tag html <br> c'est plus joli (mais prend plus de place)
>
>
> <br>Medical_technology_Moral_and_ethical_aspects <br>
> Medical_ethics <br>
> Nursing_ethics <br>
> Genetic_screening <br>
> Biomedical_Technology_Congresses <br>
> Bioethical_Issues_Congresses
>
> sera vu comme ceci
>
> Medical_technology_Moral_and_ethical_aspects 
> Medical_ethics 
> Nursing_ethics 
> Genetic_screening 
> Biomedical_Technology_Congresses 
> Bioethical_Issues_Congresses 
>
> Et si je clique depuis la notice sur Medical_ethics, je retrouve tous 
les 
> ouvrages indexé avec ce terme
>
> C'est pas l'idéal (astreignant à l'encodage), mais ça fonctionne (et ça 
> continuera de fonctionner en .19)
>
> l'idéal serait en fait que l'indexation (au sens PMB) possède les même 
> fonctionnalités que les catégories (au sens PMB) : titre et description, 

> plusieurs termes possibles, see also disponible (il y a aussi 
> Ethics,_Clinical ; Ethics,_Pharmacy 
>
> [HS] de mon point de vue (biaisé par une expérience et un envirronement 
> très particulier), il y a inversion entre indexation et catégories 
> (classement) dans PMB, mais comme je n'ai pas une formation de 
> bibliothécaire....
>
> Patrice
>
> Liste de diffusion pmb.user
> Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe
>
> 
>
>
> 



Liste de diffusion pmb.user
Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe

 



Liste de diffusion pmb.user
Pour se désinscrire : mailto:pmb.user_request@sigb.net?subject=unsubscribe