Présentation du MeSH bilingue 2019

1. Historique

Le MeSH (Medical Subject Headings) est le thésaurus de référence dans le domaine biomédical (1). La NLM (U.S. National Library of Medicine) le met à jour chaque année pour indexer et permettre d'interroger ses bases de données, notamment MEDLINE/PubMed, ainsi que pour cataloguer ses ouvrages et autres documents (2). En 1960, la NLM met en place l'informatisation des données avec le système MEDLARS (MEDical Literature Analysis and Retrieval System). En 1969, afin de faciliter l'accès en français à ses bases de données, la NLM signe une convention de partenariat avec l'Inserm, qui devient le Centre MEDLARS pour la France (3). L'Inserm traduit le MeSH et met à jour la version française chaque année depuis 1986. Dans le cadre d'un accord de coopération avec l'Inserm, l'Inist-CNRS (Institut de l'information scientifique et technique du CNRS) a contribué à la mise à jour de 2004 à 2018 (4). L'Inserm met la version bilingue à la disposition de la communauté francophone, qui peut la consulter en ligne ou l'obtenir sous la forme d'un fichier sous format XML (5). La version bilingue est souvent utilisée comme outil de traduction, ainsi que pour l'indexation et l'interrogation de bases de données en français.

2. Organisation des catégories thématiques

Le MeSH comprend les 16 catégories thématiques suivantes.

  • Anatomie [A]
  • Organismes [B]
  • Maladies [C]
  • Produits chimiques et pharmaceutiques [D]
  • Techniques et équipements analytiques, diagnostiques et thérapeutiques [E]
  • Psychiatrie et psychologie [F]
  • Phénomènes et processus [G]
  • Disciplines et professions [H]
  • Anthropologie, enseignement, sociologie et phénomènes sociaux [I]
  • Technologie, industrie et agriculture [J]
  • Sciences humaines [K]
  • Sciences de l'information [L]
  • Groupes individualisés [M]
  • Soins de santé [N]
  • Caractéristiques d'une publication [V]
  • Lieux géographiques [Z]

Chacune de ces catégories est organisée en une arborescence de descripteurs [MeSH Headings], qui peut comprendre jusqu'à treize niveaux de hiérarchie (6). La plupart des descripteurs ont une seule localisation, alors que les autres en ont plusieurs, dans la même catégorie ou dans des catégories différentes. Chaque localisation est représentée par un code d'arborescence [Tree Number], qui comprend une lettre indiquant la catégorie et une séquence numérique précisant le niveau dans la hiérarchie.


Par exemple, dans la catégorie A figurent successivement les descripteurs "Régions du corps" [A01], Membres [A01.378], "Membre supérieur" [A01.378.800], Main [A01.378.800.667], Doigts [A01.378.800.667.430] et Pouce [A01.378.800.667.430.705], qui apparaissent chacun une seule fois. Le descripteur Œil apparait au contraire deux fois dans la catégorie A, d'une part sous les descripteurs "Régions du corps" [A01], Tête [A01.456] et Face [A01.456.505] sous la forme Œil [A01.456.505.420], et d'autre part sous le descripteur "Organes des sens" [A09] sous la forme Œil [A09.371]. Enfin, le descripteur Télémédecine apparait une fois dans chacune des catégories H, L et N, respectivement sous le descripteur Médecine [H02.403] sous la forme Télémédecine [H02.403.840], sous le descripteur Télécommunications [L01.178.847] sous la forme Télémédecine [L01.178.847.652] et sous le descripteur "Prestations des soins de santé" [N04.590.374] sous la forme Télémédecine [N04.590.374.800].

3. Structure des descripteurs

Les descripteurs sont constitués de concepts, les concepts sont eux-mêmes constitués de termes, et un terme est un mot ou un ensemble de mots exprimant une notion (7). Chaque concept porte le nom d'un de ses termes, appelé terme préféré. Chaque descripteur porte le nom d'un de ses concepts, appelé concept préféré, les autres étant appelés concepts subordonnés. Chaque concept subordonné présente une relation sémantique avec le concept préféré, soit une relation hiérarchique (concept plus large ou plus étroit), soit une relation associative (concept associé). Chaque descripteur comprend un ou plusieurs concepts, et chaque concept comprend un ou plusieurs termes. Dans le cadre de l'indexation, du catalogage et de la recherche documentaires, les termes d'un descripteur donné sont équivalents entre eux.


Par exemple, le descripteur [Blindness] comprend le concept préféré [Blindness], le concept associé [Amaurosis] et les concepts plus étroits [Blindness, Acquired], [Blindness, Complete], [Blindness, Hysterical], [Blindness, Legal], [Blindness, Monocular] et [Blindness, Transient].

4. Le MeSH 2019

Chaque année, afin d'enrichir le MeSH et de tenir compte de l'évolution du domaine biomédical, de nouveaux descripteurs sont ajoutés, et d'anciens descripteurs sont modifiés, remplacés, supprimés ou déplacés. Des concepts et des termes sont ainsi ajoutés, modifiés, supprimés ou déplacés. Le MeSH 2019 comprend 29 351 descripteurs (8). Lors de la mise à jour, 421 descripteurs ont été ajoutés, 2347 ont été modifiés, 64 ont été remplacés, et 9 ont été supprimés.


Le MeSH 2019 comprend les descripteurs et termes suivants (9).

  • 184 types de publications [Publication Types]
    Contrairement aux autres descripteurs, les types de publications sont utilisés lors de l'indexation ou du catalogage des documents pour faire référence à leurs caractéristiques et non à leur contenu, comme par exemple [Biography] ou [Clinical Trial, Phase II]. Vingt types de publications ont été ajoutés.
  • 33 descripteurs obligatoires [Check Tags]
    Les descripteurs obligatoires représentent des notions à prendre systématiquement en compte lors de l'indexation des documents pour la base MEDLINE/PubMed, comme par exemple [Cats] ou [History, Medieval].
  • 76 qualificatifs [Subheadings/Qualifiers]
    Les qualificatifs sont utilisés avec les descripteurs pour l'indexation, le catalogage et la recherche documentaires. Chaque qualificatif peut être associé aux descripteurs de certaines sous-catégories, de façon à en décrire un aspect particulier. Par exemple, l'association du descripteur [Liver] et du qualificatif "drug effects" indique que le document ne concerne pas le foie de manière générale, mais les effets des médicaments et des substances chimiques sur le foie. Les qualificatifs "manpower", "secretion" et "utilization" ont été supprimés.
  • Les descripteurs précoordonnés
    Il s'agit de descripteurs à utiliser à la place de certaines combinaisons descripteur/qualificatif pour interroger la base MEDLINE/PubMed. Par exemple, le descripteur précoordonné [Heavy Ion Radiotherapy] est à utiliser à la place du descripteur [Heavy Ions] et du qualificatif "therapeutic use". Douze descripteurs précoordonnés ont été ajoutés.

5. Mise à jour de la version française

Une nouvelle version française est présentée chaque année. Il s'agit de tenir compte de la mise à jour du MeSH et de réviser la version française précédente, en ajoutant, modifiant, supprimant ou déplaçant des termes. Depuis 1986, l'Inserm a assuré la traduction des nouveaux descripteurs, la majeure partie de la révision de la version française, ainsi que le contrôle et la validation des travaux. De 2004 à 2018, l'Inist-CNRS a contribué à la révision. Les travaux ont été réalisés en ligne avec le MTMS (MeSH Translation Maintenance System), système de gestion de la traduction multilingue mis en place par la NLM (10-11).


Des règles de traduction sont appliquées. Les rectifications de l'orthographe parues au Journal Officiel du 6 décembre 1990 sont prises en compte, ainsi que les recommandations des Commissions de terminologie et de néologie concernées. Différents registres de langue sont utilisés, un nom scientifique ou médical pouvant côtoyer un nom commun, comme pour Asthénopie et "Fatigue oculaire". En cas de singulier ou de pluriel irrégulier, le terme est mentionné au singulier et au pluriel, comme pour "Anticorps monoclonal" et "Anticorps monoclonaux". En cas d'homographie, le domaine d'application est précisé, comme pour "Kiwi (oiseau)" et "Kiwi (plante)". Les acronymes sont présentés selon un format standardisé, comme pour "AVC (Accident Vasculaire Cérébral)" ou SIDA. La version française reprend de plus des termes anglais volontiers utilisés par les francophones, comme GABA ou Marketing, ainsi que des termes spécifiques de la civilisation américaine, comme "NIH Office of Scientific Integrity". La version française reprend enfin des termes d'autres langues, par exemple le latin, comme pour "Staphylococcus aureus" ou "Coxa valga".


Les travaux suivants ont été réalisés pour la version française du MeSH 2019.

  • Traduction des 421 nouveaux descripteurs ;
  • Révision d'une partie des descripteurs concernant les antigènes ou les récepteurs ;
  • Révision des sous-catégories "Complications de la grossesse" [C13-703] et "Santé publique" [N06-850] ;
  • Révision d'une partie des sous-catégories "Composés hétérocycliques" [D03], Diagnostic [E01], "Phénomènes physiologiques" [G07], "Industrie alimentaire" [J01.576.423] et "Qualité, accès, évaluation des soins de santé" [N05].

6. Outils d'exploration du MeSH et de la version bilingue

Le MeSH Browser permet de parcourir les arborescences et de consulter des informations concernant les descripteurs ou les qualificatifs (6-7). Pour un descripteur d'intérêt, il est par exemple possible d'obtenir ses concepts et termes, les qualificatifs pouvant lui être associés, ses descripteurs précoordonnés, ainsi qu'une note explicative [Scope Note] concernant sa signification ou son usage. Ses codes d'arborescences sont indiqués et ses localisations dans les arborescences sont visualisées. Des liens vers des descripteurs connexes sont également proposés. Pour le descripteur Eye, il est suggéré de consulter par exemple les descripteurs [Eye Manifestations] et [Intraocular Pressure], ainsi que les descripteurs dont des termes comprennent la chaine de caractères -ophthalm-.


Inversement, le MeSH Browser permet de formuler des requêtes pour sélectionner des descripteurs, des qualificatifs ou des notes explicatives. Par exemple, aucun terme ne contient les mots Eye et Kidney, mais huit descripteurs contiennent ces deux mots dans leurs notes explicatives, dont [Diabetes Complications] et [Oculocerebrorenal Syndrome].


Par ailleurs, un outil d'exploration de la version bilingue est proposé (5). Il permet de parcourir les arborescences françaises ou de consulter des informations bilingues concernant les descripteurs ou les qualificatifs. Inversement, cet outil permet de formuler des requêtes en français ou en anglais pour sélectionner des descripteurs, des termes ou des qualificatifs. Un champ permet également de sélectionner les descripteurs correspondant à une action pharmacologique donnée, comme par exemple Antidiarrheals ou Hemostatics. Un champ permet enfin de sélectionner les descripteurs situés sous un descripteur donné, en utilisant son code d'arborescence et la troncature à droite. La requête A01.378.800* permet par exemple de sélectionner les descripteurs situés sous le descripteur "Membre supérieur" [A01.378.800].

Références

1. Welcome to Medical Subject Headings

2. U.S. National Library of Medicine

3. NLM International Programs

4. Inist-CNRS

5. Le MeSH bilingue anglais-français

6. MeSH Browser – Tree View

7. MeSH Browser – Search

8. What's New for 2019 MeSH

9. MEDLINE Data Changes – 2019

10. The MeSH translation maintenance system : structure, interface design, and implementation

11. NLM MeSH Translation Management System to Retire on December 31, 2018