Skip to main content

Le MeSH bilingue

Historique

Le MeSH (Medical Subject Headings) est le thésaurus de référence dans le domaine biomédical (1). La NLM (U.S. National Library of Medicine) le met à jour chaque année pour indexer et permettre d’interroger ses bases de données, notamment MEDLINE/PubMed, ainsi que pour cataloguer ses ouvrages et autres documents (2). En 1960, la NLM met en place l’informatisation des données avec le système MEDLARS (MEDical Literature Analysis and Retrieval System). En 1969, afin de faciliter l’accès en français à ses bases de données, la NLM signe une convention de partenariat avec l’Inserm, qui devient le Centre MEDLARS pour la France (3). L’Inserm traduit le MeSH et met à jour la version française chaque année depuis 1986. L’Inserm met la version bilingue à la disposition de la communauté francophone, qui peut la consulter en ligne ou l’obtenir sous la forme d’un fichier sous format RDF ou JSON (5). La version bilingue est souvent utilisée pour l’indexation et l’interrogation de bases de données en français ainsi que comme outil de traduction.

Tout au long de ces années, aux côtés des anciens et actuels membres du pôle MeSH bilingue (H. Vallée, Y. Pilatte, M. Bodescot, S. Lemercier, J. Janès, A. Marenelly, F. Pesle,) et anciens et actuel directeurs (N. Pinhas, D. Pelaprat et M. Pohl) de l’IST/DSO de l’Inserm, plusieurs acteurs ont également contribué à ces travaux :

l’Inist-Cnrs (Institut de l’information scientifique et technique du Cnrs) (4) qui, dans le cadre d’un accord de coopération avec l’Inserm, a contribué à la mise à jour de 2004 à 2018 puis, de 2020 à 2023, a mis en œuvre la génération automatisée de données structurées Xml ;

Filip Kriz (National Medical Library de Prague) à partir de 2024 pour la structuration des données dans les formats RDF et JSON alimentant le moteur de recherche du mesh.inserm.fr via l’outil MTW (MeSH Translator Worker).

Le MeSH comprend les 16 catégories thématiques suivantes.

  • Anatomie [A]
  • Organismes [B]
  • Maladies [C]
  • Produits chimiques et pharmaceutiques [D]
  • Techniques et équipements analytiques, diagnostiques et thérapeutiques [E]
  • Psychiatrie et psychologie [F]
  • Phénomènes et processus [G]
  • Disciplines et professions [H]
  • Anthropologie, enseignement, sociologie et phénomènes sociaux [I]
  • Technologie, industrie et agriculture [J]
  • Sciences humaines [K]
  • Sciences de l’information [L]
  • Individus [M]
  • Santé [N]
  • Caractéristiques d’une publication [V]
  • Lieux géographiques [Z]

Chacune de ces catégories est organisée en une arborescence de descripteurs [MeSH Headings], qui peut comprendre jusqu’à treize niveaux de hiérarchie (6). La plupart des descripteurs ont une seule localisation, alors que les autres en ont plusieurs, dans la même catégorie ou dans des catégories différentes. Chaque localisation est représentée par un code d’arborescence [Tree Number], qui comprend une lettre indiquant la catégorie et une séquence numérique précisant le niveau dans la hiérarchie.

Par exemple, dans la catégorie A figurent successivement les descripteurs « Régions du corps » [A01], Membres [A01.378], « Membre supérieur » [A01.378.800], Main [A01.378.800.667], Doigts [A01.378.800.667.430] et Pouce [A01.378.800.667.430.705], qui apparaissent chacun une seule fois. Le descripteur Oeil apparaît au contraire deux fois dans la catégorie A, d’une part sous les descripteurs « Régions du corps » [A01], Tête [A01.456] et Face [A01.456.505] sous la forme Oeil [A01.456.505.420], et d’autre part sous le descripteur « Organes des sens » [A09] sous la forme Oeil [A09.371]. Enfin, le descripteur Télémédecine apparait une fois dans chacune des catégories H, L et N, respectivement sous le descripteur Médecine [H02.403] sous la forme Télémédecine [H02.403.840], sous le descripteur Télécommunications [L01.178.847] sous la forme Télémédecine [L01.178.847.652] et sous le descripteur « Prestations des soins de santé » [N04.590.374] sous la forme Télémédecine [N04.590.374.800].

Les descripteurs sont constitués de concepts, les concepts sont eux-mêmes constitués de termes, et un terme est un mot ou un ensemble de mots exprimant une notion (7). Chaque concept porte le nom d’un de ses termes, appelé terme préféré. Chaque descripteur porte le nom d’un de ses concepts, appelé concept préféré, les autres étant appelés concepts subordonnés. Chaque concept subordonné présente une relation sémantique avec le concept préféré, soit une relation hiérarchique (concept plus large ou plus étroit), soit une relation associative (concept associé). Chaque descripteur comprend un ou plusieurs concepts, et chaque concept comprend un ou plusieurs termes. Dans le cadre de l’indexation, du catalogage et de la recherche documentaire, les termes d’un descripteur donné sont équivalents entre eux.

Par exemple, le descripteur [Blindness] comprend le concept préféré [Blindness], le concept associé [Amaurosis], ainsi que les concepts plus étroits [Blindness, Acquired], [Blindness, Bilateral], [Blindness, Hysterical], [Blindness, Legal], [Blindness, Monocular], [Blindness, Transient], [Blindness, Unilateral] et [Sudden Visual Loss].

Chaque année, afin d’enrichir le MeSH et de tenir compte de l’évolution du domaine biomédical, de nouveaux descripteurs sont ajoutés, et d’autres descripteurs sont modifiés, remplacés, supprimés ou déplacés. Des concepts et des termes sont ainsi ajoutés, modifiés, supprimés ou déplacés. Le MeSH 2024 comprend environ 30 000 descripteurs. Lors de la mise à jour, 311 descripteurs ont été ajoutés (8).

Le MeSH 2024 comprend également :

76 qualificatifs [Subheadings/Qualifiers]
Les qualificatifs sont utilisés avec les descripteurs pour l’indexation, le catalogage et la recherche documentaires. Chaque qualificatif peut être associé aux descripteurs de certaines sous-catégories, de façon à en décrire un aspect particulier. Par exemple, l’association du descripteur [Liver] et du qualificatif « drug effects » indique que le document ne concerne pas le foie de manière générale, mais les effets des médicaments et des substances chimiques sur le foie.

41 descripteurs précoordonnés supplémentaires
Il s’agit de descripteurs à utiliser à la place de certaines combinaisons descripteur/qualificatif pour interroger la base MEDLINE/PubMed. Par exemple, le descripteur précoordonné [COVID-19 Drug Treatment] est à utiliser à la place de la combinaison du descripteur [COVID-19] et du qualificatif « drug therapy ». En 2024, 47 combinaisons descripteur/qualificatif ont été fusionnées en 41 descripteurs précoordonnés.

187 types de publications [Publication Types]

Contrairement aux autres descripteurs, les types de publications sont utilisés lors de l’indexation ou du catalogage des documents pour faire référence à leurs caractéristiques et non à leur contenu, comme par exemple [Biography] ou [Clinical Trial, Phase II].

Une nouvelle version française est présentée chaque année. Il s’agit de tenir compte de la mise à jour du MeSH et de réviser la version française précédente, en ajoutant, modifiant, supprimant ou déplaçant des termes. Des règles de traduction sont appliquées. Les rectifications de l’orthographe parues au Journal Officiel du 6 décembre 1990 sont prises en compte, ainsi que les recommandations des Commissions de terminologie et de néologie concernées. Différents registres de langue sont utilisés, un nom scientifique ou médical pouvant côtoyer un nom commun, comme pour Asthénopie et « Fatigue oculaire ». En cas de singulier ou de pluriel irrégulier, le terme est mentionné au singulier et au pluriel, comme pour « Anticorps monoclonal » et « Anticorps monoclonaux ». En cas d’homographie, le domaine d’application est précisé, comme pour « Kiwi (oiseau) » et « Kiwi (plante) ». Les acronymes sont présentés selon un format standardisé, comme pour « AVC (Accident Vasculaire Cérébral) » ou SIDA. La version française reprend de plus des termes anglais volontiers utilisés par les francophones, comme GABA ou Marketing, ainsi que des termes spécifiques de la civilisation américaine, comme « NIH Office of Scientific Integrity ». La version française reprend enfin des termes d’autres langues, par exemple le latin, comme pour « Staphylococcus aureus » ou « Coxa valga ».

Le MeSH Browser permet de parcourir les arborescences et de consulter des informations concernant les descripteurs ou les qualificatifs (6-7). Pour un descripteur d’intérêt, il est par exemple possible d’obtenir ses concepts et termes, les qualificatifs pouvant lui être associés, ses descripteurs précoordonnés, ainsi qu’une note explicative [Scope Note] concernant sa signification ou son usage. Ses codes d’arborescences sont indiqués et ses localisations dans les arborescences sont visualisées. Des liens vers des descripteurs connexes sont également proposés. Pour le descripteur Eye, il est suggéré de consulter par exemple les descripteurs [Eye Manifestations] et [Intraocular Pressure], ainsi que les descripteurs dont des termes comprennent la chaine de caractères -ophthalm-.

Le MeSH Browser permet également de formuler des requêtes pour sélectionner des descripteurs, des qualificatifs ou des notes explicatives. Par exemple, aucun terme ne contient les mots Eye et Kidney, mais huit descripteurs contiennent ces deux mots dans leurs notes explicatives, dont [Diabetes Complications] et [Oculocerebrorenal Syndrome].

Par ailleurs, un outil d’exploration de la version bilingue est proposé (5). Il permet de parcourir les arborescences françaises, de consulter des informations bilingues concernant les descripteurs ou les qualificatifs, ou bien de formuler des requêtes en français ou en anglais pour sélectionner des descripteurs, des termes ou des qualificatifs. Un champ permet également de sélectionner les descripteurs correspondant à une action pharmacologique donnée, comme par exemple Anti-Bacterial Agents (Antibactériens) ou Hemostatics (Hémostatiques). Enfin, la recherche de descripteurs par leur code d’arborescence est également proposée. Le signe de troncature * est utilisable. La requête A01.378.800* permet par exemple de sélectionner les descripteurs situés sous le descripteur « Membre supérieur » [A01.378.800].

Accessibilité