1. Historique
Le MeSH (Medical Subject Headings) est le thésaurus de référence dans le domaine biomédical (1). La NLM (U.S. National Library of Medicine) le met à jour chaque année pour indexer et permettre d'interroger ses bases de données, notamment MEDLINE/PubMed, ainsi que pour cataloguer ses ouvrages et autres documents (2). En 1960, la NLM met en place l'informatisation des données avec le système MEDLARS (MEDical Literature Analysis and Retrieval System). En 1969, afin de faciliter l'accès en français à ses bases de données, la NLM signe une convention de partenariat avec l'Inserm, qui devient le Centre MEDLARS pour la France (3). L'Inserm traduit le MeSH et met à jour la version française chaque année depuis 1986. Dans le cadre d'un accord de coopération avec l'Inserm, l'Inist-CNRS (Institut de l'information scientifique et technique du CNRS) a contribué à la mise à jour de 2004 à 2018 (4) puis à partir de 2020, a mis en œuvre la génération automatisée de données structurées. L'Inserm met la version bilingue à la disposition de la communauté francophone, qui peut la consulter en ligne ou l'obtenir sous la forme d'un fichier sous format XML (5). La version bilingue est souvent utilisée pour l'indexation et l'interrogation de bases de données en français ainsi que comme outil de traduction.
2. Organisation des catégories thématiques
Le MeSH comprend les 16 catégories thématiques suivantes.
- Anatomie [A]
- Organismes [B]
- Maladies [C]
- Produits chimiques et pharmaceutiques [D]
- Techniques et équipements analytiques, diagnostiques et thérapeutiques [E]
- Psychiatrie et psychologie [F]
- Phénomènes et processus [G]
- Disciplines et professions [H]
- Anthropologie, enseignement, sociologie et phénomènes sociaux [I]
- Technologie, industrie et agriculture [J]
- Sciences humaines [K]
- Sciences de l'information [L]
- Individus [M]
- Santé [N]
- Caractéristiques d'une publication [V]
- Lieux géographiques [Z]
Chacune de ces catégories est organisée en une arborescence de descripteurs [MeSH Headings], qui peut comprendre jusqu'à treize niveaux de hiérarchie (6). La plupart des descripteurs ont une seule localisation, alors que les autres en ont plusieurs, dans la même catégorie ou dans des catégories différentes. Chaque localisation est représentée par un code d'arborescence [Tree Number], qui comprend une lettre indiquant la catégorie et une séquence numérique précisant le niveau dans la hiérarchie.
Par exemple, dans la catégorie A figurent successivement les descripteurs "Régions du corps" [A01], Membres [A01.378], "Membre supérieur" [A01.378.800], Main [A01.378.800.667], Doigts [A01.378.800.667.430] et Pouce [A01.378.800.667.430.705], qui apparaissent chacun une seule fois. Le descripteur Œil apparait au contraire deux fois dans la catégorie A, d'une part sous les descripteurs "Régions du corps" [A01], Tête [A01.456] et Face [A01.456.505] sous la forme Œil [A01.456.505.420], et d'autre part sous le descripteur "Organes des sens" [A09] sous la forme Œil [A09.371]. Enfin, le descripteur Télémédecine apparait une fois dans chacune des catégories H, L et N, respectivement sous le descripteur Médecine [H02.403] sous la forme Télémédecine [H02.403.840], sous le descripteur Télécommunications [L01.178.847] sous la forme Télémédecine [L01.178.847.652] et sous le descripteur "Prestations des soins de santé" [N04.590.374] sous la forme Télémédecine [N04.590.374.800].
3. Structure des descripteurs
Les descripteurs sont constitués de concepts, les concepts sont eux-mêmes constitués de termes, et un terme est un mot ou un ensemble de mots exprimant une notion (7). Chaque concept porte le nom d'un de ses termes, appelé terme préféré. Chaque descripteur porte le nom d'un de ses concepts, appelé concept préféré, les autres étant appelés concepts subordonnés. Chaque concept subordonné présente une relation sémantique avec le concept préféré, soit une relation hiérarchique (concept plus large ou plus étroit), soit une relation associative (concept associé). Chaque descripteur comprend un ou plusieurs concepts, et chaque concept comprend un ou plusieurs termes. Dans le cadre de l'indexation, du catalogage et de la recherche documentaire, les termes d'un descripteur donné sont équivalents entre eux.
Par exemple, le descripteur [Blindness] comprend le concept préféré [Blindness], le concept associé [Amaurosis], ainsi que les concepts plus étroits [Blindness, Acquired], [Blindness, Bilateral], [Blindness, Hysterical], [Blindness, Legal], [Blindness, Monocular], [Blindness, Transient], [Blindness, Unilateral] et [Sudden Visual Loss].
4. Le MeSH 2023
Chaque année, afin d'enrichir le MeSH et de tenir compte de l'évolution du domaine biomédical, de nouveaux descripteurs sont ajoutés, et d’autres descripteurs sont modifiés, remplacés, supprimés ou déplacés. Des concepts et des termes sont ainsi ajoutés, modifiés, supprimés ou déplacés. Le MeSH 2023 comprend environ 30 000 descripteurs. Lors de la mise à jour, 262 descripteurs ont été ajoutés (8).
Le MeSH 2023 comprend les descripteurs et termes suivants.
- 187 types de publications [Publication Types] Contrairement aux autres descripteurs, les types de publications sont utilisés lors de l'indexation ou du catalogage des documents pour faire référence à leurs caractéristiques et non à leur contenu, comme par exemple [Biography] ou [Clinical Trial, Phase II].
- 33 Descripteurs obligatoires [Check Tags]
Les descripteurs obligatoires représentent des notions à prendre systématiquement en compte lors de l'indexation des documents pour la base MEDLINE/PubMed, comme par exemple [Human] ou [Animal]. - 76 qualificatifs [Subheadings/Qualifiers]
Les qualificatifs sont utilisés avec les descripteurs pour l'indexation, le catalogage et la recherche documentaires. Chaque qualificatif peut être associé aux descripteurs de certaines sous-catégories, de façon à en décrire un aspect particulier. Par exemple, l'association du descripteur [Liver] et du qualificatif "drug effects" indique que le document ne concerne pas le foie de manière générale, mais les effets des médicaments et des substances chimiques sur le foie. - Les descripteurs précoordonnés
Il s'agit de descripteurs à utiliser à la place de certaines combinaisons descripteur/qualificatif pour interroger la base MEDLINE/PubMed. Par exemple, le descripteur précoordonné [COVID-19 Drug Treatment] est à utiliser à la place de la combinaison du descripteur [COVID-19] et du qualificatif " drug therapy ". Quatre descripteurs précoordonnés ont été ajoutés. Il s’agit de [COVID-19 Drug Treatment], à utiliser à la place de [COVID-19]/"drug therapy", de [Elbow Injuries], à utiliser à la place de [Elbow]/"injuries" ou de [Elbow Joint]/"injuries" , de [Penile Transplantation], à utiliser à la place de [Penis]/"transplantation", et de [Suicide Prevention], à utiliser à la place de [Suicide]/"prevention & control".
5. Mise à jour de la version française
Une nouvelle version française est présentée chaque année. Il s'agit de tenir compte de la mise à jour du MeSH et de réviser la version française précédente, en ajoutant, modifiant, supprimant ou déplaçant des termes. De 1986 à 2018, l'Inserm a assuré la traduction des nouveaux descripteurs, la majeure partie de la révision de la version française, ainsi que le contrôle et la validation des travaux. De 2004 à 2018, l'Inist-CNRS a contribué à la révision. Les travaux ont été réalisés en ligne avec le MTMS (MeSH Translation Maintenance System), système de gestion de la traduction multilingue mis en place en 2004 et supprimé en 2018 par la NLM (9-10). Depuis 2019, l’Inserm a assuré la traduction des nouveaux descripteurs de 2020, de 2021, 2022 et de 2023, respectivement au nombre de 295, 277, 277 et de 262 (11-14). Certains d’entre eux concernent la COVID-19, le SARS CoV-2 ou des domaines connexes (15).
Des règles de traduction sont appliquées. Les rectifications de l'orthographe parues au Journal Officiel du 6 décembre 1990 sont prises en compte, ainsi que les recommandations des Commissions de terminologie et de néologie concernées. Différents registres de langue sont utilisés, un nom scientifique ou médical pouvant côtoyer un nom commun, comme pour Asthénopie et "Fatigue oculaire". En cas de singulier ou de pluriel irrégulier, le terme est mentionné au singulier et au pluriel, comme pour "Anticorps monoclonal" et "Anticorps monoclonaux". En cas d'homographie, le domaine d'application est précisé, comme pour "Kiwi (oiseau)" et "Kiwi (plante)". Les acronymes sont présentés selon un format standardisé, comme pour "AVC (Accident Vasculaire Cérébral)" ou SIDA. La version française reprend de plus des termes anglais volontiers utilisés par les francophones, comme GABA ou Marketing, ainsi que des termes spécifiques de la civilisation américaine, comme "NIH Office of Scientific Integrity". La version française reprend enfin des termes d'autres langues, par exemple le latin, comme pour "Staphylococcus aureus" ou "Coxa valga".
6. Outils d'exploration du MeSH et de la version bilingue
Le MeSH Browser permet de parcourir les arborescences et de consulter des informations concernant les descripteurs ou les qualificatifs (6-7). Pour un descripteur d'intérêt, il est par exemple possible d'obtenir ses concepts et termes, les qualificatifs pouvant lui être associés, ses descripteurs précoordonnés, ainsi qu'une note explicative [Scope Note] concernant sa signification ou son usage. Ses codes d'arborescences sont indiqués et ses localisations dans les arborescences sont visualisées. Des liens vers des descripteurs connexes sont également proposés. Pour le descripteur Eye, il est suggéré de consulter par exemple les descripteurs [Eye Manifestations] et [Intraocular Pressure], ainsi que les descripteurs dont des termes comprennent la chaine de caractères -ophthalm-.
Le MeSH Browser permet également de formuler des requêtes pour sélectionner des descripteurs, des qualificatifs ou des notes explicatives. Par exemple, aucun terme ne contient les mots Eye et Kidney, mais huit descripteurs contiennent ces deux mots dans leurs notes explicatives, dont [Diabetes Complications] et [Oculocerebrorenal Syndrome].
Par ailleurs, un outil d'exploration de la version bilingue est proposé (5). Il permet de parcourir les arborescences françaises, de consulter des informations bilingues concernant les descripteurs ou les qualificatifs, ou bien de formuler des requêtes en français ou en anglais pour sélectionner des descripteurs, des termes ou des qualificatifs. Un champ permet également de sélectionner les descripteurs correspondant à une action pharmacologique donnée, comme par exemple Antidiarrheals ou Hemostatics. Enfin, la recherche de descripteurs par leur code d’arborescence est également proposée. Le signe de troncature * est utilisable. La requête A01.378.800* permet par exemple de sélectionner les descripteurs situés sous le descripteur "Membre supérieur" [A01.378.800].
Références
1. Welcome to Medical Subject Headings
2. U.S. National Library of Medicine
4. Inist-CNRS
5. Le MeSH bilingue anglais-français
9. The MeSH translation maintenance system : structure, interface design, and implementation
10. NLM MeSH Translation Management System to Retire on December 31, 2018
11. New MeSH Headings for 2020
12. New MeSH Headings for 2021
13. New MeSH Headings for 2022