NAUTILUS : du codage à la représentation des données

Imprimer  




Auteurs: Philippe AMELINE

Les logiciels médicaux doivent devenir des outils d'aide à la décision (des "Assistants") s'ils veulent justifier de leur utilité au-delà du cercle des passionnés d'informatique. Cette fonction devient d'autant plus nécessaire que la médecine s'inscrit dans un cadre de "bonne pratique" et de réseaux de praticiens.

Pour alimenter un Assistant, il est nécessaire de structurer finement, dans la pratique de routine, les données du patient. Les structures de codage existantes sont, par essence, faites pour "paver" l'espace des descriptions possibles mais pas pour permettre de préciser un point précis de ce plan (la lésion de Mme X) ; nous avons donc élaboré, au sein de Nautilus, un "langage" de description des données médicales compréhensible par l'ordinateur.

Elaborer ce langage consiste à rassembler trois conditions : posséder un lexique de mots porteurs de sens, élaborer un mécanisme de formation de "phrases" à partir de ces mots, et enfin, savoir transmettre ces phrases vers ses correspondants (parce que l'Assistant n'existera pas chez le médecin de famille s'il n'est pas alimenté par les données du plateau technique, et n'existera pas chez le spécialiste s'il ne reçoit pas la synthèse du dossier patient).

Les mots : les mots doivent appartenir à un lexique suffisamment vaste et avoir un sens, c'est à dire appartenir à un réseau sémantique ou à un ensemble de prédicats (la logique est la même : définir par exemple le mot colite grâce à d'autres termes du lexique en représentant que colite [est un] pathologie inflammatoire et que colite [atteint le] côlon). Les mots du lexique ont un sens, mais ne constituent pas en eux même une information (il est nécessaire de les regrouper pour former des "phrases") ; il n'est donc pas pertinent, comme on le fait pour un codage, de leur attacher une "définition" qui soit une sorte de "critère d'inclusion".

Les phrases : la façon la plus naturelle (pour un informaticien) de représenter les données est de réaliser des arborescences, par exemple :

insuffisance mitrale
intensité
modérée
direction
centrale
mécanisme
prolapsus de la GVM
étiologie
élongation de cordage GVM
élongation de cordage PVM

Cette technique de description permet une bonne structuration de l'information (et de la pensée), mais il faut reconnaître qu'elle n'est pas naturelle ; aussi est-il nécessaire de mettre en place une interface qui permette de fabriquer des arbres avec souplesse : c'est le rôle, dans Nautilus, de la technologie des Fils guides.

Il peut être nécessaire de savoir faire une phrase en français à partir de la "phrase" informatique : dans le domaine du compte rendu, les systèmes classiques copient dans un traitement de texte des phrases types déclenchées par des mots clés ; l'utilisateur doit alors remanier ces phrases pour les adapter au cas du patient et il est donc impossible de vérifier la cohérence du texte et des codes, donc d'utiliser ces codes pour nourrir un Assistant (a fortiori de les transmettre au correspondant).

Si, au contraire, on sait convertir dynamiquement la représentation ci-dessus par "Il existe une insuffisance mitrale modérée de direction centrale, due à un prolapsus de la GVM avec élongation de cordage des deux valves", le compte rendu en français peut rester virtuel (il est refabriqué au vol pour qui veut le lire) et les données codées en sont la seule représentation pérenne. Nous utilisons ce principe dans nos logiciels de comptes rendus d'endoscopie digestive depuis 1987 ; il est maintenant validé sur plus de 50 sites hospitaliers.

Transmission des informations : Internet est aujourd'hui le meilleur moyen de transmettre des informations ; Nautilus est donc capable de transformer tous les documents qu'il gère en pages HTML. Ces pages peuvent incorporer des images, mais elles servent surtout à dissimuler l'ensemble des "phrases informatiques" qui ont servi à élaborer le document. Lorsque la page HTML est importée par le correspondant dans le dossier du patient, Nautilus sait automatiquement détecter leur présence et enrichir la base de connaissance grâce à ces nouvelles données.

La grande majorité des pages HTML générées par Nautilus sont construites à la demande à partir des données structurées puis détruites (mécanisme de génération dynamique).

Conclusion : Au cœur de Nautilus se situe déjà un véritable langage de description des données médicales, capable de servir d'Esperanto au sein de réseaux ou de filières de soins.
Nos axes de développement sont aujourd'hui orientés dans trois directions :

* La mise en place d'outils de monitoring comme première phase de l'aide à la décision.
* La réalisation de l'Assistant par la mise en place d'une technologie à base d'Agents (l'"intelligence" du système est obtenue par la somme de nombreux processus simples parce que dédiés à une tâche très précise - contrairement aux systèmes experts qui ont échoué par excès d'ambition, donc de complexité).
* L'élaboration de documents dans la langue du lecteur. Les documents (et les pages HTML) sont générés dynamiquement en français à partir de leur représentation structurée ; nous travaillons à les "décoder" dans d'autres langues. Il sera alors possible à tout médecin européen de lire le dossier du patient, dans sa propre langue, avec un simple navigateur Internet.

Nautilus et la CISP se sont rencontrés dans les profondeurs abyssales.

document publié en novembre 1998



Créé le 21/02/2011 - Modifié le 04/08/2011