La révolution des indicateurs de qualité des parcours

Le 1er chapitre de la stratégie nationale de santé du Gouvernement a pour objectif  d’ « inscrire la qualité et la pertinence des soins au cœur des organisations et des pratiques ». L’enjeu est de prescrire les bons traitements et les bonnes prises en charge et au bon moment. Le premier levier pour atteindre cet objectif, est-il expliqué, repose sur la mesure de la qualité grâce à des « indicateurs de qualité des parcours ». Avant la fin de l’année doivent être élaborés des « indicateurs de qualité des parcours » sur les 10 pathologies chroniques les plus fréquentes et dans le même temps sélectionnés et déployés des programmes de pertinence.

Jean Michel Chabot (Universitaire, Paris et membre du Think Tank) propose ici une analyse fine sur des heurs et malheurs des indicateurs en santé qui ont une longue histoire … pour une meilleure utilisation aujourd’hui. Car le risque est grand que le déploiement d’indicateurs arrive à l’effet inverse de celui recherché.

Les indicateurs : oui … mais

Voilà guère plus d’une quinzaine d’années que les indicateurs ont gagné le monde de la santé et des soins. On peut rappeler que l’on appelle « indicateur » une donnée quantifiée, afin de mieux apprécier, caractériser – c’est-à-dire avec un bon degré de « validité* » et de fiabilité – l’état d’une organisation ou d’un processus, ou bien, d’un point de vue davantage clinique, l’état où se trouve un patient et la maladie qui l’affecte.

S’agissant – au-delà du cas particulier que représente chaque malade – du système de soins et de son fonctionnement, on peut comprendre que les indicateurs se nourrissent de grands nombres. Ainsi, par exemple, on a pu se réjouir dans l’ensemble des pays développés que la quasi-totalité (plus de 90%) des sujets en post-infarctus bénéficiaient d’une prescription d’un béta – bloquant. Au point même que des experts nord-américains1 ont recommandé au début des années 2000 d’interrompre le suivi de cet indicateur, tant les résultats apparaissaient à la fois optimaux et stabilisés.

Déterminer des indicateurs et suivre leur évolution est donc devenu depuis les années 90, une priorité  des organismes  qui administrent et gèrent la santé ; une priorité aussi, mais dans une moindre mesure, des équipes médicales et soignantes.

Cette priorité correspond à des rationnels  puissants qui ne se démentent pas. D’abord, les financeurs des systèmes de soins ont besoin d’indicateurs pour mieux suivre, tenter de caractériser et le cas échéant   maîtriser les flux des dépenses. De leur côté, les patients, la population générale et les médias en sont le plus souvent friands (chacun sait bien que les « palmarès » des hôpitaux et cliniques, nourris par ces indicateurs et régulièrement publiés par la presse, constituent les plus forts tirages …). Et au-delà de cet appétit d’information, d’autres patients ou les associations qui les représentent, s’intéressent aux résultats des indicateurs, en particulier du point de vue de la sécurité des soins ; ainsi, les indicateurs sur les infections nosocomiales ou ceux sur la iatrogénie hospitalière. Enfin, les professionnels eux - mêmes, qui, de plus en plus entreprennent la constitution de registres, souvent à des fins de recherche clinique et d’où peuvent être extraits des indicateurs cliniques ; sans compter les divers nouveaux modes de rémunération CAPI, ROSP (Rémunération sur objectifs de Santé Publique) ...  tous fondés sur le suivi d’indicateurs. Tout cela étant favorisé par une informatique davantage fonctionnelle et enfin intégrée à l’exercice quotidien. De plus, les jeunes promotions devraient maintenant attentives à ces indicateurs qui apparaissent depuis 2013 à l’item 15 du nouveau programme** des études médicales dans les termes suivants : « Préciser les qualités d'un indicateur utilisé dans l'organisation ou la régulation des activités cliniques et professionnelles selon ses finalités : informative ou support de décision). »

Pourtant, des réserves sont formulées. Très précocement, dès 1999 dans le New England, le californien L Casalino2 avait anticipé ce qu’on appelle maintenant « l’effet lampadaire » et qui traduit que seule(s) les activités qui font l’objet d’un indicateur mobilisent l’attention et que tout le reste peut être laissé en jachère. Et puis en 2010, plus anecdotiquement, mais toujours dans le NEJM3, la new yorkaise Daniele Ofri, General Internist, et chroniqueuse régulière au New York Times http://well.blogs.nytimes.com/author/danielle-ofri-md/?_r=0 s’était étonnée que sa « quaterly report card » (son tableau de bord trimestriel) fournisse des résultats aussi peu significatifs et plutôt discordants sur l’état de ses malades.

Enfin, il n’y a pas si longtemps, ce sont des leaders professionnels à l’échelon fédéral, qui, dans la livraison en 4 décembre 2014 du NEJM et pour les Etats Unis, alertent leurs collègues professionnels et en appellent aux autorités.

D’abord, par l’article de Christine Cassel – longtemps dans l’équipe dirigeante du Board d’internal medicine (ABIM) - et coll4. Certes le principe générique selon lequel «  la mesure et son appréciation conduisent à l’amélioration » est réaffirmé. Mais (presque) tout le reste de ce qui a été entrepris au cours des deux dernières décennies est contesté.  Et principalement - après que l’énormité des investissements financiers dans cette « politique d’indicateurs » ait été rappelée - la prolifération des indicateurs eux-mêmes, qui a conduit à ce que plus de 500 mesures distinctes les unes des autres soient mises en routine, ce qui a provoqué à la fois  l’épuisement des opérateurs et un déficit de visibilité des résultats. Suivent ensuite l’évocation de plusieurs exemples du suivi et de l’utilisation d’indicateurs cliniques qui ont donné des résultats contrastés ou inattendus comme, par exemple,  l’administration précoce d’antibiotiques en cas de suspicion de pneumopathie communautaire. L’ensemble de ces constats amènent les auteurs à plaider pour qu’à l’avenir le plus grand soin soit apporté au choix d’un nombre limité d’indicateurs pour lesquelles les données seront à la fois aisées à collecter et, le cas échéant,  significatives d’une amélioration sensible de l’état des malades.

Ensuite,  toujours dans le numéro du 4 décembre, c’est Elisabeth McGlynn, désormais Director of Kaiser Permanente’s Center for Effectiveness and Safety Research (le Kaiser Permanente , avec ses 16 millions d’affiliés, étant l’une des organisations qui s’est engagée le plus résolument dans l’ObamaCare et les soins primaires aux EU) qui liste les principales propositions pour une réorganisation de la politique d’indicateurs5 (non sans avoir commencer par caractériser la situation actuelle d’ « épuisante, dispendieuse, inadaptée et surtout incapable d’ appréhender la démarche de soins dans sa complexité »).

Dans une bonne mesure, ces propositions peuvent paraître utopiques, mais les auteurs eux-mêmes s’interrogent sur cette utopie, en appelant l’attention du lecteur sur les évolutions qui se sont produites au cours des vingt dernières années.

Pour l’essentiel McGlynn et coll réclament une informatique professionnelle qui effectuerait sans aucun effort supplémentaire du praticien les traitements de données nécessaires à la production d’indicateurs cliniques significatifs. De plus les données devraient être produites sous des  formes graphiques aisément lisibles, interprétables et adaptées aux usages respectifs qu’en font les professionnels ou les patients.  Enfin, ces indicateurs de nouvelle génération – en nombre limité – devraient à la fois permettre de prendre en compte les préférences patient et, aussi, être capables d’assimiler les différentes guidelines (propres à chaque maladie) pour intégrer au mieux les comorbidités variables qui caractérisent chaque malade.

Au vu du bilan qui est dressé à la fin de l’année 2014, on comprend que de telles propositions puissent paraître hors d’atteinte.

Une considération plus pratique pour finir. Elle concerne le «  paiement à la performance » (en anglo-américain,  Payment for Performance – P4P) ; également fondée sur l’exploitation d’indicateurs cliniques. Il s’agit d’une modalité de rémunération des établissements de soins ou des professionnels eux-mêmes, dont on voit bien les risques qu’elle comporte, mais qui s’est sensiblement imposée, au cours des dix dernières années dans l’ensemble des pays développés. En France et pour les médecins libéraux, ce sont les ROSP (Rémunération sur objectifs de Santé Publique).

Dans le dernier numéro du JAMA6 de l’année 2014, deux spécialistes de la question constatent les résultats médiocres obtenus en termes d’amélioration pour les malades avec ce nouveau mode de rémunération. Et là aussi, il plaide pour une « concentration » des actions à entreprendre : en pratique, un tout petit nombre d’indicateurs pour suivre prioritairement les malades les plus complexes et les plus fragiles, en majorant sensiblement les bonus financiers qui peuvent en résulter pour les professionnels impliqués. Voilà surement de quoi susciter des débats.

*validité, terme dont la signification reste sinon obscure, du moins méconnue ou mal connue. Il suffit de solliciter son environnement pour constater la variété et quelquefois la confusion des points de vue. En fait, validity traduit « le degré d’exactitude et de réalité » avec lequel un indicateur reflète la situation ou bien le processus que l’on souhaite apprécier/mesurer. …. Et très souvent les indicateurs utilisés manquent cruellement de validité …. En fait ils mesurent AUTRE chose, de moindre intérêt.

**Voir JM Chabot et R Amalberti. Apprentissage de l’exercice médical et de l’exercice coordonné. 2013 ; La Revue du Praticien Ed (196p)

Lee TH, Eulogy for a Quality Measure. N Engl J Med 2007; 357;12 : 1175-1177

Ofri D. Quality measures and the individual physician.N Engl J Med 2010: 363;7: 606-608

Casalino LP. The unintended consequences of measuring quality on the quality of medical care. N Engl J Med. 1999 ; 341(15):1147-50.

Cassel CK, Conway PH, Delbanco SF et al. Getting more performance from performance measurement. N Engl J Med. 2014; 371(23):2145-7.

McGlynn EA, Schneider EC, Kerr EA. Reimagining quality measurement. N Engl J Med. 2014 ; 371(23):2150-3

McKethan A, Jha AK. Designing smarter pay-for-performance programs. JAMA. 2014 ; 312(24):2617-8

Pour la transparence et la standardisation des indicateurs cliniques

Peter John Pronovost, M.D., Ph.D. Professor of Anesthesiology and Critical Care Medicine - Johns Hopkins Baltimore (plus de 500 citations sur PubMed) est des auteurs les plus éclairés sur les questions d’organisation des activités de soins avec un souci premier de sécurité du patient et de qualité des pratiques.

Il fait partie avec E McGlynn*, Ch Cassel, Thomas H Lee, des contributeurs les plus avisés sur la politique optimale  d’utilisation des indicateurs cliniques ( dans les trois finalités principales que constituent l’information du public, la dynamique des équipes soignantes et le reporting à la gouvernance, déterminant l’allocation de ressources) ; ces quatre contributeurs ayant exercé ou exerçant aussi bien dans le secteur hospitalier académique que dans des organisations de soins privées (Kaiser Permanente) et qu’au sein des agences fédérales (AHRQ, etc …)

Politique dont on sait qu’après avoir bénéficié d’un budget considérable depuis près de dix années, elle n’a pas atteint les résultats projetés. En particulier, parce que la structuration des données et les caractéristiques métrologiques des indicateurs produits (incluant leur praticabilité++) étaient notoirement insuffisantes et qu’une gouvernance « fédérale » adaptée faisait défaut (ce qui s’est traduit notamment par une production échevelée de data, dépassant – de fait – les possibilités d’en tirer des enseignements à l’échelon local et bien davantage sur une plus large échelle)

Dans ce court article* Peter Pronovost rappelle avec conviction les méfaits qui menacent en l’absence d’un déficit de standardisation des indicateurs : d’abord leur profusion, génératrice de perte de sens, tant « trop d’info tue l’info », accompagnée par la surcharge de travail liée à la saisie des data correspondantes, ensuite le risque d’interprétations biaisées (en raison le plus souvent d’une « validity » insuffisante).

Un tableau synthétique résume les plus significatives des orientations qu’il conviendrait de suivre …. y compris en France

 

*Time for Transparent Standards in Quality Reporting by Health Care Organizations.

Pronovost PJ1,2, Wu AW3, Austin JM2,4.

JAMA. 2017 Aug 22;318(8):701-702. doi: 10.1001/jama.2017.10124.

Une avalanche d’indicateurs et de pourcentages !!

Une publication* sur le site NEJM.org en date du 18 avril 2018 demande un moratoire.

Ce qui est visé, sous la signature d’auteurs nord-américains de bonne notoriété académique et professionnelle, c’est un « temps mort » permettant de redéfinir le mode opératoire selon lequel les rémunérations des médecins aux États-Unis vont, bien davantage à l’avenir, dépendre de la valeur (utilité pour le malade et efficience) de leurs prescriptions, plutôt que de leur nombre …

Une formule, le « High-Value Care » se substitue au « High-Volume Care » traduit cette évolution, plutôt radicale.

Les données chiffrées sur la question peuvent être rappelées (elles sont plutôt inquiétantes, mais ne constituent pas une surprise, voir plus haut : « Les indicateurs …. oui mais ») :

-90 % des rémunérations de type « fee for service » servies aux médecins par le CMS (Centers of Medicare and Medicaid Services) le seront avant fin 2018 sur la base de leur valeur, appréciée selon les résultats d’indicateurs de performance,

- 63 % des cliniciens interrogés indiquent que les indicateurs utilisés actuellement ne reflètent pas la qualité des soins qu’ils prodiguent, en dépit d’un investissement de … 15 billions de dollars chaque année (correspondant à 40 000 $ par médecin !),

- des centaines d’indicateurs de performance sont ainsi produits, parmi lesquels 271 ont été retenus par les organismes payeurs,

- parmi ces 271, les auteurs du moratoire ont identifiés 86 indicateurs qui semblaient pertinents à la pratique  de general internal medicine en milieu ambulatoire,

Ce sont ces 86 indicateurs de performance qui ont été analysés par les auteurs afin de les valider ou non … 

Les résultats de cette analyse sont plutôt préoccupants (d’où la demande du moratoire):

- 32 (37 %) sont validés

- 30 (35 %) ne le sont pas

- et pour les 24 (28 %) restants le doute subsiste ….

Il faut aussi s’arrêter un instant sur les critères retenus pour mener cette analyse. Les auteurs ont choisi (dans le cadre d’un Performance Measurement Committee, émanation du très représentatif American College of Physicians ) d’isoler une série de critères relevant de cinq domaines principaux.

Ces cinq domaines sont les suivants (appliqués à chaque indicateur analysé, en relation avec les actions qu’il est sensé mesurer) :

  • impact potentiel
  • efficience
  • niveau de preuves
  • qualité « métrologique »
  • applicabilité, faisabilité

Sur chacun de ces cinq domaines, chaque indicateur a été coté selon une échelle de type Lickert à 9 (!) niveaux … jusqu’à obtenir une validation, dès lors que l’indicateur obtenait un score élevé (7, 8 ou 9) pour chaque domaine.

On doit cependant s’interroger sur l’identification de ces cinq domaines et aussi sur la méthode de cotation utilisée - chacun sait que la reproductibilité d’une échelle à 9 niveaux est incertaine. En un mot, pratiquement tout ce qui est visé par l’ensemble des domaines identifiés - à l’exception de l’applicabilité/faisabilité -  est en réalité déjà intégré dans une bonne compréhension de la seule validity (au sein de « qualité métrologique ») ….  d’où une sensation pénible de redondance ou même de confusion dans l’analyse.

Il reste que cette demande de moratoire, publiée dans le NEJM atteste du malaise qui s’étend aux États-Unis, alors que la plupart des cliniciens se retrouvent mal dans la dispersion des indicateurs (qu’ils ont du mal à renseigner en raison de la quantité et de la diversité des données exigées, alors que l’ergonomie des systèmes d’information - SI - est encore vraisemblablement perfectible).

*https://www.nejm.org/doi/full/10.1056/NEJMp1802595?query=featured_health-policy

*Time Out - Charting a Path for Improving Performance Measurement.  MacLean CH

Les rémunérations forfaitaires (Bundled Payment) devraient être fondées sur des indicateurs de « ce qui importe vraiment »

Dans ce court édito*, publié sur le site Annals.org le 10 avril dernier, Peter Pronovost, un réanimateur du Johns Hopkins de Baltimore (particulièrement impliqué sur les questions de réforme du système de soins) et ses co-auteurs font un constat et lance un appel.

Le constat est formel : les nouveaux modes de rémunérations, fondés sur la « value » c’est à dire l’efficience et l’utilité pour le patient, représentaient presque un tiers des revenus perçus par les médecins américains dès la fin de l’année 2016.

Cette tendance devrait s’accélérer en dépit d’une opposition larvée de l’administration Trump (voir deux des textes publiés en février 2018 ici sur le Blog du Think Tank).

L’appel est pressant : les indicateurs de performance sur lesquels sont fondés ces nouveaux modes de rémunération (forfaits de divers types mixés avec des incitatifs) ne sont pas satisfaisants ; ceci indépendamment des aspects pratiques, trop nombreux, nécessitant de saisir trop de données ….

En fait, le déficit essentiel est que les indicateurs actuels ne concernent pas suffisamment ce « qui importe vraiment ». En particulier les perceptions et le ressenti des malades, mais aussi les incertitudes ou les errements de démarche diagnostique, ou encore l’«underuse » échappent largement aux données colligées.

Tout comme la notion d’ « appropriate care »  c’est à dire du bon soin au bon moment au bon coût.

Pour combler ce déficit, sans quoi le développement des nouveaux modes de rémunération pourrait être compromis, les auteurs attendent beaucoup des données structurées issues des registres cliniques et aussi des logiciels-métier; sans négliger la production des  objets connectés.

*Peter J. Pronovost, MD, PhD; Julie Miller, MD; David E. Newman-Toker, MD, PhD et al.

We Should Measure What Matters in Bundled Payment Programs

http://annals.org/aim/article-abstract/2678085/we-should-measure-what-matters-bundled-payment-programs

 

 

 

 

 

 

 

0 commentaire

Aucun commentaire.

Partager
POSTER UN ARTICLE
Les partenaires du
think tank