Slimme algoritmes schatten medische problemen in; wat is spoed en wat niet?

Door Joost Zeeuw, data scientist bij Pacmed
Veel pijn. De jonge vrouw aan de telefoon zegt krom te liggen van de pijn en wil een arts zien. De doktersassistente aan de andere kant van de lijn (in dit geval triagist genoemd) begint haar proces om te bepalen of deze vrouw met spoed naar een arts moet. Ik heb een dergelijke oproep nog nooit meegemaakt en zit op het puntje van mijn stoel, het klinkt ernstig.
Dit is de dagelijkse praktijk op de huisartsenpost, de dienst waar mensen met dringende medische klachten buiten de werktijden van de eigen huisarts terecht kunnen en waar ik een avond mee mag kijken als onderzoeker. Aandachtig luister ik mee hoe de vrouw haar klachten beschrijft. Ik heb me ingelezen en verwacht vanwege de ondraaglijke pijn en buikklachten van de vrouw (blindedarmontsteking?) dat ze urgentiecategorie 2 (U2) toegewezen zal krijgen. De op-één-na hoogste categorie. In dat geval moet de patiënt zo snel mogelijk door een arts onderzocht worden, uiterlijk binnen een uur.
Het oordeel van de triagist blijkt tot mijn verbazing U4, de één-na-laagste urgentiecategorie: binnen 24 uur een arts zien. De kans op schade op korte termijn is namelijk verwaarloosbaar klein. Terecht, want het bleek om een blaasontsteking te gaan. Vervelend, maar zeker geen spoed. Dit voorbeeld laat de enorme complexiteit van het triagistenvak zien. De triagist waar ik naast zit kan door een combinatie van opleiding en ervaring onder grote druk de juiste vragen stellen en de situatie correct inschatten.
In veel gevallen is het voor triagisten echter nog moeilijk om de juiste urgentieclassificatie in te schatten. Dit is onderdeel van een escalerend probleem; het is té druk op de Nederlandse huisartsenposten [1]. Veel patiënten krijgen een te hoge urgentieclassificatie en komen met problemen die wel medisch maar niet dringend zijn toch op de huisartsenpost terecht. Andersom, een te lage urgentieclassificatie bij dringende problematiek, gebeurt gelukkig veel minder, maar kan wel een grotere impact op de patiënt hebben.
Dit is waar slimme algoritmes volgens Pacmed een grote rol kunnen spelen. Pacmed is een jong bedrijf uit Amsterdam en specialist in het ontwikkelen van beslissingsondersteunende algoritmes voor de gezondheidszorg, waaronder de huisartsenzorg, intensive care, oncologie, psychiatrie en chronische ziekten. Samen met Primair Huisartsenposten uit Utrecht is Pacmed eind 2017 begonnen met het ontwikkelen van algoritmes die de urgentie van een oproep aan de huisartsenpost kunnen voorspellen. Op deze manier kan de druk op de huisartsenpost gereduceerd worden, terwijl de kans op het onjuist inschatten van urgente situaties geminimaliseerd wordt.
Urgentie voorspellen, waarom dan?
Het inschatten van de urgentie is moeilijk. Heel moeilijk. Met grote bewondering zie ik hoe de triagist belangrijke informatie uit het verhaal van de vrouw destilleert en deze interpreteert aan de hand van haar medische kennis. Ze stelt scherpe vragen ter verduidelijking van de symptomen, tovert het dossier van de vrouw ergens vandaan, noteert ondertussen alles in haar computerterminal en om de zoveel tijd pauzeert ze ook nog eens haar gesprek om de lijn voor levensbedreigende oproepen te beantwoorden. Tenslotte zie ik op haar computerterminal ook nog eens de lange rij met mensen in de wacht opdringerig oplichten.
Kundig voert ze al deze taken tegelijkertijd uit, tot diep in de nacht.
Toevallig luister ik mee met een zeer ervaren triagist en is het relatief rustig. Maar vaak is er hoge drukte en lukt het niet om volledig uit te vragen wat het probleem is. In dit geval wordt er ‘defensief gehandeld’: liever een te hoge urgentie een te lage. Zeker bij minder ervaren triagisten is er sprake van defensief handelen. In slechts 30% van de spoedgevallen (U2) blijkt achteraf urgent medisch handelen nodig. En terwijl het aantal spoedgevallen de laatste jaren toeneemt, neemt het deel dat achteraf echt urgent bleek juist af [2]. Omgekeerd geldt dat in 7% van de gevallen een te lage urgentie wordt gegeven [3].
Omdat er momenteel te veel patiënten met problemen die wel medisch maar niet spoedeisend zijn toch voor een consult naar de post komen loopt de agenda van de artsen over. Tijd om te eten is er vaak nauwelijks tijdens zo’n avond- of nachtdienst. Wanneer een aantal van die consulten ook nog eens onderbroken wordt door een spoedgeval, zet dit nog meer druk op de ketel. Door de toenemende drukte raken artsen overbelast en is er te weinig tijd per consult. Dit is een risico voor de kwaliteit van de zorg. Daarnaast is er nog de impact die zo’n spoedclassificatie op de patiënt heeft. Ouders wiens kind met spoed naar een arts gestuurd wordt hadden veel zorgen en ongemak bespaard kunnen blijven wanneer blijkt dat deze urgentie onterecht was. Het kost artsen dan ook steeds meer moeite en tijd om ouders in dit soort situaties gerust te stellen. Tijd die ze door de drukte eigenlijk niet hebben.
Tenslotte leidt de toenemende druk op de huisartsenpost ook tot een verhoging van de zorgkosten: zorg op de huisartsenpost is duur, met een toenemende begroting van €250 miljoen in 2010 tot €321 miljoen in 2016 [4]. Om de huisartsenspoedzorg werkbaar en betaalbaar te houden zijn er dus innovatieve oplossingen nodig.
Slimme algoritmes
Een belangrijk onderdeel van de urgentieclassificatie is het kunnen combineren van verschillende soorten informatie. Naast de symptomen van de patiënt weegt er een groot aantal andere factoren mee in de beslissing tot urgentie of niet. Denk hierbij aan leeftijd, medische voorgeschiedenis, chronische ziektes, medicijngebruik, recente ziekenhuisbezoeken, verre reizen, eventuele geestelijke klachten en ook nog eens de samenhang van het verhaal van de patiënt. Dan is er nog het effect dat deze factoren op elkaar hebben. Hoge koorts is een alarmsignaal, maar bij jonge kinderen niet altijd urgentie-verhogend. Als deze echter weer rode vlekjes hebben duidt dit op hoger risico, maar dat gaat weer niet op wanneer de vlekjes weg te drukken zijn. Een verre reis naar een tropisch oord in de afgelopen weken opent weer een heel ander scala aan mogelijke interpretaties van de koorts.
Het mag duidelijk zijn dat het vaststellen van de urgentie een beslissing is met hoge impact en soms te complex voor een mens alleen. Zelfs als het om een ervaren expert gaat. De hoge druk waaronder deze beslissingen gemaakt worden heeft bovendien een negatieve invloed op de uitkomst. Dit is juist waar slimme algoritmes floreren: onafhankelijk van druk of andere omgevingsfactoren honderden tot duizenden (interacties tussen) variabelen tegelijk analyseren en interpreteren.
Veiligheid voorop
Door Pacmed en Primair zijn algoritmes ontwikkeld die voorspellen of er sprake moet zijn van urgentie of niet. Dit gebeurt in volledigheid van informatie: de checklist van symptomen, patiëntkenmerken, contextuele factoren, alarmsignalen en een interpretatie van het tekstuele verslag van de triagist worden meegenomen. Het algoritme krijgt miljoenen historische gevallen met hun uitkomst, en het algoritme leert zo zelf welke factoren van invloed zijn op de uitkomst. Dit wordt Machine Learning genoemd. Wanneer we dit algoritme nu toepassen in de praktijk analyseert het voor ieder nieuw geval de aanwezige factoren, en neemt deze allemaal tezamen om tot een voorspelling te komen. In ons geval de mate van urgentie die de situatie van een patiënt vereist.
Om kwaliteit en veiligheid te garanderen is er tijdens de ontwikkeling van de algoritmes van Pacmed nauw samengewerkt met een kernteam van triagisten, artsen en wetenschappers. Zij zijn onmisbaar in het interpreteren van de data en de resultaten van de modellen. Klopt het dat hoge koorts bij een peuter op zichzelf niet direct urgentie-verhogend is? Tenslotte worden de uitkomsten zelf geanalyseerd: deze patiënten zijn als non-urgent bestempeld, blijft de veiligheid daarmee gegarandeerd? Alle feedback van de experts wordt gebruikt om het algoritme bij te stellen, tot de gewenste mate van veiligheid en kwaliteit bereikt wordt.
De eerste resultaten van de algoritmes zijn veelbelovend, ze lijken het totale aantal U2-classificaties tot wel 20% te kunnen reduceren door overtriage te voorkomen, alsmede een deel van de U3-classificaties te kunnen reduceren door ondertriage te voorkomen.
Zijn de triagisten dan nog wel nodig?
De rol die de triagist heeft is onmisbaar. Het destilleren van medische informatie uit het verhaal van de patiënt, het aanvoelen van de sfeer van het gesprek en vooral de toon en het volume aan de andere kant van de lijn kunnen van grote invloed zijn. Samen met andere informatie roept dit soms een ‘niet pluis gevoel’ op bij de triagist. Objectief is het moeilijk te zeggen wat het is, maar jarenlange ervaring zegt dat hier meer aan de hand zou kunnen zijn dan de koude data zegt.
Tenslotte is er nog die ene cruciale functie waar een groot deel van de oproepen aan de huisartsenpost eigenlijk om draait: geruststelling. Ouders die voor het eerst jonge kinderen hebben, ouderen die niet meer op hun lichaam kunnen vertrouwen als vroeger, of patiënten die sinds kort een chronische aandoening hebben en (nog) niet weten wat ze met de symptomen aan moeten. De warme en zorgzame geruststelling van de triagist is hier van onmeetbare waarde, en zal dat ook altijd blijven.
Eigenlijk lag het antwoord op deze vraag al in de naam van de categorie waar Pacmed algoritmes in ontwikkelt: beslissingsondersteunend. De algoritmes moeten de triagist ondersteunen in het bepalen van de urgentie, zeker niet leiden.
Het blijft niet bij enkel urgentie voorspellen op de huisartsenpost
Een algoritme dat blind gevolgd wordt is nooit de oplossing. Er moet een synergie zijn tussen de gebruiker en het systeem. Doordat de algoritmes van Pacmed precies kunnen identificeren welke factoren invloed hebben op de urgentie kan de triagist optimaal bijleren van elke nieuwe patiënt. En omdat de algoritmes zelflerend zijn worden deze zelf ook steeds accurater.
Tenslotte ziet Pacmed mogelijkheden voor verbreding. De spoedeisende hulp (SEH) afdelingen in Nederland kampen met dezelfde problemen van overlopende drukte als de huisartsenposten [5]. Omdat ook hier met triage wordt gewerkt zouden slimme algoritmes ook dit deel van de spoedzorg kunnen helpen, opdat elke patiënt in Nederland de zorg krijgt die hij of zij verdient.
[1]https://ineen.nl/assets/files/assets/uploads/170824_Benchmarkbulletin_2016_Huisartsenposten.pdf
[2] In 2014 was het aandeel U2-classificaties 14%, en in 34% van deze gevallen was er sprake van urgent handelen door de arts. In 2017 is het aandeel U2 naar 18% gestegen, en was er nog maar in 28% van deze gevallen urgent handelen vereist.
[3] In 7% van de U4-classificaties onder jonge kinderen bleek alsnog sprake van urgent handelen door de arts in de periode 2013–2017.
[4] Blijkt uit de jaarlijkse benchmark rapporten huisartsenposten van Eerstelijnsvereniging INEEN. https://ineen.nl/onderwerpen/informatiebeleid-en-uitwisseling/benchmark-hap
[5] Artikel NRC van 13 april 2018: Het is (te) druk op de eerste hulp. (Auteur Willem Pekelder)