Zusätzliche Vorhersagemetriken (z. B. Rückruf und Genauigkeit) sind in Tabelle 2 dargestellt. Wir vergleichen uns auch mit der Verwendung der Schärfepunktzahl allein als Klassifier. Wenn der Besuch eine hohe Schärfe hat, werden alle Tests für einen Besuch bestellt. Wenn der Besuch eine geringe Schärfe hat, werden keine Tests bestellt. Die Verwendung von Schärfe allein als Proxy für die Bestellung führt zu einer erheblichen Überordnung der Tests. Beispielsweise erhöht sich die falsch positive Rate von 17 % für binäre Relevanz (BR) Multilayer Perceptron (MLP) auf 44%, wenn Akuity verwendet wird, um Aufträge vorherzusagen. Zusätzlich zeigen wir Präzisions-Rückrufkurven für 2 Aufträge mit dem BR MLP-Modell in der Zusatzabbildung S8.

Obwohl die Leistung bei Aufgaben mit niedriger Ausführungsreihenfolge laut ist, zeigen Präzisions-Rückrufkurven für gut vorhergesagte Aufträge eine konsistente Leistung mit einem starken Rückgang des Rückrufs an einem bestimmten Schwellenwert, was darauf hinweist, dass es ein enges Zeitfenster für die Schwellenwerterstellung für die Ausführung von Auftragsvorhersagen gibt. Unsere Studie hat mehrere potenzielle Einschränkungen. Erstens haben wir Besuche ohne Informationen über die herkömmliche Triage-Klassifikation ausgeschlossen, die eine potenzielle Quelle für Selektionsverzerrungen sein könnte. Dennoch waren die Merkmale und Ergebnisse des Patienten zwischen den analytischen und den nichtanalytischen Kohorten vergleichbar, was gegen eine signifikante Verzerrung argumentierte. Zweitens sind die Machine Learning-Ansätze datengesteuert und hängen daher von genauen Daten ab. Während Umfragedaten eine gewisse Fehlklassifizierung aufweisen könnten, lag die Codierungsfehlerrate in einer 10%igen Qualitätskontrollstichprobe von NHAMCS unter 1%, drittens ist die Zurechnungsfähigkeit von Fehleinschätzungen eine potenzielle Quelle von Verzerrungen. Die Zustellung durch zufällige Waldarten ist jedoch bekanntlich eine strenge Technik für die Imputation.41 Viertens können die Schwellenwerte für die Ergebnisse zwischen den EDs variabel sein (z. B.

verschiedene Kriterien für die Zulassung auf der Intensivstation). Die Entscheidungskurvenanalyse zeigte jedoch einen größeren Nettonutzen für die machine learning-Ansätze über die breite Palette von Schwellenwahrscheinlichkeiten (oder klinischen Präferenzen). Darüber hinaus sind diese Ansätze hochflexibel und von Natur aus an lokale Pflegesysteme angepasst und unterscheiden sie von den herkömmlichen Triage-Systemen. Fünftens könnte man vermuten, dass die geringe Anzahl von Ergebnissen die Vorhersagefähigkeit beeinflusst haben könnte. Aber alle 4 Machine Learning-Ansätze zeigten im Vergleich zum herkömmlichen Ansatz konstant überlegene Vorhersagefähigkeit. Sechstens messen NHAMCS-Daten einige klinische Variablen nicht (z. B. das Aussehen des Patienten, die Gestalt des Arztes, Medikamente und die behandlung und Reaktion vor der Krankenstation). Ziel der vorliegenden Studie war es jedoch nicht, Vorhersagemodelle mit einer breiten Palette von Prädiktoren abzuleiten, sondern Machine Learning-Modelle zu entwickeln, um eine begrenzte Anzahl klinischer Daten zu nutzen, die derzeit in der typischen ED-Triage-Einstellung verfügbar sind. Norman G, Young M, Brooks L.

Nicht-analytische Modelle der klinischen Argumentation: die Rolle der Erfahrung. Med Edu. 2007;41(12):1140–5. Ergebnisse In dieser prognostischen Studie einer landesweit repräsentativen Stichprobe von 52 037 Notaufnahmen von Kindern hatten maschinelles Lernen-basierte Triage-Modelle eine bessere Diskriminierungsfähigkeit für klinische Ergebnisse und Disposition im Vergleich zu den herkömmlichen Triage-Ansätzen, mit einer höheren Empfindlichkeit für das Ergebnis der kritischen Versorgung und einer höheren Spezifität für das Krankenhausaufenthaltsergebnis.