Studieobject Marcel Ooms: Veiligere zorg begint hier: het 30-dagenrisico op agressie onderbouwd en uitlegbaar.
Van verslag naar risico: kans op agressie in de komende 30 dagen Wat doet deze pagina voor jou? Deze demo helpt om uit vrije-tekstrapportages snel een inschatting van het risico op agressief gedrag in de komende 30 dagen te krijgen. Plak een stukje verslag in het tekstvak en je krijgt een kans (probabiliteit) terug, plus een voorgesteld label op basis van een drempel die je zelf kunt verschuiven. Zo kun je risico vroegtijdig signaleren en bepalen welke acties passen: extra observatie, bijsturing in het behandelplan of overleg in het team. Hoe werkt het in grote lijnen (zonder technisch gedoe):
- Bij het openen staat er al een startmodel klaar.
- Je kunt hertrainen met drie aanpakken: TF-IDF, ClinicalBERT of DutchBERT.
- De grafieken laten zien hoe nauwkeurig het model is en hoe de drempel precision en recall beïnvloedt.
- Met LIME zie je welke woorden in de tekst het meest hebben bijgedragen aan de inschatting; dat maakt de uitkomst uitlegbaar. Belangrijk om te weten:
- Dit is een demonstratie op synthetische data. De uitkomst is een waarschijnlijkheid, geen zekerheid.
- Het systeem voorspelt niet of iemand agressief wordt, maar schat de kans binnen 30 dagen in op basis van tekstsignalen.
- Gebruik de uitkomst altijd naast klinische expertise en bestaande veiligheidsprotocollen.
Wat zie je op deze pagina?
Status & prestaties
Hier zie je hoe goed het model onderscheid maakt. AUROC en AUPRC tonen in één oogopslag hoe betrouwbaar de inschatting is; hoger is beter.
Handmatig trainen (zonder upload)
Kies een featurizer (TF-IDF, ClinicalBERT of DutchBERT) en klik op Train algoritme. Je kunt opties aanpassen en direct vergelijken wat in jouw setting het beste werkt.
Visualisatie
De interactieve 2D/3D-plot laat elke tekst als een punt zien. Kleur en positie helpen om patronen te herkennen; met de muis zie je extra uitleg per punt. Er zijn twee weergaven: kleur naar werkelijk label en kleur naar voorspelde kans.
Evaluatie
Met de drempel-schuif bepaal je wanneer “hoog risico” wordt toegekend. Je ziet wat dat betekent voor precision, recall en F1. Zo kun je kiezen tussen minder valse alarmen of meer signalen oppikken.
Predict
Plak een rapportage in het tekstvak en krijg meteen een kans en een voorgesteld label. Het is een hulpmiddel voor vroegtijdige signalering, geen definitieve uitspraak.
Hertrain met eigen CSV
Upload een CSV met de juiste kolommen en train het model opnieuw. De nieuwe prestaties en grafieken worden direct bijgewerkt.
🛠️ Handmatig trainen (zonder CSV upload)
🔍 Visualisatie
Van ruwe data naar beslisinformatie De afbeelding schetst de weg van ruwe data naar beslisinformatie. We starten met tekst: observaties, verslagen en notities. Met historische labels leert een algoritme patronen herkennen. In de verwerking wordt tekst omgezet naar kenmerken (bijvoorbeeld TF-IDF of BERT-embeddings) en leert het model welke combinaties iets zeggen over het risico op agressie binnen 30 dagen. Het resultaat is een waarschijnlijkheid, geen absolute waarheid. Die kans helpt teams om eerder te signaleren en bewust te kiezen: wil je minder valse alarmen (hogere precision) of juist meer signaal oppikken (hogere recall)? De mens blijft aan het roer: de uitkomst is uitlegbaar met LIME, meetbaar met AUROC/AUPRC en bedoeld om het klinisch oordeel te ondersteunen.
📄 Datavoorbeeld
Dataset
⚙️ Evaluatie (tabellen & drempel)
Classification report
Confusion matrix (met uitleg)
Dataset-profiel
🗣️ Predict (vrije tekst)
🔁 Hertrain met eigen CSV
Upload een CSV met kolommen rapportage (tekst) en agressie_volgende30d (0/1). Kies je parameters en klik Train opnieuw (met upload).
ℹ️ Over de evaluatieplots
De onderstaande grafieken laten zien hoe het model presteert bij verschillende drempels en uitkomsten:
- Metrics vs. drempel — toont hoe precision, recall en F1-score veranderen als je de drempel aanpast.
- Kansverdeling — laat zien hoe voorspelde kansen verdeeld zijn over de echte klassen (0/1).
- ROC-curve — vergelijkt True Positive Rate met False Positive Rate (AUROC = scheidingskracht).
- Precision–Recall-curve — nuttig bij ongebalanceerde data; focust op de positieve klasse.
Gebruik ze samen om te bepalen waar je drempel moet liggen en hoe betrouwbaar het model is.
Leg uit waarom het model een voorspelling maakt (LIME).
Technische noot
Modellen: TF-IDF → Logistic Regression; ClinicalBERT/DutchBERT → Logistic Regression
Visualisatie: SVD(50) → t-SNE(2D/3D) op de gekozen tekstfeatures
CSV-loader: lokaal (map van dit bestand) of via Hugging Face Hub