Studieobject Marcel Ooms: Veiligere zorg begint hier: het 30-dagenrisico op agressie onderbouwd en uitlegbaar.

Van verslag naar risico: kans op agressie in de komende 30 dagen Wat doet deze pagina voor jou? Deze demo helpt om uit vrije-tekstrapportages snel een inschatting van het risico op agressief gedrag in de komende 30 dagen te krijgen. Plak een stukje verslag in het tekstvak en je krijgt een kans (probabiliteit) terug, plus een voorgesteld label op basis van een drempel die je zelf kunt verschuiven. Zo kun je risico vroegtijdig signaleren en bepalen welke acties passen: extra observatie, bijsturing in het behandelplan of overleg in het team. Hoe werkt het (zonder technisch gedoe):

  • Bij het openen staat er al een startmodel klaar.
  • Je kunt hertrainen met TF-IDF varianten of BERT-embeddings.
  • Grafieken tonen scheidingskracht én kalibratie; LIME maakt de uitkomst uitlegbaar. Belangrijk:
  • Demonstratie op synthetische data; kans ≠ zekerheid. Gebruik naast klinische expertise.

Wat zie je op deze pagina? Status & prestaties — AUROC/AUPRC; extra: kalibratie (Brier), gains, lift, KS.
Handmatig trainen — kies featurizer en vergelijk.
Visualisatie — 2D/3D-projecties met kleur naar label of kans.
Evaluatie — drempel schuiven; confusion matrix met uitleg.
Predict — rapportage + (optionele) context, labeladvies op aanbevolen drempel.
Hertrain — upload CSV met rapportage, optioneel context, en agressie_volgende30d (0/1).

🛠️ Handmatig trainen (zonder CSV upload)

Kies featurizer
1000 12000
n-gram max

🔍 Visualisatie

Projectiedimensie (geldt voor beide projecties)

Van ruwe data naar beslisinformatie Tekst → kenmerken (TF-IDF of BERT) → kans op 30-dagenrisico. Kalibratie (Brier/reliability) vertaalt kans→actie; Gains/Lift/KS helpen bij triage (top x%). LIME toont bijdragen per woord/frase.

📄 Datavoorbeeld

Weergave

Dataset

⚙️ Evaluatie (tabellen & drempel)

0.05 0.95

Classification report

Confusion matrix (met uitleg)

Lagere Brier is beter; lijn dicht bij de diagonaal = goede kalibratie.

🗣️ Predict (vrije tekst)

🔁 Hertrain met eigen CSV

Upload een CSV met kolommen rapportage (tekst), optioneel context, en agressie_volgende30d (0/1). Kies je parameters en klik Train opnieuw (met upload).

0.1 0.4
1 999
Tekst-featurizer
1000 12000
n-gram max

ℹ️ Over de evaluatieplots

  • Metrics vs. drempel — precision, recall en F1 over de drempel.
  • Kansverdeling — verdeling voorspelde kansen per werkelijke klasse.
  • ROC & PR — scheidingskracht, nuttig bij ongebalanceerde data.
  • Kalibratie — betrouwbaarheid van kansen (Brier lager is beter).
  • Gains/Lift/KS — inzicht voor triage (top x% casussen).

Leg uit waarom het model een voorspelling maakt (LIME).

Technische noot Modellen: TF-IDF/char TF-IDF/XLM-R/DutchBERT/ClinicalBERT → Logistic Regression (+ CalibratedClassifierCV, class_weight='balanced')
Visualisatie: SVD(50) → t-SNE(2D/3D) op gekozen tekstfeatures
CSV: rapportage (str), optioneel context (str), agressie_volgende30d (0/1)