0
Hopp til hovedinnhold

Thomas Fauskanger

Thomas Fauskanger
Informasjonsteknologi, Master IKT
Fakultet for teknologi og realfag
17. desember 2018

Analyse ICNP-bruk i naturlige språk

Mitt prosjekt har vært å utvikle et digitalt verktøy for forskere som jobber med sykepleie og pasientjournaler.

For min del begynte prosjektet som en sommerjobb i 2018 og fortsatte som en deltidsjobb ved siden av studiene utover høsten. Bakgrunnen for prosjektet er at Internasjonalt Klassifikasjonssystem for Sykepleiepraksis (ICNP) skal inføres over hele landet. Direktorat for e-helse utga i juni 2018 en konseptutredning, «Terminologi for sykepleiepraksis» (pdf),  med følgende anbefaling:

«En kombinasjon av ICNP og SNOMED CT muliggjør utnyttelse av fordeler ved begge terminologiene. Den dekker behov om full arbeidsstøtte innen sykepleiepraksis (ICNP), samt ivaretar det overordnede behovet for bedre informasjonsutveksling og samhandling på tvers av faggrupper ved bruk av SNOMED CT som referanseterminologi.»

SNOMED CT er en standard for klinisk terminologi som ikke inngår direkte i mitt arbeid.

Norsk forskning- og utviklingssenter for ICNP (N-ICNP) ved UiA har som hensikt «å etablere et nasjonalt nettverk for å integrere og bruke International Klassifikasjon av Sykepleiepraksis (ICNP) gjennom utdanning, forskning og klinisk praksis», og er ledet av professor Mariann Fossum. Prosjektet mitt har vært et samarbeid med henne, førsteamanuensis Jan Nytun, og universitetslektor Lene Laukvik.

Mitt prosjekt har vært å utvikle et digitalt verktøy for forskere som jobber med sykepleie og pasientjournaler, med fokus på søk i journaler og analyse av ICNP-bruk. Jeg har en datateknisk bakgrunn fra institutt for informasjon- og kommunikasjonsteknologi, og ingen relevant utdanning knyttet til sykepleie. Et naturlig startpunkt for prosjektet er å sette seg inn i hva ICNP omhandler, og hvordan pasientjournaler lages og brukes i forskjellige eksisterende systemer. Videre, for å tilpasse løsningen til dem som skal bruke det er det interessant å se hvordan forskere på sykepleien jobber, og hva de er ute etter.

Som samfunnsborger er jeg opptatt av et godt personvern og strenge krav til hvem som kan få innsyn i mine pasientopplysninger, og som forsker og dataanalytiker er det et viktig ansvar å være bevisst på. En av de mest utfordrende oppgavene med prosjektet er å få tilgang til pasientjournaler. Vi har møter med kommunen om hjemmesykepleien, og andre på prosjektet jobber langsiktig med å hente inn data. I mangel på ekte pasientjournaler bygger jeg opp løsningen min med test-data basert på et DIPS-system som studenter ved sykepleien har brukt. Der finnes det fiktive pasienter med tilhørende journaler. 

Den digitale løsningen består av tre deler: en database, en server, og et grafisk grensensitt i form av en nettside. I databasen er den en modell av ICNP, journaler, sykepleiere og anynomyserte pasienter. Serveren utfører skrive- og leseoperasjoner mot databasen, deriblant mer komplekse beregninger som aggregering og analyse. Serveren tilbyr tilgang til disse operasjonene til det grafiske grensesnittet. Hver av disse tre tjenestene kjører som mikrotjenester i isolerte Docker-containere, noe som gjør det enkelt å sette opp eller teste løsningen på forskjellige typer datasystemer, uavhengig av operativsystem.

Det grafiske grensesnittet lar brukerne, altså forskere, søke i fritekst fra journalene, finne termer og hvordan de er brukt over tid. Fritekssøk byr på interessante utfordringer som skrivefeil og homonymer - forskjellige ord som skrives likt. Det finnes måter å angripe disse utfordringene på, men det er ingen garanti for at et ord blir tolket korrekt. Et annet tilfelle er synonymer, hvor ord med samme betydning skrives forskjellig. F.eks. ser det ut til å være vanlig å bruke ordene pasient og bruker om en annen, men bare pasient ligger inne i ICNP. I tillegg så blir det interessant å finne referanser til termer når det finnes bøyninger av samme ord, f.eks. gå tur og gikk tur, eller pasienten og pasienter. Innen tekstanalyse kalles dette feltet for NLP - Natural Language Prosessing, og er relevant og interessant for min studieretning.

Å komme fra utsiden av helsedomenet til å få muligheten til å bli mer kjent med fagfeltet og noen av de utfordringene det tilbyr har vært en spennende oppgave. Å balansere personvern og privatliv med et effektivt, digitalisert system krever hensyn som kan produsere mange spørsmål. Det ligger et enormt potensial i å ta i bruk maskinlæring og automatiserte analyser av journaler, men samtidig er pasientjournaler en kilde på noe av de mest sensitive opplysninger om mennesker med roller i alle delene av samfunnet.