ANALYTIIKKA KESKOSTEN HOIDOSSA
IT-Kehitysjohtaja Mikko Rotonen HUS-TIETOHALLINTO 19.10.2016
SISÄLTÖ 1.Lyhyt oppimäärä tekoälyä 2.BigData 3.Case Hyksin lastenklinikan keskosteho 4.Mitä seuraavaksi
2
1. LYHYT OPPIMÄÄRÄ TEKOÄLYÄ
3
TEKOÄLYN TEKNIIKAT 1. 2. 3. 4. 5. 6.
Koneoppiminen (machine learning) Neuroverkot (artificial neural networks) Syvä neuroverkko (deep learning) Ohjattu oppiminen (supervised learning) Vahvistusoppiminen (reinforcement learning) Ohjaamaton oppiminen (unsupervised learning)
4
2. BIG DATA
5
KUINKA PALJON TIETOA TARVITAAN JOTTA VOI HYÖDYNTÄÄ TEKÖÄLYÄ? • Tiedon määrä riippuu käytettävästä tekniikasta • Kuva-analytiikassa on syötetarve on 10 000 kuvaa • Esim. Watson for Oncology • - Perustuu 300 000 lääketieteelliseen julkaisun, 200 kirjaan ja 12 miljoonaan kirjoitettuun sivuun aiheesta, • - Opettamiseen on käytetty 15 000 tuntia (=2 000 työpäivää, = 9 työvuotta) asiantuntijoiden työaikaa 6
Integroitavat tietovarannot Kuva-arkistot
PACS XDS
Laskutus ja tietovarasto
NRT Mynla ja Tietovarasto
BCB Laaturekisterit
Laaturekisterit
Uranus / Epic Laboratorio Kuvantaminen Anestesia ja teho Leikkaussali Lääkitys
Potilastietojärjestelmät ja HealthWeb Terveyskylä
17.10.2016
Potilaat
Genomi Biopankki
Mobiilisovellukset
Potilaan omat mittaukset - Noona syöpäseuranta - Diabetes-seuranta - EKG-seuranta
Metadata, Integrointi, Lataus Tietoaltaaseen
Tutkijat
Palveluoperaattori -
HUS TIETOALLAS (HUS Datalake) Watson Analyyttiset Kirontech algoritmit ja Aalto yo ennustava Nokialab mallintaminen Cortana DuoDecim
Lääkärit Hoitajat Tutkijat Hallinto
Metadata Tutkimuslupa Tiedon hallinta Monitorointi
Hallinto
Potilaat
7
GARTNER TOP 10 TECHNOLOGY TRENDS Nro
2008->2009
2011->2012
2014->2015
2016->2017
1
Virtualization
Media tablets
Computing Everywhere
Artificial Intelligence and Advanced Machine Learning
2
Cloud Computing
Mobile-centric applications and interfaces
The Internet of Things (IoT)
Intelligent Apps
3
Servers: Beyond Blades
Contextual and social user experience
3D Printing
Intelligent Things
4
Web Oriented Architecture
The Internet of Things (IoT)
Advanced, Pervasive and Invisible Analytics
Virtual Reality and Augmented Reality
5
Enterprise Mashups
App stores and Marketplaces
Context-Rich Systems
Digital Twins
6
Specialized Systems
Next-generation analytics
Smart Machines
Blockchains and Distributed Ledgers
7
Social Software & Social Networking
Big Data
Cloud/Client Computing
Conversational Systems
8
Unified Communications
In-memory computing
Software-Defined Applications and Infrastructure
Mesh App and Service Architecture
9
Business Intelligence
Extreme low-energy servers
Web-Scale IT
Digital Technology Platforms
10
Green IT
Cloud computing
Risk-Based Security and Selfprotection
Adaptive Security Architecture
Lähde: Gartner
8
Potilastietojärjestelmien kypsyystasot ja sukupolvet
Cognitive / Deep learning (IBM Watson)
17.10.2016
Tekoälyä tarvitaan, jotta voidaan saavuttaa Gartnerin kypsyystasot 4 ja 5
9
3. CASE HYKS LASTENKLINIKAN KESKOSTEHO
10
A. Tekninen ratkaisu Potilaan Tietojärjestelmäarkkitehtuuri elintoimintatietojen käsittelyvaihtoehdotja ja niiden integraatiot ajantasaisuus ja validointi
Philips potilasmonitori
GE Clinisoft
digiConnect/ ebox
GE Clinisoft database
IBM WATSON
Watson database
11
B. KÄYTETTY ANALYSOINTI- JA ENNUSTETEKNIIKKA Käytetyt potilaiden elintoimintoja kuvaavat muuttujat • • •
Syke (HR) Hengitystaajuus (RESP) Happisaturaatio (SaO2)
SPSS Modelerin avulla päätöspuumalli (CR&T) sovitettiin dataan, jossa sepsispositiivisten dataa päivää ennen kliinikon ottamaa veriviljelyä verrattiin satunnaistettuun otantaan sepsisnegatiivisten potilaiden datasta • Malli ottaa huomioon myös muuttujien väliset riippuvuudet • Data jaettiin testi- ja mallinnusosioon mallin validointia varten
12
C. Projektin löydökset - sepsiksen ennustaminen GE Clinisoftin datalla • Päätöspuun avulla datasta tunnistaa korrelaatioita, jotka ennustavat sepsistä • Algoritmi valitsee ja optimoi päätöspuussa näkyvät raja-arvot automaattisesti käytössä olevan datan perusteella • Esimerkiksi päätöspuusta voidaan nähdä kuinka alhainen sykkeen vaihtelu (HR_VAR10) kasvattaa sepsisriski • Havainto on yhtenevä alan muiden tutkimusten kanssa, joissa käytetty reaaliaikaista potilasmonitorointi dataa
13
D. Projektin löydökset - Teknisen ratkaisun kehittäminen tuotantokäyttöön Ehdotus tulevaisuuden analytiikka arkkitehtuuriksi NICU Data Sources
Video data
Real-Time Stream Computing
IBM Infosphere Streams
Millions of Events per Second / all kinds of data
Complex analytics: Everything you can express via an algorithm
Watson Analytics
Big Data Hifi-signals (Audio, Monitoring data)
IBM BigInsights for Hadoop Laboratory results Patient Monitors Ordered medication & Procedures External devices Electronic Health Records
Immediate action in real time Real-time data correlation, Anomaly Detection - Event and flow normalization context & enrichment
•
Historical data storage for research
•
Integration to production and existing data sources
•
Preservation of raw data from patient monitors
•
Long-term, multi-PB storage
•
New and old data sources
•
Predictive modeling
•
Anomaly detection
•
Research
•
New Models and variables
•
Text data analytics
Clinisoft •Legislative compliance •Laboratory results
EHR data
14 Collect
Store & Process
Analyze
TIIVISTELMÄ KOKEILUSTA JA SEN TULOKSISTA JA JATKOSUUNNITELMISTA Ennustekyvykkyys todettu GE Healthcare Centricity Critical Care Clinisoft sovelluksen datalla • •
jo medianisoidussa datassa näkyy merkkejä siitä, että sepsis voidaan ennustaa 24 h ennen kuin kliinikko tilaa verinäytteen Hoitohenkilökunnan päätöksentekoa voidaan helpottaa visualisoimalla tulokset
Ennustetarkkuutta voidaan kehittää • • • •
Hyödyntämällä lähes reaaliaikaista potilasmonitorointitietoa (esim. EKG, veren happisaturaatio, hengitystiheys, verenpaine) Parantamalla datan laatua (puuttuvien arvojen vähentäminen) Lisäämällä uusia muuttujia (esim. videoanalytiikan avulla määritetty fyysinen aktiivisuus) Parantamalla analytiikkaympäristön laskentatehoa
Seuraavat askeleet • • • •
Tieteellinen tutkimus (tutkimusluvat, infrastruktuuri yms.) näytöistä, että reaaliaikaisella datalla voidaan ennustaa sepsis. Saatava näyttöä ennustekyvystä, jonka tuloksen mukaan voidaan edetä Ennustetarkkuuden kehittäminen tieteellisen tutkimuksen kautta Käytäntöön viemisen suunnittelu • Tuotantoa ja analytiikan kehittämistä tukevan ympäristön luonti Menetelmän laajentaminen muihin käyttötapauksiin
15
Potilaan elintoimintatietojen siirto ja dokumentointi Video data
GE potilasmonitori
GE Clinisoft Critical Care Multilab
3
1
GE Gateway
Clinisoft database
Tuotanto Kehitys/DL Ennustava analytiikka
Watson Teksti
1
3 Tietoallas
BT / Stream Analytics
Ajantasaisuus
Tiedon validointi, formaatti
Tiedon sisältö
Vaihtoehto 1
60 + 120 sekuntia
Arvot mediaaneja, HL7
Laboratoriotiedot sisältyvät, samoin kertomus, ei käytetä ennustamiseen
Vaihtoehto 3
2 sekuntia
Ei, XML High Speed
Laboratoriotiedot täydennetään suoraan ennustemalliin HL7:llä, Muut tiedot siirretään XML:llä, ei siirretä kertomustietoja 16
4. MITÄ SEURAAVAKSI
17
Seuraavan sukupolven ennustava sepsisanalytiikka vuonna 2017 Streams Real-time Analytics Platform
Data Repositories Lab Data
Dynamic Patient Activity
TCP GE Gateway UDP Senosr XYZ
HealthCare Device XYZ Video Stream
Lab Results Medicine Hist Treatments Hist
Patient Data
Symptoms Hist
Patiento Demographi cs
B I G D A T A S O U R C E S
E D MQ G E A HTTP D A P HDFS T E R ODBC S
Files
C O N S U M E R IN G E S T A P P S
ECG Scoring
SIGNATURE DETECTION SEPSIS IDENTIFICATION
SYSTEMIC MEMORY PATIENT PROFILE & ANALYTICS SCORING STORE
TCP UDP
Demograph
Medicine
Lab Scoring
E D G E A D A P T E R S
TCP SINK MQ
Realtime Predictive Dashboard
Treatments, Diagnos History
Patient
HTTP
HDFS
Operative Clinician
ODBC
BUSINESS RULES FILTERING FILES
Medicine Treatment
SPSS C&DS
SPSS Modeling Development only
(A) Iterative Analytical model deployment (B) Real-time Patient Monitoring Streams + subscription other data streams ie Lab, Treatment Activity streams etc.
STREAMS FILE LANDING ZONE (I/O) Patient Account Info
Landing, Exploration and Archive data zone Production Feeds
SOURCE
PREDICTION ENGINE
DEV
Data source samples, Modelling development, Analytic Schema, Systemic Patient Profile
(C) Real-time Treatment action by Care givers (D) Real-time Predictive Dashboard
Tiedonjalostus ja sen tasot Informaation merkitys Optimointi
Ennustava mallinnus
BigDatan tiikerin loikka
Raaka data
Puhdistettu data
Vakioraportti
Mikä olisi parasta mitä voisi tapahtua?
Kuvaileva mallinnus
Mitä tulee tapahtumaan?
Kuutiot ja kyselyt
Miksi niin tapahtui?
Mitä tapahtui? Data Perus järjestelmät
Informaatio
Tietovarasto
Tietämys
BigData
Ymmärrys 19
20