ANALYTIIKKA KESKOSTEN HOIDOSSA - www-05.ibm.com

HUS TIETOALLAS (HUS Datalake) Palveluoperaattori - Metadata - Tutkimuslupa - Tiedon hallinta - Monitorointi Hallinto Integroitavat tietovarannot Metad...

30 downloads 288 Views 1MB Size
ANALYTIIKKA KESKOSTEN HOIDOSSA

IT-Kehitysjohtaja Mikko Rotonen HUS-TIETOHALLINTO 19.10.2016

SISÄLTÖ 1.Lyhyt oppimäärä tekoälyä 2.BigData 3.Case Hyksin lastenklinikan keskosteho 4.Mitä seuraavaksi

2

1. LYHYT OPPIMÄÄRÄ TEKOÄLYÄ

3

TEKOÄLYN TEKNIIKAT 1. 2. 3. 4. 5. 6.

Koneoppiminen (machine learning) Neuroverkot (artificial neural networks) Syvä neuroverkko (deep learning) Ohjattu oppiminen (supervised learning) Vahvistusoppiminen (reinforcement learning) Ohjaamaton oppiminen (unsupervised learning)

4

2. BIG DATA

5

KUINKA PALJON TIETOA TARVITAAN JOTTA VOI HYÖDYNTÄÄ TEKÖÄLYÄ? • Tiedon määrä riippuu käytettävästä tekniikasta • Kuva-analytiikassa on syötetarve on 10 000 kuvaa • Esim. Watson for Oncology • - Perustuu 300 000 lääketieteelliseen julkaisun, 200 kirjaan ja 12 miljoonaan kirjoitettuun sivuun aiheesta, • - Opettamiseen on käytetty 15 000 tuntia (=2 000 työpäivää, = 9 työvuotta) asiantuntijoiden työaikaa 6

Integroitavat tietovarannot Kuva-arkistot

PACS XDS

Laskutus ja tietovarasto

NRT Mynla ja Tietovarasto

BCB Laaturekisterit

Laaturekisterit

Uranus / Epic Laboratorio Kuvantaminen Anestesia ja teho Leikkaussali Lääkitys

Potilastietojärjestelmät ja HealthWeb Terveyskylä

17.10.2016

Potilaat

Genomi Biopankki

Mobiilisovellukset

Potilaan omat mittaukset - Noona syöpäseuranta - Diabetes-seuranta - EKG-seuranta

Metadata, Integrointi, Lataus Tietoaltaaseen

Tutkijat

Palveluoperaattori -

HUS TIETOALLAS (HUS Datalake) Watson Analyyttiset Kirontech algoritmit ja Aalto yo ennustava Nokialab mallintaminen Cortana DuoDecim

Lääkärit Hoitajat Tutkijat Hallinto

Metadata Tutkimuslupa Tiedon hallinta Monitorointi

Hallinto

Potilaat

7

GARTNER TOP 10 TECHNOLOGY TRENDS Nro

2008->2009

2011->2012

2014->2015

2016->2017

1

Virtualization

Media tablets

Computing Everywhere

Artificial Intelligence and Advanced Machine Learning

2

Cloud Computing

Mobile-centric applications and interfaces

The Internet of Things (IoT)

Intelligent Apps

3

Servers: Beyond Blades

Contextual and social user experience

3D Printing

Intelligent Things

4

Web Oriented Architecture

The Internet of Things (IoT)

Advanced, Pervasive and Invisible Analytics

Virtual Reality and Augmented Reality

5

Enterprise Mashups

App stores and Marketplaces

Context-Rich Systems

Digital Twins

6

Specialized Systems

Next-generation analytics

Smart Machines

Blockchains and Distributed Ledgers

7

Social Software & Social Networking

Big Data

Cloud/Client Computing

Conversational Systems

8

Unified Communications

In-memory computing

Software-Defined Applications and Infrastructure

Mesh App and Service Architecture

9

Business Intelligence

Extreme low-energy servers

Web-Scale IT

Digital Technology Platforms

10

Green IT

Cloud computing

Risk-Based Security and Selfprotection

Adaptive Security Architecture

Lähde: Gartner

8

Potilastietojärjestelmien kypsyystasot ja sukupolvet

Cognitive / Deep learning (IBM Watson)

17.10.2016

Tekoälyä tarvitaan, jotta voidaan saavuttaa Gartnerin kypsyystasot 4 ja 5

9

3. CASE HYKS LASTENKLINIKAN KESKOSTEHO

10

A. Tekninen ratkaisu Potilaan Tietojärjestelmäarkkitehtuuri elintoimintatietojen käsittelyvaihtoehdotja ja niiden integraatiot ajantasaisuus ja validointi

Philips potilasmonitori

GE Clinisoft

digiConnect/ ebox

GE Clinisoft database

IBM WATSON

Watson database

11

B. KÄYTETTY ANALYSOINTI- JA ENNUSTETEKNIIKKA Käytetyt potilaiden elintoimintoja kuvaavat muuttujat • • •

Syke (HR) Hengitystaajuus (RESP) Happisaturaatio (SaO2)

SPSS Modelerin avulla päätöspuumalli (CR&T) sovitettiin dataan, jossa sepsispositiivisten dataa päivää ennen kliinikon ottamaa veriviljelyä verrattiin satunnaistettuun otantaan sepsisnegatiivisten potilaiden datasta • Malli ottaa huomioon myös muuttujien väliset riippuvuudet • Data jaettiin testi- ja mallinnusosioon mallin validointia varten

12

C. Projektin löydökset - sepsiksen ennustaminen GE Clinisoftin datalla • Päätöspuun avulla datasta tunnistaa korrelaatioita, jotka ennustavat sepsistä • Algoritmi valitsee ja optimoi päätöspuussa näkyvät raja-arvot automaattisesti käytössä olevan datan perusteella • Esimerkiksi päätöspuusta voidaan nähdä kuinka alhainen sykkeen vaihtelu (HR_VAR10) kasvattaa sepsisriski • Havainto on yhtenevä alan muiden tutkimusten kanssa, joissa käytetty reaaliaikaista potilasmonitorointi dataa

13

D. Projektin löydökset - Teknisen ratkaisun kehittäminen tuotantokäyttöön Ehdotus tulevaisuuden analytiikka arkkitehtuuriksi NICU Data Sources

Video data

Real-Time Stream Computing

IBM Infosphere Streams

Millions of Events per Second / all kinds of data

Complex analytics: Everything you can express via an algorithm

Watson Analytics

Big Data Hifi-signals (Audio, Monitoring data)

IBM BigInsights for Hadoop Laboratory results Patient Monitors Ordered medication & Procedures External devices Electronic Health Records

Immediate action in real time Real-time data correlation, Anomaly Detection - Event and flow normalization context & enrichment



Historical data storage for research



Integration to production and existing data sources



Preservation of raw data from patient monitors



Long-term, multi-PB storage



New and old data sources



Predictive modeling



Anomaly detection



Research



New Models and variables



Text data analytics

Clinisoft •Legislative compliance •Laboratory results

EHR data

14 Collect

Store & Process

Analyze

TIIVISTELMÄ KOKEILUSTA JA SEN TULOKSISTA JA JATKOSUUNNITELMISTA Ennustekyvykkyys todettu GE Healthcare Centricity Critical Care Clinisoft sovelluksen datalla • •

jo medianisoidussa datassa näkyy merkkejä siitä, että sepsis voidaan ennustaa 24 h ennen kuin kliinikko tilaa verinäytteen Hoitohenkilökunnan päätöksentekoa voidaan helpottaa visualisoimalla tulokset

Ennustetarkkuutta voidaan kehittää • • • •

Hyödyntämällä lähes reaaliaikaista potilasmonitorointitietoa (esim. EKG, veren happisaturaatio, hengitystiheys, verenpaine) Parantamalla datan laatua (puuttuvien arvojen vähentäminen) Lisäämällä uusia muuttujia (esim. videoanalytiikan avulla määritetty fyysinen aktiivisuus) Parantamalla analytiikkaympäristön laskentatehoa

Seuraavat askeleet • • • •

Tieteellinen tutkimus (tutkimusluvat, infrastruktuuri yms.) näytöistä, että reaaliaikaisella datalla voidaan ennustaa sepsis. Saatava näyttöä ennustekyvystä, jonka tuloksen mukaan voidaan edetä Ennustetarkkuuden kehittäminen tieteellisen tutkimuksen kautta Käytäntöön viemisen suunnittelu • Tuotantoa ja analytiikan kehittämistä tukevan ympäristön luonti Menetelmän laajentaminen muihin käyttötapauksiin

15

Potilaan elintoimintatietojen siirto ja dokumentointi Video data

GE potilasmonitori

GE Clinisoft Critical Care Multilab

3

1

GE Gateway

Clinisoft database

Tuotanto Kehitys/DL Ennustava analytiikka

Watson Teksti

1

3 Tietoallas

BT / Stream Analytics

Ajantasaisuus

Tiedon validointi, formaatti

Tiedon sisältö

Vaihtoehto 1

60 + 120 sekuntia

Arvot mediaaneja, HL7

Laboratoriotiedot sisältyvät, samoin kertomus, ei käytetä ennustamiseen

Vaihtoehto 3

2 sekuntia

Ei, XML High Speed

Laboratoriotiedot täydennetään suoraan ennustemalliin HL7:llä, Muut tiedot siirretään XML:llä, ei siirretä kertomustietoja 16

4. MITÄ SEURAAVAKSI

17

Seuraavan sukupolven ennustava sepsisanalytiikka vuonna 2017 Streams Real-time Analytics Platform

Data Repositories Lab Data

Dynamic Patient Activity

TCP GE Gateway UDP Senosr XYZ

HealthCare Device XYZ Video Stream

Lab Results Medicine Hist Treatments Hist

Patient Data

Symptoms Hist

Patiento Demographi cs

B I G D A T A S O U R C E S

E D MQ G E A HTTP D A P HDFS T E R ODBC S

Files

C O N S U M E R IN G E S T A P P S

ECG Scoring

SIGNATURE DETECTION SEPSIS IDENTIFICATION

SYSTEMIC MEMORY PATIENT PROFILE & ANALYTICS SCORING STORE

TCP UDP

Demograph

Medicine

Lab Scoring

E D G E A D A P T E R S

TCP SINK MQ

Realtime Predictive Dashboard

Treatments, Diagnos History

Patient

HTTP

HDFS

Operative Clinician

ODBC

BUSINESS RULES FILTERING FILES

Medicine Treatment

SPSS C&DS

SPSS Modeling Development only

(A) Iterative Analytical model deployment (B) Real-time Patient Monitoring Streams + subscription other data streams ie Lab, Treatment Activity streams etc.

STREAMS FILE LANDING ZONE (I/O) Patient Account Info

Landing, Exploration and Archive data zone Production Feeds

SOURCE

PREDICTION ENGINE

DEV

Data source samples, Modelling development, Analytic Schema, Systemic Patient Profile

(C) Real-time Treatment action by Care givers (D) Real-time Predictive Dashboard

Tiedonjalostus ja sen tasot Informaation merkitys Optimointi

Ennustava mallinnus

BigDatan tiikerin loikka

Raaka data

Puhdistettu data

Vakioraportti

Mikä olisi parasta mitä voisi tapahtua?

Kuvaileva mallinnus

Mitä tulee tapahtumaan?

Kuutiot ja kyselyt

Miksi niin tapahtui?

Mitä tapahtui? Data Perus järjestelmät

Informaatio

Tietovarasto

Tietämys

BigData

Ymmärrys 19

20