UTILIZZO DI R IN EPIDEMIOLOGIA: INTRODUZIONE ALLE PRINCIPALI ANALISI

Download Modello di. Regressione. Lineare. Packages. Epidemiology. Packages. Epitool ed. Epicalc. Survival. Analysis. Survival Package. Bibliografia...

0 downloads 429 Views 762KB Size
Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Utilizzo di R in Epidemiologia: introduzione alle principali analisi

Perch´ e R? Functions

Gaia Bertarelli

Modello di Regressione Lineare

Packages Epidemiology Packages

Istituto Nazionale Tumori PhD Statistica Universit` a Milano Bicocca

Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Italian BioR Day

Utilizzo di R in Epidemiologia: introduzione alle principali analisi

1

Perch´e R?

2

Functions Modello di Regressione Lineare

3

Packages

4

Epidemiology Packages Epitool ed Epicalc

5

Survival Analysis Survival Package

6

Bibliografia-Sitografia

Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Perch´e usare R in ambito epidemiologico? Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Capire il metodo; Applicare il metodo; Modellare il metodo alle proprie esigenze.

Functions Comandi statistici di base Utilizzo di R in Epidemiologia: introduzione alle principali analisi

Summary Statistics

Gaia Bertarelli

summary(), fivenum(), stem();

Sommario

qqnorm(), qqline();

Perch´ e R?

boxplot.

Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Test t.test(); var.test(); wilcox.test ().

Functions Comandi statistici di base Utilizzo di R in Epidemiologia: introduzione alle principali analisi

Summary Statistics

Gaia Bertarelli

summary(), fivenum(), stem();

Sommario

qqnorm(), qqline();

Perch´ e R?

boxplot.

Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Test t.test(); var.test(); wilcox.test ().

Functions Output ”stringato” Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Le functions di R generalmente restituiscono un output molto ”riassuntivo”. Come risolvere il problema ed estrarre informazioni aggiuntive? Assegnare la funzione ad un oggetto. La funzione str() pu` o servire ad esplorare l’oggetto.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Functions Estrarre informazioni da un modello di regressione lineare Utilizzo di R in Epidemiologia: introduzione alle principali analisi

lm (formula, dati) x < −lm(y ∼ x, data = z)

Gaia Bertarelli

summary(x): riassunto risultati generali;

Sommario

print(x): descrizione ”precisa” dell’oggetto;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

deviance(x): residui; plot(x): plot residui, valori ”fitted” e diagnostica (utile per gli assunti); coef(x): coefficienti di regressione; predict(x, newdata=previsione): previsione `e la matrice di valori di cui si richiede una previsione; step(): aggiunge/elimina regressori e restituisce il modello con AIC pi` u basso.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

I pacchetti sono ”collezioni” di funzioni creati dagli utenti I pacchetti usati in epidemiologia possono dividersi in categorie in base alla loro funzione: Soddisfare aree specifiche di analisi survival, genetics,

Manipolare i dati plyr, RecordLinkage,

Supporto didattico PASWR, LearnBayes,

Ampliare le capacit`a di R R2WinBUGSM, ggplot2,

Raggruppare insieme funzionalit`a (e DB) utili da condividere epitools, epicalc, epi, epiR.

Epidemiology Packages Rate Ratios, Relative Risks, Odds Ratios Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Rate Ratio /p−t1 RR = rate 1/rate 2 = xx21 /p−t 2 q 1 1 se[ln(RR)] = x1 + x2 .

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Relative Risk 1 RR = risk 1/risk 2 = xx12 /n /n2 q se[ln(RR)] = x11 + x12 − n11 −

1 n2 .

Odds Ratio /n1 −x1 OR = odds 1/odds 2 = xx21 /n 2 −x2 q se[ln(OR)] = 1a + b1 + c1 + d1 .

Epidemiology Packages Rate Ratios, Relative Risks, Odds Ratios Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Rate Ratio /p−t1 RR = rate 1/rate 2 = xx21 /p−t 2 q 1 1 se[ln(RR)] = x1 + x2 .

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Relative Risk 1 RR = risk 1/risk 2 = xx12 /n /n2 q se[ln(RR)] = x11 + x12 − n11 −

1 n2 .

Odds Ratio /n1 −x1 OR = odds 1/odds 2 = xx21 /n 2 −x2 q se[ln(OR)] = 1a + b1 + c1 + d1 .

Epidemiology Packages Rate Ratios, Relative Risks, Odds Ratios Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Rate Ratio /p−t1 RR = rate 1/rate 2 = xx21 /p−t 2 q 1 1 se[ln(RR)] = x1 + x2 .

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Relative Risk 1 RR = risk 1/risk 2 = xx12 /n /n2 q se[ln(RR)] = x11 + x12 − n11 −

1 n2 .

Odds Ratio /n1 −x1 OR = odds 1/odds 2 = xx21 /n 2 −x2 q se[ln(OR)] = 1a + b1 + c1 + d1 .

Epitools Epitab Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Calcola il rischio, il rischio relativo, l’odds ratio e i relativi intervalli di confidenza per dati epidemiologici (studi di coorte o caso controllo). Tabelle r*2;

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

OR: Wald, Fisher, mid-p, corretto per piccoli campioni; IC OR: Wlad(normal), Fisher(ipergeometrica esatta), mid-p esatto, aggiustato per piccoli campioni; RR: Wald, corretto per piccoli campioni; IC RR: Wald, bootstrap; Rate ratio (IC): Wlad, Median unbiased.

Epitool Epitab Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions

> > + >

Modello di Regressione Lineare

0 1 0 2209 1194 1 2216 1181

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

library(epitools) dig<-read.csv("C:/Users/Gaia/Desktop/BioR/dig.csv", stringsAsFactors=F) #digitalis data table(dig$TRTMT,dig$DEATH)

>

Come passare i dati a epitab? Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

#Tabelle tab.1<-xtabs(~TRTMT + DEATH, data=dig) epitab(tab.1) #Factors epitab(dig$TRTMT,dig$DEATH) #Valori epitab(c(2209, 1194, 2216, 1181)) epitab(tab.1, rev="rows") $tab DEATH TRTMT 0 p0 1 p1 oddsratio 1 2216 0.500791 1181 0.4972632 1.000000 0 2209 0.499209 1194 0.5027368 1.014211

Come passare i dati a epitab? Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

$measure [1] "wald"

Perch´ e R? Functions Modello di Regressione Lineare

$conf.level [1] 0.95

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

$pvalue [1] "fisher.exact"

Analisi stratificata con epitool Assegnare i risultati di una funzione a un oggetto ed estrarre gli elementi necessari Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

> tab.1<-table(dig$TRTMT[dig$AGE<50], + dig$DEATH[dig$AGE<50]) > tab.2<-table(dig$TRTMT[dig$AGE>=50 & dig$AGE<65], + dig$DEATH[dig$AGE>=50 & dig$AGE<65]) > tab.3<-table(dig$TRTMT[dig$AGE>=65], dig$DEATH[dig$AGE>=65]) > or.1<-epitab(tab.1) > or.2<-epitab(tab.2) > or.3<-epitab(tab.3) > young<-or.1$tab[2,5:7] > middle<-or.2$tab[2,5:7] > old<-or.3$tab[2,5:7]

Analisi stratificata con epitool Assegnare i risultati di una funzione a un oggetto ed estrarre gli elementi necessari Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

> my.table<-data.frame(rbind(young, + middle, old)) > my.table oddsratio lower upper young 1.046963 0.7802002 1.404935 middle 1.041631 0.8869418 1.223300 old 0.931582 0.8090384 1.072687 >

Analisi Supplementari Utilizzo di funzioni da R base o altri packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

> fisher.test(tab.1) Fisher’s Exact Test for Count Data

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

data: tab.1 p-value = 0.7647 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.7718428 1.4205336 sample estimates: odds ratio 1.046926

Analisi Supplementari Utilizzo di funzioni da R base o altri packages Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

> chisq.test(tab.1)

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Pearson’s Chi-squared test with Yates’ continuity correction data: tab.1 X-squared = 0.0533, df = 1, p-value = 0.8174

Epicalc Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

cc() `e in epicalc il comando analogo all’ epitab. Restituisce CI esatti per default e grafici dscrittivi.

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

> install.packages("epicalc") > library(epicalc) > ?cc

Epicalc The birth dataset Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Domanda C’`e associazione fra il nascere prematuri e l’avere un basso peso alla nascita?

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

library(epicalc) births<-read.csv("C:/Users/Gaia/Desktop/ BioR/births.csv") names(births) cc(births$low, births$prev_pretrm)

Epicalc The birth dataset Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Domanda C’`e associazione fra il nascere prematuri e l’avere un basso peso alla nascita?

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

library(epicalc) births<-read.csv("C:/Users/Gaia/Desktop/ BioR/births.csv") names(births) cc(births$low, births$prev_pretrm)

Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Figura: cc() output

Epicalc Confondimento Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Domanda Sono presenti altre relazioni fra i dati? > cc(births$uterine_irr,births$low)

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages

births$low births$uterine_irr 0 1 Total 0 116 45 161 1 14 14 28 Total 130 59 189

Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

OR = 2.58 Exact 95% CI = 1.04, 6.32 Chi-squared = 5.4, 1 d.f., P value = 0.02 Fisher’s exact test (2-sided) P value = 0.027

Epicalc Confondimento Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Domanda Sono presenti altre relazioni fra i dati? > cc(births$uterine_irr,births$prev_pretrm)

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages

births$prev_pretrm births$uterine_irr 0 1 Total 0 140 21 161 1 19 9 28 Total 159 30 189

Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

OR = 3.16 Exact 95% CI = 1.1, 8.5 Chi-squared = 6.52, 1 d.f., P value = 0.011 Fisher’s exact test (2-sided) P value = 0.021

Epicalc Confondimento- MH Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Domanda Sono presenti altre relazioni fra i dati?

Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Risposta Mhor(): O.R. di Mantel-Haenszel Compara le stime aggiustate con quelle crude

Epicalc Confondimento- MH Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages

> mhor(births$low, births$prev_pretrm, births$uterine_irr) Stratified analysis by Var3 OR lower lim. upper lim. P value Var3 0 5.41 1.889 16.51 0.000501 Var3 1 1.37 0.215 9.35 1.000000 M-H combined 3.65 1.610 8.29 0.000902

Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

M-H Chi2(1) = 11.02 , P value = 0.001 Homogeneity test, chi-squared 1 d.f. = 2.09 , P value = 0.149

Rischi vs Tassi Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Persone-Tempo 100 persone; 40 morti; Rischio (proporzione) Tasso

40 80

40 100

= 0.4;

= 0.5

60 + 12 40 = 80 persone tempo.

Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Figura: Source: Aragon (http://www.medepi.com)

Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

> library(MASS) > data(Melanoma) > # Frequenza della malattia > mm.deaths<-sum(Melanoma$status==1) > mm.deaths [1] 57 > per.time<-sum((Melanoma$time)/356) > per.time [1] 1239.674 > mortality.rate<-mm.deaths/per.time > round(100*mortality.rate,1) [1] 4.6 > # Quale ` e il rischio di morte? > mortality.risk <- mm.deaths/nrow(Melanoma) > round(100*mortality.risk,1) [1] 27.8

Hazard Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

L’hazard `e collegato al modello esponenziale del rischio R(t) = 1 − e −λt dove λ `e il tasso di un evento e t il tempo trascorso. hazard `e P(D) in (t + δt) (la probabilit`a di passare dallo stato di non malattia allo stato di malattia in un intervallo di tempo); un hazard `e un rischio individuale (a livello di popolazione gli hazard sono essenzialmete tassi); costant hazard = tassi costanti.

Analisi della sopravvivenza Cosa fare quando il modello binomiale dei rischi non `e applicabile? Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Analisi longitudinale; Modello Esponenziale; Modello Product-Limit → Kaplan Meier: drop out, ’Quando’, Non Parametrico, Q ni −di S(T > t) = ni Dove ni `e il numero dei soggetti a rischio e di evnti al tempo i.

Survival Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario

Surv: crea un ”oggtto survival”;

Perch´ e R?

Survfit(): Kaplan Meier da un oggetto survival;

Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

survdiff(): Log Rank test; coxph(): Modello di Cox rischi proporzionali.

Survival Survival Obj e KM Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

data(Melanoma) names(Melanoma)

Sommario Perch´ e R? Functions Modello di Regressione Lineare

survival.object<-Surv(Melanoma$time, Melanoma$status==1) survival.object # in output indicates censoring

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

KM.object<-survfit(survival.object~1) summary(KM.object) plot(KM.object)

Survival plot(KM.object) Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Figura: Curva di Kaplan Meier

Survival Confronto fra due curve KM Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R?

> KM.object.ulcer<-survfit( + survival.object~Melanoma$ulcer) > KM.object.ulcer Call: survfit(formula = + survival.object ~ Melanoma$ulcer)

Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

records n.max n.start events Melanoma$ulcer=0 115 115 115 16 Melanoma$ulcer=1 90 90 90 41 median 0.95LCL 0.95UCL NA NA NA 3042 1726 NA

Survival plot(KM.object.ulcer, conf.int=T, col=c(black, red)) Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Figura: Confronto curve di Kaplan Meier

Survival Logrank Test: chi 2 per il confronto fra due curve di sopravvivenza Utilizzo di R in Epidemiologia: introduzione alle principali analisi

X X ( (Oij − Eij )/var ( (Oij − Eij )))

Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

> survdiff(survival.object~Melanoma$ulcer) Call: survdiff(formula = survival.object ~ Melanoma$ulcer) N Observed Expected Melanoma$ulcer=0 115 16 35.8 Melanoma$ulcer=1 90 41 21.2 Chisq= 29.6

on 1 degrees of freedom, p= 5.41e-08

Cox PH model Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

Hazard opposto Sopravvivenza; hi (t) = h0 (t)e (β1 x+...+βk xk )

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Proporzionalit`a Semi-Parametrico; Curve di sopravvivenza proporzionali (parallele); Coefficienti beta; non necessario hazard baseline.

Cox PH model Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Figura: summary(cox.object)

Bibliografia - Sitografia Utilizzo di R in Epidemiologia: introduzione alle principali analisi Gaia Bertarelli

R CRAN http: //cran.r-project.org/

Bendix Carstensen: http://www.bendixcarstensen.com/ (Copenhagen)

Sommario Perch´ e R? Functions Modello di Regressione Lineare

Packages Epidemiology Packages Epitool ed Epicalc

Survival Analysis Survival Package

BibliografiaSitografia

Charles J. DiMaggio: http://www.mailman.columbia.edu/ourfaculty/profile?uni=cjd11 (Columbia)

”Applied Epidemiology using R” T. Aragon: http://www.medepi.net/

”Analysis of Epidemiological data using R and Epicalc” Virasakdi Chongsuvivatwong Epidemiology Unit Prince of Songkla University THAILAND.