P. 1
Colleges Epidemiologie en Biostatistiek I

Colleges Epidemiologie en Biostatistiek I

|Views: 57|Likes:
Published by Stuvia.com
Dictaat van alle colleges van het vak epidemiologie en biostatistiek I. Dit is ook een samenvatting van de boeken 'Epidemiologisch Onderzoek' (Bouter, van Dongen, Zielhuis) en 'Inleiding in de Toegepaste Biostatistiek' (Twisk).
Dictaat van alle colleges van het vak epidemiologie en biostatistiek I. Dit is ook een samenvatting van de boeken 'Epidemiologisch Onderzoek' (Bouter, van Dongen, Zielhuis) en 'Inleiding in de Toegepaste Biostatistiek' (Twisk).

More info:

Published by: Stuvia.com on Jul 19, 2013
Copyright:Traditional Copyright: All rights reserved
List Price: $1.30 Buy Now

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
See more
See less

02/05/2014

$1.30

USD

pdf

Colleges Epidemiologie en Biostatistiek I

door

maaloess

De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal
Koop en Verkoop al je samenvattingen, aantekeningen, onderzoeken, scripties, collegedictaten, en nog veel meer..

www.stuvia.com

Uit de basispopulatie worden de controles gekozen door middel van een random steekproef. Nadelen aan deze methode zijn confounding. Hierna werd nog een onderzoek uitgevoerd naar de relatie van roken en longkanker. informatiebias (recall). De cohort wordt gevolgd in de tijd. men begint bij de uitkomst en vervolgens wordt er terug gevraagd naar mogelijke oorzaken. ze moeten de blootstelling in de basispopulatie weerspiegelen. het is onpraktisch en kostbaar bij een lange inductietijd of zeldzame ziekte en bovendien moet men vooraf inzicht hebben in de relevante determinanten (deze moeten namelijk vooraf gemeten worden). Het onderzoek omving 700 patiënten (350 met longkanker en 350 met maag. Alle associatiematen kunnen gebruikt worden. Bruikbare frequentiematen zijn prevalentie.of darmkanker). Beschrijvende epidemiologie beantwoordt de vraag: “Hoe vaak komt het voor?”. Dit was een prospectief cohort onderzoek. De voordelen zijn de kleine kans op selectiebias en informatiebias (vertekening door meetfouten) en ook hier is de oorzaak voor gevolg. De frequentiemaat is prevalentie en de associatiemaat is oddsratio. In de eerste helft van de 20e eeuw ontstond er een explosie van longkankergevallen. Een transversaal onderzoek kan dus alleen toegepast worden als de determinant constant is gedurende een lange tijd. samen kregen ze de opdracht de aanleiding van longkanker te onderzoeken. opgespoord in een ziekenhuis. selectiebias door uitval in de groep. Etiologie bestudeerd de oorzaak van ziekte en prognose de beloop van ziekte. De associatiematen zijn OR.Stuvia. omdat ze uit de basispopulatie moeten komen. medical docters study. Verklarende epidemiologie houdt zich bezig met de verbanden tussen determinanten en ziekte/gezondheid  de onafhankelijke versus de afhankelijke variabele. Richard Doll kwam in aanraking et het Medical Research Councel (onder leiding van Sir Bradford Hill). Het nadeel is dat ziekteontwikkeling meestal vrij lang duurt. De nadelen zijn selectiebias (prevalentie gevallen). Het voordeel van een case-control is dat het efficiënt werkt. Het selecteren van controles voor een dergelijk onderzoek is lastig.com . ferquentiematen en associatiematen Epidemiologie is methodologie van onderzoek naar gezondheid en ziekte. confounding en de inefficiëntie. Een voormeting is nodig om te checken of de randomisatie goed . Ferquentiematen die gebruikt kunnen worden zijn prevalentie. De toewijzing is op basis van randomisatie. RR en RV. Een bruikbare frequentiemaat is prevalentie en een associatiemaat is de oddsratio. cumulatieve incidentie (aantal nieuwe gevallen/hele groep ‘at risk’) en incidentiedichtheid (nieuwe gevallen/totale persoonstijd ‘at risk’). Het voordeel is dat dit relatief snel is. hierbij moet iedereen ‘at risk’ zijn. Experimenteel is een speciaal soort prospectief onderzoek en is eigenlijk een soort dictatuur. cumulatieve incidentie en incidentiedichtheid. Het voordeel hiervan is dat er geen selectiebias kan zijn. Bij een transversaal onderzoek wordt op één moment de uitkomst en de determinant gemeten.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Epidemiologie en biostatistiek I Herhaling en uitbreiding onderzoeksdesigns. De nadelen zijn confounding en de grote gevoeligheid voor selectiebias. er hoeft niet gewacht te worden op een uitkomst. Ook is er sprake van oorzaak voor gevolg. Het voordeel van een retrospectief cohort onderzoek is dat de oorzaak voor gevolg is. Dit is dus een voorbeeld van een case-control onderzoek.

(Rpopulation-Runexposed)/Rpopulation  p(RR-1)/p(RR1)+1 .com .(1/RR)  (RR-1)/RR. . Een dosis-response relatie wordt toegepast om de oorzaak-gevolg relatie sterk aan te tonen. Rangschikking van veel naar weinig bewijs: 1. 2. vooral hypothesevormend (exploratief). Het nadeel is de ecologische valkuil. RR en RV. Bij een cross-overdesign geldt de voorwaarde dat de interventie een kortdurend effect heeft (‘jezelf met jezelf vergelijken’). 6. 5. De hoogte van APT is de sterkte van het verband en proportie van populatie die blootgesteld is. Het nadeel van een experimenteel onderzoek is dat het vaak ethisch niet verantwoord is. cumulatieve incidentie en incidentiedichtheid.Stuvia. het geeft het percentage van risico of kans bij blootgestelden dat kan worden toegeschreven aan de blootstelling. hoe hoger de APE. Hierbij moet de aanname gedaan worden dat de prevalentie van de risicofactor/determinant in de onderzoeksgroep ook representatief is voor de gehele populatie. Het betekend dus dat het zoveel procent van het aantal gevallen in een populatie toe te schrijven is aan de determinant.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal gelukt is en om te zien voor wie de resultaten gelden (beschrijving van de steekproef). Associatiematen zijn OR. Odds is de verhouding zieken ten opzichte van niet-zieken. Betekenis: er moeten x aantal mensen met een behandeling behandeld worden om één extra persoon beter te maken. RR is relatief risico en RV is risicoverschil. OR = (ziek/niet-ziek van cases)/(ziek/nietziek van controles). 3. RCT Nested case control Case control Retrospectief cohort onderzoek Transversaal cohort onderzoek Ecologisch onderzoek Een nested case control is een combinatie van een retrospectief en prospectief onderzoek. APE (cinical) is de attributieve proportie onder de geëxponeerden. Ecologisch onderzoek (gebruik maken van reeds bestaande data) kan zijn geografische correlatiestudie (vergelijke van twee gebieden) of tijdstrendstudie (vergelijken van twee tijdstippen in één regio). er een selectiebias is door uitval en dat het minder efficiënt is omdat er een grote populatie nodig is voor weinig ziekte. Het doel is te voorkomen dat betrokkenen de uitkomst kunnen beïnvloeden. Door middel van blindering kunnen deelnemers (onderzoekers en patiënten) niet weten wie in welke proef zit  placebo. NNT is number needed to treat. 1/RV. dus zeer efficiënt. (RexposedRunexposed)/Rexposed  1. Het voordeel is dat deze studie snel gedaan is. deze twee maten zijn alleen uit te rekenen als de cumulatieve incidentie beschikbaar is. APT (cmmunity) is voor de totale populatie. Hoe groter het RR. Frequentiematen zijn prevalentie. Door de blootstelling van determinant volledig weg te nemen kan het volle percentage APE verminderen. door verschillende groepen verschillende hoeveelheid determinant toe te dienen. 4.

Bij een scheve verdeling is de mediaan lager dan het gemiddelde en de modus het allerlaagst. meerdere mogelijkheden die wel eenduidig te rangschikken zijn Discreet: telvariabele (bijvoorbeeld hartslag).De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Beschrijvende statistiek Meetschalen: Categoriaal: weergave is numeriek (frequentietabel) of grafisch (staaf. het heeft namelijk al een betekenisvolle waarde. - Vertekening I: selectiebias en informatiebias Bij een normale verdeling is het gemiddelde hetzelfde als de mediaan en de modus.Stuvia. interpretatie is mogelijk zonder een label te geven. deze truc werkt bij iedere grondtal.of taartdiagram)  Dichotoom: twee mogelijkheden  Nominaal. eerste kwartiel is 25e en derde is 75e. Continu: elke mogelijke waarde tussen minimum en maximum. stem-and-leaf diagram (tabel en figuur in één).com . meerdere mogelijkheden die niet eenduidig te rangschikken zijn  Ordinaal. Checken op normaliteit: Gemiddelde en mediaan zijn gelijk. . Door middel van logtransformatie worden de hoge cijfers ver naar het midden getrokken. Om een scheve verdeling normaal te maken kun je door middel van een logtransformatie de getallen bewerken. Gemiddelde – 2xstandaarddeviatie is positief.1 = -1  10^-1 = 0. Bijvoorbeeld bloeddruk. histogram. boxplot. 10 log 0. Hoe hoger dit getal is.1 10 log 100 = 2  10^2 = 100 De 10 voor de log is het grondtal.box-and-wisker diagram (met kwartielen. hoe groter het effect. gewicht en lengte. boxplot) of normale verdeling (scheve verdeling met Log bewerken om normaal te maken). Met een plot (stem-and-leaf. in theorie dus een oneindig aantal decimalen. De samenvattende maten: o Gemiddelde o Mediaan o Modus o Variantie o Standaardafwijking o Kleinste-grootste waarde o Percentielen: mediaan is 50ste percentiel. normal-QQ) kan een normale verdeling gezien worden. het is dan ook “mooier” om hierbij een mediaan met interkwartielafstand te geven in plaats van een gemiddelde. samen het interkwartiel. Weergave in een histogram (geen ruimte tussen staven). De waarden zijn heel.

com . dit kan op verschillende manieren gebeuren: Recall: bij een case control studie kunnen personen de determinanten niet meer herinneren. behalve bij selectieve uitval (wanneer bijvoorbeeld patiënten die een placebo krijgen te veel pijn ervaren/geen pijnafname merken). Dichotome variabelen hebben de kans op verlies van informatie. want de selectie is gelijk) en differentiële selectie/selectiebias (dit is wel slecht). maar zijn anderzijds klinisch zeer duidelijk.Stuvia. maar zijn klinisch of praktisch soms lastig te interpreteren. Een selectie is alleen erg als het ongelijk is in beide groepen. Representativiteit versus selectie: 1. bij beschrijvende epidemiologie (hoe vaak iets voorkomt) wel. Bij verklarende epidemiologie (verbanden tussen determinanten en ziekte) is non differentiële selectie niet erg. Diagnostic suspicion bias: de effectbeoordelaar heeft al een vermoeden. houdt het pakket daarmee rekening?) Het is belangrijk om af te vragen wat de reden is voor het missen van een waarde. In een RCT is selectiebias gevaarlijk. Waar is de selectie? Is het in de blootstelling of in de uitkomst? 2. Misclassificatie: dichotome uitkomsten worden verkeerd verdeeld. dit kan leiden tot onderschatting. Verkeerd gekozen tijdsvenster: sommige ziekten hebben een lange incubatietijd. Een selectie is een onevenredige proportie van wel of niet blootgestelden / wel of niet zieken. vooral veroorzaakt door de selecties van controles. omdat het onderzoek niet (volledig) geblindeerd is. Een prospectief cohort onderzoek is niet erg gevoelig voor selectiebias. dit is alleen als er een betekenisvol afkappunt bestaat. Er is non differentiële selectie (waarbij het niet uit maakt. hierbij is het gevaar dat shift workers bij voorbaar al gezonder zijn en dus een selectie veroorzaken. Een case-control onderzoek is erg gevoelig voor de selectiebias. Is dit erg? Is er een verschil tussen de groepen? Een informatiebias ontstaat door meetfouten. . Continue variabelen hebben een goed onderscheidingsvermogen. Uitbijters/outliers zijn hele hoge of hele lage waarden. differentieel en non differentieel kan beiden leiden tot vertekening. Missing data: Tijdelijk of blijvend? (kan de waarde nog achterhaald worden?) Terecht of onterecht? (bijvoorbeeld zwangerschap bij mannen kan niet) Cave afgeleide variabele (hoog of laag: 0 of 1. De generaliseerbaarheid is in hoeverre onderzoeksresultaten ook toepasbaar zijn op andere populaties. Een non respondent bias ontstaat door een selectie weigeraars.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Bij een vermoeden van een verhouding die scheef naar rechts is. wanneer het onderzoek niet geblindeerd wordt gedaan. Bij het Healthy Worker Effect worden arbeiders en gewone burgers vergeleken. Bij compliance is men in de RCT niet therapietrouw. geeft een logtransformatie een rechte lijn.

De valkuil is dat de gouden standaard vaak niet goud is.7 (bij 1. . ook kan confounding door dezelfde factor nooit meer een rol spelen. Confounding is wanneer het gevonden effect ook wordt veroorzaakt door andere dingen.0 is het perfect).A x C) + (0. VW+ is de voorspellende waarde van een positieve uitslag. Bij effectmodificatie is het effect van de determinant op de uitkomst anders voor verschillende categorieën.com .% toevalsovereenstemming) De totaalovereenstemming is over het algemeen 100 %.B x D). Cohen’s kappa: reproduceerbaarheid houdt rekening met toevalsovereenstemming. Het percentage toevalsovereenkomst gezien vanuit beoordelaar 1 kan als volgt berekend worden: (0. Een meetfout door slechte reproduceerbaarheid is te verkleinen door herhaalde metingen.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Vertekening II: informatiebias. het is dus een correctie voor toeval. Deze is geassocieerd met de uitkomst en met de determinant. Criterium validiteit is de gouden standaard. in tegenstelling tot sensitiviteit en specificiteit.6 en 0. Deze voorspellende waarde is er ook voor VW-. Dit zijn geen stabiele waardes. te gebruiken bij het vergelijken van waardes van een nieuw ontwikkeld instrument. als: Beoordelaar 2 + Beoordelaar 1 + … … C … … D A B Bland-Altman plot: systematische en niet-systematische meetfouten kunnen uitgedrukt of onderscheden worden. De drempelwaarde van deze maten worden bepaald door de consequenties van de meting (denk aan de nek-plooimeting). de stippellijnen geven de verschillen van individuen aan (95 % van de gevallen ligt tussen deze lijnen  limits of agreement). Het afkappunt ligt meestal tussen de 0. Bij een goede validiteit is het gemiddelde van de metingen zoals het hoort te zijn. Deze plot kan alleen eenduidig geïnterpreteerd worden als de spreiding homogeen over de x-as is.Stuvia. dus het percentage positieve uitslagen die daadwerkelijk ziek zijn. een meetfout door slechte validiteit is blijvend. De potentiële confounder zit niet in het causale pad tussen de determinant en de ziekte. De dikke streep geeft het gemiddelde verschil aan (ligt rond de 0). Een gemiddeld verband zegt dus niets meer. Bij een goede reproduceerbaarheid liggen de metingen iedere keer dicht bij elkaar. Sensitiviteit (percentage terecht positieve testuitslagen onder zieke personen zieken) en specificiteit (percentage terecht negatieve testuitslagen onder de niet-zieke personen) worden gebruikt bij dichotome maten. confounding en effectmodificatie Bij informatiebias hebben validiteit en reproduceerbaarheid van de meting een centrale rol. Kappa = (% overeenstemming – % toevalsovereenstemming)/(% totaalovereenstemming .

! is bijvoorbeeld: 6*5*4*3*2*1 P of en n zijn parameters. .Stuvia. wanneer deze nagenoeg gelijk is. De totale oppervlakte onder de curve is 1. deze kansverdeling is te gebruiken bij dichotome variabelen. In een Venndiagram zijn de relaties tussen kansprocessen inzichtelijk gemaakt. De OR voor beide groepen moet dus uitgerekend worden. de kans is hierbij 0. P(x=d) = n * p * (1  p) .De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Wanneer je wil uitzoeken of de variabele een effectmodificator of confounder is kijk je eerst naar de effectmodificator. De x-as heeft een oneindig bereik. n is het aantal personen. of een dobbelsteen: (1/6).π)^(n-d) = productregel π is de kans in de hele populatie. de ruwe OR moet vergeleken worden met stratumspecifieke OR’s.Bij n personen is het aantal n! * ^d *(1.π)^(n-d) d!*(n  d )! n! = aantal volgordes d!*(n  d )! ^d *(1. ze zijn discreet. Bij een binomiale kansverdeling zijn de uitkomsten precies vast te stellen. Kansrekenen Bij statistiek wordt de uitkomst van onderzoek betrokken op de hele populatie. Continue uitkomsten zijn niet precies vast te stellen. Bij confounding is de ruwe OR niet gelijk aan de stratumspecifieke OR’s. maar een kansdichtheid die af te lezen is op de y-as. De somregel wordt gebruikt bij elkaar uitsluitende gebeurtenissen (signaalwoord: of) en productregel wordt gebruikt bij onafhankelijke gebeurtenissen (signaalwoord: en). Verwachtingswaarde (n*p) bij random steekproef van 100 mensen. Standaardafwijking: mogelijkheden 2^n. Een kans is het zelfde als een proportie van voorkomen van de uitkomst bij veel herhalen. Vervolgens wordt er uitgezocht of het een confounder is. d is het aantal successen. Deze verdeling geeft geen kans. dus de som van alle kansen is 1. P(ziek│symp) betekend: de voorwaardelijke kans op ziekte gegeven dat je symptomen vertoond. Dit leidt naar de complementregel: p(A)= 1-p(niet-A).com . Denk aan kop of munt. De confounder kan dus weggewerkt worden door een gestratificeerde analyse. Kansen liggen altijd tussen de 0 en 1.5. dan is het geen effectmodificator. De parameters zijn μ (mu) = gemiddelde en σ (sigma) = standaardafwijking. p is de kans. dan moet er dus gebruik gemaakt worden van een normale verdeling (Gausse verdeling).

deze zijn te verkrijgen door steekproeven.6 heeft Z-waarden en kansen. het betekend dat 97. De afspraak hierbij is dat wanneer p kleiner is dan α (vaak 0.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal De Z-verdeling is een standaard normaalverdeling. het statistisch significant is en de nulhypothese dus verworpen kan worden. E de SE verwachte waarde uit de nulhypothese en SE de standaardfout.x . Dit wordt getest aan de hand van statistische toetsen. Bij een tweezijdige kans p(│z│>0. x is nu μ (verwachtingswaarde) en Sgem. Waarden op de x-as kunnen uitgedrukt worden in Z-scores. De nieuwe formule voor het berekenen van Z-waarden bij steekproefgemiddeldes: gem. De spreiding van gemiddeldes zit dichter bij elkaar omdat de standaardafwijking door n wordt gedeeld.5 procent erna. Wanneer je de kans op een type I fout wilt verkleinen. Fouten: Werkelijkheid (onbekend) H0 onjuist 1-α α β 1-β H0 juist H0 niet verwerpen H0 wel verwerpen De kans dat H0 juist is. Het gemiddelde moet nul worden. Z0. De kans dat H0 ten onrechte niet . uitgedrukt in aantal standaarddeviaties.x is nu σ/ n (standaardfout). N staat voor het aantal mensen binnen de steekproef.com . ongeacht de oorspronkelijke verdeling (deze hoeft dus niet normaal te zijn). geldt dit voor ieder steekproefgemiddelde. We zijn er wel op uit om deze hypothese te verwerpen/falsificeren. Gem. De omschrijving naar Z-waarden is nodig om kansen te sdx kunnen berekenen. De verdeling wordt smaller naarmate n groter wordt.5) is twee keer de kans van een eenzijdige kans.05).Stuvia. De nulhypothese (H0) versus de alternatieve hypothese (H1 of Ha). X   . De nulhypothese is juist tot het tegendeel(H1) bewezen is. Binnen de gezondheidswetenschappen wordt altijd tweezijdig getoetst. Omgekeerd is een eenzijdige kans: tweezijdig/2. Tabel 3. Toetsen en schatten Extrapolatie naar doelpopulatie kan met de parameters μ en σ. Als de steekproefomvang/n groot genoeg is. maar wel wordt verworpen is α (dus 0. Voor negatieve getallen gelden dezelfde kansen. Waarbij O de geobserveerde waarde is.8 zijn tweezijdige kansen te vinden. Vervolgens moet deze waarde gedeeld worden door de standaarddeviatie. / n Een hypothese is een bewering over de “werkelijkheid”. Z-scores zijn de afstanden tot het gemiddelde. moet α verlaagd worden. In tabel 3. Dit is een type I fout. Toetsen gebeurd aan de hand van een toetsingsgrootheid die wordt berekend door: OE . Voor individuele observaties wordt de formule Z = x  gem. dit kan door van iedere x-waarde het gemiddelde af te trekken.5 procent ervoor ligt en 2. Het toetsen vindt plaats onder aanname dat h0 geldt.05). Per steekproef zullen deze waarden verschillen.975 is een percentiel. De gemiddelden en standaardafwijking van de steekproeven hebben ook weer een kansverdeling die bij benadering normaal verdeeld is. Een eenzijdige toets wordt sneller verworpen dan een tweezijdige toets.

Dus als n stijgt. Vooraf moeten er sample size berekeningen gedaan worden: hoe groot moet mijn steekproef zijn om een relevant verschil aan te kunnen tonen? Welk verschil wil ik aantonen? Welk type I fout accepteer ik daarbij? En welk type II fout accepteer ik? Er moet een keuze gemaakt worden over het aantal mensen dat meegenomen wordt in een steekproef. P-waarde berekenen. kan door α te vergroten. vanaf welke waarde ten opzichte van μ0 het verschil relevant is. Als de waarde van H0 niet in het betrouwbaarheidsinterval ligt. daalt Se (= σ/ n ) en stijgt de Z. X   . dit wil zeggen: wel of geen verschil bijvoorbeeld) en is heel eenduidig. De p-waarde is afhankelijk van de grootte van het verschil en van de populatiegrootte want: Z= gem.96. Mrv = minimaal relevant verschil. mag de nulhypothese wel verworpen worden. Het doel van statistiek is het kwantificeren van de onzekerheid rond het gevonden effect of verband. Een hypothese toetsen: 1. Bij 95% van (veel aantal) steekproeven ligt μ binnen n het betrouwbaarheidsinterval. Hoe zekerder je het wil weten. De Z-waarde maal de standaardfout geeft de linker en rechter grens. hoe groter de marge wordt.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal wordt verworpen is β.com .x Z1-α/2 *(σ/ n ) ± Z1-α/2 = het percentiel. Dus een grotere n zorgt voor een / n grotere Z. Power is het onderscheidingsvermogen. Wanneer deze erbuiten valt. 4. De kans op een type II fout verkleinen. De bijhorende Z-waarden moeten in tabel 3.8 opgezocht worden.Stuvia. De bijbehorende Z-waarde is 1.05 is een arbitraire grens. Wel of niet de nulhypothese verwerpen. . Toetsen leidt tot een kwalitatieve uitspraak.X*  . want het is tweezijdig. 2. het steekproefaantal/n (Se = σ/ n ) te vergroten of het werkelijke verschil van observatie. Het nadeel van een toets is dat het niets zegt over het effect of de sterkte van het verband en α=0. Als de waarde van μ0 binnen het betrouwbaarheidsinterval valt moet de nulhypothese niet verworpen worden. H0 en H1 formuleren. Er zijn ook andere betrouwbaarheidsintervallen mogelijk: 100*(1-α)%-BI voor μ: gem. kan de nulhypothese verworpen worden. 95%-betrouwbaarheidsinterval: μ: gem. Toetsingsgrootheid onder H0 berekenen. 3.

SE SEverschil .com . want deze gaat altijd goed. Deze waarde moet geschat worden. als: Variabele normaal verdeeld is Steekproefomvang groot genoeg is De normale verdeling kan gebruikt worden om verdeling te beschrijven van: Een verzameling waarnemingen Een toetsingsgrootheid (bijv. Een gemiddelde is geen goede maat. De vorm van de T-verdeling is afhankelijk van het aantal vrijheidsgraden (= n-1).Stuvia. transversaal. Bij het doen van een uitspraak over de populatie aan de hand van een steekproef is σ onbekend. SEM = sd/ n Geometrisch gemiddelde = e^(gem. maar hoger bij de uiteinden. De waarde van t moet opgezocht worden in een tabel waar de waarde van p te vinden is. Daarom kan een Z-verdeling niet gebruikt worden.96 *SEM Normale verdeling van steekproeven. Deze formule is terug te voeren op . ook wel degrees of freedom (df) genoemd. Hierbij kan t (=toetsingsgrootheid) uitgerekend worden. omdat de laatste waarde altijd door het gemiddelde vast ligt.05 en vervolgens wordt de nulhypothese wel of niet verworpen. Om te kunnen rekenen is het gemiddelde van alle verschillen ten opzichte van de standaardwaarde en de sd nodig. Bij een scheve verdeling naar rechts kan het beste een logtransformatie gebruikt worden. Een t-verdeling is ten opzichte van een Z-verdeling lager bij de top. T-toets: t= Xverschil  verschil OE . De σ kan dan nauwkeuriger geschat worden. maar bij een kleine steekproef is deze schatting niet zo goed. 1 meting  vergelijken met referentiewaarde. Er wordt 1 afgehaald. Deze p-waarde moet worden vergeleken met α = 0. De T-toets is hier de oplossing voor.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Centrale limietstelling: steekproefgemiddelden met een grote n zijn normaal verdeeld. na logtransformatie) 95% BI = gemiddelde ± 1. waarbij SE = sd/ n .: Z) Se = standard error Sem = standard error of the mean Schatten en toetsen bij continue uitkomstmaten deel I 1 groep. Hoe meer vrijheidsgraden. Hierdoor kunnen kansen uit de Z-verdeling gebruikt worden. hoe dichter de T-verdeling bij de Zverdeling komt. Bij een grote n is de T-verdeling hetzelfde als de Z-verdeling. anders zou je geen onderzoek hoeven te doen.

De waarde die vergeleken wordt met α is de kans dat gemiddelde verschil x is als de nulhypothese klopt. 2 is de waarde bij de t-toets voor 95%. 2 metingen  volgen in de tijd. De aannames hierbij zijn dat de toetsingsgrootheid normaal verdeeld is en de varianties van beide populaties gelijk zijn. is er een verschil? Toetsen: aan de hand van kansrekenen. Hoe groot is het verschil? Schatten: aan de hand van betrouwbaarheidsinterval. dus er moet gewerkt worden met de getallen die het dichtst in de buurt liggen. . 1 meting  onafhankelijke groepen vergelijken. 95%-BI = gemiddelde verandering ± 2 * standaardfout. kan de nulhypothese verworpen worden. deze wordt geschat met behulp van sd1 en sd2 uit de steekproeven. prospectie. In SPSS is dit af te lezen onder paired samples statistics. Deze tabel is helaas niet nauwkeurig. T= OE . tabel 3. Schatten en toetsen bij continue uitkomstmaten deel II 1 groep. De toetsingsgrootheid moet bij benadering normaal verdeeld zijn. Bij de juiste aantal vrijheidsgraden is de bijbehorende kans te vinden.1) * S2² (n1  1  n2  1) ( n1  1) * S1² = vrijheidsgraad*de variantie van groep 1.Stuvia.9 2 groepen. standaardfout = σ/ n .com . Met 95% zekerheid is het gemiddelde verschil tussen x1 en x2 voor iedereen in de doelpopulatie. ook hier moet het gemiddelde verschil berekend worden maar nu tussen beide waarnemingen. σ is onbekend. Schatten van σ: Sp = (n1  1) * S1²  (n2 . Deze methode is gelijk aan de t-toets voor verschil met standaardwaarde. Bij twee onafhankelijke (=verschillende) groepen. De nulhypothese is dat er geen verschil is tussen beide waarden.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal In tabel 3. Dus als 0 niet tussen beide waarden ligt. SE Hypothesen zijn dus op twee manieren te toetsen: Via betrouwbaarheidsinterval Via t-toets.9 zijn de vrijheidsgraden en bijbehorende waarden te vinden. case control.

9. het is wel mogelijk om hiermee te rekenen. 100*(1-α)%-BI voor μ1 tot μ2: (gem. Deze methode kun je gebruiken als het niet normaal verdeeld is. Bij een proportie kan een prevalentie en een cumulatieve incidentie worden berekend.Stuvia. dobbelstenen. Dit is de Wilcoxon-test. Schatten en toetsen bij dichotome uitkomstmaten (I) Eén proportie ten opzichte van een referentie maarde (1 groep-1 meting). moet je daarna wel weer terug transformeren.x ±t1-α/2. Sp * (1 / n1)  (1 / n 2) F-toets voor gelijkheid varianties: sdA ²/sdB². met de formule: P(r )  n! *  ^ r * (1   )^ (n  r ) r!(n  r )! . X 2  ( 1   2) . Tweezijdige kans: 2* eenzijdige kans. Hoeveel mogelijkheden op kleiner dan de som/totaal aantal mogelijkheden  eenzijdige kans. De toets is op basis van rangnummers.< ∑)=?. Hier komt de ratio voor geometrische gemiddeldes uit. H0: σA²/σB²=1.com .(n1+n2-2)df*Sp* (1 / n1)  (1 / n2) 100*(1-α)%-BI voor gemiddelde/gepaarde waarnemingen: gem. je kunt ook de getallen met een positief teken gebruiken. t-toets: t  gem. De kans op een type II fout is groot bij een kleine onderzoekspopulatie. de variantie ongelijk is of het een kleine steekproef betreft. Hierbij is H0 = 0. Je begint met het rangordenen van de verschillen van laag naar hoog. Wanneer een verdeling scheef naar links is kan je hier geen logtransformatie op uitvoeren. Met deze formule weegt de grotere groep zwaarder mee. maar geen BI. In SPSS is dit te zien onder Levene’s test voor gelijkheid varianties. verwachtingswaarde = n*p standaardafwijking = n * p * (1  p) Bij dichotome variabelen zijn kansen exact te berekenen. Wanneer je een logtransformatie hebt uitgevoerd om een scheve verdeling recht te maken.(n1+n2-2)df : opzoeken in tabel 3. Vervolgens maak je een som van de rangnummers van de getallen met een negatief tegen (W-). Dus een p kan uitgerekend worden. x1 – gem. P(W.(n-1)df * sd n t1-α/2. Deze formule is afgeleid van O-E/SE. de truc van Welsch of niet-parametrische methode.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Sp betekend pooled standard deviation (pooled=samengevat). x2) ± t1-α/2. kan worden getoetst met de exacte methode of een benadering. waarmee je exacte kansen kan uitrekenen. X 1  gem. Indien de varianties niet gelijk zijn: onderste regel van SPSS-output. De kansberekening werkt hierbij hetzelfde als bijv. Denk hierbij aan: log(A)-log(B)=log(A/B).

waarbij SE ( )  n SE SE ( ) P = proportie (hetzelfde als de kans). met SE ( p )  p (1  p ) . hoe symmetrischer de binomiale verdeling. Schatten aan de hand van RR. Bij een grote n kan dus een standaard normale verdeling gebruikt worden. moet de berekening uitgevoerd worden met de formule voor de exacte kans.96 * SE( p) . c en d: + a c b d 1 1 1 1    .96* SE(ln(RR)) . dan kan de normale verdeling gebruikt worden. Het bereik is (0. ∞). b.Stuvia. met de formule: Z  (1   ) O  E p  0  . Verklaring van a ab c cd + - totaal a+b c+d .1. Bij een kleine steekproef is het BI groot. Als de nulhypothese klopt is de steekproef RR scheef naar rechts verdeeld. SPSS gebruikt een soort Z-benadering bij n>25. Hoe groter de n. RR=1. RR heeft een lognormale benadering.05 (α). Deze normale verdeling kan gebruikt worden indien n*p ≥ 10 en n*(1-p) ≥ 10. Kwantificeren van onzekerheid rond het gevonden resultaat gaat dus door middel van een Zverdeling en door 95%-BI voor π: p  /  1. met SE(p1-p2)= var( p1)  var( p2) = p1(1  p) / n1  p2(1  p2) / n2 . Met een lognormale transformatie kan er gerekend worden: e^ ln(RR)  / . Als de placebo effectiever is. n Interpretatie hiervan is: 95% kans dat de proportie in de populatie tussen deze waarden ligt. Als de interventie effectiever is. Rr<1.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Wanneer een overschrijdingskans (minstens x) berekend moet worden. maar di is niet de standaard normale benadering. waarbij SE (ln( RR ))  a. RR>1 (nadert de x-as). RR: Wanneer er geen effect is. Interpretatie van p: de kans dat je een proportie (x) vindt in een steekproef van y-aantal mensen. Analyse van verschil in proporties tussen twee onafhankelijke groepen.com . In het boek “inleiding in de toegepaste biostatistiek staat 5”. Als de steekproef hier niet aan voldoet. Ook gebruikt SPSS altijd een eenzijdige toets. dan is de kans te klein om ervan uit te gaan dat de H0 klot  verwerpen van H0. RV: Betrouwbaarheidsinterval: RV ± Z(1-α/2)*SE(p1-p2). Wanneer deze kans kleiner is dan 0. als de werkelijke proportie z is. OR en RV en toetsen met de exacte methode of benadering.

b. die ook normaal te maken is met een natuurlijk logaritme. Ook de OR is scheef naar rechts verdeeld.Stuvia. Dit is beschrijvende epidemiologie.1. want er wordt gebruik gemaakt van proporties. c en d: + a c a+c b d b+d totaal a+b c+d N + totaal . het levert een nauwkeuriger BI op (smaller interval).96* SE(ln(OR)) . Een case-control studie werkt altijd met een OR. N!*a!*b!*c!*d! Verklaring van a. ∞).en rechtergrens ligt. deze geeft een exacte kans op een bepaalde uitkomst: P(combinatie)  (a  b)!*(a  c)!*(b  d )!*(c  d )! .De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Bovenstaande formule is een natuurlijk logaritme van RR. Toetsen is een verschil aantonen met behulp van een nulhypothese. e^ ln(OR)  / . OR heeft een bereik van (0. RR wordt gebruikt bij cohortonderzoek. Bij het toetsen van twee onafhankelijke groepen kan de Fisher’s exact test gebruikt worden. OR: Bij H0 is de odds ratio 1. 1 1 1 1    . 95%-BI voor RR: e^links – e^rechts (terug transformeren).com . Interpretatie: met 95% zekerheid kan je stellen dat de interventiegroep x tot y keer zo veel kans heeft om te herstellen in vergelijking tot de placebogroep. waarbij SE (ln( OR ))  95%-BI voor OR: e^links tot e^rechts. Parameters Populatie Gem. a b c d Interpretatie: met 95% zekerheid kunnen zeggen dat OR voor hele populatie tussen linker.x Sd p μ σ π Steekproef Schatten en toetsen bij dichotome uitkomstmaten (II) Schatten gaat over de sterkte van een verband in de hele populatie.

Voorwaarden: Deze toets is alleen met positieve waarden mogelijk Fexp ≥ 5 in 80% van de cellen Fexp ≥ 1 in alle cellen Deze toets is altijd tweezijdig en de waarden zijn terug te vinden in tabel 5. omdat daarmee alle verbanden vergeleken worden. b. Deze toets wordt gebruikt als men al een idee heeft van de richting (dus bijvoorbeeld hoe zwaarder de risicofactor. Hierbij kun je dus geen chi-kwadraattoets gebruiken. Een tweezijdige toets is bij kleine aantallen nu niet het dubbele van een eenzijdige. kan de rest berekend worden door waardes van elkaar af te trekken. E Onder H0 volgt x^2 een x^2-verdeling (deze is anders dan bijvoorbeeld de Z-verdeling). Als er geen verband is dan zal de proportie verbeterd en niet-verbeterd voor beide therapieën gelijk zijn: Fexp = p(verbetering aantal)*p(interventiepopulatie)*N.Chi is kwadraat van Zwaarde. . De 2XC-tabel kan gebruikt worden om dichotome en ordinale variabelen te toetsen. hoe zwaarder de aandoening). RR en fisher’s test weergegeven in tabellen. Bij een fisher’s exact test kan een Z-toets of chikwadraat toets worden gebruikt. SE ( p1  p 2) H 0 Vaker wordt de chi-kwadraat toets toegepast. Hoe meer vrijheidsgraden. want een binomiale verdeling is dan niet symmetrisch. c en d ongeveer dezelfde waarde hebben. Met (r-1)*(c1) aantal vrijheidsgraden. Je bent echter op zoek naar een lineaire trend. hoe minder stijl de grafiek wordt (hij wordt steeds symmetrischer). Deze toets heeft –in het geval van een lineair verbandmeer power dan een gewone chi-kwadraattoets. Wanneer deze waarden niet gelijk zijn.De p-waarde hangt af van de sterkte van het verband en de populatiegrootte. De Z-toets werkt met proporties. Dit is in feite het toepassen van de productregel voor tee onafhankelijke gebeurtenissen. De x2-toets voor trend heeft 1 vrijheidsgraad. Bij een 2x2-tabel heb je dus 1 vrijheidsgraad. waardoor de uitkomst van de breuk (=kans) kleiner wordt naarmate de verschillen groter worden. Bij SPSS worden OR.De Marktplaats voor het Kopen en Verkopen van je Studiemateriaal Als de nulhypothese klopt.Stuvia. zullen a. omdat er geen verschil is. de volgende formule wordt in de praktijk maar weinig gebruikt: Z ( p1  p 2)  0 . Dit is de som van de determinant +.com . Vervolgens moet het verschil tussen de geobserveerde waarde en de berekende verwachte waarde bekeken worden: x^2   (O  E )^2 . levert dit een groter getal onder de deelstreep op (want de faculteiten worden groter). r = rijen en c = kolommen. Na één waarde met deze formule uitgerekend te hebben.4.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->