Adherence, korelace, kauzalita…
Vyšlo v časopise:
Čas. čes. lék., 97, 2025, č. 10, s. 13-15
Ludwig Bolzmann, jenž zasvětil většinu svého života studiu statistické mechaniky, zemřel v roce 1906 vlastní rukou. Paul Ehrenfest, pokračuje v jeho práci, zemřel podobným způsobem v roce 1933. Teď je řada na nás, abychom studovali statistickou mechaniku. Nejspíš bude moudré přistoupit k tématu opatrně.
To jsou (v mém skromném překladu) pravděpodobně historicky nejslavnější úvodní slova první kapitoly napříč všemi vysokoškolskými učebnicemi. Již nejméně dekádu kolují jako internetový meme. Napsal je David L. Goodstein na začátek své přelomové učebnice z roku 1975 Stavy hmoty (States of Matter) na začátek Kapitoly I: Termodynamika a statistická mechanika. Pokud chcete proniknout do tajů moderního pojetí stavových veličin, je tato učebnice stále povinnou četbou, na kterou nakonec odkazují i modernější koncepty.
Cítím potřebu zmínit, že sám Goodstein zemřel krátce po svých 85. narozeninách v dubnu 2024 a podle všeho z přirozených příčin. Nicméně varovná (až výhružná) slova na úvod devadesátistránkové kapitoly bleskově čtenáře zasvěcující do statistického pojetí modelů hmoty nejsou bezpředmětná. Už jen proniknutí do kinetické teorie ideálního plynu – první koncept, na kterém učebnice (jako většina oboru) staví – je opravdu procesem náročným na psychiku. Začínáte relativně jednoduchou představou hmotných bodů (koulí s nulovým průměrem a nenulovou hmotností), které se všechny stejnou rychlostí pohybují v nádobě (např. duté kouli o průměru 1 m) naprosto náhodně všemi směry. Když se srazí, tak dokonale elasticky (energie obou částic zůstane zachována, jen změní směr úměrně úhlu srážky).
Z této jednoduché a relativně snadno pochopitelné představy malými logickými kroky budujete veličiny jako tlak (počet nárazů na stěnu nádoby), teplotu (rychlost pohybu hmotných bodů), entropii (pravděpodobnost výskytu částic v určitém výseku nádoby), a tak dále. Objevujete matematický, ale zejména statistický aparát po krocích, které průkopníci této fyziky – zmíněný Bolzmann a James Clerk Maxwell – museli vyvinout takřka jen ze svých představ, aby se jim příslušné problémy dařilo řešit. Fascinující je, že na konci vší té statistiky dojdete ke vztahům, které ve své fenomenologické podobě byly známy již sto let před zmíněnými giganty – empiricky a experimentálně. Například k stavové rovnici ideálního plynu. Tedy čistě na základě abstraktních úvah docílíte výsledku, který je ověřitelně hmatatelný.
Není divu, že u tohoto poznání zažívá vnímavý člověk nejeden psychický otřes – od obdivu hraničícího s náboženským vytržením po sebepochyby a pocit prázdnoty. A to mluvím jen z pohledu studenta. Těžko říci, co se muselo odehrávat v duši těch, kteří tyto výpočty průkopnicky tvořili, jako byl Bolzmann či Ehrenfest.
Především to ale ukazuje, že se lidský mozek zdá povážlivě nevybaven na vnímání statistiky jako matematického oboru. Úvahové zkratky a kognitivní biasy, které tvoří většinu toho, co nazýváme intuice, nás tváří v tvář výpočtům a exaktním číslům opakovaně zrazují. A odsuzují nás k unáhleným a nesprávným závěrům. Jakkoli se tomu jako lidé generací X, Y, Z snažíme vzpírat, stále máme mozek postavený na včasný únik před šavlozubým tygrem, nikoli na řešení Maxwell-Bolzmannova rozdělení.
Naše omezení se ovšem netýkají jen vysoké statistiky. I statistika, kterou by oba zmínění pánové nejspíš považovali za nudně banální, dokáže s naším vnímáním zacvičit. A člověk nemusí být jen nevzdělaný prosťáček, aby se chytil. Velmi často se to stává i uznávaným vědcům a nepochybným kapacitám v oboru. A to je mnohem větší problém, než se zdá. V současné době je to totiž právě statistika, která přináší většinu vědeckých výsledků (respektive jejich hodnocení). A nejen to, na základě statistik je činěno vše; od úředního rozhodování (např. bezpečných dávek rizikových látek v životním prostředí) až po rozhodování vysoce politické. Jinak řečeno: pasti, které nám naše mysl staví na cestě k pochopení informace poskytnuté statistikou, občas sklapnou i u těch nejlepších z nejlepších.
Okřídleným učebnicovým příkladem matoucí statistiky je tvrzení, že 50 % světových válek začalo v důsledku atentátu na habsburského následníka trůnu. To je jistě pravdivá statistika (počítáme-li mezi světové války jen ty, které měly slovo „světová“ v názvu). Nikoho (příčetného) však nenapadne, že bychom riziko další světové války snížili na polovinu, pokud bychom jako oko v hlavě střežili současného habsburského následníka, rakouského ex-europoslance Karla Habsbursko-Lotrinského. Každého logicky napadne, že vzorek je v tomto případě velmi malý a tvrzení, byť formálně správné, je poněkud zavádějící.
Co ale tvrzení, že 80 % viníků smrtelných autonehod mělo v den události k snídani teplý nápoj obsahující kofein (čaj, kávu)? Mohlo by takové tvrzení naznačovat, že konzumace kofeinu vede (minimálně při řízení) k rizikovějšímu chování? Abych nikoho nevyděsil, rovnou přiznávám, že tuto statistiku jsem si (na rozdíl od té předchozí) pro potřeby článku zcela vymyslel. Berme ji ale na chvilku pro další diskusi jako platnou. 80 % jsou čtyři z pěti (hle, hned to číslo působí ještě sugestivněji, že – inu intuice). Dejme tomu, že to číslo bylo získáno v ČR na tragických autonehodách v průběhu jednoho roku. Těch bývá v ČR každoročně okolo 500. Bylo by tedy v tom případě možné, že se jedná o nějakou souvislost?
Dobrá, vzdávám to. Vzdělané publikum čtenářů tohoto časopisu těmito lacinými manipulacemi asi nezviklám. Možná se to číslo nekritickým pohledem zdá vysoké, nicméně mezi dospělými lidmi (z nichž se řidiči rekrutují) je zvyk ranní kávy či čaje také poměrně častý. Bez dalších údajů je taková statistika bezcenná. Inu přidejme údaj, že v populaci nad 18 let pije k snídani nějaký kofeinový nápoj 60 % lidí. Tedy kofeinisté jsou mezi nešťastnými viníky silničních tragédií jednoznačně tzv. nadreprezentováni.
Co teď? Máme spěchat doporučovat těm, kteří rozhodují, aby byl kofein za volantem zakázán?
Popsaný statistický vztah se nazývá adherence. Nějaká sledovaná veličina statisticky „přilne“ k veličině jiné. V tomto případě tedy pravděpodobnost způsobení tragické dopravní nehody a záliba v ranní dávce kofeinu. Vypadá to přesvědčivěji než izolované číslo. A objeví-li se v nějakém zkoumání statistická adherence, je to znamení, že by měl být tento problém dál vyšetřován. Nicméně z přítomnosti adherence jako takové ještě nemohou být činěny žádné závěry. Adherence může být dílem náhody. I když ale náhodnou fluktuaci dat vyloučíme, příčiny adherence mohou být nesčetné. Kupříkladu výběrová chyba.
Data o tom, co měli viníci tragických nehod k snídani, se nejspíš dozvíme tak, že se jich zeptáme. Logicky bude složité zeptat se té části viníků, kteří byli zároveň i obětí jimi způsobené autonehody. Část „respondentů“ je proto ze souboru přirozeně vyloučených. Ale i přeživší viníci – zvlášť, když se jich ptáme s časovým odstupem – si nemusí přesně vzpomínat na snídani pravděpodobně nejhoršího dne jejich života. Častěji tedy přesnou informaci dostaneme buď od těch, kteří mají zavedený snídaňový rituál (jehož součástí káva či čaj bývá), nebo od těch, pro něž byla snídaně toho dne nějak významná (např. tak, že si pochutnali na dobré kávě). V tuto chvíli bychom byli v situaci, kdy jsme si onu adherenci dost možná „vyrobili“ samotným návrhem výzkumu. Respektive nejsme schopni tento „artefakt“ (výstup výzkumu získaný samotnou výzkumnou metodou) odlišit od přirozené souvislosti.
Pokud bychom chtěli náš případ adherence náležitě vyšetřit, museli bychom např. zavést povinné krevní testy pro všechny viníky autonehod a v krevních vzorcích sledovat např. plazmatickou hladinu kofeinu. Nebo podávat čaj, kávu nebo dokonce nitrožilní kofein reprezentativnímu vzorku zdravých dobrovolníků a nechat je pod různými dávkami řídit dopravní trenažer (experimenty ve skutečném provozu by nejspíš etická komise neschválila) a vyhodnocovat, jak často se dostávali do nebezpečných situací a jak dobře (bezpečně) je řešili. Pakliže by v těchto následných studiích vyšla nějaká závislost hladiny kofeinu v krvi na pravděpodobnosti nehody (či nebezpečnosti řízení), mohli bychom mluvit o korelaci.
Jak zní ovšem známá poučka statistiků, korelace stále ještě neznamená kauzalitu. A to platí i pro korelaci takto jednoznačně oddělenou od adherence. Spoustu dat totiž nemáme šanci obdržet ve tvaru, ve kterém jsme dostatečně dobře schopni odlišit adherenci a korelaci, pak – jak to je se vším ve statistice – poněkud kontraintuitivně nazýváme korelací jakýkoli vztah dvou (nebo více) veličin. Nicméně i v případě, že máme v ruce jednoznačnou pravou korelaci, je činění závěrů předčasné. Korelaci, na rozdíl od adherence, lze zpravidla matematicky kvantifikovat. Existují různé druhy korelačních koeficientů, jež nám různými způsoby sdělí, jak moc pravděpodobné je, že pozorovaná závislost dvou (či několika) veličin může být náhodná.
Avšak ani v případě, že je náhoda tak málo pravděpodobná, že se takřka nemůže jednat o náhodu, nemáme vyhráno. Přítomnost korelace totiž nikdy neodliší veličinu nezávislou (příčinu) od veličiny závislé (následku). Klasickým příkladem je vztah nespavosti a užívání marihuany u středoškolských a vysokoškolských studentů. Od roku 2000 dodnes opakovaně vychází práce, které u obou populací nacházejí poměrně jasný vztah. Uživatelé marihuany, zvláště tedy z řad studentstva, velmi často mívají problémy se spánkem, spí v průměru méně hodin a méně kvalitně. Těch výsledků je tolik, že je – ze statistického hlediska – lze jen velmi těžko popřít. Problém ovšem je, co je v tomto případě příčinou a co následkem. Téma je i po čtvrt století velmi kontroverzní, avšak existují velmi dobré argumenty i pro poněkud kontraintuitivní interpretaci, že příčinou je ve skutečnosti nespavost. Například v kulturách, kde ani mezi studenty není užívání marihuany běžné a/nebo dostupné (typicky na univerzitách v Íránu) je problém nespavosti studentstva přes jeho veškerou populaci takřka stejný jako na marihuanou provoněných kolejích v Evropě či USA. Proti tomu ovšem stojí argument, že je docela možné, že data jsou ovlivněna velmi restriktivním vztahem oněch kultur (a mnohdy i vládnoucích režimů) k drogám obecně a tím i ochotou tamních studentů se k užívání přiznávat. Inu, abychom od korelace došli ke kauzalitě (vztahu příčin a následků) je zpravidla potřeba celá baterie statistických šetření a analýz, nezřídka podpořených teoretickými argumenty ze zkoumaného oboru. A někdy ani tak nedospějeme k jednoznačným závěrům.
Jak vidno, v hlubinách statistiky je i pro rutinérského profesionála poměrně snadné se ztratit. O to větší výzvy nám tento všestranně užitečný obor připravuje, stanou-li se statistiky předmětem komunikace politiků s veřejností. O až neobyčejně instruktivní příklad se nedávno na jedné tiskové konferenci postaral nejspíš nejmocnější člověk světa – americký prezident Donald Trump.
Velmi zjednodušeně lze říci, že na jaře tohoto roku (spíš několik týdnů než měsíců od své inaugurace) ohlásil americký ministr zdravotnictví Robert F. Kennedy jr., že se dostal k „překvapivým“ výsledkům ohledně autismu a oznámí je v září. Většina jeho kritiků měla takřka okamžitě jasno, že chce opakovat svůj dlouho držený názor, že je autismus způsobován vakcínami, a chce použít sílu své exekutivní funkce, aby tomuto názoru dodal patřičnou váhu (a dost možná i podpis nějakého uznávaného odborníka).
Září téměř uplynulo, aniž by avizované oznámení zaznělo. To přirozeně jen posílilo sbor především Kennedyho kritiků, kteří jej chtěli hnát k zodpovědnosti za nesplněný slib. Podle všeho proto, aby svému politickému spojenci pomohl, uvolil se sám americký prezident svolat tiskovou konferenci, na které hodlal „zjištění administrativy o autismu“ s novináři diskutovat. K překvapení doslova všech nebyl hlavním výstupem tohoto veřejného oznámení vztah autismu a vakcín. Přestože zmíněn byl, americký prezident jen opakoval slova o „podezření“ a nutnosti „prošetření“.
Americe a celému světu však oznámil něco jiného. Autismus je podle něj spojen s užíváním paracetamolu během těhotenství!
Na obranu vůdce svobodného světa je nutné poznamenat, že – pro mnohé možná překvapivě – toto tvrzení zdaleka nebylo postaveno na vodě. Prezidentská kancelář a posléze americké ministerstvo zdravotnictví promptně dodalo několik relevantních vědeckých publikací, které měly prezidentova slova potvrdit. Tou nejvýznamnější a důkazně nejsilnější je studie v prestižním JAMA Psychiatry (2020; 77 : 180-9), kde se užívání paracetamolu v těhotenství opravdu jeví jako spojené s projevy autismu.
Konkrétně se jednalo o studii 996 zhruba desetiletých dětí z nichž 257 (25,8 %) mělo diagnostikováno ADHD, 66 autismus, 42 jak autismus, tak ADHD a 304 „ostatní vývojové vady“, což dává 327 zcela zdravých. U všech těchto dětí byla jejich archivovaná pupečníková krevní plazma odebraná při porodu a krevní plazma jejich matek odebraná po jídle tři dny po porodu zpětně analyzována na přítomnost metabolitů acetaminofenu (paracetamolu). Použita byla nejspíš velmi citlivá metoda (která v článku není zmíněna), neboť byla přítomnost metabolitů nalezena u všech. Jednotlivé výsledky byly rozděleny do tercilů (první tercil – nejmenší přítomnost metabolitů, třetí – nevyšší) a proti řazení do tercilů byla sledována četnost uvedených diagnóz.
Například pro nějakou formu autismu byl detekován třetí tercil koncentrace nemetabolizovaného acetaminofenu u poloviny sledovaných (33 ze 66), což je oproti vývojově zdravým dětem (83 z 327, cca 25 %) zhruba dvojnásobná četnost. Podobné výsledky byly sledovány i u ADHD a kombinace obou poruch. Co myslíte – adherence, korelace či kauzalita?
Dle mého adherence. Navíc komplikovaná. U dvou sledovaných metabolitů (acetaminofen-glukuronid a acetylcystein-S-yl-acetaminofen) se jeví výsledky složitější (např. nepřítomnost metabolitů je u některých poruch četnější než vysoká přítomnost). To svědčí o tom, že byl nejspíš sledován hlavně paracetamol podaný perinatálně, což evokuje hypotézu, že větší vliv na přítomnost poruch má možná přítomnost bolestí u porodu (jež byly paracetamolem např. tlumeny), než by byl vliv samotných látek.
Rigoróznosti celé práce navíc nepřispívá, že byly poruchy kategorizovány v celé své šíři. Lze tedy předpokládat, že mírná forma Aspergerova syndromu (v dnešní době takřka plně kompenzovatelná neurodivergence) spadla do stejné kategorie jako těžký Kannerův autismus (spojený zpravidla s neschopností komunikace, efektivní sociální interakce a sníženým intelektem). Ani si nelze nevšimnout, že je statistický soubor koncipován tak, že jsou v něm neurovývojové poruchy značně nadreprezentovány oproti běžné populaci, což zvyšuje riziko nějaké skryté (z hlediska autorů jistě mimoděčné) výběrové chyby.
Přes všechny kritiky je citovaná práce samozřejmě zajímavým a validním výsledkem. A pozorováním, které je rozhodně hodno dalšího zkoumání.
Přináší však poznání, které by měli hlásat politici z pódia jako fakt? Odpovězme si raději každý sám.
Daniel Cvejn
Štítky
Farmacie Farmakologie Farmaceutický asistentČlánek vyšel v časopise
Časopis českých lékárníků
2025 Číslo 10
- Ukažte mi, jak kašlete, a já vám řeknu, co vám je
- Psilocybin a neurodegenerace: Kam míří současný výzkum?
Nejčtenější v tomto čísle
- Osvědčení k výkonu lékárenské praxe
- interaktivní dispenzační semináře
- Editorial
- Hubnu, hubneš, hubneme
Zvyšte si kvalifikaci online z pohodlí domova
Současné možnosti léčby obezity
nový kurzVšechny kurzy