13.6 C
Pristina
spot_img

The Art of Statistics (arti i statistikës) – David Spiegelhalter

Share:

Kalimi nga të dhënat në mostër padyshim, kërkon që të dhënat të jenë të vlefshme. Si u bënë pyetjet? Një sondazh i kryer nga Ryanair në 2017 mbeti famëkeq. Rezultati tha që 92% e udhëtarëve ishin të kënaqur me përvojën e fluturimit. Sa keq që përgjigjet e mundshme në pyetësor ishin: të shkëlqyera, shumë të mira, të mira, ok.

George Gallup, i konsideruar shpikësi i sondazhit të opinionit në 1930, tha: “Nëse po gatuani një tenxhere me supë, nuk keni nevojë ta hani të gjithën për të ditur nëse nuk ka kripë. Mund të shijoni një lugë, duke kontrolluar që keni dhënë një trazim të mirë. Gjithçka qendron tek trazimi i mirë’’.

Në vitin 1969, kur erdhi puna për të vendosur burrat që do të dërgoheshin në Vietnam në një listë të renditur, ditët e vitit ishin tërhequr për ta renditur listën në mënyrë të drejtë. Megjithatë, kapsulat që përmbajnë kartat e muajit nuk u trazuan dhe siç tregon një video, për arsye se personi i ngarkuar për nxjerrjen po peshkonte nga sipërfaqja, burrat e lindur në dhjetor, kapsulat e ditëlindjes së të cilëve ishin vendosur në vazo për të fundit përfunduan në disavantazh. Në krye të listës përfunduan 26 data në muajin dhjetor përkundrejt 14 në muajin janar.”

Për ta zgjeruar, përgjithësuar informacionin nga kampioni te popullata, duhet të jeni i sigurt që mostra është përfaqësuese.

Vendet skandinave janë një parajsë për epidemiologët. Njerëzit kanë një numër identiteti të përbashkët për gjithçka që lidhet me marrëdhëniet me shtetin, kështu që të gjitha informacionet në lidhje me shëndetin e tyre, arsimin dhe taksat e tyre janë të lidhura ngushtë dhe lejojnë të bëhen analiza që duken të pamundura në krahasim me ato të qytetarëve të vendeve të tjera.

Për shembull, u krye një studim i 18 milion suedezëve, të dhënat e taksave dhe shëndetit të të cilëve ishin të lidhura. Ky zbuloi se burrat me status më të mirë socio-ekonomik kanë më shumë gjasa që të diagnostikohen me kancer të trurit. Kjo u shfaq në tituj në gazeta, por në të vërtetë, me një inspektim më të thelluar doli se burrat me status më të mirë socio-ekonomik kishin më shumë kujdes për shëndetin e tyre, kështu që kanceret  zbuloheshin dhe më tej regjistroheshin.

Paragjykimi i ndërgjegjësimit është një paragjykim sistematik në matjen e frekuencës së vërtetë të një fenomeni për shkak të mënyrës së mbledhjes së të dhënave.

Korrelacioni nënkupton shumë të dhëna krejtësisht të pavarura priren të ndryshojnë së bashku, madje ekziston një faqe në internet humoristike që luan duke përputhur rritjen e konsumit të mozarelës me numrin e studentëve të diplomuar për inxhinieri në Shtetet e Bashkuara.

Apofenia përcaktohet si njohja e modeleve ose lidhjeve në të dhëna të rastësishme ose të pakuptimta. Termi u shpik në 1958 nga Klaus Conrad, i cili e përcaktoi atë si një “vizion të pamotivuar të lidhjeve” i shoqëruar nga një “rëndësi anormale”.

Mekanizmi i kauzalitetit është vështirë të përcaktohet statistikisht, pasi është e nevojshme të organizohen eksperimente shumë të organizuara (të rastësishme) nga pikëpamja e zgjedhjes së mostrës, të mostrave të kontrollit, të strukturës. Sidomos kur bëhet fjalë për hetime mjekësore, parimi i “punës në errësirë” është thelbësor, dmth me subjekte që nuk janë të vetëdijshme për qëllimin e hetimit. Është e rëndësishme të vëzhgohen marrëdhëniet midis ekspozimit dhe rezultatit për të verifikuar ekzistencën e bashkë faktorëve që mund të shtrembërojnë këto të fundit.

━ të ngjashme si kjo