13.6 C
Pristina
spot_img

The Art of Statistics (arti i statistikës) – David Spiegelhalter

Share:

Si ndërtohen algoritmet: Një eksperiment i bazuar në fundosjen e Titanikut

Është e mundur dhe madje e dobishme të mbështetemi në të dhëna nga e kaluara për të krijuar një algoritëm, i cili është është një formulë mekanike, i aftë të prodhojë automatikisht një përgjigje për secilin rast të ri që do të vijë, pa kërkuar ndërhyrjen njerëzore.

Ekzistojnë dy detyra të rezervuara për këto lloj algoritmash:

  • Klasifikimi: për shembull, identifikimi i pëlqimeve/mospëlqimeve të një përdoruesi në internet
  • Parashikimi: na tregoni se çfarë do të ndodhë, për shembull, motin e parashikuar për fundjavën

Krijimi dhe përdorimi i këtyre algoritmeve quhet gjithashtu analiza parashikuese dhe është thelbësore në fushën e inteligjencës artificiale, në të cilën algoritmet e futura në makineri i lejojnë të kryejnë aktivitete të rezervuara deri më tani për njerëzit, siç janë makinat që drejtojnë vetveten.

A mund të krijojmë një algoritëm që mund të parashikojë se cilët pasagjerë mund të mbijetojnë nga një fundosje e re e Titanikut?

Natën e 14-15 Prillit 1912, Titaniku u fundos në udhëtimin e saj të parë. Rreth 700 nga më shumë se 2200 persona në bord arritën të shpëtonin dhe studimet e kryera u përqëndruan në faktin se shanset për të mbijetuar në atë ngjarje ishin të lidhura me mundësinë për të hipur në një varkë shpëtimi, kështu që ata vareshin nga klasa të biletës.

Një algoritëm për të kuptuar nëse kjo është e vërtetë mund të duket i padobishëm, duke  qenë se ngjarja nuk ka mundësi të përsëritet, por unë e zhvillova atë sepse kam lindur dhe jam rritur në Ilfracombe, në veri të Devon, nga ku Francis William Somerton u largua me Titanikun për në Amerikë në kërkim të fatit, me një biletë 8 paund të klasës së tretë.

Ky është më shumë një klasifikim sesa një parashikim, pasi ngjarja tashmë ka ndodhur. Merren të gjitha të dhënat që kemi në dispozicion, ato të 1309 pasagjerëve: emri, titulli, gjinia, mosha, klasa e udhëtimit, çmimi i biletës, pavarësisht nëse ata ishin apo jo pjesë e një familjeje, ku hipën, për ata që është e mundur deri edhe numri i kabinës. Pastaj vendoset ndryshorja: 1 i/e mbijetuar, 0 i/e vdekur. Një grup prej 897 rastesh do të përbëjë grupin eksperimentues, 412 të tjerët do të jenë grupi i provës.

Rezultati është i qartë: kemi një përqindje më të lartë të të mbijetuarve pasagjerë që përputhen me këto karakteristika:

  • Udhëtojnë në klasin e parë
  • Janë gra apo fëmijë
  • I përkasin një familjeje të vogël (3/4 persona)
  • Kanë paguar shumë për biletën e tyre
  • Mbajnë titullin Zonjë, Zonjushë, Mjeshtër (Shef).

Mund ta analizojmë lehtë rezultatin e analizës sonë duke ndërtuar një klasifikim të pemëve, i cili është forma më e thjeshtë e algoritmit. Ky klasifikim përbëhet nga një seri pyetjesh me përgjigje të mbyllura, të llojit po ose jo. Bazuar në përgjigjen e dhënë, kemi ardhur në një pyetje tjetër. Duke lexuar përsëri të dhënat kemi që Francis, i nisur me titullin Lord, hyn në një “degë” të klasifikimit që çon në të dhënat e mbijetesës 16.

Algoritmi ynë i thjeshtë identifikon 2 grupe me më shumë se 50% shanse për të mbijetuar:

  • Gra dhe fëmijë në klasin e parë dhe të dytë, 93% mundësi për të mbijetuar;
  • Gra dhe fëmijë që u përkasin familjeve të mëdha, në klasin e tretë: 60% mbijetesë.

Duke zbatuar rregullat në grupin e kontrollit, besueshmëria e algoritmit testohet lehtë.

━ të ngjashme si kjo