Cum să mint cu statisticile

După cum știe orice observator bun, statisticile pot fi foarte confuze dacă nu aveți cunoștințe anterioare pentru interpretarea lor. Citiți pașii următori pentru a afla cum să înțelegeți statisticile înșelătoare și complicate și folosiți aceste cunoștințe ca avantaj.

pași

Metoda 1
Situată cu medii

Imaginea intitulată Lie with Statistics Step 1
1
Înțelegeți terminologia. Cuvântul "medie" este larg utilizat atunci când se discută datele statistice. La prima vedere, termenul sună destul de simplu: media este suma care cade mai mult sau mai puțin în mijloc. Cu toate acestea, există de fapt diferite tipuri de medii, toate acestea putând duce la erori dacă nu sunt înțelese în mod corespunzător.
  • media aritmetică se obține prin suma tuturor numerelor într-un set de date și diviziunea dintre numărul de elemente din acesta. Cu alte cuvinte, dacă aveți numerele 3, 3, 5, 4 și 7, media aritmetică poate fi realizată prin adăugarea lor (pentru 22) și împărțirea sumei de 5 (așa cum sunt 5 numere din set).
  • În acest exemplu, media aritmetică este de 4,4.
  • mediană este numărul dintr-un set de date care se află între numerele cele mai scăzute și cele mai înalte. Folosind aceleași date ca și înainte (3, 3, 5, 4 și 7), valoarea mediană este de 4, din moment ce 2 dintre numere sunt mai mici și 2 sunt mai mari.
  • modă este o reprezentare a celui mai comun număr din set. Folosind același exemplu, moda este de 3, deoarece apare de două ori.
  • Imaginea intitulată Lie with Statistics Step 2
    2
    Situată cu ciorapi aritmetici. Media aritmetică ar putea părea ca cea mai infailibilă din toate metodele descrise mai sus, dar acest lucru nu este adevărat. Acest lucru se datorează faptului că numerele anormal de mari sau scăzute din setul de date pot varia considerabil de la media. Pentru a pune la dispoziție o medie aritmetică, colectați datele periferice și folosiți-le în ecuație.
  • De exemplu, imaginați-vă că studiați 50 de gospodării dintr-un cartier cu privire la venitul acestora. Majoritatea familiilor câștigă între 40.000 și 60.000 de dolari pe an, dar unul dintre ocupanții unei case câștigă 5 milioane de dolari pe an. La calculul mediei aritmetice, numărul va fi semnificativ mai mare decât media venitului "real" în această zonă, deoarece suma de 5 milioane de dolari este mult mai mare decât celelalte.
  • În mod similar, dacă ați avut date care arată că 9 persoane au avut fiecare 1.000 $ în conturile lor bancare, dar numai o singură persoană a zecea are $ 1 media aritmetică a $ 900.10 va fi aproape 10% mai mică decât cantitatea mai mult comună.
  • Cercetările reputate declanșează adesea numere foarte mari și foarte scăzute înainte de calcularea mediei aritmetice. Cu toate acestea, nu toate sondajele care se văd în știri se bucură de o bună reputație. Dacă tu nu ai acces la setul de date sau dacă vezi o garanție scrisă că s-au eliminat valorile extreme, este cel mai sigur să presupunem că nu au fost eliminate.
  • Imaginea intitulată Lie with Statistics Step 3
    3
    Cu medii Mediana este, în realitate, cel mai dificil număr cu care se poate "minți", deoarece nu poate fi niciodată prea mare sau prea scăzut în comparație cu cele mai multe seturi de date. Trebuie să fie în centru. Cu toate acestea, puteți utiliza mediana pentru a ascunde un număr foarte mare sau mic. De exemplu, dacă elementele setului sunt 1, 1, 2, 3, 4, 5, 3000, media este de 3.
  • Când aveți același număr de elemente, puteți obține mediana dacă veți găsi media celor două intrări în centru. Acest lucru nu este încă în considerare pentru valori excepționale.
  • Fii atent cu mediile care sunt folosite pentru a descrie modificările în ultimul moment. O companie care ridică prețul serviciilor cu 3% în fiecare an ar putea să-i majoreze cu 20% anul acesta și să o ascundă cu o prezentare de 3% în medie în ultimii 9 ani.
  • Image cu titlul Lie cu statistici Pasul 4
    4
    Mănâncă cu modă. În anumite cazuri, este aproape imposibil să minți cu moda. De exemplu, numărul mediu de bilete achiziționate pe persoană pentru un joc cu bile va fi aproape întotdeauna corect reflectat de modă. Cu toate acestea, moda poate exclude și date importante, în special în seturi mai mici.
  • De exemplu, dacă aveți un set de toate numerele 1-100, dar numărul 1 este inclus de 3 ori 1 este media stabilit la modă, chiar dacă media (și, în acest caz, mai rezonabil ) este mult mai aproape de 50.
  • Orice sondaj care estimează o scară largă poate fi manipulat pentru a accentua moda. Dacă faceți sondaj de 100 de persoane pe o scară de la 1 la 10 despre opinia lor despre un subiect și cu mai multe persoane care se califică " 10 " decât cu orice alt număr, chiar dacă numai o altă persoană a dat un rating de 10 în loc de 1, apoi 10 este modă.
  • Image cu titlul Lie with Statistics Pasul 5
    5
    Situată cu numere reprezentative. Dacă aveți date definite de numere abstracte, mai degrabă decât numere specifice (de exemplu, un studiu de satisfacție a clientului) este sperietor ușor să mintă cu acel set. Dacă vă cere oamenilor pentru a evalua satisfacția lor pe o scară de la 1 la 3, care nu dovedește neapărat că clienții care au ales 3 sunt de trei ori mai fericiți decât cei care au ales să 1. Acest lucru este folosit pentru a devia media aritmetică în în special, dar poate fi aplicată și la mediană și, uneori, la modă.
  • Metoda 2
    Situată cu seturi de date

    Imaginea intitulată Lie with Statistics Step 6
    1
    Utilizați un set mic Orice expert în statistici știe că singura modalitate de a aborda o medie utilă sau de a detecta o tendință reală este de a colecta date din cel mai larg set posibil. Dacă puteți obține informații de la 100 de persoane, este bine - 10.000 sunt chiar mai bune. Cu cât mai multe date pe care le puneți în set, cu atât sunt mai exacte să obțineți medii corecte. Folosind un set de, să zicem, 3 sau 5 date, puteți obține rezultate care nu reflectă cu acuratețe starea de lucruri.
    • De exemplu, dacă ați găsit doi oameni care au fost recent răniți de ceva prostesc, ca o pernă, și de a folosi ca o parte din setul de date, puteți argumenta că pernele sunt categoric periculoase pentru toată lumea. Indiferent de media pe care decideți să o afișați, atâta timp cât nu arată că dimensiunea eșantionului este de numai 2 persoane, nu există nicio modalitate clară de a respinge reclamația dvs.
  • Imaginea intitulată
    2
    Utilizați un set controlat Seturile de date cele mai exacte nu sunt doar mari, ci și largi. Un geolog care studiază tipurile de minerale dintr-un deșert va avea o listă mai precisă dacă colectează multe mostre din toate părțile desertului, în loc să colecteze 1000 de probe din același loc. Dacă limitați domeniul de aplicare al setului de date, acest lucru poate influența semnificativ rezultatele.
  • Uneori, este util și realizat cu intenție. Oamenii care efectuează cercetări folosind date demografice, de exemplu, ar dori să știe în mod specific despre tipurile de locuri de muncă pe care bărbații le au în mod obișnuit și, prin urmare, ar putea să-și descopere numai bărbații. Deși acest lucru este clar exprimat în date, nu este nimic întunecat în legătură cu acesta.
  • În special, datele provenite din proiecte mici de cercetare universitară tind să fie utilizate în mod abuziv pentru a echivala un set de date controlat, cu un rezultat general. Acest lucru se datorează faptului că multe dintre proiectele de cercetare de la nivel universitar nu au suficient timp sau resurse pentru a utiliza în mod aleatoriu un eșantion mare de cetățeni obișnuiți și, în schimb, să se bazeze numai pe studenții universitari. Din nou, este bine, atâta timp cât aceste informații sunt clar stabilite, deși organizațiile de știri, în căutarea unor titluri senzaționale, au ascuns adesea detaliile unui mic studiu universitar pentru a face să pară mult mai generale.


  • Image cu titlul Lie with Statistics Step 8
    3
    Utilizați un set de neechilibrată. Această tehnică este foarte inteligentă, din moment ce puteți minți cu un detaliu oferit spectatorului. Trucul aici este de a folosi date care nu pot fi comparate corect și sunt tratate ca și cum ar fi în condiții egale. De exemplu, dacă aveți un oraș de 100.000, care a câștigat 10 000 de locuitori în 10 ani, și să compare cu o populație de 10, care a câștigat 10 rezidenți mai mult în ultimii 10 ani, procentele de fiecare creștere par să arate că micul oraș a crescut mult mai repede.
  • Uneori, oamenii care analizează datele de piață folosesc acest lucru pentru a prezenta o imagine înșelătoare a cifrelor de vânzări. Să presupunem că urmăriți vânzările de mere și portocale, dar în mijlocul studiului nu mai este portocaliu, deoarece există o lipsă. Dacă veți continua să comparați datele pentru restul studiului, va exista o creștere importantă a vânzărilor de mere în legătură cu vânzările de portocale, deși mereul nu devine mai popular.
  • Metoda 3
    Situată cu grafică

    Imaginea intitulată Minciuna cu statisticile Pasul 9
    1
    Lăsați axa Y necompletată. Nu există o imagine mai clară pentru date decât un grafic sau un tabel, dar chiar și acestea pot fi manipulate subtil pentru a da diferite efecte. Acest lucru se datorează faptului că oamenii tind să se uite la formele și dimensiunile din grafică înainte de a deranja verificarea detaliilor numerice conectate la ele. Cea mai ușoară modalitate de a manipula axa Y nu este să o etichetați.
    • Dacă aveți un set de 5 bare pe axa X, dar nu există niciun indicator despre cât de înalt este în raport cu alții, nu există nicio modalitate de a măsura dacă există sau nu o diferență semnificativă între ele.
  • Image cu titlul Lie cu statistici Pasul 10
    2
    Utilizați numere foarte mari sau mici pe axa Y. Spune Setul de date variază între 1 și 50. Pentru a ascunde diferențele, măsoară axa Y în trepte de 100- pentru a accentua în mod deliberat măsoară axa Y în trepte de câte 1/10 zecimi. O diferență între 3 și 10 pare enorm atunci când este măsurată în zecimi (sunteți în afară de 70 de unitati!), Dar este greu de observat pe un grafic în cazul în care 100 este prima crestere (Este mult, mult mai puțin retrasă decât unitatea 1! ).
  • Imaginea intitulată Lie cu statistici Pasul 11
    3
    Porniți axa Y la jumătatea intervalului. Dacă datele variază de la 11 la 51, puteți face numărul inferior să pară chiar mai mic și numărul mai mare ar arăta chiar mai mare, marcând axa Y astfel încât să pornească de la 10. Aceasta face ca bara care reprezintă numărul 11 ​​este cu puțin mai mare decât axa X. Va apărea ca aproape nimic dacă cineva nu este suficient de inteligent pentru a arăta foarte aproape și pentru a vedea că graficul a început de la 10 în loc de 0.
  • Bara care reprezintă 51 este de 50 de ori mai mare decât bara care reprezintă 11 pe un grafic de acest tip, deoarece bara cea mai mică este de numai 1 unitate. Dacă graficul ar fi început la 0, bara reprezentând 51 ar fi fost mai mică de 5 ori înălțimea barei care reprezintă 11.
  • Image cu titlul Lie with Statistics Step 12
    4
    Utilizați scara inadecvată. De fiecare dată când vezi cuvintele " nu este la scară " În imprimarea fină, este probabil că ați întâlnit un exemplu de acest lucru. Nu este întotdeauna făcută cu răutate, uneori numerele implicate sunt atât de diferite încât nu există nicio modalitate de a le reprezenta cu acuratețe pe aceeași pagină. Cu toate acestea, acesta poate fi utilizat cu ușurință în scopuri nedorite.
  • De exemplu, o reprezentare vizuală a mărimii ar putea fi desenată pe o scală înălțime, dar nu pe o scară largă, ceea ce face ca un obiect mai mare (de exemplu, o clădire) să pară și mai subțire sau mai larg decât este într-adevăr .
  • Imaginea intitulată Lie cu statistici Pasul 13
    5
    Folosiți grafice pentru a omite datele. Acest lucru este frecvent observat în anchetele generale care împart rezultatele în anumite categorii, cum ar fi celebrul grafic care arată care este cel mai popular termen pentru o băutură răcoritoare într-un anumit județ din Statele Unite. La prima vedere, aceste informații par foarte detaliate, dar în curând apar întrebări: cât de largi sunt datele sondajului? Care este pragul pentru a determina rezultatul? Este folosit media, mediana sau moda?
  • Dacă doriți să utilizați numai unul dintre rezultatele din toate zonele pe care le-ați intervievat și ați renunțat la orice altceva, puteți controla cu ușurință rezultatele pe zone, fără a dezvălui faptul că dimensiunea eșantionului pentru fiecare domeniu a fost foarte mică. Încă o dată, lipsa informațiilor concrete este ceea ce face rezultatele atât de dificil de cuantificat.
  • sfaturi

    • În caz de îndoială, verificați. Dacă nu puteți obține informații detaliate și complete despre dimensiunea, sfera de aplicare și metodele de eșantionare în spatele unei statistici, nu aveți încredere în ea.

    avertismente

    • Este destul de ușor să stai cu statisticile odată ce știi cum, dar nu e chiar etic. Fii atent în folosirea cunoștințelor pe care le-ai câștigat. Nu o utilizați pentru a răni, a înșelă sau pentru a înșel pe cineva.
    Distribuiți pe rețelele sociale:

    înrudit
    Cum se calculează mediile în ExcelCum se calculează mediile în Excel
    Cum se scrie un program în Java pentru a calcula mediaCum se scrie un program în Java pentru a calcula media
    Cum să redirecționați materiale media de pe PC pe PS3 cu PlayStation Media ServerCum să redirecționați materiale media de pe PC pe PS3 cu PlayStation Media Server
    Cum se imprimă Biblioteca mea media în Windows Media PlayerCum se imprimă Biblioteca mea media în Windows Media Player
    Cum de a alege numerele pentru loterieCum de a alege numerele pentru loterie
    Cum se citesc statisticile de baseballCum se citesc statisticile de baseball
    Cum se calculează intervalul de încredereCum se calculează intervalul de încredere
    Cum se calculează media ponderatăCum se calculează media ponderată
    Cum se calculează procentajul de golireCum se calculează procentajul de golire
    Cum se calculează media, deviația standard și eroarea standardCum se calculează media, deviația standard și eroarea standard
    » » Cum să mint cu statisticile

    © 2011—2020 ertare.com