Da li sažetak 5 brojeva uključuje vanjske vrijednosti?
Da li sažetak 5 brojeva uključuje vanjske vrijednosti?
Anonim

The Sažetak od pet brojeva je metoda za sumiranje distribucije podataka. The pet brojeva su minimalna, vrijednost prvog kvartila (Q1), medijana, vrijednost trećeg kvartila (Q3) i maksimum. Ovo se veoma razlikuje od ostalih podataka. To je an outlier i mora se ukloniti.

Što se toga tiče, od čega se sastoji sažetak od 5 brojeva?

Pet- broj sažetaka A pet - broj sažetak je posebno korisno u deskriptivnim analizama ili tokom preliminarnog istraživanja velikog skupa podataka. A sažetak se sastoji od pet vrijednosti: najekstremnije vrijednosti u skupu podataka (maksimalne i minimalne vrijednosti), donji i gornji kvartil i medijana.

Također, kako otkriti da li je novo zapažanje više od toga? Neke od najpopularnijih metoda za otkrivanje odstupanja su:

  1. Z-score ili analiza ekstremne vrijednosti (parametrijska)
  2. Vjerovatno i statističko modeliranje (parametarsko)
  3. Modeli linearne regresije (PCA, LMS)
  4. Modeli zasnovani na blizini (neparametarski)
  5. Modeli teorije informacija.

Ovdje, kako tumačite interkvartilni raspon?

Tumačenje rezultata: kvartili i interkvartilni raspon

  1. Percentili su korisni za davanje relativnog položaja pojedinca u grupi.
  2. Medijan je 50. percentil.
  3. Kvartili dijele podatke u četiri grupe, od kojih svaka sadrži jednak broj vrijednosti.
  4. Razlika između 75. i 25. percentila naziva se interkvartilni raspon.

Šta je pravilo 1,5 IQR?

Korištenje interkvartila Pravilo da biste pronašli outliers Pomnožite interkvartilni raspon ( IQR ) by 1.5 (konstanta koja se koristi za razlikovanje odstupanja). Dodati 1.5 x ( IQR ) do trećeg kvartila. Bilo koji broj veći od ovog je sumnjivi izlaz. Oduzmi 1.5 x ( IQR ) iz prvog kvartila. Bilo koji broj manji od ovog je sumnjivo odstupanje.

Preporučuje se: