Anong z score ang itinuturing na outlier?
Anong z score ang itinuturing na outlier?

Video: Anong z score ang itinuturing na outlier?

Video: Anong z score ang itinuturing na outlier?
Video: Z-Scores, Standardization, and the Standard Normal Distribution (5.3) 2024, Mayo
Anonim

Anuman z - puntos mas malaki sa 3 o mas mababa sa -3is isinasaalang-alang upang maging isang outlier . Ang panuntunang ito ng hinlalaki ay nakabatay sa empirikal na tuntunin. Mula sa panuntunang ito makikita natin na halos lahat ng data (99.7%) ay dapat nasa loob ng tatlong karaniwang paglihis mula sa mean.

Kung isasaalang-alang ito, paano mo matutukoy ang isang outlier?

Isang puntong nasa labas ng panloob na fencesis ng data set na inuri bilang isang menor de edad outlier , habang ang isa na nasa labas ng mga panlabas na bakod ay inuri bilang isang major outlier . Upang mahanap ang mga panloob na bakod para sa iyong set ng data, una, i-multiply ang interquartile range sa 1.5. Pagkatapos, idagdag ang resulta sa Q3 at ibawas sa Q1.

Gayundin, ano ang panuntunan ni Tukey para sa mga outlier? Ang tuntunin ni Tukey sinasabi na ang outliers ang mga halaga ay higit sa 1.5 beses ang interquartile range mula sa mga quarter - alinman sa ibaba ng Q1 − 1.5IQR, o sa itaas ng Q3 +1.5IQR.

Bukod dito, ano ang itinuturing na outlier sa isang normal na distribusyon?

Anumang 2.72 standard deviations sa itaas ng Q3 o 2.72 belowQ1 ay inuri bilang isang outlier . Maaari mo ring sabihin ang lahat ng mga halaga na 3.4 karaniwang paglihis sa itaas o ibaba ng themedian/mean ay outliers . Kung nangyari ito, ang halaga ay hindi magiging isang outlier at magkakaroon ka ng bimodal pamamahagi ng mga halaga.

Ano ang tumutukoy sa isang outlier?

Outlier . Halimbawa, ang punto sa dulong kaliwa sa figure sa itaas ay isang outlier . Isang maginhawa kahulugan ng outlier ay isang punto na bumabagsak ng higit sa 1.5 beses sa hanay ng interquartile sa itaas ng ikatlong quartile o sa ibaba ng unang quartile. Mga outlier maaari ding mangyari kapag inihahambing ang mga ugnayan sa pagitan ng dalawang set ng data.

Inirerekumendang: