Talaan ng mga Nilalaman:

Ano ang multivariate outlier?
Ano ang multivariate outlier?

Video: Ano ang multivariate outlier?

Video: Ano ang multivariate outlier?
Video: Univariate, Bivariate and Multivariate Analysis 2024, Mayo
Anonim

A multivariate outlier ay isang kumbinasyon ng mga hindi pangkaraniwang marka sa hindi bababa sa dalawang variable. Parehong uri ng outliers maaaring makaimpluwensya sa kinalabasan ng mga istatistikal na pagsusuri. Mga outlier umiiral sa apat na dahilan. Ang maling pagpasok ng data ay maaaring maging sanhi ng data na maglaman ng matinding mga kaso.

Katulad nito, itinatanong, paano mo nakikilala ang mga bivariate outlier?

Isa paraan upang suriin kung ganito" bivariate outlier " ay upang suriin ang mga nalalabi ng mga kaso sa pagsusuri. Upang gawin ito, makuha namin ang bivariate formula ng regression, ilapat ito pabalik sa bawat kaso na kumukuha ng y', at pagkatapos ay kalkulahin ang natitirang bilang y-y'. Sa totoo lang, gagawin ito ng SPSS para sa atin sa loob ng isang regression run.

Maaari ring magtanong, ano ang pagkakaiba sa pagitan ng Multivariate at univariate? Univariate at multivariate kumakatawan sa dalawang diskarte sa pagsusuri sa istatistika. Univariate nagsasangkot ng pagsusuri ng isang variable habang multivariate sinusuri ng pagsusuri ang dalawa o higit pang mga variable. Karamihan multivariate Ang pagsusuri ay nagsasangkot ng dependent variable at maramihang independent variable.

Kung isasaalang-alang ito, ano ang iba't ibang uri ng mga outlier?

Ang tatlong magkakaibang uri ng outlier

  • Uri 1: Mga Global Outlier (tinatawag ding "Mga Anomalya sa Punto"):
  • Pandaigdigang Anomalya:
  • Type 2: Contextual (Conditional) Outlier:
  • Anomalya sa Konteksto: Ang mga halaga ay wala sa normal na pandaigdigang hanay, ngunit abnormal kumpara sa pana-panahong pattern.
  • Uri 3: Mga Kolektibong Outlier:

Paano mo nakikilala ang mga multivariate outlier?

Mga multivariate na outlier maaaring matukoy sa paggamit ng distansya ng Mahalanobis, na kung saan ay ang distansya ng isang punto ng data mula sa kinakalkula na sentroid ng iba pang mga kaso kung saan ang centroid ay kinakalkula bilang intersection ng mean ng mga variable na sinusuri.

Inirerekumendang: