Paano kinakalkula ang ibig sabihin ng K?
Paano kinakalkula ang ibig sabihin ng K?

Video: Paano kinakalkula ang ibig sabihin ng K?

Video: Paano kinakalkula ang ibig sabihin ng K?
Video: Hirap Makadumi: 6 Simpleng Lunas - Payo ni Doc Willie Ong #1179 2024, Mayo
Anonim

K - ibig sabihin Clustering

Pumili k mga puntos nang random bilang mga sentro ng kumpol. Magtalaga ng mga bagay sa kanilang pinakamalapit na cluster center ayon sa Euclidean distance function. Kalkulahin ang sentroid o ibig sabihin ng lahat ng bagay sa bawat kumpol. Ulitin ang mga hakbang 2, 3 at 4 hanggang sa ang parehong mga puntos ay itinalaga sa bawat cluster sa magkakasunod na round.

Dito, ano ang ibig sabihin ng K sa K?

K - ibig sabihin ang clustering ay isa sa pinakasimple at sikat na unsupervised machine learning algorithm. Sa madaling salita, ang K - ibig sabihin kinikilala ng algorithm k bilang ng mga centroid, at pagkatapos ay inilalaan ang bawat punto ng data sa pinakamalapit na cluster, habang pinapanatili ang mga centroid bilang maliit hangga't maaari.

Gayundin, ang paraan ba ng paghahanap ng halaga ng K para sa K ay nangangahulugan ng clustering? Basically walang ganyan paraan na maaaring eksaktong matukoy ang halaga ng k . Mayroong iba't ibang mga pamamaraan na sinusunod upang makuha ang eksaktong halaga ng k . Ang ibig sabihin distansya sa pagitan ng data point at ng kumpol ay isang pinakamahalaga salik na maaaring matukoy ang halaga ng k at ito paraan ay karaniwang ihambing.

Kaya lang, paano gumagana ang K ibig sabihin ng algorithm?

Ang k - nangangahulugan ng clustering algorithm sinusubukang hatiin ang isang hindi kilalang data set (isang set na walang impormasyon tungkol sa pagkakakilanlan ng klase) sa isang nakapirming numero ( k ) ng mga kumpol. Sa una k pinipili ang bilang ng tinatawag na mga sentroid. Ang bawat sentroid ay pagkatapos noon ay nakatakda sa aritmetika ibig sabihin ng kumpol na tinukoy nito.

Bakit ibig sabihin ng K?

Ang K - ibig sabihin Ang clustering algorithm ay ginagamit upang maghanap ng mga pangkat na hindi tahasang na-label sa data. Magagamit ito upang kumpirmahin ang mga pagpapalagay ng negosyo tungkol sa kung anong mga uri ng mga pangkat ang umiiral o upang tukuyin ang mga hindi kilalang grupo sa mga kumplikadong set ng data.

Inirerekumendang: