k-vidurkių metodas

Vienas iš hierarchinių klasterinės analizės metodų trūkumų – skaičiavimams naudojama
atstumų matrica. Pavyzdžiui, jei yra 300 objektų, kuriuos norima suskirstyti į klasterius, atstumų
matricą sudaro 90 000 elementų. Skaičiavimai darosi labai komplikuoti. Tad dideliems objektų
masyvams klasterizuoti dažnai naudojami nehierarchiniai klasterizavimo metodai. Paprasčiausias jų k-vidurkių
metodas. Klasterizavimo procedūrą sudaro trys žingsniai:
1. Objektai skirstomi į k pradinių klasterių;
2. Paeiliui apskaičiuojamas kiekvieno objekto atstumas iki klasterių centro (atstumas
paprastai skaičiuojamas naudojantis Euklido atstumų matu arba jo kvadratu). Objektas skiriamas į
artimiausia klasterį. Klasterių centrai perskaičiuojami;
3. 2 žingsnis kartojamas tol, kol perskirstymų daugiau nėra.
Vienas iš k-vidurkių metodų trūkumų – klasterių skaičių reikia nustatyti iš anksto. Yra keletas
argumentų prieštaraujančių išankstiniam klasterių skaičiaus nustatymui:
1. Net jei iš tiesu žinoma, kad objektų populiacijoje yra k klasterių, tiriamojoje objektų
imtyje gali nepasitaikyti atstovų iš k-ojo klasterio;
2. Išskirtys gali sudaryti atskirą klasterį
3. Klasterinės analizės tikslas – egzistuojančių struktūrų paieška, tačiau, nurodant pradinį
klasterių skaičių, struktūra yra primetama.

Žymos:

Vienas atsakymas to “k-vidurkių metodas”

  1. anataskina Says:

    Šis algoritmas klasterizuoja objektus, suskaidydamas juos į k
    klasterių.
    Algoritmas pradedamas suskaidant stebinius į k pradinių klasterių. Tuomet apskaičiuojamas kiekvieno klasterio vidurkis ar randamas jo centras. Atliekamas naujas suskaidymas stebinius priskiriant artimiausiems centrams. Vėliau perskaičiuojami naujų klasterių centrai ir šie du žingsniai kartojami tol, kol stebiniai nebekeičia klasterių, t. y. centrai stabilizuojasi. Ne vieną kartą pastebėta, jog algoritmo iteracijų skaičius yra daug mažesnis nei klasterizuojamų objektų skaičius.

Parašykite komentarą

Įveskite savo duomenis žemiau arba prisijunkite per socialinį tinklą:

WordPress.com Logo

Jūs komentuojate naudodamiesi savo WordPress.com paskyra. Atsijungti /  Pakeisti )

Google photo

Jūs komentuojate naudodamiesi savo Google paskyra. Atsijungti /  Pakeisti )

Twitter picture

Jūs komentuojate naudodamiesi savo Twitter paskyra. Atsijungti /  Pakeisti )

Facebook photo

Jūs komentuojate naudodamiesi savo Facebook paskyra. Atsijungti /  Pakeisti )

Connecting to %s


%d bloggers like this: