Objektų panašumo matai

Panašumas – subjektyvus dalykas. Todėl net ir statistikoje, vertinant panašumą, labai daug
priklauso nuo matuojamų požymių tipo, nuo matavimo skalės ir nuo pasirinkto panašumo mato.
Dažniausiai naudojami panašumo matai yra trys:
1. Metriniai atstumo matai;
2. Koreliacijos koeficientai;
3. Asociatyvumo koeficientai.
Kai objektus charakterizuojantys požymiai matuojami pagal intervalų arba santykių skalę
(taip dažniausiai pasitaiko meteorologijoje) gali būti taikomi metriniai atstumo matai arba
koreliacijos koeficientai. Juos ir panagrinėsime plačiau.
Metriniai atstumo matai. Šiuos matus tiksliau būtų vadinti skirtingumo matais – kuo didesnė
reikšmė, tuo objektai mažiau panašūs.
Plačiausiai naudojami atstumai yra šie:
Euklido:

\left \|X-Y \right \|=\sqrt{\sum_{i=1}^{m}\left ( x_{i} -y_{i}\right )^{2}}
Pagrindinis metrinių atstumo matų trūkumas – nevienoda skirtingai matuojamų požymių įtaka.
Kintamieji, kurių sklaidos charakteristikos įgyja dideles reikšmes, gali nustelbti mažai įvairuojančių
kintamųjų įtaką. Pavyzdžiui, jei analizuojami požymiai yra kritulių kiekis ir oro temperatūra, tai be
abejo kritulių kiekio įtaka, dėl didesnės parametro sklaidos, bus žymiai didesnė. Todėl užuot
klasterizavus pačius kintamuosius, būtina naudoti jų standartizuotas reikšmes.
Koreliacijos koeficientai. Jau žinome, kad koreliacijos koeficientai naudojami kaip kintamųjų
panašumo matai. Kartais jais remiantis vertinamas objektų panašumas. Jei duomenys yra kiekybiniai,
objektų panašumui nustatyti galima naudoti elementarų tiesinės koreliacijos koeficientą. Jis
skaičiuojamas taip:

r_{xy}=\frac{\sum_{i=1}^{m}\left ( x_{i} -x\bar{}\right )\left ( y_{i}-y\bar{} \right )}{\sqrt{\sum_{i=1}^{m}\left ( x_{i} -x\bar{}\right)^{2}\sum_{i=1}^{m}\left ( y_{i} -y\bar{ }\right )^{2}}}

Čia: xi yra X objekto i-ojo požymio reikšmė, yj – Y objekto i-ojo požymio reikšmė, m –
matuojamų požymių skaičius.
Vis dėl to šis metodas neturi aiškios statistinė prasmės. Jei koreliacijos koeficientas –0,25, ar
galima teigti, kad objektai labai skiriasi? Be to jei vieno iš objektų kintamųjų reikšmės yra vienodos
(pvz., 5,5,5,5,5,), r skaičiuoti negalima.

Žymos:

4 atsakymai to “Objektų panašumo matai”

  1. staneikaite Says:

    Naudojama klasterinėje analizėje. Panašūs objektai priklauso tam pačiam klasteriui, nutolę objektai — skirtingiems klasteriams. Pavyzdžiui, valstybės gali būti suskirstytos į homogenines grupes pagal biudžeto ir ekonomikos rodiklius, turizmo rinka — pagal įvairius paklausos rodiklius.

  2. ksavera Says:

    Dar kartais naudojami tikimybiniai panašumo matai, bet plačiausiai taikomi metriniai atstumo matai ir koreliacijos koeficientai.

  3. nathalija Says:

    Taigi ėsmė tame, kad skirtumai klasterių viduje turi būti kuo mažesni, o skirtumai tarp pačių klasterių – kuo didesni.

  4. auzi22 Says:

    Taip. Tikrai taip. 🙂

Palikti atsakymą: staneikaite Atšaukti atsakymą