Může mi někdo říct, jaký je rozdíl mezi klasifikací k-znamená a svm?


Odpověď 1:

Jedna třída problémů vás požádá o nalezení rozdělení pravděpodobnosti vzhledem k datům. Další třída vás požádá, abyste zjistili, které z několika distribucí (často dvou) má v daném bodě vyšší hodnotu. V tomto druhém případě nemusíte najít distribuce sami.

K-znamená zvláštní případ EM algoritmu a patří do první z výše uvedených tříd. Nepřímo se snažíte najít jedinou distribuci.

SVM patří do druhé třídy. Máte dvě sady bodů (řekněme, červená a modrá) a cílem je pro každý daný bod v prostoru, kde vaše data žijí, aby zjistil, který typ (červený nebo modrý) je v tomto bodě pravděpodobnější.


Odpověď 2:

K-znamená algoritmus shlukování, nikoli klasifikační metodu. Na druhé straně SVM je klasifikační metoda. Klastrování provádíme, když nemáme popisky tříd, a klasifikace provádíme, když máme popisky tříd. Clustering je technika učení bez dozoru a klasifikace je technika učení pod dohledem. Srovnáváním obou je tedy srovnání jablek a pomerančů. Měli byste si přečíst následující, abyste pochopili jejich rozdíl - odpověď Shehroz Khan na Je učení pod dohledem běžně prováděno po shlukování? (Přečtěte si také odkazy v této odpovědi)