Lineaire Discriminantanalyse, uitgelegd

Classificatie door discriminantanalyse
Lineaire en kwadratische discriminantanalyse
Wat is beter? LDA of QDA?
Best van twee werelden? Compromis tussen LDA & QDA
Berekening voor LDA

Classificatie door discriminantanalyse

Laten we eens zien hoe LDA kan worden afgeleid als een classificatiemethode onder supervisie. Beschouw een algemeen classificatieprobleem: Een willekeurige variabele X komt uit een van K klassen, met enkele klasse-specifieke waarschijnlijkheidsdichtheden f(x). Een discriminantregel probeert de dataruimte te verdelen in K disjuncte regio’s die alle klassen vertegenwoordigen (stel je de vakjes op een schaakbord voor). Met deze regio’s betekent classificatie door discriminantanalyse eenvoudigweg dat we x aan klasse j toewijzen als x in regio j ligt. De vraag is dan, hoe weten we in welke regio de gegevens x vallen? Uiteraard kunnen we twee toewijzingsregels volgen:

Maximale waarschijnlijkheidsregel: Als we aannemen dat elke klasse met evenveel waarschijnlijkheid kan voorkomen, wijzen we x toe aan klasse j als

Bayesiaanse regel: Als we de klasse-prioriteiten, π, kennen, dan x aan klasse j toewijzen als

Lineaire en kwadratische discriminantanalyse

Als we aannemen dat de gegevens afkomstig zijn van een multivariate Gaussische verdeling, d. w. z.d.w.z. dat de verdeling van X kan worden gekarakteriseerd door zijn gemiddelde (μ) en covariantie (Σ), kunnen expliciete vormen van de bovenstaande toewijzingsregels worden verkregen. Volgens de Bayesiaanse regel delen wij de gegevens x in klasse j in, indien zij van alle K klassen voor i = 1,…,K de hoogste waarschijnlijkheid heeft: