Wanneer we het over modelvoorspelling hebben, is het belangrijk om voorspellingsfouten (bias en variantie) te begrijpen. Er is een wisselwerking tussen het vermogen van een model om de bias en de variantie te minimaliseren. Een goed begrip van deze fouten zou ons niet alleen helpen om nauwkeurige modellen te bouwen, maar ook om de fout van overfitting en underfitting te vermijden.
Dus laten we beginnen met de basisprincipes en zien hoe ze verschil maken voor onze machine learning-modellen.
Wat is bias?
Bias is het verschil tussen de gemiddelde voorspelling van ons model en de juiste waarde die we proberen te voorspellen. Een model met een hoge bias besteedt zeer weinig aandacht aan de trainingsgegevens en oversimplificeert het model. Het leidt altijd tot een hoge fout op de trainings- en testgegevens.
Wat is variantie?
Variantie is de variabiliteit van de modelvoorspelling voor een gegeven gegeven datapunt of een waarde die ons de spreiding van onze gegevens vertelt. Een model met een hoge variantie besteedt veel aandacht aan de trainingsgegevens en generaliseert niet op de gegevens die het nog niet eerder heeft gezien. Dergelijke modellen presteren dus zeer goed op de trainingsgegevens, maar hebben hoge foutenpercentages op de testgegevens.
Mathematisch
Laat de variabele die we proberen te voorspellen staan als Y en andere covariaten als X. We nemen aan dat er tussen die twee een verband bestaat dat
Y=f(X) + e
Waarbij e de foutterm is en die normaal verdeeld is met een gemiddelde van 0.
We maken een model f^(X) van f(X) met behulp van lineaire regressie of een andere modelleringstechniek.
Dus de verwachte kwadratische fout in een punt x is
De Err(x) kan verder worden ontleed als
Err(x) is de som van Bias², variantie en de onherleidbare fout.
Onherleidbare fout is de fout die niet kan worden verminderd door goede modellen te maken. Het is een maat voor de hoeveelheid ruis in onze gegevens. Hier is het belangrijk te begrijpen dat hoe goed we ons model ook maken, onze gegevens een bepaalde hoeveelheid ruis of onherleidbare fout zullen bevatten die niet kan worden verwijderd.
Bias en variantie met behulp van het bulls-eye diagram