Niet-lineaire regressie definiëren
Niet-lineaire regressie is een vorm van regressieanalyse waarbij gegevens worden aangepast aan een model en vervolgens worden uitgedrukt als een wiskundige functie. Eenvoudige lineaire regressie relateert twee variabelen (X en Y) met een rechte lijn (y = mx + b), terwijl niet-lineaire regressie de twee variabelen relateert in een niet-lineaire (gebogen) relatie.
Het doel van het model is om de som van de kwadraten zo klein mogelijk te maken. De som van de kwadraten is een maat die bijhoudt hoe ver de Y-waarnemingen verschillen van de niet-lineaire (gebogen) functie die wordt gebruikt om Y te voorspellen.
Het wordt berekend door eerst het verschil te vinden tussen de aangepaste niet-lineaire functie en elk Y-punt van gegevens in de set. Vervolgens wordt elk van die verschillen in het kwadraat gemaakt. Ten slotte worden alle gekwadrateerde cijfers bij elkaar opgeteld. Hoe kleiner de som van deze kwadraten, hoe beter de functie past bij de datapunten in de set. Niet-lineaire regressie maakt gebruik van logaritmische functies, trigonometrische functies, exponentiële functies, machtsfuncties, Lorenz-curven, Gaussische functies en andere aanpasmethoden.
Belangrijkste leerpunten
- Zowel lineaire als niet-lineaire regressie voorspellen Y-reacties van een X-variabele (of variabelen).
- Niet-lineaire regressie is een gekromde functie van een X-variabele (of variabelen) die wordt gebruikt om een Y-variabele te voorspellen
- Niet-lineaire regressie kan een voorspelling van de bevolkingsgroei in de tijd laten zien.
Niet-lineaire regressiemodellering is vergelijkbaar met lineaire regressiemodellering in die zin dat beide proberen een bepaalde respons van een reeks variabelen grafisch te volgen. Niet-lineaire modellen zijn ingewikkelder dan lineaire modellen om te ontwikkelen, omdat de functie wordt gecreëerd door een reeks benaderingen (iteraties) die kunnen voortkomen uit vallen en opstaan. Wiskundigen gebruiken verschillende gevestigde methoden, zoals de Gauss-Newton-methode en de Levenberg-Marquardt-methode.
Regressiemodellen die op het eerste gezicht niet-lineair lijken, zijn vaak in feite lineair. De curveschattingsprocedure kan worden gebruikt om de aard van de functionele relaties die in uw gegevens spelen te identificeren, zodat u het juiste regressiemodel kunt kiezen, of het nu lineair of niet-lineair is. Lineaire regressiemodellen, hoewel ze doorgaans een rechte lijn vormen, kunnen ook krommen vormen, afhankelijk van de vorm van de lineaire regressievergelijking. Evenzo is het mogelijk om algebra te gebruiken om een niet-lineaire vergelijking te transformeren, zodat deze een lineaire vergelijking nabootst – een dergelijke niet-lineaire vergelijking wordt ‘intrinsiek lineair’ genoemd.
Lineaire regressie relateert twee variabelen met een rechte lijn; niet-lineaire regressie relateert de variabelen met behulp van een curve.
Voorbeeld van niet-lineaire regressie
Een voorbeeld van hoe niet-lineaire regressie kan worden gebruikt, is om de bevolkingsgroei in de tijd te voorspellen. Een spreidingsdiagram van veranderende bevolkingsgegevens in de loop van de tijd laat zien dat er een verband lijkt te bestaan tussen tijd en bevolkingsgroei, maar dat het een niet-lineaire relatie is, waarvoor het gebruik van een niet-lineair regressiemodel vereist is. Een logistiek bevolkingsgroeimodel kan schattingen geven van de bevolking voor perioden die niet zijn gemeten, en voorspellingen doen over toekomstige bevolkingsgroei.
Onafhankelijke en afhankelijke variabelen die bij niet-lineaire regressie worden gebruikt, moeten kwantitatief zijn. Categorische variabelen, zoals woongebied of religie, moeten worden gecodeerd als binaire variabelen of andere soorten kwantitatieve variabelen.
Om nauwkeurige resultaten te verkrijgen van het niet-lineaire regressiemodel, moet u ervoor zorgen dat de functie die u specificeert de relatie tussen de onafhankelijke en afhankelijke variabelen nauwkeurig beschrijft. Ook goede uitgangswaarden zijn noodzakelijk. Slechte beginwaarden kunnen resulteren in een model dat niet convergeert, of een oplossing die alleen lokaal optimaal is in plaats van globaal, zelfs als u de juiste functionele vorm voor het model heeft gespecificeerd.