25 juni 2021 1:33

T Distributiedefinitie

Wat is een T-distributie?

De T-verdeling, ook wel bekend als de Student-t-verdeling, is een soort kansverdeling die vergelijkbaar is met de normale verdeling met zijn belvorm, maar heeft zwaardere staarten. T-verdelingen hebben een grotere kans op extreme waarden dan normale verdelingen, vandaar de dikkere staarten.

Belangrijkste leerpunten

  • De T-verdeling is een continue kansverdeling van de z-score wanneer de geschatte standaarddeviatie wordt gebruikt in de noemer in plaats van de echte standaarddeviatie.
  • De T-verdeling is, net als de normale verdeling, klokvormig en symmetrisch, maar heeft zwaardere staarten, wat betekent dat het de neiging heeft om waarden te produceren die ver van het gemiddelde liggen.
  • T-tests worden in statistieken gebruikt om de significantie in te schatten.

Wat zegt een T-distributie u? 

Zwaarte van de staart wordt bepaald door een parameter van de T-verdeling die vrijheidsgraden wordt genoemd, waarbij kleinere waarden zwaardere staarten geven en met hogere waarden de T-verdeling lijkt op een standaard normale verdeling met een gemiddelde van 0 en een standaarddeviatie van 1. De T-distributie wordt ook wel “Student’s T-distributie” genoemd.

Wanneer een steekproef van n waarnemingen wordt genomen uit een normaal verdeelde populatie met gemiddelde M en standaarddeviatie D, zullen het steekproefgemiddelde, m, en de steekproefstandaarddeviatie, d, verschillen van M en D vanwege de willekeurigheid van de steekproef.

Een z-score kan worden berekend met de standaarddeviatie van de populatie als Z = (x – M) / D, en deze waarde heeft de normale verdeling met gemiddelde 0 en standaarddeviatie 1. Maar bij gebruik van de geschatte standaarddeviatie, een t-score wordt berekend als T = (m – M) / {d / sqrt (n)}, het verschil tussen d en D maakt de verdeling een T-verdeling met (n – 1) vrijheidsgraden in plaats van de normale verdeling met gemiddelde 0 en standaarddeviatie 1. 

Voorbeeld van het gebruik van een T-distributie

Neem het volgende voorbeeld voor hoe t-distributies worden gebruikt in statistische analyse. Onthoud allereerst dat een betrouwbaarheidsinterval voor het gemiddelde een reeks waarden is, berekend op basis van de gegevens, bedoeld om een ​​”populatiegemiddelde” vast te leggen. Dit interval is m + – t * d / sqrt (n), waarbij t een kritische waarde is uit de T-verdeling.

Een betrouwbaarheidsinterval van 95% voor het gemiddelde rendement van de Dow Jones Industrial Average in de 27 handelsdagen voorafgaand aan 9/11/2001 is bijvoorbeeld -0,33%, (+/- 2,055) * 1,07 / sqrt (27), wat een (aanhoudend) gemiddeld rendement oplevert als een getal tussen -0,75% en + 0,09%. Het getal 2.055, het aantal standaardfouten waarmee moet worden gecorrigeerd, wordt gevonden in de T-verdeling.

Omdat de T-verdeling dikkere staarten heeft dan een normale verdeling, kan deze worden gebruikt als een model voor financiële rendementen die excessieve kurtosis vertonen, wat in dergelijke gevallen een meer realistische berekening van Value at Risk ( VaR ) mogelijk maakt.

Het verschil tussen een T-distributie en een normale distributie 

Normale verdelingen worden gebruikt wanneer wordt aangenomen dat de populatieverdeling normaal is. De T-verdeling is vergelijkbaar met de normale verdeling, alleen met dikkere staarten. Beiden gaan uit van een normaal verdeelde populatie. T-distributies hebben een hogere kurtosis dan normale distributies. De kans om waarden te krijgen die ver van het gemiddelde liggen, is groter bij een T-verdeling dan bij een normale verdeling.

Beperkingen bij het gebruik van een T-distributie 

De T-verdeling kan de nauwkeurigheid scheeftrekken ten opzichte van de normale verdeling. Zijn tekortkoming doet zich alleen voor wanneer er behoefte is aan perfecte normaliteit. Het verschil tussen het gebruik van een normale en een T-verdeling is echter relatief klein.