Statistische modellen en data-analyse

Uit Wina Examenwiki
Versie door Vincent (overleg | bijdragen) op 18 jan 2007 om 14:05 (New page: == Inleiding == Dit is geschreven op basis van 1 observatie, dus het betrouwbaarheidsinterval is nogal ruim :). Met name ben ik er niet zeker van of volgende jaren dezelfde prof (J. Beirla...)
(wijz) ← Oudere versie | Huidige versie (wijz) | Nieuwere versie → (wijz)
Naar navigatie springen Naar zoeken springen

Inleiding

Dit is geschreven op basis van 1 observatie, dus het betrouwbaarheidsinterval is nogal ruim :). Met name ben ik er niet zeker van of volgende jaren dezelfde prof (J. Beirlandt) dit vak zal geven. Het examen is schriftelijk en open boek. Je krijgt 4 uur de tijd. De vragen hebben nogal veel uitleg en zijn vrij algemeen. Er wordt nadruk gelegd op veel details geven, het goed uitleggen, ...

2006-2007: 18/01/07

Vragen zijn zo'n beetje uit de losse pols geformuleerd hier.

Vraag 1

Hoe kunnen we homoscedasticiteit tegenover heteroscedasticiteit testen in het univariate ANOVA model? Geef formules en uitleg voor de teststatistiek, de verdeling onder nulhypothese en de p-waarde. Waarom is de teststatistiek zinvol? Wat betekent ze?


Vraag 2

In de bedrijfswereld gebruikt men dikwijls een afwikkelingsdriehoek om de kosten van een ongeval op lange termijn (meestal 10 jaar) weer te geven. Men is dan ook geïnteresseerd in voorspellingen over wat er de volgende jaren te betalen valt. (hier moet nog een voorbeeldje van zo'n tabelding komen met wat uitleg)

  1. Stel dat we een regressie willen doen volgens het algemeen lineair model met logYi,j=αi+βilogj+γi. Hoe bouwen we dit concreet op?
  2. Op de nevendiagonalen staan telkens de waarden van wat er in 1 kalenderjaar betaald wordt, bvb, de getallen Y1,3,Y2,2 en Y3,1 zijn betaald in het jaar 3. Stel nu dat we een simpele lineaire regressie willen doen die Fout bij het parsen (syntactische fout): {\displaystyle \log{Y_{i,j}} in functie van het kalenderjaar geeft. Hoe bouwen we dit model op?
  3. Bepaal met behulp van het model uit de vorige oefening een schatting voor de som van de betalingen in het jaar T+1.

Vraag 3

  1. Als we een steekproef van n nemen die we voorstellen door Y1,...,Yn van Y=(Y1,...,Yn), hoe kunnen we dan grafisch verifiëren of dit uit een multivariate normale verdeling komt?
  2. Zie figuur (ze komt, ze komt, ze komt). Dit is een univariate normale kwantielplot van een eerste principaalcomponent. Welke van onderstaande uitspraken is juist? Verantwoord.
    1. De staarten van de verdeling van de Mahalanobisafstanden zijn zwaarder dan die van een χ2-verdeling.
    2. De verdeling is elliptisch en de staarten van de verdeling van de Mahalanobisafstanden zijn zwaarder dan die van een χ2-verdeling.
    3. De staarten van de verdeling van de Mahalanobisafstanden zijn lichter dan die van een χ2-verdeling.
    4. De verdeling is elliptisch en de staarten van de verdeling van de Mahalanobisafstanden zijn lichter dan die van een χ2-verdeling.

Vraag 4

Voor n personen werd een assertiviteitsmeting gedaan na 2 behandelingen. X1 is de score voor behandeling, X2 en X3 na de eerste en de tweede behandeling. De personen werden willekeurig in 2 groepen van grootte n1 en n2 ingedeeld.

  1. Geef de datastructuur die in een statistisch programma gebruikt zou worden als model.
  2. Hoe testen we of er een significante stijging is van X1 rightarrowX2 en/of X2 rightarrowX3? Bekijk alleen groep 1. Geef in detail de test, betrouwbaarheidsintervallen, het statistische model en hoe de p-waarde berekend wordt.
  3. Hoe testen we of de verschillen tussen X1 rightarrowX2 en X2 rightarrowX3 TESAMEN voor beide groepen gemiddeld hetzelfde is?