Statistiek

Ga naar: navigatie, zoeken

Samenvattingen

Klik hier om de samenvattingen te bekijken

Inleiding

Dit vak werd tot en met december 2004 in het tweede jaar gegeven, en door een andere prof. De cursus die destijds werd gebruikt, was veel wiskundiger (veel analysevoorkennis was vereist). Vragen van 2003-04 en vroeger zullen dus niet altijd overeenstemmen met wat de huidige prof verwacht.

Vanaf academiejaar 2009-2010 zit dit vak weer in het pakket van de 2e bachelor informatica onder een nieuwe naam: Statistiek en Data-Analyse.

Examens 2015-2016

Examen juni 2016

Examens 2009-2010 Wiskunde/Fysica

Examen juni 2010

Examen juni 2010 - oplossingen

Examen september 2010

Examens 2008-2009 Wiskunde/Fysica

Eerste zit: Media:Examen_Statistiek_Juni_2008.pdf

Eerste zit 2007-08 Wiskunde/Fysica

Examen juni 2008

Academiejaar 2006-2007

Juni 2007 (W&F&I)

  1. In een systeem heb je een paswoord van 7 cijfers (0-9). Het systeem accepteert enkel paswoorden waar niet meer dan 3 keer hetzelfde cijfer in voorkomt. Hoeveel geldige paswoorden zijn er? Stel dat de cijfers volledig willekeurig zijn, hoeveel keer moet je dan gemiddeld proberen vooraleer een geldig paswoord is ingegeven?
  2. Vraag over een artikel (over vrouwen die liever chocolade eten dan seks te hebben). Bepaal aan de hand van de gegevens of de proportie van vrouwen die chocolade verkiezen boven seks significant groter is dan 0.5.
  3. Vraag om een hypothesetest op te stellen. Gegeven zijn twee lognormale verdelingen waarvan je de parameters van de bijhorende normale verdeling krijgt. Gevraagd is een hypothesetest op te stellen om te testen of de verwachtingswaarde van X meer dan dubbel zo groot is als die van Y.
  4. Een student heeft een vakantiejob. Op het einde van iedere dag gooit de baas een muntje op. Als het Kop is krijgt de student 80 euro en anders 40 euro. De student werkt 8 weken bij de baas (7 dagen/week). Wat is de kans dat de student op het einde van deze periode meer dan 3500 euro heeft verdiend.
  5. Vraag om enkele termen van lineaire regressie uit te leggen (o.a. s.e.(B), P waarde) en een interval uit te rekenen. Er werd ook gevraagd naar het model waar vanuit gegaan werd en wat dat bijhorende parameters waren. (wat bij deze vraag net bedoeld werd weet ik ook niet juist)

Augustus 2007 (W&F)

  1. Bij de scouts kopen 20% van de leden een nieuwe das. Hoeveel dassen moet de leiding hoogstens aankopen opdat er met 90% kans weinig zijn voor 50 leden.
  2. [Artikel] Er is een artikel gegeven over yoghurt met/zonder aroma en dat ouderen het eerste preferen, de jongeren preferen het tweede. Geef de statistische test voor deze uitspraken samen met de nulhypothese en de altnernatieve hypothese. Hoe zou je dit aanpakken?
    • Stelling 1: "Verkiezen jongeren yoghurts met aardbeienaroma boven yoghurts zonder aroma?"
    • Stelling 2: "Zijn er meer ouderen die yoghurt nemen met aroma boven jongeren die yoghurt nemen zonder aroma?"
  3. Ik beschik over een steekproef van 28 metingen van twee continue variabelen X en Y. De correlatiecoëfficiënt tussen X en Y is 0,12. Zijn volgende uitspraken correct of niet. Verklaar.
    • X en Y zijn onafhankelijk,
    • X en Y zijn ongecorreleerd,
    • er bestaat een zwak lineair verband tussen X en Y,
    • er bestaat een zwak niet-lineair verband tussen X en Y.
  4. De kans dat een persoon sterft aan de leeftijd van 20 is gelijk aan 0,00178. Een verzekeringsmaatschappij vraagt hierom op de leeftijd van 19 een premie. Als die persoon sterft aan de leeftijd van 20 dan krijgt de familie 2000 euro.
    • Hoeveel premie moet men vragen zodat ze bij 1 contract minstens 15 euro winst hebben.
    • Wat is de standaarafwijking van de winst bij die premie.
    • De verzekeringsmaatschappij houdt een reclamecampagne die 6000 euro kost. Hoeveel nieuwe contracten moeten er zijn opdat hun winst 1000 euro is.
  5. Zij X een niet-negatieve continue toevalsvariabele met verdelingsfunctie F(x) en dichtheidsfunctie f(x). De hazardfunctie is gedefinieerd als .
    • Toon aan dat .
    • Bewijs dat .
    • Bespreek de Hazardfunctie voor de exponentiële verdeling.

Academiejaar 2004-2005

20 juni 2005 (Informatica)

Examen 20 juni 2005 (I)

20 juni 2005 (W&F)

Examen 20 juni 2005 (W&F)

Augustus 2005

Bron: Toledo.

  1. Als iemand een breuk heeft opgelopen waarbij een bot volledig doormidden gebroken is, worden de twee stukken van het bot operatief terug bijeengebracht. Chirurgen bevestigen dan een metalen plaatje om de twee stukken stevig tegen mekaar te houden. Idealiter moet het plaatje uiteraard zo aangebracht zijn dat de hoek tussen de twee stukken bot nul graden bedraagt. Een farmaceutische firma wil een nieuw soort plaatje op de markt brengen. De volgende studie werd opgezet:
    • 16 patiënten werden behandeld met een klassiek plaatje. De absolute waarde van de hoek tussen de twee stukken bot na bevestiging van het plaatje werd gemeten. Het steekproefgemiddelde bedroeg 0.21 graden met steekproefstandaarddeviatie 1.12 graden.
    • 21 andere patiënten werden behandeld met het nieuwe plaatje. Hier bedroeg het steekproefgemiddelde 0.15 graden met steekproefstandaarddeviatie 0.67 graden. Veronderstel dat de absolute waarde van de hoek tussen twee stukken bot normaal verdeeld is en neem significantieniveau 0.05. Is het nieuwe plaatje dan significant beter dan het klassieke plaatje?
  2. Voor wiskunde en fysica. Gegeven twee toevalsvariabelen X en Y zodat (X, Y) bivariaat normaal verdeeld is. Bewijs dat X en Y zijn onafhankelijk als en slechts als Cov(X,Y)=0.
  3. Voor informatica. Gegeven (uit vorige, uitgebreide studies) dat in normale omstandigheden, dus zonder Activia te eten, de kans op regulatie van de darmfunctie na 15 dagen 70% is bij mensen met transitproblemen. Is de doeltreffendheid van Activia dan inderdaad significant zoals in onderstaande advertentie beweerd wordt? Advertentie: "Activia, bewezen doeltreffend vanaf de 15e dag. Een studie uitgevoerd bij 1000 personen toont aan dat 80% van de mensen met transitproblemen een regulatie van de darmfunctie vaststelden door elke dag een Activia te eten.
  4. De momentgenererende functie van een toevalsvariabele X is gedefinieerd als volgt: voor .
    • Bewijs: als X Poisson verdeeld is met parameter , dan is zijn momentgenererende functie .
    • Men kan aantonen (dit hoef je zelf NIET te doen) dat steeds en (vandaar de term momentgenererende functie). Toon aan dat dit inderdaad klopt wanneer X Poisson verdeeld is met parameter .
    • Toon aan: wanneer X en Y onafhankelijke toevalsvariabelen zijn, dan is .
    • Men kan het volgende aantonen (dit hoef je zelf NIET te doen): indien voor een toevalvariabele X geldt dat , dan is X Poisson verdeeld met parameter . Wat is dan de verdeling van een som van n onafhankelijke toevalsvariabelen , die elk Poisson verdeeld zijn met parameter  ?
  5. Hieronder vind je 6 uitspraken. Schrijf bij elke uitspraak of ze goed of fout is. Als je denkt dat een uitspraak fout is, leg dan ook uit waarom.
    • Na uitvoering van een hypothesetest vind men een p-waarde van 0.04. Men kan besluiten dat er 96% kans is dat de alternatieve hypothese waar is.
    • Als men in een hypothesetest de steekproefgrootte verhoogt, verlaagt de kans op een type II fout.
    • In bridge worden de volgende punten gegeven aan de kaarten: 0 punten voor een tien of lager, 1 punt voor een boer, 2 voor een dame, 3 voor een heer en 4 voor een aas. Stel X het aantal punten dat een willekeurig getrokken kaart waard is.
      • Toon aan (afgerond tot op twee cijfers na de komma): EX = 0.77 en VarX = 1.72.
      • Goed of fout: uit een standaard kaartspel van 52 kaarten krijg je nu k willekeurige kaarten gedeeld. Stel Y het totaal aantal punten dat je k kaarten waard zijn. Dan kan de verdeling van Y via de centrale limietstelling benaderd worden, en voor k voldoende groot.
    • Gegeven zijn 17 tweelingen. Voor elke tweeling wordt de lengte van de eerstgeborene en de lengte van de laatstgeborene gemeten, als ze 5 jaar oud zijn. Veronderstel dat de lengte van een eerstgeborene en van een laatstgeborene normaal verdeeld is. Men wil nu nagaan of er een verband is tussen lengte op 5 jarige leeftijd en eerst/laatst geboren zijn. Dan kan dat met behulp van een gepaarde t-test.
    • Een enkelvoudige regressie-analyse levert een waarde van 0.74. We mogen besluiten dat er een lineair verband is tussen de twee bestudeerde variabelen.
    • Twee inspecteurs stellen onafhankelijk van elkaar een betrouwbaarheidsinterval op voor de gemiddelde inhoud van colablikjes. De eerste inspecteur berekent een 99% betrouwbaarheidsinterval, de tweede een 95% betrouwbaarheidsinterval. Het interval van de eerste inspecteur is dus zeker breder dan dat van de tweede.
  6. Op een bescheiden trouwfeest zijn 25 koppels uitgenodigd. Om de catering dienst te organiseren wil het trouwende paar een goede schatting opstellen van het aantal personen dat werkelijk naar het avondfeest zal komen. Slechts acht koppels hebben al laten weten dat ze zeker aanwezig zullen zijn die avond. Van twee koppels weet het paar ook dat ze misschien niet zullen komen en ze schatten de kans op hun komst op 30% voor elk koppel. De andere koppels hebben nog niets laten weten maar zullen normaal gezien wel aanwezig zijn. Daarom schatten ze voor elk koppel hun kans op komst op 80%.
    • Wat is de kans dat alle 25 koppels aanwezig zullen zijn? Welke veronderstelling(en) heb je hierbij gemaakt?
    • Na 1 week laten de twee koppels die met 30% kans zouden komen, weten dat ze zeker niet zullen komen. Hoeveel zitplaatsen moeten er dan voorzien worden om met 90% kans voldoende plaats te hebben?
    • Stel dat je geen extra informatie hebt over de komst van die twee koppels (dus enkel de oorspronkelijke informatie dat de kans voor elk van die twee koppels 30% bedraagt). Hoeveel zitplaatsen moeten er dan voorzien worden om met 90% kans voldoende plaats te hebben?