Statistiek: verschil tussen versies
Geen bewerkingssamenvatting |
|||
Regel 1: | Regel 1: | ||
==Samenvattingen== | |||
[[Statistiek/Samenvattingen| Klik hier om de samenvattingen te bekijken]] | |||
== Inleiding == | == Inleiding == | ||
Dit vak werd tot en met december 2004 in het tweede jaar gegeven, en door een andere prof. De cursus die destijds werd gebruikt, was veel wiskundiger (veel analysevoorkennis was vereist). Vragen van 2003-04 en vroeger zullen dus niet altijd overeenstemmen met wat de huidige prof verwacht. | Dit vak werd tot en met december 2004 in het tweede jaar gegeven, en door een andere prof. De cursus die destijds werd gebruikt, was veel wiskundiger (veel analysevoorkennis was vereist). Vragen van 2003-04 en vroeger zullen dus niet altijd overeenstemmen met wat de huidige prof verwacht. |
Versie van 25 aug 2013 13:23
Samenvattingen
Klik hier om de samenvattingen te bekijken
Inleiding
Dit vak werd tot en met december 2004 in het tweede jaar gegeven, en door een andere prof. De cursus die destijds werd gebruikt, was veel wiskundiger (veel analysevoorkennis was vereist). Vragen van 2003-04 en vroeger zullen dus niet altijd overeenstemmen met wat de huidige prof verwacht.
Vanaf academiejaar 2009-2010 zit dit vak weer in het pakket van de 2e bachelor informatica onder een nieuwe naam, nl. "Statistiek en Data-Analyse".
2012-2013 Informatica
Vrijdag 18/01/2013 voormiddag
Dit is wat ik er mij nog van herinner, de vragen zijn dus niet precies dezelfde.
- Thomas Van Den Spiegel is 214 cm groot. Leg uit hoe men kan bepalen hoe groot (of hoe normaal) dit is.
- Gegeven een tabel met daarin de absolute frequenties van een steekproef naar het spijbelgedrag van leerlingen uit het ASO, BSO en TSO: nooit, soms, vaak. Dit is dus een 3x3 tabel.
- Test: meer dan 50% van de leerlingen uit het ASO spijbelt nooit.
- Geef H0.
- Geef de teststatistiek onder H0 en de testwaarde.
- Geef de P-waarde.
- Besluit.
- Ga na of er een verband is tussen de waarden.
- Geef H0.
- Geef de teststatistiek onder H0 en de testwaarde.
- Geef de P-waarde.
- Besluit.
- ???
- Test: meer dan 50% van de leerlingen uit het ASO spijbelt nooit.
- Gegeven de functie als en anders 0. Deze stelt de tijd voor die ik nodig heb om op mijn werk te geraken.
- Ik moet om 9u op mijn werk zijn, wat is de kans dat ik te laat kom als ik om 7u40 vertrek?
- Over 200 dagen gezien als ik opnieuw om 7u40 vertrek: wat is de kans dat ik hoogstens 20 keer op die 200 dagen te laat kom?
- Voor een nieuw soort roomijs hebben 9 mensen geproefd en een score tussen 1 en 20 (kan ook tussen 0 en 20 zijn, ik hoop van niet). Er waren 2 scores onder 10 en 7 scores boven 10.
- Bepaal met een teststatistiek of het ijs lekker is (dus een score groter dan 10).
- Geef H0.
- Geef de teststatistiek onder H0 en de testwaarde.
- Geef de P-waarde.
- Besluit.
- Wat is het 95% betrouwbaarheidsinterval van de mediaan? Wat betekent dit interval concreet voor dit voorbeeld?
- Bepaal met een teststatistiek of het ijs lekker is (dus een score groter dan 10).
- Een lineair verband tussen de maandelijkse productie van windmolens en de hoeveelheid wind, gezien over 32 maanden. Gegeven de output van de lm-functie uit R, een paar Shapiro-Wilk tests, enkele QQ-plots en de residuplot.
- ???
- ???
- Is het een goed model? (of zoiets)
- Vul de ANOVA tabel in (enkel 1 en F zijn gegeven).
- Wat betekent Std. Error in die lm-functie?
Examens 2009-2010 Wiskunde/Fysica
Examen juni 2010 - oplossingen
Examens 2008-2009 Wiskunde/Fysica
Eerste zit: Media:Examen_Statistiek_Juni_2008.pdf
Eerste zit 2007-08 Wiskunde/Fysica
Eerste zit 2006-07 Wiskunde/Fysica/Informatica
Bron: vergeetachtige student (correcties/aanvullingen welkom) -> Ik heb een beetje aangevuld, maar de exacte vragen heb ik ook niet meer --Mattia 19 jun 2007 22:22 (CEST)
- In een systeem heb je een paswoord van 7 cijfers (0-9). Het systeem accepteert enkel paswoorden waar niet meer dan 3 keer hetzelfde cijfer in voorkomt. Hoeveel geldige paswoorden zijn er? Stel dat de cijfers volledig willekeurig zijn, hoeveel keer moet je dan gemiddeld proberen vooraleer een geldig paswoord is ingegeven?
- Vraag over een artikel (over vrouwen die liever chocolade eten dan seks te hebben). Bepaal aan de hand van de gegevens of de proportie van vrouwen die chocolade verkiezen boven seks significant groter is dan 0.5.
- Vraag om een hypothesetest op te stellen. Gegeven zijn twee lognormale verdelingen waarvan je de parameters van de bijhorende normale verdeling krijgt. Gevraagd is een hypothesetest op te stellen om te testen of de verwachtingswaarde van X meer dan dubbel zo groot is als die van Y.
- Een student heeft een vakantiejob. Op het einde van iedere dag gooit de baas een muntje op. Als het Kop is krijgt de student EUR 80 en anders EUR 40. De student werkt 8 weken bij de baas (7 dagen/week). Wat is de kans dat de student op het einde van deze periode meer dan EUR 3500 heeft verdiend.
- Vraag om enkele termen van lineaire regressie uit te leggen (o.a. s.e.(B), P waarde) en een interval uit te rekenen. Er werd ook gevraagd naar het model waar vanuit gegaan werd en wat da bijhorende parameters waren. (wat bij deze vraag net bedoeld werd weet ik ook niet juist)
Tweede zit 2006-07 Wiskunde/Fysica
- Bij de scouts kopen 20% van de leden een nieuwe das. Hoeveel dassen moet de leiding hoogstens aankopen opdat er met 90% kans weinig zijn voor 50 leden.
- [Artikel] Er is een artikel gegeven over yoghurt met/zonder aroma en dat ouderen het eerste preferen, de jongeren preferen het tweede.
Stelling1 : 'Verkiezen jongeren yoghurts met aardbeienaroma boven yoghurts zonder aroma?' Stelling2: ' Zijn er meer ouderen die yoghurt nemen met aroma boven jongeren die yoghurt nemen zonder aroma?' Geef de statistische test voor deze uitspraak samen met de nulhypothese en de altnernatieve hypothese. Hoe zou je dit aanpakken?
- Ik beschik over een steekproef van 28 metingen van twee continue variabelen X en Y. De correlatiecoëfficient tussen X en Y is 0,12.
Zijn volgende uitspraken correct of niet. Verklaar.
- X en Y zijn onafhakelijk
- X en Y zijn ongecorreleerd
- Er bestaat een zwak lineair verband tussen X en Y
- Er bestaat een zwak niet-lineair verband tussen X en Y
- De kans dat een persoon sterft aan de leeftijd van 20 is gelijk aan 0,00178.
Een verzekeringsmaatschappij vraagt hierom op de leeftijd van 19 een premie. Als die persoon sterft aan de leeftijd van 20 dan krijgt de familie 2000 EUR.
- Hoeveel premie moet men vragen zodat ze bij 1 contract minstens 15 EUR winst hebben.
- Wat is de standaarafwijking van de winst bij die premie.
- De verzekeringsmaatschappij houdt een reclamecampagne die 6000 EUR kost. Hoeveel nieuwe contracten moeten er zijn opdat hun winst 1000 EUR is.
- Zij X een niet-negatieve continue toevalsvariabele met verdelingsfunctie F(x) en dichtheidsfunctie f(x).
De hazardfunctie =
- Toon aan dat
- Bewijs dat
- Neem de exponentiële dichtheidsfunctie en vul in. Bespreek het resultaat.
Eerste zit 2004-05 informatica
Examen juni 2005 (informatica)
Dit waren op vraag 4 na ook de vragen voor Fysica en Wiskunde. Vraag 4 was een wiskundigere afleiding ivm met zelf een schatter vinden.
Tweede zit 2004-05
Bron: Toledo
Vraag 1
Als iemand een breuk heeft opgelopen waarbij een bot volledig doormidden gebroken is, worden de twee stukken van het bot operatief terug bijeengebracht. Chirurgen bevestigen dan een metalen plaatje om de twee stukken stevig tegen mekaar te houden. Idealiter moet het plaatje uiteraard zo aangebracht zijn dat de hoek tussen de twee stukken bot nul graden bedraagt.
Een farmaceutische ï¬Ârma wil een nieuw soort plaatje op de markt brengen. De volgende studie werd opgezet:
- 16 patiënten werden behandeld met een klassiek plaatje. De absolute waarde van de hoek tussen de twee stukken bot na bevestiging van het plaatje werd gemeten. Het steekproefgemiddelde bedroeg 0.21 graden met steekproefstandaarddeviatie 1.12 graden.
- 21 andere patiënten werden behandeld met het nieuwe plaatje. Hier bedroeg het steekproefgemiddelde 0.15 graden met steekproefstandaarddeviatie 0.67 graden.
Veronderstel dat de absolute waarde van de hoek tussen twee stukken bot normaal verdeeld is en neem signiï¬Âcantieniveau 0.05. Is het nieuwe plaatje dan signiï¬Âcant beter dan het klassieke plaatje?
Vraag 2 (wiskunde en fysica)
Gegeven twee toevalsvariabelen X en Y zodat (X, Y) bivariaat normaal verdeeld is. Bewijs: X en Y zijn onafhankelijk als en slechts als Cov(X, Y ) = 0.
Vraag 2 (informatica)
Gegeven (uit vorige, uitgebreide studies) dat in normale omstandigheden, dus zonder Activia te eten, de kans op regulatie van de darmfunctie na 15 dagen 70% is bij mensen met transitproblemen. Is de doeltreffendheid van Activia dan inderdaad signiï¬Âcant zoals in onderstaande advertentie beweerd wordt?
- Advertentie: "Activia, bewezen doeltreffend vanaf de 15e dag. Een studie uitgevoerd bij 1000 personen toont aan dat 80% van de mensen met transitproblemen een regulatie van de darmfunctie vaststelden door elke dag een Activia te eten.
Vraag 3
De momentgenererende functie van een toevalsvariabele X is gedeï¬Ânieerd als volgt:
voor
- Bewijs: als X Poisson verdeeld is met parameter , dan is zijn momentgenererende functie .
- Men kan aantonen (dit hoef je zelf NIET te doen) dat steeds en (vandaar de term momentgenererende functie). Toon aan dat dit inderdaad klopt wanneer X Poisson verdeeld is met parameter .
- Toon aan: wanneer X en Y onafhankelijke toevalsvariabelen zijn, dan is .
- Men kan het volgende aantonen (dit hoef je zelf NIET te doen): indien voor een toevalvariabele X geldt dat , dan is X Poisson verdeeld met parameter . Wat is dan de verdeling van een som van n onafhankelijke toevalsvariabelen , die elk Poisson verdeeld zijn met parameter ?
Vraag 4
Hieronder vind je 6 uitspraken. Schrijf bij elke uitspraak of ze goed of fout is. Als je denkt dat een uitspraak fout is, leg dan ook uit waarom.
- Na uitvoering van een hypothesetest vind men een p-waarde van 0.04. Men kan besluiten dat er 96% kans is dat de alternatieve hypothese waar is.
- Als men in een hypothesetest de steekproefgrootte verhoogt, verlaagt de kans op een type II fout.
- In bridge worden de volgende punten gegeven aan de kaarten: 0 punten voor een tien of lager, 1 punt voor een boer, 2 voor een dame, 3 voor een heer en 4 voor een aas. Stel X het aantal punten dat een willekeurig getrokken kaart waard is.
- Toon aan (afgerond tot op twee cijfers na de komma): EX = 0.77 en VarX = 1.72.
- Goed of fout: uit een standaard kaartspel van 52 kaarten krijg je nu k willekeurige kaarten gedeeld. Stel Y het totaal aantal punten dat je k kaarten waard zijn. Dan kan de verdeling van Y via de centrale limietstelling benaderd worden, en voor k voldoende groot.
- Gegeven zijn 17 tweelingen. Voor elke tweeling wordt de lengte van de eerstgeborene en de lengte van de laatstgeborene gemeten, als ze 5 jaar oud zijn. Veronderstel dat de lengte van een eerstgeborene en van een laatstgeborene normaal verdeeld is. Men wil nu nagaan of er een verband is tussen lengte op 5 jarige leeftijd en eerst/laatst geboren zijn. Dan kan dat met behulp van een gepaarde t-test.
- Een enkelvoudige regressie-analyse levert een waarde van 0.74. We mogen besluiten dat er een lineair verband is tussen de twee bestudeerde variabelen.
- Twee inspecteurs stellen onafhankelijk van elkaar een betrouwbaarheidsinterval op voor de gemiddelde inhoud van colablikjes. De eerste inspecteur berekent een 99% betrouwbaarheidsinterval, de tweede een 95% betrouwbaarheidsinterval. Het interval van de eerste inspecteur is dus zeker breder dan dat van de tweede.
Vraag 5
Op een bescheiden trouwfeest zijn 25 koppels uitgenodigd. Om de catering dienst te organiseren wil het trouwende paar een goede schatting opstellen van het aantal personen dat werkelijk naar het avondfeest zal komen. Slechts acht koppels hebben al laten weten dat ze zeker aanwezig zullen zijn die avond. Van twee koppels weet het paar ook dat ze misschien niet zullen komen en ze schatten de kans op hun komst op 30% voor elk koppel. De andere koppels hebben nog niets laten weten maar zullen normaal gezien wel aanwezig zijn. Daarom schatten ze voor elk koppel hun kans op komst op 80%.
- Wat is de kans dat alle 25 koppels aanwezig zullen zijn? Welke veronderstelling(en) heb je hierbij gemaakt?
- Na 1 week laten de twee koppels die met 30% kans zouden komen, weten dat ze zeker niet zullen komen. Hoeveel zitplaatsen moeten er dan voorzien worden om met 90% kans voldoende plaats te hebben?
- Stel dat je geen extra informatie hebt over de komst van die twee koppels (dus enkel de oorspronkelijke informatie dat de kans voor elk van die twee koppels 30% bedraagt). Hoeveel zitplaatsen moeten er dan voorzien worden om met 90% kans voldoende plaats te hebben?