Text - based information retrieval: verschil tussen versies

Uit Wina Examenwiki
Naar navigatie springen Naar zoeken springen
Geen bewerkingssamenvatting
Geen bewerkingssamenvatting
Regel 1: Regel 1:
=Examen=
Het examen bestaat uit 2 delen:
# schriftelijk, open boek: oefening vragen
# mondeling, gesloten boek: theorie vragen


1) Exercise:
Hierna kan men de theorie vragen gaan bespreken bij de professor. Hier is ze heel vriendelijk bij, en stelt hier en daar nog een bijvraag. Na de theorie, bespreekt ze nog even het practicum (paper of programmeeropdracht)
Given dissimilarity matrix.
# calculate and draw dendograms
# comment dendograms
# (?)
# use an appropriate algorithm to make 2 clusters
# if d was done in function of creating a thesaurus, which could be considered thesaurus class terms


2) Theory
=Examenvragen=
word sense disambiguation
==23/06/2006==
#Oefening:
#*Gegeven: 2 teksten (2 zinnen eerder)
#*Gevraagd:
#*#Stel inference netwerk op.
#*#Stel query netwerk op van de 2 termen "virus" en "outbreak"
#*#Rangschik de documenten voor de AND query van deze 2 termen.
#*#Rangschik de documenten voor de OR query van deze 2 termen.
#*#Rangschik de documenten indien 1 van de termen en 1 van de documenten belangrijker is.
#Oefening:
#*Gegeven: dissimilsarity matrix van 7 documenten voor het woord "star"
#*Gevraagd:
#*#Zoek de verschillende betekenissen. (cluster de documenten)
#*#Hoe zou je de oplossingen vergelijken indien een expert je de juiste oplossingen zou geven? (Vilain, B-CUBED)
#Theorie:
#* Leg HITS en PageRank uit.
#* Hoe zou men deze algoritmes kunnen gebruiken bij text summarization?
#* Hoe zou je die methode aanpassen voor topic general summaries of specific summaries?
#Theorie: Wat is co-training?


3) Paper
==pre 2006==
'daar heb ik eigenlijk geen vragen over, dat was in orde' ;)
#Oefening: gegeven dissimilariteit matrix.
#* Bereken en teken dendogrammen
#* Becommentarieer de dendogrammen
#* (?)
#* Gebruik een gepast algoritme om 2 clusters te maken.
#* Indien (3) was gedaan door het creëren van een thesaurus. Welke zouden dan de thesaurus klasse termen zijn.
#Theorie: Word sense disambiguation.
#Paper: 'daar heb ik eigenlijk geen vragen over, dat was in orde' ;)


[[Categorie:1li]] [[Categorie:2li]]
[[Categorie:1li]] [[Categorie:2li]]

Versie van 23 jun 2006 11:42

Examen

Het examen bestaat uit 2 delen:

  1. schriftelijk, open boek: oefening vragen
  2. mondeling, gesloten boek: theorie vragen

Hierna kan men de theorie vragen gaan bespreken bij de professor. Hier is ze heel vriendelijk bij, en stelt hier en daar nog een bijvraag. Na de theorie, bespreekt ze nog even het practicum (paper of programmeeropdracht)

Examenvragen

23/06/2006

  1. Oefening:
    • Gegeven: 2 teksten (2 zinnen eerder)
    • Gevraagd:
      1. Stel inference netwerk op.
      2. Stel query netwerk op van de 2 termen "virus" en "outbreak"
      3. Rangschik de documenten voor de AND query van deze 2 termen.
      4. Rangschik de documenten voor de OR query van deze 2 termen.
      5. Rangschik de documenten indien 1 van de termen en 1 van de documenten belangrijker is.
  2. Oefening:
    • Gegeven: dissimilsarity matrix van 7 documenten voor het woord "star"
    • Gevraagd:
      1. Zoek de verschillende betekenissen. (cluster de documenten)
      2. Hoe zou je de oplossingen vergelijken indien een expert je de juiste oplossingen zou geven? (Vilain, B-CUBED)
  3. Theorie:
    • Leg HITS en PageRank uit.
    • Hoe zou men deze algoritmes kunnen gebruiken bij text summarization?
    • Hoe zou je die methode aanpassen voor topic general summaries of specific summaries?
  4. Theorie: Wat is co-training?

pre 2006

  1. Oefening: gegeven dissimilariteit matrix.
    • Bereken en teken dendogrammen
    • Becommentarieer de dendogrammen
    • (?)
    • Gebruik een gepast algoritme om 2 clusters te maken.
    • Indien (3) was gedaan door het creëren van een thesaurus. Welke zouden dan de thesaurus klasse termen zijn.
  2. Theorie: Word sense disambiguation.
  3. Paper: 'daar heb ik eigenlijk geen vragen over, dat was in orde' ;)