Natural Language Processing: verschil tussen versies

Uit Wina Examenwiki
Naar navigatie springen Naar zoeken springen
cheap viagra
Wouter.mertens (overleg | bijdragen)
 
(83 tussenliggende versies door 32 gebruikers niet weergegeven)
Regel 1: Regel 1:
[[Afbeelding:GeertAdriaens.jpg|right|200px|]]
==Samenvattingen==
=Natural Language Processing=
[[Natural Language Processing/Samenvattingen| Klik hier om de samenvattingen te bekijken]]
==Table of Contents, Some structure==
[http://trappie.be/share/nlp/NLP-toc.pdf toc-structure, PDF]


==Opgeloste Examenvragen==
==Informatie over het vak==
[http://s74.photobucket.com/albums/i270/jeroentrappers/NLP/ Examenvragen en oplossingen (grote download)] (Ik heb de afbeeldingen niet verkleind, om de leesbaarheid zo hoog mogelijk te houden. (Een camera biedt natuurlijk niet dezelfde kwaliteit als een scanner)) Dank aan Mathijs!
Sinds 2009 wordt dit vak gegeven door Marie-Francine Moens en Vincent Vandeghinste.
De inhoud is dan ook compleet veranderd.


==Meer info over ATN's==
Update 2015:
http://www.cs.msstate.edu/~lboggess/courses/atninstr.txt
* Lessen worden afwisselend gegeven door Marie-Francine Moens en Vincent Vandeghinste
* Lessen duren 1,5 uur
* Er worden 4 oefenzittingen gegeven


http://www.cs.bham.ac.uk/research/poplog/src/master/S.pcwnt/teach/atnsum
== Algemeen ==
* Schriftelijk 4u
* Open boek, gebruik van handboek Jurafsky & Martin, slides, oplossingen oefenzittingen en notities.


==Systems & Approaches==
==Examenvragen==
[https://docs.google.com/document/d/1W8Wt2wVeoaHo5DulKSATFhQqBwevDN3YdtIcg5afOzs/edit?usp=sharing 2021 google doc]
===January 2015===


Ik stel voor dat we hier de gevonden informatie of links posten over. De vragen die we over het systeem zullen krijgen zijn waarschijnlijk:
1. Given three phrases.
*Bespreek 1 van de 3 systemen die je gelezen hebt:
** What kind of nlp system is it?
** What is the approach. What are the principles?
** Give Pro’s and Contra’s
** How is this an improvement over older systems; how would newer systems tackle this problem?


=== Algemeen ===
  a) Tag all the phrases using the Penn treebank POS tags.
  b) Compute the HMM transition probability matrix (do not apply smoothing).
  c) Compute the HMM emission probability matrix (no smoothin).
  d) Given a new phrase: compute the bigram probabilities for this phrase.
  e) Discuss the results of d). What would happen if we apllied smoothing?


*[http://www.cs.dartmouth.edu/~brd/Teaching/AI/Lectures/Summaries/natlang.html Hier] en [http://www.cs.bham.ac.uk/~pjh/sem1a5/pt1/pt1_history.html hier] wordt (meestal zeer korte) informatie gegeven over een heel aantal van de opgegeven systemen.
2. Given two phrases:


=== ATLAST ===
Fruit flies like a ripe banana.
=== BASEBALL ===
Time flies like an arrow.
=== BOEING SEC ===
=== BORIS ===
=== CA ===
=== CO-OP ===
=== DEACON ===
=== DIAMOND ===
=== DOCTOR ===
=== ELI ===
=== ELIZA ===
*[http://www-ai.ijs.si/eliza-cgi-bin/eliza_script http://www-ai.ijs.si/eliza-cgi-bin/eliza_script]
*[http://i5.nyu.edu/~mm64/x52.9265/january1966.html dé paper]


=== EPISTLE ===
  a) Write down the PCFG for this corpus.
=== EUROTRA ===
  b) Convert it to CNF.
=== FLEXP ===
  c) Apply CKY parsing.
[http://www.gnu.org/software/flex/ http://www.gnu.org/software/flex/]
  d) Show the resulting parse trees and their probabilities.
  e) Discuss the results.


=== FRUMP ===
3. Given a hidden Markov model and a series of observations, compute the most likely joint state of the HMM.
=== GRUNDY ===
=== GUS ===
=== GSP ===
=== HAM-ANS ===
=== HAM-RPM ===
=== HARPY ===
=== HEARSAY-II ===
=== INTELLECT ===
=== JETS ===
=== KAMP ===
=== KLAUS ===
buy viagra online
<a href="http://www.youtube.com/viagrashala">buy viagra</a>
http://www.youtube.com/viagrashala
[url=http://www.youtube.com/viagrashala]buy viagra[/url]


generic cialis online
4. Given three text snippets, compute the association of two pairs of words using pointwise mutual information association measure and the Lin association measure.
<a href="http://corkd.com/people/salenmark">generic cialis</a>
http://corkd.com/people/salenmark
[url=http://corkd.com/people/salenmark]generic cialis[/url]


buy cialis online
5. Question 5, January 2015.
<a href="http://corkd.com/people/salenmark">buy cialis</a>
http://corkd.com/people/salenmark
[url=http://corkd.com/people/salenmark]buy cialis[/url]


order cialis online
6. You want to build a system which finds companies, brands, names, etc. which are mentioned on web pages. How would you do this? Go step by step, in enough detail, using the techniques mentioned in the course. Mention the bottlenecks involved in the process.
<a href="http://corkd.com/people/salenmark">order cialis</a>
http://corkd.com/people/salenmark
[url=http://corkd.com/people/salenmark]order cialis[/url]


doxycycline online
<a href="http://corkd.com/people/danforman">doxycycline</a>
http://corkd.com/people/danforman
[url=http://corkd.com/people/danforman]doxycycline[/url]


buy doxycycline online
===Januari 2015===
<a href="http://corkd.com/people/danforman">buy doxycycline</a>
1) Gegeven een FSA, geef de bijhorende regex en geef 10 strings die door deze FSA gegenereerd kunnen worden. De FSA was net dezelfde als die van op het examen in 2009.
http://corkd.com/people/danforman
[url=http://corkd.com/people/danforman]buy doxycycline[/url]


buy viagra online
2) Je krijgt 2 parse-trees (2 heel eenvoudige zinnen "time flies like an arrow" en "time flies like a banana")
<a href="http://www.citeulike.org/profile/DarienSolano">buy viagra</a>
  a) stel een PCFG hiervan op
http://www.citeulike.org/profile/DarienSolano
  b) zet deze PCFG om naar CNF
[url=http://www.citeulike.org/profile/DarienSolano]buy viagra[/url]
  c) pas CKY toe op de zin "time flies like a banana"
  d) teken de mogelijke parse-trees en schrijf bij elk hun probabiliteit


cheap doxycycline online
3) Gegeven 5 zinnen (zin 1 is dezelfde als zin 3 en zin 2 is dezelfde als zin 4). Het woord "anybody" kwam geen enkele keer voor in de 5 zinnen, het woord "nobody" 3 keer.
  <a href="http://corkd.com/people/danforman">cheap doxycycline</a>
  a) Met het gebruik van bigrams, bereken de probabiliteit van het woord "nobody" en het woord '"anybody" met behulp van MLE, Laplace smoothing en Good Turing Smoothing.  
http://corkd.com/people/danforman
  b) Vergelijk de drie methodes en geef voor- en nadelen voor elke methode.
  [url=http://corkd.com/people/danforman]cheap doxycycline[/url]


generic viagra online
4) Theorievraag: de vraag ging over pairwise coreference classifier (discourse analysis) en had twee deelvragen:
  <a href="http://www.citeulike.org/profile/DarienSolano">generic viagra</a>
  a) hoe worden coreference chains gevormd op basis van het resultaat van de classifier?
http://www.citeulike.org/profile/DarienSolano
  b) geef vijf features (gezien tijdens de les) die voor deze classifier gebruikt kan worden
  [url=http://www.citeulike.org/profile/DarienSolano]generic viagra[/url]


buy viagra online online
5) Theorievraag: gegeven de slides van de laatste les over semantic parsing. Op de slides staat een uitgewerkt voorbeeld van stochastic gradient descent, een optimaliserend algoritme. Gevraagd: leg de verschillende iteraties van het voorbeeld uit en leg uit hoe de parameters in het algoritme aan hun waarde komen.
<a href="http://www.citeulike.org/profile/DarienSolano">buy viagra online</a>
http://www.citeulike.org/profile/DarienSolano
[url=http://www.citeulike.org/profile/DarienSolano]buy viagra online[/url]


cheap cialis online
===Juni 2009===
  <a href="http://corkd.com/people/salenmark">cheap cialis</a>  
1) Gegeven een FSA, geef de bijhorende regex. De FSA zag er ongeveer zo uit:
http://corkd.com/people/salenmark
[url=http://corkd.com/people/salenmark]cheap cialis[/url]
  q_0 -> q_1 <-> f <- q_2
        |            ^
        |            |
          - - - - - -
met q_0 -> q_1 = a
    q_1 -> f = b
    q_1 -> q_2 = b
    q_2 -> f = a
    f -> q_1 = a


cialis online
2) Je krijgt 2 parse-trees (2 heel eenvoudige zinnen "time flies like an arrow" en "time flies
<a href="http://corkd.com/people/salenmark">cialis</a>
    like a banana")
http://corkd.com/people/salenmark
  a) stel een PCFG hiervan op
[url=http://corkd.com/people/salenmark]cialis[/url]
  b) zet deze PCFG om naar CNF
  c) pas CKY toe op een zin (juiste zin weet ik niet meer, alleszinds ook iets met "time flies")
  d) teken de mogelijke parse-trees en schrijf bij elk hun probabiliteit


doxycycline online online
  3) Wat is rhetorical structure theory? Geef relevante voorbeelden, uitleg en toepassingen.
  <a href="http://corkd.com/people/danforman">doxycycline online</a>
http://corkd.com/people/danforman
[url=http://corkd.com/people/danforman]doxycycline online[/url]


generic viagra online
  4) Gegeven 3 engelstalige zinnen.
  <a href="http://www.clubplanet.com/AlenClark">generic viagra</a>
  a) bereken de similatiteit tussen 'flight' & 'debris' en 'flight' & 'Airbus' via de lin assoc
http://www.clubplanet.com/AlenClark
      methode
[url=http://www.clubplanet.com/AlenClark]generic viagra[/url]
  b) waarvoor kan je deze similariteit zoals gebruiken


buy viagra online online
  5) theorie...cant quite remember
  <a href="http://www.clubplanet.com/AlenClark">buy viagra online</a>
http://www.clubplanet.com/AlenClark
[url=http://www.clubplanet.com/AlenClark]buy viagra online[/url]


buy viagra online
  6) Stel je moet een e-mail management programma maken dat bestaat uit 2 delen.
  <a href="http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1">buy viagra</a>
  - Task manager : haalt uit de binnenkomende e-mails alle tasken
http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1
  - Time manager : bewaart het overzicht over je afspraken en herinnert je aan deadline en tasks
[url=http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1]buy viagra[/url]
  Hoe zou je dit aanpakken?


viagra online online
[[Categorie:mi]]
<a href="http://www.clubplanet.com/AlenClark">viagra online</a>
http://www.clubplanet.com/AlenClark
[url=http://www.clubplanet.com/AlenClark]viagra online[/url]
 
generic viagra online
<a href="http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1">generic viagra</a>
http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1
[url=http://my.nbc.com/blogs/DanForter/main/2008/10/19/vaigralowest-viagra-prices-1]generic viagra[/url]
 
cheap viagra online
<a href="http://www.clubplanet.com/AlenClark">cheap viagra</a>
http://www.clubplanet.com/AlenClark
[url=http://www.clubplanet.com/AlenClark]cheap viagra[/url]
 
=== REL ===
=== RENDEZVOUS ===
=== REQUEST ===
=== ROBOT ===
[http://s74.photobucket.com/albums/i270/jeroentrappers/NLP/ROBOT/ Paper over ROBOT (grote download)] (Ik heb de afbeeldingen niet verkleind, om de leesbaarheid zo hoog mogelijk te houden. (Een camera biedt natuurlijk niet dezelfde kwaliteit als een scanner)) Dank aan Mathijs!
 
=== RUS ===
=== SAD-SAM ===
=== SHRDLU ===
 
=== SIR ===
=== SOPHIE ===
=== SPEECHLIS ===
=== STUDENT ===
=== SYNTHEX ===
=== SYSTRAN ===
 
*[http://en.wikipedia.org/wiki/SYSTRAN SYSTRAN op wikipedia]
*[http://www.imagiforce.com/translation-technology.htm Een commerciele uitleg over SYSTRAN], bevat toch wat bruikbare informatie.
 
=== TALE-SPIN ===
=== TAUM-METEO ===
=== TEXT ===
=== TORUS ===
=== TOVNA ===
http://lists.village.virginia.edu/lists_archive/Humanist/v02/0023.html
 
=== TQA ===
=== UNDERSTAND ===
=== USL ===
=== VERBMOBIL ===
 
=== WEP/PEP ===
=== EIGEN VONDSTEN ===
 
==2008-06-14==
 
Dit jaar kuste het meisje de jongen en werden er voor de reading assignment geen systemen geschrapt.  Verder alles exact hetzelfde als de voorbije 3 jaar...
 
==2007-06-16==
Weer dezelfde vragen....
 
*1. Gegeven 3 teksten (origineel, ingetypt en verbeterd), bereken precision en recall en bespreek het resultaat.
*2. Exact dezelfde grammar en zin als de vorige jaren (the girl kisses the boy on the mouth).
**Let wel: hij durft over de jaren heen de woorden "girl" en "boy" van plaats wisselen.  Ziet dat ge niet door de mand valt ;-)
*3. Bespreek 1 van de 3 systemen waarover je informatie hebt opgezocht.
'''Opgelet, dit jaar schreef hij 3 systemen op het bord die we niet mochten bespreken: SHRDLU, ELIZA en LUNAR. Dit om te vermijden dat iedereen maar 1 systeem zou voorbereiden (wat bij de meesten wel het geval was), hij is het blijkbaar zelf beu om elk jaar hetzelfde te lezen...'''
*Beste aanrader hierbij: kies systemen in een zelfde "categorie": dat scheelt veel overhead bij het vergelijk-(met oudere/nieuwere systemen)-deel van de vraag.  Als ge wat ingewerkt zijt in het "domein" van dat specifiek soort systemen, kunt ge u normaal gezien wel redden als hij systemen uitsluit. (ik was wat gezien doordat ik eigenlijk ELIZA als hoofdsysteem had, maar ik kende van mezelf (en voor de vergelijking) heel wat van PARRY, dus heb het kunnen fixen om PARRY te bespreken)
 
==Jeroen Trappers, 2006-06-17==
Examenvragen NLP 2006; weeral dezelfde vragen, waarom is hier nog een examen van? (niet dat ik klaag :))
 
*1. Gegeven 3 teksten (Origineel, resultaat van dictee en vorige door spell checker gehaald, met gevonden fouten aangeduid).
Gevraagd:
**bereken precision en recall
**bespreek wat je van het resultaat vindt (bespreek de kwaliteit van de spell checker)
 
*2. Parsing
Grammar:
S ← NP VP                        NP ← '''DET N'''
VP ← '''V NP'''                        NP ← '''DET N''' PP
VP ← '''V NP''' PP                      PP ← P NP
Lexicon:
the: DET
boy, girl, mouth: N
on: P
kisses: '''V, N'''
 
Gevraagd:
:Shift reduce parser: maak hiervoor een parser state diagram en oracle (parse tabel);
:Pas het toe op de gegeven zin: “The girl kisses the boy on the mouth”. (maak de volledige trace, geef met andere woorden aan wat de toestand van de invoer, en parse stack op elk moment in het proces is)
 
*3. Bespreek 1 van de 3 systemen die je gelezen hebt: (at most 2 pages should suffice)
** What kind of nlp system is it?
** Give Pro’s and Contra’s
** -voor nieuwere systemen: hoe zijn ze een verbetering ten op zicht van ouderen
** -voor oudere systemen: leg uit hoe nieuwere systemen het gekozen systeem verbeteren
 
--> merk hierbij op dat de prof niet zegt welk van de drie je moet bespreken, 't komt er dus op neer dat je er vooral een goed gelezen moet hebben en kunnen vergelijken met een ander.
 
==Koenraad Heijlen, 2005-06-18==
Examenvragen NLP 2005; zeker geen verrassing t.o.v. de vorige jaren.
 
* 1. Gegeven 3 teksten (1 correct, 1 ingetypt en 1 door een spellings-checker gehaald met de gevonden fouten gemarkeerd).
 
Gevraagd:
(a) bereken precision en recall
(b) bespreek en wat vind je van het resultaat?
 
*2. Parsing
 
Grammar:
S ← NP VP                        NP ← DET N
VP ← V NP                        NP ← DET N PP
VP ← V NP PP                      PP ← P NP
 
Lexicon:
the: DET
boy, girl, mouth: N
on: P
kisses: V, N
 
Gevraagd:
:Shift reduce parser: maak hiervoor een parser state diagram en oracle;
:Pas het toe op de gegeven zin: “The boy kisses the girl on the mouth”. (of vice versa)
 
*3. Bespreek 1 van de 3 systemen die je gelezen hebt:
** What kind of nlp system is it?
** What is the approach. What are the principles?
** Give Pro’s and Contra’s
** How is this an improvement over older systems; how would newer systems tackle this problem?
 
==Willem Poorten, 2003-06-21==
* 1. In class we dealt with ATN’s for NP-structures. Write the network(s) that you need to recognice and analyse (i.e. build the structure of) a PP (Prepositional Phrase); start from the states of the simple RTN for PPs From figure (TD3’)
REMARK: the NP-ATN is not asked for; you may assume that it is available
 
* 2. ab*a*c:  transitiediagram maken
 
* 3. geg:
S <- NP VP
VP <- V NP
VP <- V NP PP
NP <- DET N
NP <- DET N PP
PP <- P NP
shift reduce parser: maak hiervoor een parser state diagram en oracle
parse trace NOT asked
 
*4. reading assignment
** kind of nlp system
** approach/principles
** pro en contra
** how is this an improvement over older systems/how would newer systems tackle this problem
 
==Robby Goetschalckx, 2002-02-02==
 
* 1) error grammar approach en similarity: bespreek voor en nadelen, wat gebruiken in een echt systeem
 
* 2) a(ba)*b*c: deterministisch transitiediagram maken
 
* 3) geg:
S <- NP
NP <- DET NO
NP <- NP PP
NO <-N
NO <- ADJ NO
PP <- PREP NP
shift reduce parser: maak hiervoor een parser state diagram en oracle + pas toe op een gegeven zin
 
* 4) reading assignment
** kind of nlp system
** approach/principles
** pro en contra
** how is this an improvement over older systems/how would newer systemstackle this problem
 
[[Categorie:1li]] [[Categorie:2li]]

Huidige versie van 22 jan 2021 16:39

Samenvattingen

Klik hier om de samenvattingen te bekijken

Informatie over het vak

Sinds 2009 wordt dit vak gegeven door Marie-Francine Moens en Vincent Vandeghinste. De inhoud is dan ook compleet veranderd.

Update 2015:

  • Lessen worden afwisselend gegeven door Marie-Francine Moens en Vincent Vandeghinste
  • Lessen duren 1,5 uur
  • Er worden 4 oefenzittingen gegeven

Algemeen

  • Schriftelijk 4u
  • Open boek, gebruik van handboek Jurafsky & Martin, slides, oplossingen oefenzittingen en notities.

Examenvragen

2021 google doc

January 2015

1. Given three phrases.

 a) Tag all the phrases using the Penn treebank POS tags.
 b) Compute the HMM transition probability matrix (do not apply smoothing).
 c) Compute the HMM emission probability matrix (no smoothin).
 d) Given a new phrase: compute the bigram probabilities for this phrase.
 e) Discuss the results of d). What would happen if we apllied smoothing?

2. Given two phrases:

Fruit flies like a ripe banana. Time flies like an arrow.

 a) Write down the PCFG for this corpus.
 b) Convert it to CNF.
 c) Apply CKY parsing. 
 d) Show the resulting parse trees and their probabilities.
 e) Discuss the results.

3. Given a hidden Markov model and a series of observations, compute the most likely joint state of the HMM.

4. Given three text snippets, compute the association of two pairs of words using pointwise mutual information association measure and the Lin association measure.

5. Question 5, January 2015.

6. You want to build a system which finds companies, brands, names, etc. which are mentioned on web pages. How would you do this? Go step by step, in enough detail, using the techniques mentioned in the course. Mention the bottlenecks involved in the process.


Januari 2015

1) Gegeven een FSA, geef de bijhorende regex en geef 10 strings die door deze FSA gegenereerd kunnen worden. De FSA was net dezelfde als die van op het examen in 2009.

2) Je krijgt 2 parse-trees (2 heel eenvoudige zinnen "time flies like an arrow" en "time flies like a banana")

 a) stel een PCFG hiervan op
 b) zet deze PCFG om naar CNF
 c) pas CKY toe op de zin "time flies like a banana"
 d) teken de mogelijke parse-trees en schrijf bij elk hun probabiliteit

3) Gegeven 5 zinnen (zin 1 is dezelfde als zin 3 en zin 2 is dezelfde als zin 4). Het woord "anybody" kwam geen enkele keer voor in de 5 zinnen, het woord "nobody" 3 keer.

a) Met het gebruik van bigrams, bereken de probabiliteit van het woord "nobody" en het woord '"anybody" met behulp van MLE, Laplace smoothing en Good Turing Smoothing. 
b) Vergelijk de drie methodes en geef voor- en nadelen voor elke methode.

4) Theorievraag: de vraag ging over pairwise coreference classifier (discourse analysis) en had twee deelvragen:

a) hoe worden coreference chains gevormd op basis van het resultaat van de classifier?
b) geef vijf features (gezien tijdens de les) die voor deze classifier gebruikt kan worden

5) Theorievraag: gegeven de slides van de laatste les over semantic parsing. Op de slides staat een uitgewerkt voorbeeld van stochastic gradient descent, een optimaliserend algoritme. Gevraagd: leg de verschillende iteraties van het voorbeeld uit en leg uit hoe de parameters in het algoritme aan hun waarde komen.

Juni 2009

1) Gegeven een FSA, geef de bijhorende regex. De FSA zag er ongeveer zo uit:

q_0 -> q_1 <-> f <- q_2
        |            ^
        |            |
         - - - - - - 
met q_0 -> q_1 = a
    q_1 -> f = b
    q_1 -> q_2 = b
    q_2 -> f = a
    f -> q_1 = a
2) Je krijgt 2 parse-trees (2 heel eenvoudige zinnen "time flies like an arrow" en "time flies 
   like a banana")
 a) stel een PCFG hiervan op
 b) zet deze PCFG om naar CNF
 c) pas CKY toe op een zin (juiste zin weet ik niet meer, alleszinds ook iets met "time flies")
 d) teken de mogelijke parse-trees en schrijf bij elk hun probabiliteit
3) Wat is rhetorical structure theory? Geef relevante voorbeelden, uitleg en toepassingen.
4) Gegeven 3 engelstalige zinnen.
  a) bereken de similatiteit tussen 'flight' & 'debris' en 'flight' & 'Airbus' via de lin assoc 
     methode
  b) waarvoor kan je deze similariteit zoals gebruiken
5) theorie...cant quite remember
6) Stel je moet een e-mail management programma maken dat bestaat uit 2 delen.
  - Task manager : haalt uit de binnenkomende e-mails alle tasken
  - Time manager : bewaart het overzicht over je afspraken en herinnert je aan deadline en tasks
 Hoe zou je dit aanpakken?