-------------------------------------------------------------------------- Ausgew"ahlte Fragen zur Vorlesung "Der EM-Algorithmus" -------------------------------------------------------------------------- zu Abschnitt 3.2: (1) Welches sind die Elemente des EM-Algorithmus? (2) Was versteht man unter der empirischen Wahrscheinlichkeitsverteilung der unvollst"andigen Datentypen? (Beispiele) (3) Was versteht man unter einer symbolischen Analysekomponente? (Beispiele) (4) Was ist ein Parameterraum? (Beispiele) (5) Welche Eigenschaften muss die symbolische Analysekomponente erf"ullen? (6) Warum fordert man diese Eigenschaften? (7) Warum sollte man bei Anwendung des EM-Algorithmus mit m"oglichst vielen Startparametern arbeiten? (8) Wie sieht die prozedurale Sicht auf den EM-Algorithmus aus? zu Abschnitt 3.3: (9) Was versteht man unter der empirischen Wahrscheinlichkeitsverteilung der vollst"andigen Datentypen? (10) Wie kann man die Log-Likelihood des gegenw"artigen Korpus der vollst"andigen Datentypen interpretieren? (11) Zu welcher neuen Sichtweise auf den EM-Algorithmus f"uhrt dies? zu Abschnitt 2.3: (12) Was ist ein Erwartungswert? (13) Was ist die Korpuswahrscheinlichkeit? (14) Was ist die Log-Likelihood eines Korpus? (15) Was ist die Cross-Entropie? (16) Was ist die Entropie eines Korpus? (17) Was ist die relative Entropie? (18) In welchem Verh"altnis stehen Entropie und Cross-Entropie zueinander? (19) Was hat damit die ber"uhmte Informationsungleichung der Informationstheorie zu tun? zu Abschnitt 2.4: (20) Was versteht man unter Maximum-Likelihood-Estimierung? (21) Unter welchen Umst"anden ist das Ergebnis der Maximum-Likelihood-Estimierung die empirische Wahrscheinlichkeitsverteilung? (22) Kannst Du dies (unter Benutzung der Informationsungleichung) beweisen? zu Abschnitt 3.6: (23) Was ist ein GEM-Algorithmus? (24) Ist der EM-Algorithmus ein GEM-Algorithmus? (25) Welche Eigenschaften hat ein GEM-Algorithmus? zu Abschnitt 2.5: (26) Wie ist Baumbank-Training definiert? (Beispiel) (27) Unter welchen statistischen Annahmen darf ein Korpus von Syntaxb"aumen als ein Korpus von Grammatikregeln aufgefasst werden? (28) Unter welchen Annahmen maximiert Baumbank-Training die Wahrscheinlichkeit der Baumbank? zu Abschnitt 3.8: (29) Was ist eine probabilistische kontextfreie Grammatik? (30) Wie ist die Wahrscheinlichkeit eines Syntaxbaums definiert? (31) Wie ist die Wahrscheinlichkeit eines Satzes definiert? (32) Was sind die Voraussetzungen daf"uer, dass eine probabilistische kontextfreie Grammatik mit dem EM-Algorithmus trainiert werden kann? (33) Wie sehen die EM-Reestimierungsformeln f"ur probabilistische kontextfreie Grammatiken aus? (34) Welche symbolische Analysekomponente muss man benutzen, um zu zeigen, dass Baumbank-Training ein Spezialfall des EM-Trainings ist?