Gruppe Dienstag 12-14Uhr Thema 1: In Korpora gesprochener Sprache sind häufig keine Sätze/Satzzeichen annotiert. Eine Abfrage "within s" ist somit nicht möglich. Wie lässt sich dennnoch die Satzanzahl im Korpus abfragen? Welchen Zusammenhang gibt es zwischen (finiten) Verben und der Satzanzahl? Wie sieht die Query für eine Abfrage aller finiter Verben im Korpus TIC aus? Welche Unterscheide sind zwischen folgenden Subkorpora zu beobachten: - original spoken (ORG_SP) vs original written (ORG_WR) - translated (TR) vs interpreted (SI) - ES_EN vs. DE_EN. Zusatz: Wie kann die durchschnittliche Satzlänge berechnet werden? Thema 2: Beim Simultandolmetschen ist der Dolmetscher abhängig von Redefluss und Redegeschwindigkeit des Originalredners. Dieser Zeitdruck könnte dazu führen, dass weniger wichtige Information wie (redundante) Attribute weggelassen werden. Vergleichen Sie die Gesamtanzahl der Nomen im Korpus TIC mit der Anzahl von Adjektiv-Nomen- und Adjektiv-Adjektiv-Nomenverbindungen. Wie sehen die entsprechenden Queries aus? Welche Unterscheide sind zwischen folgenden Subkorpora zu beobachten: - original spoken (ORG_SP) vs original written (ORG_WR) - translated (TR) vs interpreted (SI) - ES_EN vs. DE_EN. Thema 3: In Korpora gesprochener Sprache sind häufig keine Sätze/Satzzeichen annotiert. Eine Abfrage "within s" ist somit nicht möglich. Wie lässt sich dennnoch die Satzanzahl im Korpus abfragen? Welchen Zusammenhang gibt es zwischen Konjunktionen und der Satzanzahl? Welche Konjunktionen müssen berücksichtigt werden, wenn die Anzahl der Haupt- und Nebensätze ermittelt werden soll? Konjunktionen in welchem Umfeld müssen ausgeschlossen werden? Wie sieht die Query für Konjunktionen, die Haupt- und Hauptsätze, sowie Haupt- und Nebensätze verbinden für das Korpus TIC aus? Welche Unterscheide sind zwischen folgenden Subkorpora zu beobachten: - original spoken (ORG_SP) vs original written (ORG_WR) - translated (TR) vs interpreted (SI) - ES_EN vs. DE_EN.