LFG als Interlingua in der maschinellen - PowerPoint PPT Presentation

About This Presentation
Title:

LFG als Interlingua in der maschinellen

Description:

Title: Kein Folientitel Author: Zuzanna Pesselova Last modified by: Karl Heinz Wagner Created Date: 2/4/2003 7:49:24 PM Document presentation format – PowerPoint PPT presentation

Number of Views:79
Avg rating:3.0/5.0
Slides: 22
Provided by: Zuza46
Category:

less

Transcript and Presenter's Notes

Title: LFG als Interlingua in der maschinellen


1
LFG als Interlingua in der maschinellen
Übersetzung
  • Referat von Zuzana Pesselová
  • am Mittwoch, den 05.02.2003

2
Typen der MÜ (designs)
  • direkte MÜ
  • minimale Analyse
  • transfer-basierte MÜ
  • zunehmende Analyse
  • kontrastive Basis
  • interlingua-basierte MÜ
  • maximale Analyse
  • universelle Basis

3
Interlingua
  • Ziel Eine Repräsentation soll Hierarchien von
    Substrukturen abbilden, dabei jedoch klare
    Zwischenbeziehungen zeigen.
  • gewünschtes Ergebnis Eine Repräsentation des
    Textes, die unabhängig von einer Einzelsprache
    existiert ( Basis für die Generierung des
    zielsprachigen Textes).
  • Nachteile Analyse und Generierung müssen streng
    getrennt sein Während der Generierung ist es
    nicht möglich, auf den Originaltext
    zurückzugreifen.

4
strukturelle Repräsentation in den
Interlingua-Systemen
  • Propositionale Logik
  • Any government is dependent on its supporters.
  • All(X), government (X), indefinite (Y), plural
    (Y), support (Y, X, T), depend on (X, Y, T),
    timeless (T)
  • Wertung
  • Problemlose Analyse, Generierung beinahe
    unmöglich, da keine syntaktische Information
    vorhanden.
  • Lösungen multilingual paraphrasing
  • Every governmet has supporters which it depends
    on.
  • People who support all governments are depended
    on by them.
  • All governments depend on people who support them.

5
strukturelle Repräsentation in den
Interlingua-Systemen
  • LFG
  • Zusammenfassung mehrerer Sprachen beim
    gleichzeitigen Ausgleich deren Unterschiede.

6
lexikalische Repräsentation in den
Interlingua-Systemen
  • Konzepte
  • sprachunabhängige lexikalische Einheiten
  • meanings derived from the process of
    understanding of texts
  • Text (sein linguistischer Inhalt), über Phänomene
    (Einheiten, Aktionen, Begebenheiten) außerhalb
    des Textes (außersprachliche Realität)

7
Definition von Interlingua
  • Eine Interlingua ist keine Sprache in
    herkömmlichen Sinne, sondern eine Art der
    Repräsentation (der Struktur).
  • Üblicherweise wird sie gezielt bei ausgewählten
    Sprachpaaren oder bei mehreren verwandten
    Sprachen angewandt.

8
Die Interlingua-Grammatiken
  • Generative Transformationsgrammatik (Chomsky,
    seit 1955)
  • 50.-90. Jahre
  • Oberflächenstruktur vs. Tiefenstruktur
  • Transformationen, die eine TS in eine OS
    überführen
  • Die Annahme, dass es sich um eine
    sprach-unabhängige Basis für die semantische
    Interpretation handelt, hat sich nicht bestätigt.

9
Die Interlingua-Grammatiken
  • 2. Kasusgrammatik(Fillmore, 1968)
  • Vermutung, dass die Repräsentationen der
    Kasusstruktur die Syntaxuniversalien abbilden
  • oft benutzt worden in bilingualen
    transfer-basierten Systemen (z.B. Japanisch)
  • Problem Kasusrollen nicht standardisiert(no
    widely agreed set of case relations)

10
Maschinelle Übersetzung mit LFG
  • 70. Jahre (Bresnan, Kaplan)
  • als Kritik an GTG
  • zwei Ebenen der syntaktischen Repräsentation
  • C-Struktur (constituent-structure)
  • F-Struktur (functional-structure)
  • werden erzeugt über die Phrasenstrukturregeln
  • zusätzlich
  • Funktionen (als Grundbegriffe)
  • Lexikoneinträge (mit lexikalischen Regeln)

11
C-Struktur und F-Struktur
  • Beispiel

12
C-Struktur und F-Struktur
  • C-Struktur
  • Phrasenstrukturbaum
  • geordnete Aufstellung der Wörter und Phrasen des
    Satzes
  • kontextfreie Notation
  • F-Struktur
  • hierarchische Funktion
  • enspricht den grammatischen Funktionen (S, O,
    etc.)
  • umfaßt auch morphosyntaktische Merkmale (Case,
    Num, Tense)

13
Transfer mit F-Strukturen
  • Einlesen des Quellsprachensatzes (Parser)
  • Ergebnis ist/sind F-Struktur(en) der Quellsprache
  • Übersetzung der F-Struktur(en) mithilfe von
  • Transfer-Lexikon (inkl. Subkategorisierung)
  • Top-Down-Verfahren
  • Ergebnis ist/sind F-Struktur(en) der Zielsprache
  • Generieren der Oberfläche (Generator)

14
Top down beim Transfer mit F-Strukturen
  • Suche von PRED (zunächst das vom Wurzelknoten
    dominierte PRED)
  • Überfprüfung der Valenz in der vorliegenden
    F-Struktur
  • Suche vom Eintrag mit der gleichen Valenz
  • Eintrag Grundlage für die F-Struktur der
    Zeilsprache
  • anschl. PRED der nächste niedrigen Stufe wird
    gesucht

15
Transfer mit F-Strukturen
  • Beispiel

16
Funktionen in der LFG
  • Description-by-analysis
  • Die Struktur kann nur diejenigen Eigenschaften
    haben, die aus der Information abgeleitet wurde,
    die in der vorliegenden Struktur explizit
    identifiziert wurde.
  • Codescription
  • Diese Beschreibungen lassen zu, dass die
    endgültige Struktur Eigenschaften hat, die in der
    F-Struktur nicht vorhanden sein können.

17
Funktionen in der LFG
  • Funktionen signalisieren das Überführen der
    Strukturen in andere Strukturen (z.B. von
    C-Strukturen zu F-Strukturen, von F-Strukturen zu
    semantischen Strukturen).

18
Vorgehensweise bei der MÜ mit LFG (Stufe 2)
  • Die Beschreibung der zielsprachigen Strukturen
    ist von den quellsprachigen Strukturen mittels
    Analyse und Codescription abgeleitet.
  • Dabei werden zusätzliche Vermerke auf der Basis
    der C-Strukturen und der lexikalischen Einheiten
    gemacht.
  • Dies dient als Input für die Generierung der
    zielsprachigen Version.

19
Beispiel für die Leistungsfähigkeit
  • The student is likely to work.
  • Il est probable que letudiant travaillera.

20
Beispiel für die Leistungsfähigkeit
  • Berücksichtigung der Tempuskonkordanz

21
Fazit des Ansatzes von Kaplan
  • an approach to machine translation that exploits
    the potential of simultaneous correspondences
    between different levels of linguistic
    representation
  • it allows partial specification and
    multi-level-transfer

22
Kommerzielle Nutzung
  • XLE (Xerox Linguistic Environment)
  • Xerox Palo Alto Research Center in California
  • Xerox Research Center in Europe (Grenoble)
  • Institut für maschinelle Sprachverarbeitung
    (Stuttgart)
  • FUJITSU (Japan)
  • NEC (Japan)
Write a Comment
User Comments (0)
About PowerShow.com