Parser: Unterschied zwischen den Versionen
(12 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt) | |||
Zeile 4: | Zeile 4: | ||
[[Kategorie:Informatik]] | [[Kategorie:Informatik]] | ||
=Fachbegriffe= | |||
Scanner, Parser, Interpreter, Zustand, Wort, Buchstabe, switch-case | |||
=Begriffsklärung: Scanner, Parser, Interpreter= | =Begriffsklärung: Scanner, Parser, Interpreter= | ||
Ein '''Scanner''' zu einem Alphabet überprüft, ob ein Wort ausschließlich aus Buchstaben des Alphabets besteht. | Ein '''Scanner''' zu einem Alphabet überprüft, ob ein Wort ausschließlich aus Buchstaben des Alphabets besteht. | ||
Ein '''Parser''' zu einer Grammatik ist ein Algorithmus, mit dem sich überprüfen lässt, ob ein Wort zu der von der Grammatik erzeugten Sprache gehört, d.h. ob es syntaktisch korrekt ist. Der Algorithmus lässt sich dann z.B. in Java implementieren.<br> | Ein '''Parser''' zu einer Grammatik ist ein Algorithmus, mit dem sich überprüfen lässt, ob ein Wort zu der von der Grammatik erzeugten Sprache gehört, d.h. ob es syntaktisch korrekt ist. Der Algorithmus lässt sich dann z.B. in Java implementieren.<br> | ||
Ein '''Interpreter''' (im Sinne der Softwaretechnik) ist ein Computerprogramm, das einen Programm-Quellcode einliest, analysiert und ausführt. | Ein '''Interpreter''' (im Sinne der Softwaretechnik) ist ein Computerprogramm, das einen Programm-Quellcode einliest, analysiert und ausführt. | ||
Zeile 19: | Zeile 20: | ||
=Funktionsweise des Parsers= | =Funktionsweise des Parsers= | ||
'''Ein Parser simuliert den zu der Grammatik gehörenden [[Deterministischer Endlicher Automat|Automaten]]'''. | '''Ein Parser simuliert den zu der Grammatik gehörenden Automaten'''. | ||
* Im folgenden wird der Parser für einen '''[[Deterministischer Endlicher Automat|Deterministischen Endlichen Automaten]]''' beschrieben. | |||
* Der Parser für einen '''[[Kellerautomat]]''' findet sich '''[[Kellerautomat#Parser_für_einen_Kellerautomaten|hier]]'''. | |||
=Beispiel= | =Beispiel= | ||
Zeile 27: | Zeile 31: | ||
Der KGB-Automat erkennt Wörter, die nur aus den Ziffern 0,...,9 bestehen und die irgendwo die Zahlenkette "007" enhalten. | Der KGB-Automat erkennt Wörter, die nur aus den Ziffern 0,...,9 bestehen und die irgendwo die Zahlenkette "007" enhalten. | ||
=Implementierung mit switch-case= | =Implementierung mit switch-case= | ||
Die Implementierung mit switch-case bildet den Automaten ab. | Die Implementierung mit switch-case bildet den Automaten ab. | ||
<code> | '''Diese Implementierungsvariante ist nur bedingt klausurgeeignet.'''<br/> | ||
'''Für Klausuren nimmt man besser die Variante mit <code>else if</code>.''' | |||
<u>Hinweis:</u> Die Zustände werden duch '''Zahlen''' (<code>int</code>) abgebildet, die "Buchstaben" des zu prüfenden Wortes dagegen sind <code>char</code>, d.h. z.B. <code>'0'</code> | |||
import gui.GUI; | <code>import gui.GUI; | ||
public class KGBAutomat { | |||
private char[] alphabet = {'0', '1', '2','3','4','5','6','7','8','9'}; | |||
'''public boolean imAlphabet(char pZeichen){''' | |||
for(int i=0; i<alphabet.length; i++){ | |||
char zeichen = alphabet[i]; | |||
if(zeichen == pZeichen){ | |||
return true; | |||
} | |||
} | |||
return false; | |||
} | |||
// ueberprueft, ob pWort aus Buchstaben des Alphabets besteht | |||
'''public boolean scan(String pWort){''' | |||
for(int i=0; i<pWort.length(); i++){ | |||
char zeichen = pWort.charAt(i); | |||
if(!imAlphabet(zeichen)){ | |||
return false; | |||
} | |||
} | |||
return true; | |||
} | |||
'''public boolean parse(String pWort){''' | |||
//erst auf das Alphabet ueberpruefen | |||
if(scan(pWort) == false){ | |||
return false; | |||
} | |||
int zustand = 0; | |||
for(int i=0; i<pWort.length(); i++){ | |||
char zeichen = pWort.charAt(i); | |||
switch(zustand){ | |||
case 0: switch(zeichen){ | |||
case '0': zustand = 1; continue; | |||
default: zustand = 0; continue; | |||
} | |||
case 1: switch(zeichen){ | |||
case '0': zustand = 2; continue; | |||
default: zustand = 0; continue; | |||
} | |||
case 2: switch(zeichen){ | |||
case '0': zustand = 2; continue; | |||
case '7': zustand = 3; continue; | |||
default: zustand = 0; continue; | |||
} | |||
case 3: switch(zeichen){ | |||
default: zustand = 3; continue; | |||
} | |||
} | |||
} | |||
return (zustand == 3); | |||
} | |||
public static void main(String[] args) { | |||
new GUI(new KGBAutomat()); | |||
} | |||
}</code> | |||
=Implementierung mit <code>else if</code>= | |||
'''Die Implementierung mit <code>else if</code> ist vor allem für Klausuren geeignet, weil man sich so keine neue Syntax merken muss!''' | |||
<code>public boolean parse(String pWort){ | |||
int zustand = 0; | |||
for(int i=0; i<pWort.length(); i++){ | |||
char zeichen = pWort.charAt(i); | |||
'''if'''(zustand == 0){ | |||
'''if'''(zeichen == '0') zustand = 1; | |||
'''else''' zustand = 0; | |||
} | |||
'''else if'''(zustand == 1){ | |||
'''if'''(zeichen == '0') zustand = 2; | |||
'''else''' zustand = 0; | |||
} | |||
'''else if'''(zustand == 2){ | |||
'''if'''(zeichen == '0') zustand = 2; | |||
'''else if'''(zeichen == '7') zustand = 3; | |||
'''else''' zustand = 0; | |||
} | |||
// die einzig verbleibende Moeglichkeit ist zustand==3 | |||
// d.h. man braucht kein else if mehr! | |||
'''else''' { | |||
zustand = 3; | |||
} | |||
} | |||
//zurueckgeben, ob der Zustand 3 erreicht wurde. | |||
return (zustand == 3); | |||
}</code> | |||
</code> |
Aktuelle Version vom 10. April 2024, 06:58 Uhr
Fachbegriffe
Scanner, Parser, Interpreter, Zustand, Wort, Buchstabe, switch-case
Begriffsklärung: Scanner, Parser, Interpreter
Ein Scanner zu einem Alphabet überprüft, ob ein Wort ausschließlich aus Buchstaben des Alphabets besteht.
Ein Parser zu einer Grammatik ist ein Algorithmus, mit dem sich überprüfen lässt, ob ein Wort zu der von der Grammatik erzeugten Sprache gehört, d.h. ob es syntaktisch korrekt ist. Der Algorithmus lässt sich dann z.B. in Java implementieren.
Ein Interpreter (im Sinne der Softwaretechnik) ist ein Computerprogramm, das einen Programm-Quellcode einliest, analysiert und ausführt.
Im Umgang mit Programm-Quellcode ergibt sich folgende Arbeitsfolge:
Scanner → Parser → Interpreter
Funktionsweise des Parsers
Ein Parser simuliert den zu der Grammatik gehörenden Automaten.
- Im folgenden wird der Parser für einen Deterministischen Endlichen Automaten beschrieben.
- Der Parser für einen Kellerautomat findet sich hier.
Beispiel
Es soll ein Parser für den KGB-Automaten (siehe rechts) erstellt werden.
Der KGB-Automat erkennt Wörter, die nur aus den Ziffern 0,...,9 bestehen und die irgendwo die Zahlenkette "007" enhalten.
Implementierung mit switch-case
Die Implementierung mit switch-case bildet den Automaten ab.
Diese Implementierungsvariante ist nur bedingt klausurgeeignet.
Für Klausuren nimmt man besser die Variante mit else if
.
Hinweis: Die Zustände werden duch Zahlen (int
) abgebildet, die "Buchstaben" des zu prüfenden Wortes dagegen sind char
, d.h. z.B. '0'
import gui.GUI;
public class KGBAutomat {
private char[] alphabet = {'0', '1', '2','3','4','5','6','7','8','9'};
public boolean imAlphabet(char pZeichen){
for(int i=0; i<alphabet.length; i++){
char zeichen = alphabet[i];
if(zeichen == pZeichen){
return true;
}
}
return false;
}
// ueberprueft, ob pWort aus Buchstaben des Alphabets besteht
public boolean scan(String pWort){
for(int i=0; i<pWort.length(); i++){
char zeichen = pWort.charAt(i);
if(!imAlphabet(zeichen)){
return false;
}
}
return true;
}
public boolean parse(String pWort){
//erst auf das Alphabet ueberpruefen
if(scan(pWort) == false){
return false;
}
int zustand = 0;
for(int i=0; i<pWort.length(); i++){
char zeichen = pWort.charAt(i);
switch(zustand){
case 0: switch(zeichen){
case '0': zustand = 1; continue;
default: zustand = 0; continue;
}
case 1: switch(zeichen){
case '0': zustand = 2; continue;
default: zustand = 0; continue;
}
case 2: switch(zeichen){
case '0': zustand = 2; continue;
case '7': zustand = 3; continue;
default: zustand = 0; continue;
}
case 3: switch(zeichen){
default: zustand = 3; continue;
}
}
}
return (zustand == 3);
}
public static void main(String[] args) {
new GUI(new KGBAutomat());
}
}
Implementierung mit else if
Die Implementierung mit else if
ist vor allem für Klausuren geeignet, weil man sich so keine neue Syntax merken muss!
public boolean parse(String pWort){
int zustand = 0;
for(int i=0; i<pWort.length(); i++){
char zeichen = pWort.charAt(i);
if(zustand == 0){
if(zeichen == '0') zustand = 1;
else zustand = 0;
}
else if(zustand == 1){
if(zeichen == '0') zustand = 2;
else zustand = 0;
}
else if(zustand == 2){
if(zeichen == '0') zustand = 2;
else if(zeichen == '7') zustand = 3;
else zustand = 0;
}
// die einzig verbleibende Moeglichkeit ist zustand==3
// d.h. man braucht kein else if mehr!
else {
zustand = 3;
}
}
//zurueckgeben, ob der Zustand 3 erreicht wurde.
return (zustand == 3);
}