Giáo trình Chương trình dịch - Bài 6: Phân tích cú pháp trên xuống có quay lui - Nguyễn Thị Thu Hương
Cài đặt phức tạp
Chi phí thời gian quá lớn nếu chương trình
phải phân tích gồm nhiều ký hiệu (từ tố)
Không thể thông báo lỗi chi tiế
8 trang |
Chia sẻ: huongthu9 | Lượt xem: 436 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Giáo trình Chương trình dịch - Bài 6: Phân tích cú pháp trên xuống có quay lui - Nguyễn Thị Thu Hương, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/1/2010
1
Bài 6
Phân tích cú pháp
t ê ố ó l i
1
r n xu ng c quay u
Bài toán phân tích cú pháp
Bài toán đặt ra
Cho văn phạm phi ngữ cảnh G và xâu w
L(G) đú h i?
2
w ∈ ng ay sa
Phân tích trên xuống (top down)
S ⇒* w?
w đúng cú pháp ⇒cây cú pháp
E -> E + T
E -> T
T > T * F
3
-
T -> F
F -> ( E )
F -> ident
Biểu diễn cây cú pháp bằng cách nào?
Phân tích trái
Phân tích trái của α là dãy các sản xuất
được sử dụng trong suy dẫn trái ra α từ S
4
Phân tích là danh sách các số từ 1 đến p
21/1/2010
2
Ví dụ
Xét văn phạm G, các sản xuất được đánh số
như sau
1.E → T+E
2.E → T
5
3.T → F* T
4.T → F
5.F → (E)
6.F → a
Phân tích trái của xâu a*(a+a) là 23645124646
Giải thuật phân tích top down quay lui
Tư tưởng chủ yếu của giải thuật là xây
dựng cây phân tích cú pháp (cây suy dẫn)
cho xâu w
6
Đánh số thứ tự các sản xuất có cùng vế
phải, như vậy, các A - sản xuất của văn
phạm sẽ được xếp thứ tự
A → α1 | α2 | . . . .| αn
Mô tả giải thuật
Bắt đầu từ nút gốc S
Nút S được coi là nút hoạt động
7
Tạo ra các nút con một cách đệ quy
Nút hoạt động là ký hiệu
không kết thúc A
Chọn vế phải đầu tiên của A- sản xuất : X1X2. . . .Xk.
Tạo k nút con trực tiếp của A với nhãn X1, X2, . . . .Xk.
Nút hoạt động là nút nhãn X1
8
.
Nếu k = 0, (sản xuất A → ε) thì nút hoạt động sẽ là nút
bên phải (ngay sau) A khi duyệt cây theo thứ tự trái
21/1/2010
3
Nút được xét có nhãn là ký hiệu
kết thúc a
So sánh với ký hiệu đang xét.
Nếu trùng với ký hiệu đang xét thì chuyển đầu
đọc sang phải 1 ô, chuyển sang xét nút bên phải.
Nếu a không trùng với ký hiệu đang xét thì quay
9
lui tới nút mà tại đó đã sử dụng sản xuất trước
(Thay thế một ký hiệu không kết thúc (chẳng hạn
A) bằng vế phải một sản xuất).
Chuyển đầu đọc sang trái (nếu cần) và thử với lựa
chọn tiếp theo. Nếu không còn lựa chọn nào khác
thì quay lui tới bước trước đó
Nếu đã quay lui tới S và không còn lựa chọn
khác:câu sai cú pháp
Điều kiện để thực hiện giải thuật
Văn phạm G cần thoả điều kiện
10
không đệ quy trái để tránh rơi vào
chu trình
Ví dụ
Cho văn phạm
S → aSb | c
Các sản xuất sẽ được đánh số từ 1 đến 2
11
.
Xét xâu vào aacbb
Dựng cây phân tích cú pháp
12
21/1/2010
4
Thử lựa chọn khác
13
Giải thuật phân tích cú pháp quay lui
Vào
Văn phạm G phi ngữ cảnh không đệ quy trái,
xâu w = a1. . . .an, n ≥ 0
Các sản xuất của G được đánh số 1,. . . . q
Ra
Một hâ tí h t ái h ( ế ó)
14
p n c r c o w n u c
Thông báo lỗi nếu ngược lại
Phương pháp
(Xây dựng 2 stack D1 và D2.
D2 biểu diễn dạng câu trái hiện tại có được bằng
15
cách thay thế các ký hiệu không kết thúc bởi vế
phải tương ứng
D1 ghi lại lịch sử những lựa chọn đã sử dụng và
những ký hiệu vào trên đó đầu đọc đã đổi vị trí
(1)
∀ A ∈ N , giả sử có các A-sản xuất
A → α1 | α2 | . . . .| αn
Coi các sản xuất trên là
16
A1 → α1
. . . .
An → αn
21/1/2010
5
Hình trạng của giải thuật
Bộ bốn (s, i, α, β)
s ∈ Q: Trạng thái hiện thời
q: Trạng thái bình thường
b Q l i
17
: uay u
t: Kết thúc
i : Vị trí đầu đọc (Băng vào có dấu hiệu kết thúc #)
α: Nội dung stack thứ nhất
β: Nội dung stack thứ hai
Thực hiện giải thuật
Bắt đầu từ hình trạng đầu, tính liên tiếp
các hình trạng tiếp theo cho đến khi
không tính được nữa.
18
Nếu hình trạng cuối là (t,n+1,γ,ε), đưa
ra h(γ) và dừng. Ngược lại đưa ra thông
báo sai
Ví dụ
Xét xâu vào aacbb và văn phạm G với
các sản xuất
19
S → aSb
S → c
Đánh số lại các sản xuất
1. S1 → aSb
2 S → c
20
. 2
21/1/2010
6
Quá trình thay đổi hình trạng
(q,1, ε, S#)
|⎯ (q, 1, S1, aSb#)
|⎯ (q, 2, S1a, Sb#)
|⎯ (q, 2, S1aS1,aSbb#)
|⎯ (q, 3, S1aS1a, Sbb#)
| ( 3 S S S Sbbb#)
21
⎯ q, , 1a 1a 1,a
|⎯ (b, 3, S1aS1aS1,aSbbb#)
|⎯ (q, 3, S1aS1aS2, cbb#)
|⎯ (q, 4, S1aS1aS2c,bb#)
|⎯ (q, 5, S1aS1aS2cb,b#)
|⎯ (q, 6, S1aS1aS2cbb,#)
|⎯ (t, 6, S1aS1aS2cbb, ε )
Tìm phân tích trái
h(a) = ε ∀a là ký hiệu kết thúc
h(Ai)= p ,
p là số hiệu của sản xuất liên hệ với sản
xuất A→ γ với γ là lựa chọn thứ i của A
Văn phạm
22
h(S1aS1aS2cbb)=112
1. S1 → aSb
2. S2 → c
Thử phân tích quay lui với KPL
Phân tích từ vựng và mã hóa từ tố
Tập sản xuất của văn phạm
23
Chuyển sơ đồ cú pháp thành luật
::= program ident ; .
::=
24
- -
begin
end
21/1/2010
7
Mã hóa ký hiệu không kết thúc
if(str=="") return 1;
if(str=="") return 2;
if(str=="") return 3;
if (str == "") return
4;
if (str == "") return 5;
if (str == "") return 13;
if (str == "") return 14;
if(str=="") return 15;
if(str=="") return 16;
if(str=="" ) return 17;
if ( t " diti ") t 18
25
if(str=="") return 6;
if (str =="") return 7;
if (str == "") return 8;
if (str == "") return 9;
if(str=="") return 10;
if (str == "") return 11;
if(str=="") return 12;
s r == re urn ;
if (str == "") return 19;
if(str=="") return 20;
if (str == "") return 21;
if(str=="") return 22
if(str=="") return 23;
if (str == "") return 24;
Mã hóa từ tố: tên, số, hằng ký tự
// ident;
if(str == "ident") return 25;
//const
if(str == "number")return 26;
if (str == "charcon") return 27;
//specific symbol
if (str =="lparen") return 35;
if (str == "rparen") return 36;
if (str == "comma") return 37;
if (str == "semicolon") return 38;
26
//operator
if(str == "plus")return 28;
if (str == "minus") return 29;
if (str == "times") return 30;
if (str == "slash") return 31;
if (str == "oddsym") return 32;
if (str == "assign") return 33;
if (str == "leq") return 34;
if (str == "period") return 39;
if (str == "becomes") return 40;
if (str == "lbrace") return 41;
if (str == "rbrace") return 42;
if (str == "lbrack") return 43;
if (str == "rbrack") return 44;
Mã hóa từ tố: từ khóa
if (str == "beginsym") return 45;
if (str == "endsym") return 46;
if (str == "ifsym") return 47;
if (str == "varsym") return 53;
if (str == "progsym") return 54;
if (str == "funcsym") return 55;
if (str == "typesym") return 56;
27
if (str == "thensym") return 48;
if (str == "whilesym") return 49;
if (str == "dosym") return 50;
if (str == "callsym") return 51;
if (str == "constsym") return 52;
if (str == "arraysym") return 57;
if (str == "ofsym") return 58;
if (str == "intsym") return 59;
if (str == "charsym") return 60;
Mã hóa từ tố: phép toán quan hệ
//relations
if (str == "eql") return 61;
if (str == "leq") return 62;
if (str == "neq") return 63;
28
if (str == "lss") return 64;
if (str == "gtr") return 65;
if (str == "geq") return 66;
21/1/2010
8
Mã hóa sản xuất
::= program ident ; .
setlaw[1,1]="54 25 38 2 39 ";
29
::=
begin end
setlaw[2,1]=" 3 6 12 15 10 45 16 46 ";
Nhận xét
Cài đặt phức tạp
Chi phí thời gian quá lớn nếu chương trình
phải phân tích gồm nhiều ký hiệu (từ tố)
30
Không thể thông báo lỗi chi tiết
Các file đính kèm theo tài liệu này:
- giao_trinh_chuong_trinh_dich_bai_6_phan_tich_cu_phap_tren_xu.pdf