Giáo trình Chương trình dịch - Bài 6: Phân tích cú pháp trên xuống có quay lui - Nguyễn Thị Thu Hương

Cài đặt phức tạp „ Chi phí thời gian quá lớn nếu chương trình phải phân tích gồm nhiều ký hiệu (từ tố) „ Không thể thông báo lỗi chi tiế

pdf8 trang | Chia sẻ: huongthu9 | Lượt xem: 426 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Giáo trình Chương trình dịch - Bài 6: Phân tích cú pháp trên xuống có quay lui - Nguyễn Thị Thu Hương, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/1/2010 1 Bài 6 Phân tích cú pháp t ê ố ó l i 1 r n xu ng c quay u Bài toán phân tích cú pháp Bài toán đặt ra Cho văn phạm phi ngữ cảnh G và xâu w L(G) đú h i? 2 w ∈ ng ay sa Phân tích trên xuống (top down) S ⇒* w? w đúng cú pháp ⇒cây cú pháp E -> E + T E -> T T > T * F 3 - T -> F F -> ( E ) F -> ident Biểu diễn cây cú pháp bằng cách nào? Phân tích trái „ Phân tích trái của α là dãy các sản xuất được sử dụng trong suy dẫn trái ra α từ S 4 „ Phân tích là danh sách các số từ 1 đến p 21/1/2010 2 Ví dụ „ Xét văn phạm G, các sản xuất được đánh số như sau 1.E → T+E 2.E → T 5 3.T → F* T 4.T → F 5.F → (E) 6.F → a „ Phân tích trái của xâu a*(a+a) là 23645124646 Giải thuật phân tích top down quay lui „ Tư tưởng chủ yếu của giải thuật là xây dựng cây phân tích cú pháp (cây suy dẫn) cho xâu w 6 „ Đánh số thứ tự các sản xuất có cùng vế phải, như vậy, các A - sản xuất của văn phạm sẽ được xếp thứ tự A → α1 | α2 | . . . .| αn Mô tả giải thuật „Bắt đầu từ nút gốc S „Nút S được coi là nút hoạt động 7 „ Tạo ra các nút con một cách đệ quy Nút hoạt động là ký hiệu không kết thúc A „ Chọn vế phải đầu tiên của A- sản xuất : X1X2. . . .Xk. „ Tạo k nút con trực tiếp của A với nhãn X1, X2, . . . .Xk. „ Nút hoạt động là nút nhãn X1 8 . „ Nếu k = 0, (sản xuất A → ε) thì nút hoạt động sẽ là nút bên phải (ngay sau) A khi duyệt cây theo thứ tự trái 21/1/2010 3 Nút được xét có nhãn là ký hiệu kết thúc a „ So sánh với ký hiệu đang xét. … Nếu trùng với ký hiệu đang xét thì chuyển đầu đọc sang phải 1 ô, chuyển sang xét nút bên phải. … Nếu a không trùng với ký hiệu đang xét thì quay 9 lui tới nút mà tại đó đã sử dụng sản xuất trước (Thay thế một ký hiệu không kết thúc (chẳng hạn A) bằng vế phải một sản xuất). … Chuyển đầu đọc sang trái (nếu cần) và thử với lựa chọn tiếp theo. Nếu không còn lựa chọn nào khác thì quay lui tới bước trước đó „ Nếu đã quay lui tới S và không còn lựa chọn khác:câu sai cú pháp Điều kiện để thực hiện giải thuật „Văn phạm G cần thoả điều kiện 10 không đệ quy trái để tránh rơi vào chu trình Ví dụ „ Cho văn phạm S → aSb | c Các sản xuất sẽ được đánh số từ 1 đến 2 11 . „ Xét xâu vào aacbb Dựng cây phân tích cú pháp 12 21/1/2010 4 Thử lựa chọn khác 13 Giải thuật phân tích cú pháp quay lui „ Vào Văn phạm G phi ngữ cảnh không đệ quy trái, xâu w = a1. . . .an, n ≥ 0 Các sản xuất của G được đánh số 1,. . . . q „ Ra Một hâ tí h t ái h ( ế ó) 14 p n c r c o w n u c Thông báo lỗi nếu ngược lại Phương pháp „ (Xây dựng 2 stack D1 và D2. D2 biểu diễn dạng câu trái hiện tại có được bằng 15 cách thay thế các ký hiệu không kết thúc bởi vế phải tương ứng D1 ghi lại lịch sử những lựa chọn đã sử dụng và những ký hiệu vào trên đó đầu đọc đã đổi vị trí (1) „ ∀ A ∈ N , giả sử có các A-sản xuất A → α1 | α2 | . . . .| αn Coi các sản xuất trên là 16 A1 → α1 . . . . An → αn 21/1/2010 5 Hình trạng của giải thuật Bộ bốn (s, i, α, β) „ s ∈ Q: Trạng thái hiện thời ƒ q: Trạng thái bình thường b Q l i 17 ƒ : uay u ƒ t: Kết thúc „ i : Vị trí đầu đọc (Băng vào có dấu hiệu kết thúc #) α: Nội dung stack thứ nhất β: Nội dung stack thứ hai Thực hiện giải thuật „ Bắt đầu từ hình trạng đầu, tính liên tiếp các hình trạng tiếp theo cho đến khi không tính được nữa. 18 „ Nếu hình trạng cuối là (t,n+1,γ,ε), đưa ra h(γ) và dừng. Ngược lại đưa ra thông báo sai Ví dụ „ Xét xâu vào aacbb và văn phạm G với các sản xuất 19 S → aSb S → c Đánh số lại các sản xuất 1. S1 → aSb 2 S → c 20 . 2 21/1/2010 6 Quá trình thay đổi hình trạng (q,1, ε, S#) |⎯ (q, 1, S1, aSb#) |⎯ (q, 2, S1a, Sb#) |⎯ (q, 2, S1aS1,aSbb#) |⎯ (q, 3, S1aS1a, Sbb#) | ( 3 S S S Sbbb#) 21 ⎯ q, , 1a 1a 1,a |⎯ (b, 3, S1aS1aS1,aSbbb#) |⎯ (q, 3, S1aS1aS2, cbb#) |⎯ (q, 4, S1aS1aS2c,bb#) |⎯ (q, 5, S1aS1aS2cb,b#) |⎯ (q, 6, S1aS1aS2cbb,#) |⎯ (t, 6, S1aS1aS2cbb, ε ) Tìm phân tích trái „ h(a) = ε ∀a là ký hiệu kết thúc h(Ai)= p , p là số hiệu của sản xuất liên hệ với sản xuất A→ γ với γ là lựa chọn thứ i của A Văn phạm 22 „ „ h(S1aS1aS2cbb)=112 1. S1 → aSb 2. S2 → c Thử phân tích quay lui với KPL „ Phân tích từ vựng và mã hóa từ tố „ Tập sản xuất của văn phạm 23 Chuyển sơ đồ cú pháp thành luật ::= program ident ; . ::= 24 - - begin end 21/1/2010 7 Mã hóa ký hiệu không kết thúc if(str=="") return 1; if(str=="") return 2; if(str=="") return 3; if (str == "") return 4; if (str == "") return 5; if (str == "") return 13; if (str == "") return 14; if(str=="") return 15; if(str=="") return 16; if(str=="" ) return 17; if ( t " diti ") t 18 25 if(str=="") return 6; if (str =="") return 7; if (str == "") return 8; if (str == "") return 9; if(str=="") return 10; if (str == "") return 11; if(str=="") return 12; s r == re urn ; if (str == "") return 19; if(str=="") return 20; if (str == "") return 21; if(str=="") return 22 if(str=="") return 23; if (str == "") return 24; Mã hóa từ tố: tên, số, hằng ký tự // ident; if(str == "ident") return 25; //const if(str == "number")return 26; if (str == "charcon") return 27; //specific symbol if (str =="lparen") return 35; if (str == "rparen") return 36; if (str == "comma") return 37; if (str == "semicolon") return 38; 26 //operator if(str == "plus")return 28; if (str == "minus") return 29; if (str == "times") return 30; if (str == "slash") return 31; if (str == "oddsym") return 32; if (str == "assign") return 33; if (str == "leq") return 34; if (str == "period") return 39; if (str == "becomes") return 40; if (str == "lbrace") return 41; if (str == "rbrace") return 42; if (str == "lbrack") return 43; if (str == "rbrack") return 44; Mã hóa từ tố: từ khóa if (str == "beginsym") return 45; if (str == "endsym") return 46; if (str == "ifsym") return 47; if (str == "varsym") return 53; if (str == "progsym") return 54; if (str == "funcsym") return 55; if (str == "typesym") return 56; 27 if (str == "thensym") return 48; if (str == "whilesym") return 49; if (str == "dosym") return 50; if (str == "callsym") return 51; if (str == "constsym") return 52; if (str == "arraysym") return 57; if (str == "ofsym") return 58; if (str == "intsym") return 59; if (str == "charsym") return 60; Mã hóa từ tố: phép toán quan hệ //relations if (str == "eql") return 61; if (str == "leq") return 62; if (str == "neq") return 63; 28 if (str == "lss") return 64; if (str == "gtr") return 65; if (str == "geq") return 66; 21/1/2010 8 Mã hóa sản xuất ::= program ident ; . setlaw[1,1]="54 25 38 2 39 "; 29 ::= begin end setlaw[2,1]=" 3 6 12 15 10 45 16 46 "; Nhận xét „ Cài đặt phức tạp „ Chi phí thời gian quá lớn nếu chương trình phải phân tích gồm nhiều ký hiệu (từ tố) 30 „ Không thể thông báo lỗi chi tiết

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_chuong_trinh_dich_bai_6_phan_tich_cu_phap_tren_xu.pdf