Giáo trình Chương trình dịch - Bài 11: Sinh mã trung gian - Nguyễn Thị Thu Hương

Nếu E có dạng: a

pdf10 trang | Chia sẻ: huongthu9 | Lượt xem: 541 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Giáo trình Chương trình dịch - Bài 11: Sinh mã trung gian - Nguyễn Thị Thu Hương, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
21/1/2010 1 Bài 11 Sinh mã trung gian Nội dung „ Mã ba địa chỉ „ Sinh mã cho lệnh gán „ Sinh mã cho các biểu thức logic „ Sinh mã cho các cấu trúc lập trình Mã trung gian Một chương trình với mã nguồn được chuyển sang chương trình tương đương trong ngôn ngữ trung gian bằng bộ sinh mã trung gian. Ngôn ngữ trung gian được người thiết kế trình biên dịch quyết định, có thể là: ‰ Cây cú pháp ‰ Ký pháp Ba Lan sau (hậu tố) ‰ Mã 3 địa chỉ Mã trung gian „ Được sản sinh dưới dạng một chương trình cho một máy trừu tượng „ Mã trung gian thường dùng : mã ba địa chỉ, tương tự mã assembly „ Chương trình là một dãy các lệnh. Mỗi lệnh gồm tối đa 3 toán hạng „ Tồn tại nhiều nhất một toán tử ở vế phải cộng thêm một toán tử gán „ Dạng tổng quát: x := y op z „ x,y,z là các địa chỉ , tức là tên, hằng hay các tên trung gian do trình biên dịch sinh ra … Tên trung gian phải được sinh để thực hiện các phép toán trung gian … Các địa chỉ được thực hiện như con trỏ tới lối vào của nó trong bảng ký hiệu 21/1/2010 2 Mã trung gian của x + y * z „ t1 := y*z „ t2 := x+t1 Các dạng mã ba địa chỉ phổ biến „ Mã 3 địa chỉ tương tự mã Assembly: lệnh có thể có nhãn, có những lệnh chuyển điều khiểnolcho các cấu trúc lập trình. 1 Lệnh gán x := y op z. . 2. Lệnh gán với phép toán 1 ngôi : x := op y. 3. Lệnh sao chép: x := y. 4. Lệnh nhảy không điều kiện: goto L, L là nhãn của một lệnh 5. Lệnh nhảy có điều kiện x relop y goto L. Các dạng mã ba địa chỉ 6. Lời gọi thủ tục param x và call p,n để gọi thủ tục p với n tham số . Return y là giá trị thủ tục trả về param x1 param x2 . . . param xn Call p,n 7. Lệnh gán có chỉ số x:=y[i] hay x[i]:=y Sinh mã trực tiếp từ ĐNTCP „ Thuộc tính tổng hợp S.code biểu diễn mã ba địa chỉ của lệnh „ Các tên trung gian được sinh ra cho các tính toán trung gian „ Các biểu thức được liên hệ với hai thuộc tính tổng hợp „ E.place chứa địa chỉ chứa giá trị của E „ E.code mã ba địa chỉ để đánh giá E „ Hàm newtemp sinh ra các tên trung giant1, t2,. . „ Hàm gen sinh mã ba địa chỉ „ Trong thực tế, code được gửi vào file thay cho thuộc tính code 21/1/2010 3 Dịch trực tiếp cú pháp thành mã 3 địa chỉ Sản xuất Quy tắc ngữ nghĩa S → id := E { S.code = E.code||gen(id.place ‘:=’ E.place) } E → E1 + E2 {E.place= newtemp ; E.code = E1.code || E2.code || || gen(E.place‘:=’E1.place‘+’E2.place) } E → E1 * E2 {E.place= newtemp ; E.code = E1.code || E2.code || || gen(E.place‘:=’E1.place‘*’E2.place) } E → - E1 {E.place= newtemp ; E.code = E1.code || || gen(E.place ‘:=’ ‘uminus’ E1.place) } E → ( E1 ) {E.place= E1.place ; E.code = E1.code} E → id {E.place = id.place ; E.code = ‘’ } „ Hàm newtemp trả về một dãy các tên khác nhau t1, t2 cho lời gọi kế tiếp. … E.place: là tên sẽ giữ giá trị của E … E.code:là dãy các câu lệnh 3 địa chỉ dùng để ước lượng E Mã cho lệnh gán a := b * -c + d Cài đặt câu lệnh 3 địa chỉ Bộ bốn (Quadruples) t1:=- c t2:=b * t1 op arg1 arg2 result (0) uminus c t1 (1) * b t1 t2 (2) uminus c t3 t3:=- c t4:=b * t3 t5:=t2 + t4 a:=t5 (3) * b t3 t4 (4) + t2 t4 t5 (5) := t5 a Tên tạm phải được thêm vào bảng kí hiệu khi chúng được tạo ra. Cài đặt câu lệnh 3 địa chỉ „ Bộ ba (Triples) t1:=- c t2:=b * t1 t := c op arg1 arg2 (0) uminus c (1) * b (0) (2) uminus c 3 - t4:=b * t3 t5:=t2 + t4 a:=t5 (3) * b (2) (4) + (1) (3) (5) assign a (4) Tên tạm không được thêm vào trong bảng kí hiệu. 21/1/2010 4 Các dạng khác của câu lệnh 3 địa chỉ „ Ví dụ: x[i]:=y x:=y[i] „ Sử dụng 2 cấu trúc bộ ba op arg1 arg2 (0) [ ] x i (1) := (0) y op arg1 arg2 (0) [ ] y i (1) := x (0) Cài đặt câu lệnh 3 địa chỉ „ Bộ 3 gián tiếp: sử dụng một danh sách các con trỏ các bộ 3 op arg1 arg2 (14) uminus c op (0) (14) (15) * b (14) (16) uminus c (17) * b (16) (18) + (15) (17) (19) assign a (18) (1) (15) (2) (16) (3) (17) (4) (18) (5) (19) Sinh mã cho khai báo Sử dụng biến toàn cục offset. Các tên cục bộ trong chương trình con được truy xuất thông qua địa chỉ tương đối offset. Sản xuất Quy tắc ngữ nghĩa P → M D { } M → ε {offset:=0 } D → D; D D → id : T { enter(id.name, T.type, offset) offset:=offset + T.width } T → integer {T.type = integer; T.width = 4 } T → real {T.type =real; T.width = 8 } T → array [ num ] of T1 {T.type=array(1..num.val,T1.type) T.width = num.val * T1.width} Lưu trữ thông tin về phạm vi „ Trong một ngôn ngữ mà chương trình con được phép khai báo lồng nhau, mỗi khi tìm thấy một CTC thì quá trình khai báo của chương trình bao nó bị tạm dừng. „ Văn phạm của khai báo này: P D → D → D; D | id : T | proc id ; D ; S „ Khi một khai báo chương trình con D → proc id D1; S được tạo ra thì các khai báo trong D1 được lưu trong bảng kí hiệu mới. 21/1/2010 5 Khai báo chương trình con lồng nhau „ Ví dụ chương trình: 1) Program sort; 2) Var a: array[0..10] of integer; 3) x: integer; 4) Procedure readarray; 5) Var i: integer; 6) Begin a end {readarray}; 7) Procedure exchange(i, j: integer); 8) Begin {exchange} end; 9) Procedure quicksort(m, n: integer); 10) Var k, v: integer; 11) Function partition(y,z: integer): integer; 12) Begin ..a..v..exchange(i,j) end; {partition} 13) Begin end; {quicksort} 14) Begin end; {sort} Năm bảng kí hiệu của Sort Các thủ tục trong tập quy tắc ngữ nghĩa mktable(previous) – tạo một bảng kí hiệu mới, bảng này có previous chỉ đến bảng cha của bảng kí hiệu mới này. enter(table,name,type,offset) – tạo ra một ô mới có tên name trong bảng kí hiệu được chỉ ra bởi table và đặt kiểu type, địa chỉ tương đối offset vào các trường bên trong ô đó. enterproc(table,name,newbtable) – tạo ra một ô mới cho tên chương trình con vào table, newtable trỏ tới bảng kí hiệu của chương trình con này. addwidth(table,width) – ghi tổng kích thước của tất cả các ô trong bảng kí hiệu vào header của bảng đó. Xử lý các khai báo trong những chương trình con lồng nhau P → M D { addwidth(top(tblptr), top(offset)); pop(tblptr); pop(offset) } M → ε { t:=mktable(null); push(t, tblptr); push(0, offset)} D → D1 ; D2 D → proc id ; N D1 ; S { t:=top(tblpr); addwidth(t,top(offset)); pop(tblptr); pop(offset); enterproc(top(tblptr), id.name, t)} N → ε {t:=mktable(top(tblptr)); push(t,tblptr); push(0,offset);} D → id : T {enter(top(tblptr), id.name, T.type, top(offset); top(offset):=top(offset) + T.width … tblptr – để giữ con trỏ bảng kí hiệu. … offset – lưu trữ địa chỉ offset hiện tại của bảng kí hiệu trong tblptr. 21/1/2010 6 Xử lý các khai báo trong những chương trình con lồng nhau „ Với sản xuất A → BC {actionA} thì các hoạt động trong cây con B, C được thực hiện trước A. „ Sản xuất M → ε khởi tạo stack tblptr với một bảng kí hiệu cho phạm vi ngoài cùng (chương trình sort) bằng lệnh mktable(nil) đồng thời đặt offset = 0. „ N đóng vai trò tương tự M khi một khai báo chương trình con xuất hiện, nó dùng lệnh mktable(top(tblptr)) để tạo ra một bảng mới, tham số top(tblptr) cho giá trị con trỏ tới bảng lại được đẩy vào đỉnh stack tblptr và 0 được đẩy vào stack offset. „ Với mỗi khai báo id: T một ô mới được tạo ra cho id trong bảng kí hiệu hiện hành, stack tblptr không đổi, giá trị top(offset) được tăng lên bởi T.width. „ Khi D → proc id ; N D1 ; S diễn ra thì kích thước của tất cả các đối tượng dữ liệu khai báo trong D1 sẽ nằm trên đỉnh stack offset. Nó được lưu trữ bằng cách dùng Addwidth, các stack tblptr và offset bị đẩy và chúng ta thao tác trên các khai báo của chương trình con. Tên trong bảng kí hiệu „ Xét ĐNTCP để sinh ra mã lệnh 3 địa chỉ cho lệnh gán Tên trong bảng kí hiệu „ Hàm lookup sẽ tìm trong bảng kí hiệu xem có hay không một tên được cho bởi id.name. Nếu có thì trả về con trỏ của ô, nếu không thì trả về nil. „ Thủ tục emit để đưa mã 3 địa chỉ vào một tập tin output chứ không xây dựng thuộc tính code cho các kí hiệu chưa kết thúc như gen. Quá trình dịch thực hiện bằng cách đưa ra một tập tin output nếu thuộc tính code của kí hiệu không kết thúc trong vế trái sản xuất được tạo ra bằng cách nối thuộc tính code của kí hiệu không kết thúc trong vế phải theo đúng thứ tự xuất hiện của các kí hiệu chưa kết thúc ở vế phải. Tên trong bảng kí hiệu „ Xét sản xuất D → proc id; ND1; S „ Các tên trong lệnh gán sinh ra bởi kí hiệu không kết thúc S sẽ được khai báo trong chương trình con này hoặc trong chương trình chứa nó. „ Khi khai báo tới một tên thì trước hết hàm lookup sẽ tìm xem tên đó có trong bảng kí hiệu hiện hành hay không, nếu không thì dùng con trỏ trong header của bảng để tìm bảng kí hiệu bao nó và tìm trong đó, nếu không tìm thấy trong tất cả các mức thì lookup trả về nil. 21/1/2010 7 Địa chỉ hóa các phần tử của mảng „ Các phần tử của mảng có thể truy xuất nhanh nếu chúng được lưu trữ trong một khối ô nhớ kế tiếp nhau. Trong mảng một chiều, nếu kích thước của một phần tử là w thì địa chỉ tương đối phần tử thứ i của mảng A được tính theo công thức: „ A[i] = base + (i-low)*w „ Trong đó: … Low: cận dưới tập chỉ số … Base: địa chỉ tương đối của ô nhớ cấp phát cho mảng(địa chỉ tương đối của A[low]) „ Tương đương A[i] = i*w + (base – low*w) „ Trong đó: … c = base – low*w có thể được tính tại thời gian dịch và lưu trong bảng kí hiệu „ ⇒ A[i] = i*w + c Địa chỉ hóa các phần tử của mảng 2 chiều „ Theo dòng Địa chỉ tương đối của A[i1,i2] = base + ((i1 – low1)*n2 + i2 – low2)*w low1, low2: cận dưới cho i1 và i2 n2: số lượng các giá trị mà i2 có thể nhận. Nếu high2 là cận trên của i2 thì n2 = high2 – low2 + 1 Địa chỉ hóa các phần tử của mảng 2 chiều …Theo cột Sinh mã biểu thức Logic „ Biểu thức logic được sỉnh bởi văn phạm sau: E→ E or E | E and E | not E | (E) | id relop id | true |false „ Trong đó: O à A d kế h ái… r v n t ợp tr …Or có độ ưu tiên thấp nhất tiếp theo là And, và Not 21/1/2010 8 Biểu diễn bằng số „ Mã hóa true và false bằng các số và ước lượng một biểu thức boole tương tự như đối với biểu thức số học „ Có thể biểu diễn true là 1; false là 0 „ Hoặc các số khác 0 là true, 0 là false Ví dụ: biểu thức a or b and not c „ Mã 3 địa chỉ: t1 = not c t2 = b and t1 t3 = a or t2 „ Biểu thức quan hệ a<b tương đương lệnh điều kiện if a<b then 1 else 0. Mã 3 địa chỉ tương ứng: 100: if a<b goto 103 101: t:=0 102: goto 104 103: t:= 1 104: ĐNTCPdùng số để biểu diễn các giá trị logic Nextstat cho biết chỉ số của câu lệnh 3 địa chỉ tiếp theo. Emit: đặt câu lênh 3 địa chỉ vào tập tin, emit làm tăng nextstat sau khi thực hiện Sinh mã cho các cấu trúc lập trình „ Biểu diễn các giá trị của biểu thức Boole bằng biểu thức đã đến được trong một chương trình. „ Ví dụ: cho câu lệnh sau „ S→ if E then S1 | iF E then S1 else S2 | while E do S1 „ Với mỗi biểu thức E chúng ta kết hợp với 2 nhãn: … E.true: nhãn của dòng điều khiển nếu E là true … E.false: nhãn của dòng điều khiển nếu E là false … S.code: mã lệnh 3 địa chỉ được sinh ra bởi S … S.next: là nhãn mã lệnh 3 địa chỉ đầu tiên sẽ thực hiện sau mã lệnh của S … S.begin: nhãn địa chỉ lệnh đầu tiên được sinh ra cho S Mã lệnh của các lệnh if-then, if-then-else, while-do 21/1/2010 9 ĐNTCP cho các cấu trúc lập trình Dịch biểu thức logic trong các cấu trúc lập trình „ Nếu E có dạng: a<b thì mã lệnh sinh ra có dạng If a<b then goto E.true else goto E.false „ Nếu E có dạng: E1 or E2 thì … Nếu E1 là true thì E cũng là true … Nếu E1là false thì phải đánh giá E2; E sẽ làtrue hay false phụ thuộc E2 „ Tương tự với E1 and E2 Dịch biểu thức logic trong các cấu trúc lập trình Biểu thức logic ở dạng hỗn hợp „ Thực tế, các biểu thức logic thường chứa các biểu thức số học như trong (a+b)<c 21/1/2010 10 Biểu thức logic ở dạng hỗn hợp Biểu thức logic ở dạng hỗn hợp

Các file đính kèm theo tài liệu này:

  • pdfgiao_trinh_chuong_trinh_dich_bai_11_sinh_ma_trung_gian_nguye.pdf