Bài giảng Nguyên lý ngôn ngữ lập trình - Chương 7: Môi trường thời gian thực hiện

Cấu trúc đơn giản, dễ cài đặt nhất cho bảng ký hiệu là danh sách tuyến tính của các mẩu tin. Ta dùng một mảng hoặc nhiều mảng tương đương để lưu trữ tên và các thông tin kết hợp với chúng. Các tên mới được đưa vào trong danh sách theo thứ tự mà chúng được phát hiện. Vị trí của mảng được đánh dấu bởi con trỏ available chỉ ra một ô mới của bảng sẽ được tạo ra. Việc tìm kiếm một tên trong bảng ký hiệu được bắt đầu từ available đến đầu bảng. Trong các ngôn ngữ cấu trúc khối sử dụng quy tắc tầm tĩnh. Thông tin kết hợp với tên có thể bao gồm cả thông tin về độ sâu của tên. Bằng cách tìm kiếm từ available trở về đầu mảng chúng ta đảm bảo rằng sẽ tìm thấy tên trong tầng gần nhất

26 trang | Chia sẻ: huongthu9 | Lượt xem: 515 | Lượt tải: 0

Bạn đang xem trước 20 trang tài liệu Bài giảng Nguyên lý ngôn ngữ lập trình - Chương 7: Môi trường thời gian thực hiện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

CHƯƠNG VII MÔI TRƯỜNG THỜI GIAN THỰC HIỆN Nội dung chính: Trước khi xem xét vấn đề sinh mã được trình bày ở các chương sau, chương này trình bày một số vấn đề liên quan đến việc gọi thực hiện chương trình con, các chiến lược cấp phát bộ nhớ và quản lý bảng ký hiệu. Cùng một tên trong chương trình nguồn có thể biểu thị cho nhiều đối tượng dữ liệu trong chương trình đích. Sự biểu diễn của các đối tượng dữ liệu tại thời gian thực thi được xác định bởi kiểu của nó. Sự cấp phát và thu hồi các đối tượng dữ liệu được quản lý bởi một tập các chương trình con ở dạng mã đích. Việc thiết kế các chương trình con này được xác định bởi ngữ nghĩa của chương trình nguồn. Mỗi sự thực thi của một chương trình con được gọi là một mẩu tin kích hoạt. Nếu một chương trình con đệ quy, một số mẩu tin kích hoạt có thể tồn tại cùng một thời điểm. Mỗi ngôn ngữ lập trình đều có quy tắc tầm vực để xác định việc xử lý khi tham khảo đến các tên không cục bộ. Tùy vào ngôn ngữ, nó cho phép một chương trình chứa các chương trình con lồng nhau hoặc không lồng nhau; Cho phép gọi đệ quy hoặc không đệ quy; Cho phép truyền tham số bằng giá trị hay tham chiếu Vì thế, khi thiết kế một chương trình ở dạng mã đích ta cần chú ý đến các yếu tố này. Mục tiêu cần đạt: Sau khi học xong chương này, sinh viên phải nắm được: • Cách gọi và thực thi một chương trình. • Cách tổ chức bộ nhớ và các chiến lược cấp phát – thu hồi bộ nhớ. Kiến thức cơ bản: Sinh viên phải biết một số ngôn ngữ lập trình cấp cao như Pascal, C++, Java, v.v hoặc đã được học môn ngôn ngữ lập trình (phần đề cập đến các chương trình con). Tài liệu tham khảo: [1] Compilers : Principles, Technique and Tools - Alfred V.Aho, Jeffrey D.Ullman - Addison - Wesley Publishing Company, 1986. [2] Modern Compiler Implementation in C - Andrew W. Appel - Cambridge University Press, 1997. I. CHƯƠNG TRÌNH CON 1. Ðịnh nghĩa chương trình con Ðịnh nghĩa chương trình con là một sự khai báo nó. Dạng đơn giản nhất là sự kết hợp giữa tên chương trình con và thân của nó. Ví dụ 7.1: Chương trình Pascal đọc và sắp xếp các số nguyên 142 (1) program sort(input, output) (2) var a: array[0..10] of integer; (3) procedure readarray; (4) var i: integer; (5) begin (6) for i=1 to 9 do read(a[i]); (7) end; (8) function partition(y,z:integer): integer; (9) var i,j,x,v: integer; (10) begin... (11) end; (12) procedure quicksort(m,n:integer); (13) var i: integer; (14) begin; (15) if (n>m) then begin (16) i:= partition(m,n); (17) quicksort(m,i-1); (18) quicksort(i+1,n); (19) end; (20) end; (21) begin (22) a[0]:= -9999, a[10]:= 9999; (23) readarray; (24) quicksort(1,9); (25) end. Hình 7.1- Chương trình Pascal đọc và sắp xếp các số nguyên Chương trình trên chứa các định nghĩa chương trình con - Chương trình con readarray từ dòng 3 - 7, thân của nó từ 5 - 7 - Chương trình con partition từ dòng 8 - 11, thân của nó từ 10 - 11. - Chương trình con quicksort từ dòng 12 - 20, thân của nó từ 14 - 20. Chương trình chính cũng được xem như là một chương trình con có thân từ dòng 21 - 25 Khi tên chương trình con xuất hiện trong phần thân của một chương trình con ta nói chương trình con được gọi tại điểm đó. 143 2. Cây hoạt động Trong quá trình thực hiện chương trình thì: 1. Dòng điều khiển là tuần tự: tức là việc thực hiện chương trình bao gồm một chuỗi các bước. Tại mỗi bước đều có một sự điều khiển xác định. 2. Việc thực hiện chương trình con bắt đầu tại điểm bắt đầu của thân chương trình con và trả điều khiển về cho chương trình gọi tại điểm nằm sau lời gọi khi việc thực hiện chương trình con kết thúc. • Thời gian tồn tại của một chương trình con p là một chuỗi các bước giữa bước đầu tiên và bước cuối cùng trong sự thực hiện thân chương trình con bao gồm cả thời gian thực hiện các chương trình con được gọi bởi p. • Nếu a và b là hai sự hoạt động của hai chương trình con tương ứng thì thời gian tồn tại của chúng tách biệt nhau hoặc lồng nhau. • Một chương trình con là đệ quy nếu một hoạt động mới có thể bắt đầu trước khi một hoạt động trước đó của chương trình con đó kết thúc. • Ðể đặc tả cách thức điều khiển vào ra mỗi hoạt động của chương trình con ta dùng cấu trúc cây gọi là cây hoạt động. 1. Mỗi nút biểu diễn cho một hoạt động của một chương trình con. 2. Nút gốc biểu diễn cho hoạt động của chương trình chính. 3. Nút a là cha của b nếu và chỉ nếu dòng điều khiển sự hoạt động đó từ a sang b 4. Nút a ở bên trái của nút b nếu thời gian tồn tại của a xuất hiện trước thời gian tồn tại của b. Ví dụ 7.2: Xét chương trình sort nói trên - Bắt đầu thực hiện chương trình. - Vào readarray. - Ra khỏi readarray. - Vào quicksort(1,9). - Vào partition(1,9) - Ra khỏi partition(1,9) // giả sử trả về 4 - Vào quicksort(1,3) - .. . . .. . - Ra khỏi quicksort(1,3). - Vào quicksort(5,9); - .. .. .. .. - Ra khỏi quicksort(5,9). - Sự thực hiện kết thúc. 144 Hình 7.2 - Xuất các mẩu tin hoạt động đề nghị của chương trình trong hình 7.1 Ta có cây hoạt động tương ứng. s r q(1,9) p(1,9) q(1,3) q(5,9) p(1,3) q(1,0) q(2,3) p(5,9) q(5,5) q(7,9) p(2,3) q(2,1) q(3,3) p(7,9) q(7,7) q(9,9) Hình 7.3- Cây hoạt động tương ứng với phần xuất trong hình 7.2 3. Ngăn xếp điều khiển Dòng điều khiển một chương trình tương ứng với phép duyệt theo chiều sâu của cây hoạt động. Bắt đầu từ nút gốc, thăm một nút trước các con của nó và thăm các con một cách đệ quy tại mỗi nút từ trái sang phải. Chúng ta có thể dùng một Stack, gọi là Stack điều khiển, để lưu trữ sự hoạt động của chương trình con. Khi sự hoạt động của một chương trình con bắt đầu thì đẩy nút tương ứng với sự hoạt động đó lên đỉnh Stack. Khi sự hoạt động kết thúc thì pop nút đó ra khỏi Stack. Nội dung của Stack thể hiện đường dẫn đến nút gốc của cây hoạt động. Khi nút n nằm trên đỉnh Stack thì Stack chứa các nút nằm trên đường từ n đến gốc. Ví dụ 7.3: Hình sau trình bày nội dung của Stack đang lưu trữ đường đi từ nút q(2, 3) đến nút gốc. Các cạnh nét đứt thể hiện một nút đã pop ra khỏi Stack. s r q(1,9) p(1,9) q(1,3) p(1,3) q(1,0) q(2,3) Hình 7.4 - Stack điều khiển chứa các nút dẫn tới nút gốc Tại thời điểm này thì đường dẫn tới gốc là: s q(1, 9) q(1, 3) q(2, 3) ( q(2, 3) nằm trên đỉnh Stack) 145 4. Tầm vực của sự khai báo Ðoạn chương trình chịu ảnh hưởng của một sự khai báo gọi là tầm vực của khai báo đó. Trong một chương trình có thể có nhiều sự khai báo trùng tên ví dụ biến i trong chương trình sort. Các khai báo này độc lập với nhau và chịu sự chi phối bởi quy tắc tầm của ngôn ngữ. Sự xuất hiện của một tên trong một chương trình con được gọi là cục bộ (local) trong chương trình con ấy nếu tầm vực của sự khai báo nằm trong chương trình con, ngược lại được gọi là không cục bộ (nonlocal). 5. Liên kết tên Trong ngôn ngữ của ngôn ngữ lập trình, thuật ngữ môi trường (enviroment) để chỉ một ánh xạ từ một tên đến một vị trí ô nhớ và thuật ngữ trạng thái (state) để chỉ một ánh xạ từ vị trí ô nhớ tới giá trị lưu trữ trong đó tên ô nhớ giá trị môi trường trạng thái Hình 7.5 - Hai ánh xạ từ tên tới giá trị Môi trường khác trạng thái: một lệnh gán làm thay đổi trạng thái nhưng không thay đổi môi trường. Khi một môi trường kết hợp vị trí ô nhớ s với một tên x ta nói rằng x được liên kết tới s. Sự kết hợp đó được gọi là mối liên kết của x. Liên kết là một bản sao động (dynamic counterpart) của sự khai báo. Chúng ta có sự tương ứng giữa các ký hiệu động và tĩnh: Ký hiệu tĩnh Bản sao động Ðịnh nghĩa chương trình con Sự khai báo tên Tầm vực của sự khai báo Sự hoạt động cuả chương trình con Liên kết của tên Thời gian tồn tại của liên kết Hình 7.6 - Sự tương ứng giữa ký hiệu động và tĩnh 6. Các vấn đề cần quan tâm khi làm chương trình dịch Các vấn đề cần đặt ra khi tổ chức lưu trữ và liên kết tên: 1. Chương trình con có thể đệ quy không? 2. Ðiều gì xảy ra cho giá trị của các tên cục bộ khi trả điều khiển từ hoạt động của một chương trình con. 146 3. Một chương trình con có thể tham khảo tới một tên cục bộ không? 4. Các tham số được truyền như thế nào khi gọi chương trình con. 5. Một chương trình con có thể được truyền như một tham số? 6. Một chương trình con có thể được trả về như một kết quả? 7. Bộ nhớ có được cấp phát động không? 8. Bộ nhớ có phải giải phóng một cách tường minh? II. TỔ CHỨC BỘ NHỚ Tổ chức bộ nhớ trong thời gian thực hiện ở đây có thể sử dụng cho các ngôn ngữ Fortran, Pascal và C. 1. Phân chia bộ nhớ trong thời gian thực hiện Bộ nhớ có thể chia ra để lưu trữ các phần: 1. Mã đích. 2. Ðối tượng dữ liệu. 3. Bản sao của Stack điều khiển để lưu trữ hoạt động của chương trình con. Trong đó kích thước của mã đích được xác định tại thời gian dịch cho nên nó được cấp phát tĩnh tại vùng thấp của bộ nhớ. Tương tự kích thước của một số đối tượng dữ liệu cũng có thể biết tại thời gian dịch cho nên nó cũng được cấp phát tĩnh. Cài đặt các ngôn ngữ như Pascal, C dùng sự mở rộng của Stack điều khiển để quản lý sự hoạt động của chương trình con. Khi có một lời gọi chương trình con, sự thể hiện của một hoạt động bị ngắt và thông tin về tình trạng của máy, chẳng hạn như giá trị bộ đếm chương trình (program counter) và thanh ghi được lưu vào trong Stack. Khi điều khiển trả về từ lời gọi, hoạt động này được tiếp tục sau khi khôi phục lại giá trị của thanh ghi và đặt bộ đếm chương trình vào ngay sau lời gọi. Ðối tượng dữ liệu mà thời gian tồn tại của nó được chứa trong một hoạt động được lưu trong Stack. Một vùng khác của bộ nhớ được gọi là Heap lưu trữ tất cả các thông tin khác. Code Static Data Stack Heap 147 Hình 7.7 - Phân chia bộ nhớ trong thời gian thực hiện cho mã đích và các vùng dữ liệu khác 2. Mẩu tin hoạt động Thông tin cần thiết để thực hiện một chương trình con được quản lý bằng cách dùng một mẩu tin hoạt động bao gồm một số trường như sau : Giá trị trả về Các tham số thực tế Liên kết điều khiển Liên kết truy nhập Trạng thái máy Dữ liệu cục bộ Giá trị tạm thời Hình 7.8 - Mẩu tin hoạt động tổng quát Ý nghĩa các trường như sau: 1. Giá trị tạm thời: được lưu giữ trong quá trình đánh giá biểu thức. 2. Dữ liệu cục bộ: Lưu trữ dữ liệu cục bộ trong khi thực hiện chương trình con. 3. Trạng thái máy: lưu giữ thông tin về trạng thái của máy trước khi một chương trình con được gọi. Thông tin máy bao gồm bộ đếm chương trình và thanh ghi lệnh mà nó sẽ phục hồi khi điều khiển trả về từ chương trình con 4. Liên kết truy nhập: tham khảo tới dữ liệu không cục bộ được lưu trong các mẩu tin hoạt động khác. 5. Liên kết điều khiển: trỏ tới mẩu tin hoạt động của chương trình gọi. 6. Các tham số thực tế: được sử dụng bởi các chương trình gọi để cho chương trình được gọi. Thông thường các tham số được lưu trong thanh ghi chứ không phải trong mẩu tin hoạt động. 7. Giá trị trả về: được dùng bởi chương trình được gọi để trả về cho chương trình gọi một giá trị. Trong thực tế giá trị này thường được trả về trong thanh ghi. III. CHIẾN LƯỢC CẤP PHÁT BỘ NHỚ Ðối với các vùng nhớ khác nhau trong tổ chức bộ nhớ, ta có các chiến lược cấp phát khác nhau : 1. Cấp phát tĩnh cho tất cả các đối tượng dữ liệu tại thời gian dịch. 148 2. Cấp phát sử dụng Stack cho bộ nhớ trong thời gian thực hiện. 3. Ðối với vùng dữ liệu Heap sử dụng cấp phát và thu hồi dạng Heap. 1. Cấp phát tĩnh Trong cấp phát tĩnh, tên được liên kết với vùng nhớ lúc chương trình được dịch. Vì mối liên kết không thay đổi tại thời gian chạy nên mọi lần một chương trình con được kích hoạt, tên của nó được liên kết với cùng một vùng nhớ. Tính chất này cho phép giá trị của các tên cục bộ được giữ lại thông qua hoạt động của các chương trình con. Từ kiểu của tên, trình biên dịch xác định kích thước bộ nhớ của nó. Do đó trình biên dịch xác định được vị trí của mẩu tin kích hoạt giữa đoạn mã chương trình và các mẩu tin kích hoạt khác. Trong thời gian biên dịch, chúng ta có thể điền vào đoạn của các địa chỉ mà mã lệnh có thể tìm đến để truy xuất dữ liệu. Tương tự địa chỉ các vùng lưu trữ thông tin khi chương trình con được gọi đều được xác định tại thời gian dịch. Tuy nhiên cấp phát tĩnh cũng có một số hạn chế sau: 1. Kích thước và vị trí của đối tượng dữ liệu trong bộ nhớ phải được xác định tại thời gian dịch. 2. Không cho phép gọi đệ quy vì tất cả các kích hoạt của một chương trình con đều dùng chung một liên kết đối với tên cục bộ. 3. Cấu trúc dữ liệu không thể được cấp phát động vì không có cơ chế để cấp phát tại thời gian thực hiện. 2. Cấp phát ô nhớ sử dụng Stack Bộ nhớ được tổ chức như là một Stack. Các mẩu tin kích hoạt được push vào Stack khi hoạt động bắt đầu và pop ra khỏi Stack khi hoạt động kết thúc. Ví dụ 7.4: Chúng ta sẽ minh họa việc cấp phát và loại bỏ mẩu tin kích hoạt tương ứng với cây hoạt động của chương trình sort: s r q(1,9) s a: array q(1,9) i: integer s Cây hoạt động s a: array s r s a: array r i: integer Mẩu tin kích hoạt trong Stack 149 Hình 7.9 - Sự cấp phát và lọai bỏ các mẩu tin kích hoạt p(1,9) s r q(1,9) s a: array q(1,9) i: integer q(1,3) p(1,3) q(1,0) q(2,3) q(1,3) i: integer q(2,3) i: integer Bộ nhớ cho dữ liệu cục bộ trong mỗi lần gọi một chương trình con được chứa trong mẩu tin kích hoạt cho lần gọi đó. Như vậy các tên cục bộ được liên kết với bộ nhớ trong mỗi một hoạt động, bởi vì một mẩu tin kích hoạt được push vào Stack khi có một lời gọi chương trình con. Dữ liệu của các biến cục bộ sẽ bị xóa bỏ khi sự thực hiện chương trình con kết thúc. Giả sử thanh ghi top đánh dấu đỉnh của Stack. Tại thời gian thực hiện một mẩu tin kích hoạt có thể được cấp phát hoặc thu hồi bằng cách tăng hoặc giảm thanh ghi top bằòng kích thước của mẩu tin kích hoạt. Gọi thực hiện chương trình con Gọi chương trình con được thực hiện bởi lệnh gọi trong mã đích - lệnh gọi cấp phát một mẩu tin kích hoạt và đưa thông tin vào cho các trường - lệnh trở về sẽ phục hồi các trạng thái máy để chương trình gọi tiếp tục thực hiện Hình 7.10 - Phân chia công việc giữa chương trình gọi và chương trình bị gọi Tham số và giá trị trả về Dữ liệu tạm và cục bộ Liên kết và trạng thái máy Tham số và trị trả về Liên kết và trạng thái máy Dữ liệu tạm và cục bộ Mẩu tin kích hoạt của chương trình gọi Mẩu tin kích hoạt của chương trình bị gọi Trách nhiệm của chương trình gọi Trách nhiệm của chương trình bị gọi top_sp 150 Hình trên mô tả mối quan hệ giữa mẩu tin kích hoạt của chương trình gọi và chương trình bị gọi. Mỗi mẩu tin như vậy có ba trường chủ yếu: các tham số thực tế và trị trả về, các mối liên kết và trạng thái máy và cuối cùng là trường dữ liệu tạm và cục bộ. Thanh ghi top.sp chỉ đến cuối trường các mối liên kết và trạng thái máy. Vị trí này được biết bởi chương trình gọi. Ðoạn mã cho chương trình bị gọi có thể truy xuất dữ liệu tạm và cục bộ của nó bằng cách sử dụng độ dời (offsets) từ top.sp. Lệnh gọi thực hiện các công việc sau : 1. Chương trình gọi đánh giá các tham số thực tế. 2. Chương trình gọi lưu địa chỉ trả về và giá trị cũ của top.sp vào trong mẩu tin kích hoạt của chương trình bị gọi. Sau đó tăng giá trị của top.sp. 3. Chương trình được gọi lưu giá trị thanh ghi và các thông tin trạng thái khác 4. Chương trình được gọi khởi tạo dữ liệu cục bộ của nó và bắt đầu thực hiện. Lệnh trả về thực hiện các công việc sau: 1. Chương trình bị gọi gởi giá trị trả về vào mẩu tin kích hoạt của chương trình gọi. 2. Căn cứ vào thông tin trong trường trạng thái, chương trình bị gọi khôi phục top_sp cũng như giá trị các thanh ghi và truyền tới địa chỉ trả về trong mã của chương trình gọi. 3. Mặc dù top_sp đã bị giảm, chương trình gọi cần sao chép giá trị trả về vào trong mẩu tin kích hoạt của nó để sử dụng cho việc tính toán biểu thức. Dữ liệu có kích thước thay đổi Một số ngôn ngữ cho phép dữ liệu có kích thước thay đổi. Chẳng hạn chương trình con p có 3 mảng có kích thước thay đổi, các mảng này được lưu trữ ngoài mẩu tin kích hoạt của p. Trong mẩu tin kích hoạt của p chỉ chứa các con trỏ trỏ tới điểm bắt đầu của mỗi một mảng. Ðịa chỉ tương đối của các con trỏ này được biết tại thời gian dịch nên mã đích có thể truy nhập tới các phần tử mảng thông qua con trỏ. Hình sau trình bày chương trình con q được gọi bởi p. Mẩu tin kích hoạt của q nằm sau các mảng của p. Truy nhập vào dữ liệu trong Stack thông qua hai con trỏ top, top.sp: top chỉ đỉnh Stack nơi một mẩu tin kích hoạt mới có thể bắt đầu. top_sp dùng để tìm dữ liệu cục bộ 151 Mẩu tin kích hoạt của p Các mảng của p Mẩu tin kích hoạt cho q được gọi bởi p Các mảng của q Liên kết điều khiển Con trỏ tới A Con trỏ tới B Con trỏ tới C Mảng A Mảng B Mảng C Liên kết điều khiển top_sp top Hình 7.11 - Truy xuất các mảng được cấp phát động 3. Cấp phát Heap Chiến thuật cấp phát sử dụng Stack không đáp ứng được các yêu cầu sau: 1. Giá trị của tên cục bộ được giữ lại khi hoạt động của chương trình con kết thúc. 2. Hoạt động của chương trình bị gọi tồn tại sau chương trình gọi. Các yêu cầu trên đều không thể cấp phát và thu hồi theo cơ chế LIFO (Last - In, First - Out) tức là tổ chức theo Stack. Heap là khối ô nhớ liên tục được chia nhỏ để có thể cấp phát cho các mẩu tin kích hoạt hoặc các đối tượng dữ liệu khác. Sự khác nhau giữa cấp phát Stack và Heap là ở chỗ mẩu tin cho một hoạt động được giữ lại khi hoạt động đó kết thúc. 152 Các hoạt động Các mẩu tin kích hoạt Các mẩu tin kích hoạt trong Stack trong Heap s q(1,9) r s q(1,9) Liên kết điều khiển s r Liên kết điều khiển q(1,9) Liên kết điều khiển Hình 7.12 - Mẩu tin kích hoạt được giữ lại trong Heap Về mặt vật lý, mẩu tin kích hoạt cho q(1,9) không phụ thuộc mẩu tin kích hoạt cho r. Khi mẩu tin kích hoạt cho r bị giải phóng thì bộ quản lý Heap có thể dùng vùng nhớ tự do này để cấp phát cho mẩu tin khác. Một số vấn đề thuộc quản lý hiệu quả một Heap sẽ được trình bày trong mục VIII. IV. TRUY XUẤT TÊN KHÔNG CỤC BỘ 1. Quy tắc tầm vực Quy tắc tầm vực của ngôn ngữ sẽ xác định việc xử lý khi tham khảo đến các tên không cục bộ. Quy tắc tầm vực bao gồm hai loại: Quy tắc tầm tĩnh và quy tắc tầm động. Quy tắc tầm tĩnh (static - scope rule): Xác định sự khai báo áp dụng cho một tên bằng cách kiểm tra văn bản chương trình nguồn. Các ngôn ngữ Pascal, C và Ada sử dụng quy tắc tầm tĩnh với một quy định bổ sung: “tầm gần nhất”. Quy tắc tầm động (dynamic- scope rule): Xác định sự khai báo có thể áp dụng cho một tên tại thời gian thực hiện bằng cách xem xét hoạt động hiện hành. Các ngôn ngữ Lisp, APL và Snobol sử dụng quy tắc tầm động. 2. Cấu trúc khối Một khối bắt đầu bởi một tập hợp các khai báo cho tên (khai báo biến, định nghĩa kiểu, định nghĩa hằng...) sau đó là một tập hợp các lệnh mà trong đó các tên có thể được tham khảo. Cấu trúc khối thường được sử dụng trong các ngôn ngữ cấu trúc như Pascal, Ada, PL/1. Trong đó chương trình hay chương trình con được tổ chức thành các khối lồng nhau. 153 Ngôn ngữ cấu trúc khối sử dụng quy tắc tầm tĩnh. Tầm của một khai báo được cho bởi quy tắc tầm gần nhất (most closely nested). 1. Một khai báo tại đầu một khối xác định một tên cục bộ trong khối đó. Bất kỳ một tham khảo tới tên trong thân khối được xem xét như là một tham khảo tới dữ liệu cục bộ trong khối nếu nó tồn tại. 2. Nếu một tên x được tham khảo trong thân một khối B và x không được khai báo trong B thì x được xem như là một sự tham khảo tới sự khai báo trong B’ là khối nhỏ nhất chứa B. Nếu trong B’ không có một khai báo cho x thì lại tham khảo tới B’’ là khối nhỏ nhất chứa B’. 3. Nếu một khối chứa định nghĩa các khối khác thì mọi khai báo trong các khối con hoàn toàn bị che dấu đối với khối ngoài. Cấu trúc khối có thể cài đặt bằng cách sử dụng cơ chế cấp phát Stack. Khi điều khiển đi vào một khối thì ô nhớ cho các tên được cấp phát và chúng bị thu hồi khi điều khiển rời khỏi khối. 3. Tầm tĩnh với các chương trình con không lồng nhau Quy tắc tầm tĩnh của ngôn ngữ C đơn giản hơn so với Pascal và các định nghĩa chương trình con trong C không lồng nhau. Một chương trình C là một chuỗi các khai báo biến và hàm. Nếu có một sự tham khảo không cục bộ đến tên a trong một hàm nào đó thì a phải được tham khảo bên ngoài tất cả các hàm. Tất cả các tên khai báo bên ngoài hàm đều có thể được cấp phát tĩnh. Vị trí các ô nhớ này được biết tại thời gian dịch do đó một tham khảo tới tên không cục bộ trong thân hàm được xác định bằng địa chỉ tuyệt đối. Các tên cục bộ trong hàm nằm trong mẩu tin hoạt động trên đỉnh Stack và có thể xác định bằng cách sử dụng địa chỉ tương đối. 4. Tầm tĩnh với các chương trình con lồng nhau. Trong ngôn ngữ Pascal các chương trình con có thể lồng nhau nhiều cấp. Ví dụ 7.5: Xét chương trình (1) program sort(input, output); (2) var a: array [0...10] of integer; (3) x : integer; (4) procedure readarray; (5) var y : integer; (6) begin ... a... end; {readarray} (7) procedure exchange(i,j:integer); (8) begin (9) x:= a[i]; a[i] := a[j]; a[j] := x; (10) end; {exchange} (11) procedure quicksort(m,n:integer); (12) var k,v: integer; 154 (13) function partition(y,z: integer) : integer; (14) var i,j : integer; (15) begin...a... (16) ...v... (17) ...exchange(i,j)... (18) end; {partition} (19) begin...end; {quicksort} (20) begin...end; {sort} Hình 7.13 - Một chương trình Pascal với các chương trình con lồng nhau Xét chương trình con partition, trong đó tham khảo đến các tên không cục bộ như: a: Khai báo trong chương trình chính. v: khai báo trong quicksort; exchange:khai báo trong chương trình chính. Ðộ sâu của sự lồng nhau Chúng ta sử dụng thuật ngữ độ lồng sâu để chỉ tầm tĩnh. Tên của chương trình chính có độ sâu cấp một và chúng ta tăng thêm một khi đi từ một chương trình con vào một chương trình con được bao (khai báo) trong nó. Như vậy trong chương trình con partition, a có độ sâu cấp 1, v có độ sâu cấp 2, i có độ sâu cấp 3. Quicksort có độ sâu cấp 2, partition có độ sâu cấp 3, exchange có độ sâu cấp 2. Liên kết truy xuất Ðể cài đặt tầm tĩnh cho các chương trình con lồng nhau ta dùng con trỏ liên kết truy xuất trong mỗi mẩu tin kích hoạt. Nếu chương trình con p được lồng trực tiếp trong q thì liên kết trong mẩu tin kích hoạt của p trỏ tới liên kết truy xuất của mẩu tin kích hoạt hiện hành của q. Hình sau mô tả nội dung Stack trong khi thực hiện chương trình sort trong ví dụ trên Ví dụ 7.6: s a,x q(1,9) access link k,v (a) s a,x q(1,9) access link k,v q(1,9) access link k,v q(1,3) access link k,v (b) 155 s a,x q(1,9) access link k,v q(1,3) access link k,v p(1,3) access link i,j (c) s a,x q(1,9) access link k,v q(1,9) access link k,v q(1,3) access link k,v p(1,3) access link i,j e(1,3) access link (d) Hình 7.14 - Liên kết truy xuất cho phép tìm kiếm ô nhớ của các tên không cục bộ Liên kết truy xuất của s rỗng vì s không có bao đóng. Liên kết truy xuất của một mẩu tin kích hoạt của một chương trình con bất kỳ đều trỏ đến mẩu tin kích hoạt của bao đóng của nó. Giả sử chương trình con p có độ lồng sâu np tham khảo tới một tên không cục bộ a có độ lồng sâu na <= np. Việc tìm đến địa chỉ của a được tiến hành như sau: - Khi chương trình con p được gọi thì một mẩu tin kích hoạt của p nằm trên đỉnh Stack. Tính giá trị np - na. Giá trị này được tính tại thời gian dịch. - Ði xuống np - na mức theo liên kết truy xuất ta tìm đến được mẩu tin kích hoạt của chương trình con trong đó a được khai báo. Tại đây địa chỉ của a được xác định bằng cách lấy địa chỉ của mẩu tin cộng với độ dời của a (địa chỉ tương đối của a). Ví dụ 7.7 (ứng với hình 7.14c) : Hàm partition có độ lồng sâu là np = 3 tham khảo tới biến a có độ lồng sâu na = 1 và biến v có độ lồng sâu nv =2. Ðể xác định a cần tính np- na = 3 -1 = 2 => cần hạ hai cấp Từ p(1,3) hạ một cấp đến q(1,3) theo liên kết truy xuất. Từ q(1,3) hạ một cấp đến s theo liên kết truy xuất đến s là nơi a được khai báo. 156 Ðể xác định v cần tính np- nv = 3- 2 = 1 => cần hạ một cấp xuốn q(1,3) là nơi v được khai báo. Giả sử chương trình con p có độ lồng sâu np gọi chương trình con e ở độ lồng sâu ne. Ðoạn mã để thiết lập liên kết truy xuất phụ thuộc vào việc chương trình được gọi có được định nghĩa trong chương trình gọi hay không? Trường hợp 1: np < ne: Chương trình con e có độ lồng sâu lớn hơn chương trình con p do đó hoặc e được lồng trong p hoặc p không thể tham khảo đến e (e bị che dấu khỏi p). Ví dụ sort gọi quickort, quicksort gọi partition. Trường hợp 2: np >= ne: chương trình con e có độ lồng sâu nhỏ hơn hoặc bằng độ lồng sâu của chương trình con p. Theo quy tắc tầm tĩnh thì p có thể tham khảo e. Ví dụ quicksort gọi chính nó, partition gọi exchange. Từ chương trình gọi np-ne +1 bước làm theo liên kết truy nhập ta tìm được mẩu tin kích hoạt của bao đóng gần nhất chứa cả chương trình gọi và chương trình được gọi. Chẳng hạn p(1,3) gọi e(1,3), np =3, ne =2. Ta phải làm 3 - 2 + 1 bằng hai bước theo liên kết truy xuất từ p đến s. Display: để truy xuất nhanh các tên không cục bộ người ta dùng một mảng d các con trỏ tới các mẩu tin kích hoạt mảng này gọi là display. Giả sử điều khiển nằm trong hoạt động của chương trình con t có độ lồng sâu j thì j-1 phần tử của display trỏ tới các mẩu tin kích hoạt của các bao đóng gần nhất của p và d[j] trỏ tới kích hoạt của p. Một tên không cục bộ a có độ sâu i nằm trong mẩu tin kích hoạt được trỏ bởi d[i]. Ví dụ 7.8: s s d[1] d[2] d[1] d[2] q(1,9) saved d[2] q(1,9) saved d[2] (a) q(1,3) saved d[2] (b) 157 Hình 7.15 - Sử dụng display khi các chương trình con không được truyền như các tham số (a): Tình trạng trước khi q(1,3) bắt đầu, quicksort có độ lồng sâu cấp 2, d[2] được gửi cho mẩu tin kích hoạt của quicksort khi nó bắt đầu. Giá trị của d[2] được lưu trong mẩu tin kích hoạt của q(1,9). (b): Khi q(1,3) bắt đầu d[2] trỏ tới mẩu tin kích hoạt mức ứng với q(1,3), giá trị của d[2] lại được lưu trong mẩu tin này. Giá trị này là cần thiết để phục hồi display cũ khi điều khiển trả về cho q(1,9). Như vậy khi một mẩu tin kích họat mới được đẩy vào Stack thì: - Lưu giá trị của d[i] vào mẩu tin đó. - Ðặt d[i] trỏ tới mẩu tin đó. Khi một mẩu tin được pop khỏi Stack thì d[i] được phục hồi. Giả sử một chương trình con có độ lồng sâu cấp j gọi một chương trình con có độ lồng sâu cấp i. Có hai trường hợp xảy ra phụ thuộc chương trình con được gọi có được định nghĩa trong chương trình gọi hay không. Trường hợp 1: j i = j+1: thêm ô nhớ d[i], cấp phát mẩu tin kích hoạt cho chương trình con i, ghi d[i] vào trong đó và đặt d[i] trỏ tới nó (ví dụ 7.8a, 7.8c) Trường hợp 2: j >= i: Ghi giá trị cũ của d[i] vào mẩu tin kích hoạt mới và đặt d[i] trỏ vào mẩu tin cuối. (ví dụ 7.8b và 7.8d) 5. Tầm động Với khái niệm tầm động, một hoạt động mới kế thừa sự liên kết đã tồn tại của một tên không cục bộ. Tên không cục bộ a trong hoạt động của chương trình được gọi tham khảo đến cùng một ô nhớ như trong hoạt động của chương trình gọi. Ðối với tên cục bộ thì một liên kết mới được thiết lập tới ô nhớ trong mẩu tin hoạt động mới. d[1] d[2] d[3] s q(1,9) saved d[2] q(1,3) saved d[2] p(1,3) saved d[3] (c) d[1] d[2] d[3] s q(1,9) saved d[2] q(1,3) saved d[2] p(1,3) saved d[3] e(1,3) saved d[2] (d) 158 Ví dụ 7.9: Xét chương trình: (1) program dynamic (input, output); (2) var r : real; (3) procedure show; (4) begin write(r : 5 : 3); end; (5) procedure small; (6) var r : real; (7) begin r := 0.125; show; end; (8) begin (9) r := 0.25; (10) show, small, writeln; (11) end; Hình 7.16 - Kết quả chương trình tùy thuộc vào tầm động hay tầm tĩnh được sử dụng Kết quả thực hiện chương trình: • Dưới tầm tĩnh; 0.250 0.250 • Dưới tầm động: 0.250 0.125 Khi show được gọi tại dòng 10 trong chương trình chính thì 0.250 được in ra vì r của chương trình chính được sử dụng. Tuy nhiên khi show được gọi tại dòng 7 trong small thì 0.125 được in ra vì r của chương trình con small được sử dụng. Cơ chế tầm động sử dụng liên kết điều khiển để tham khảo tên không cục bộ. Show được gọi tại dòng 10 tham khảo r= 0.25 Dynamic r = 0.25 show control link Dynamic r = 0.25 small control link r = 0.125 show control link Show được gọi tại dòng 7 tham khảo r = 0.125 159 Hình 7.17 - Sử dụng liên kết điều khiển để tham khảo các tên không cục bộ V. TRUYỀN THAM SỐ Khi một chương trình con gọi một chương trình con khác thì phương pháp thông thường để giao tiếp giữa chúng là thông qua tên không cục bộ và thông qua các tham số của chương trình được gọi. Ví dụ 7.10: Ðể đổi hai giá trị a[i] và a[j] cho nhau ta dùng (1) procedure exchange(i,j : integer); (2) var x : integer; (3) begin (4) x := a[i]; a[i] := a[j]; a[j] := x; (5) end; trong đó mảng a là tên không cục bộ và i,j là các tham số. Có rất nhiều phương pháp truyền tham số như: - Truyền bằng giá trị (Transmision by value, call- by-value) - Truyền bằng tham khảo (Transmision by name, call- by-name)... Ở đây chúng ta xét hai phương pháp phổ biến nhất: 1. Truyền bằng giá trị Là phương pháp đơn giản nhất của truyền tham số được sử dụng trong C và Pascal. Truyền bằng giá trị được xử lý như sau: 1. Tham số hình thức được xem như là tên cục bộ do đó ô nhớ của các tham số hình thức nằm trong mẩu tin kích hoạt của chương trình được gọi. 2. Chương trình gọi đánh giá các tham số thực tế và đặt các giá trị của chúng vào trong ô nhớ của tham số hình thức. 2. Truyền tham chiếu (truyền địa chỉ hay truyền vị trí) Chương trình gọi truyền cho chương trình được gọi con trỏ tới địa chỉ của mỗi một tham số thực tế. Ví dụ 7.11: (1) program reference (input, output) (2) var i: integer; (3) a: array[0...10] of integer; (4) procedure swap(var x, y: integer); (5) var temp : integer; (6) begin (7) temp := x; 160 (8) x := y; (9) y := temp; (10) end; (11) begin (12) i := 1; a[1] := 2; (13) swap(i,a[1]); (14) end; Hình 7.18 - Chương trình Pascal với thủ tục swap Với lời gọi tại dòng (13) ta có các bước sau: 1. Copy địa chỉ của i và a[ i] vào trong mẩu tin hoạt động của swap thành arg1, arg2 tương ứng với x, y. 2. Ðặt temp bằng nội dung của vị trí được trả về bởi arg1 tức là temp := 1. Bước này tương ứng lệnh temp := x trong dòng (7) của swap. 3. Ðặt nội dung của vị trí được trỏ bằng arg1 bởi giá trị của vị trí được trả bởi arg2, tức là i := a[1]. Bước này tương ứng lệnh x := y trong dòng (8) của swap. 4. Ðặt nội dung của vị trí được trỏ bởi arg2 bởi giá trị của temp. Tức là a[1] := i. Bước này tương ứng lệnh y := temp. VI. BẢNG KÝ HIỆU Chương trình dịch sẽ sử dụng bảng ký hiệu để lưu trữ thông tin về tầm vực và mối liên kết của các tên. Bảng ký hiệu được truy xuất nhiều lần mỗi khi một tên xuất hiện trong chương trình nguồn. Có hai cơ chế tổ chức bảng ký hiệu là danh sách tuyến tính và bảng băm. 1. Cấu trúc một ô của bảng ký hiệu Mỗi ô trong bảng ký hiệu tương ứng với một tên. Ðịnh dạng của các ô này thường không giống nhau vì thông tin lưu trữ về một tên phụ thuộc vào việc sử dụng tên đó. Thông thường một ô được cài đặt bởi một mẩu tin. Nếu muốn có được sự đồng nhất của các mẩu tin ta có thể lưu thông tin bên ngoài bảng ký hiệu, trong mỗi ô của bảng chỉ chứa các con trỏ trỏ tới thông tin đó, Trong bảng ký hiệu cũng có thể có lưu các từ khóa của ngôn ngữ. Nếu vậy thì chúng phải được đưa vào bảng ký hiệu trước khi bộ phân tích từ vựng bắt đầu. 2. Vấn đề lưu trữ lexeme của danh biểu Các danh biểu trong các ngôn ngữ lập trình thường có hai loại: Một số ngôn ngữ quy định độ dài của danh biểu không được vượt quá một giới hạn nào đó. Một số khác không giới hạn về độ dài. 161 Trường hợp danh biểu bị giới hạn về độ dài thì chuỗi các ký tự tạo nên danh biểu được lưu trữ trong bảng ký hiệu. s o r t a r e a d a r r a y i Name Attribute Hình 7.19 - Bảng ký hiệu lưu giữ các tên bị giới hạn độ dài Trường hợp độ dài tên không bị giới hạn thì các Lexeme được lưu trong một mảng riêng và bảng ký hiệu chỉ giữ các con trỏ trỏ tới đầu mỗi Lexeme Name Attribute Hình 7.20 - Bảng ký hiệu lưu giữ các tên không bị giới hạn độ dài 3. Tổ chức bảng ký hiệu bằng danh sách tuyến tính Cấu trúc đơn giản, dễ cài đặt nhất cho bảng ký hiệu là danh sách tuyến tính của các mẩu tin. Ta dùng một mảng hoặc nhiều mảng tương đương để lưu trữ tên và các thông tin kết hợp với chúng. Các tên mới được đưa vào trong danh sách theo thứ tự mà chúng được phát hiện. Vị trí của mảng được đánh dấu bởi con trỏ available chỉ ra một ô mới của bảng sẽ được tạo ra. Việc tìm kiếm một tên trong bảng ký hiệu được bắt đầu từ available đến đầu bảng. Trong các ngôn ngữ cấu trúc khối sử dụng quy tắc tầm tĩnh. Thông tin kết hợp với tên có thể bao gồm cả thông tin về độ sâu của tên. Bằng cách tìm kiếm từ available trở về đầu mảng chúng ta đảm bảo rằng sẽ tìm thấy tên trong tầng gần nhất. s o r t eos a eos r e a d a r r a y eos i eos SymTable Lexeme id1 info 1 id2 info2 162 ... Hình 7.21 - Danh sách tuyến tính các mẩu tin 4. Tổ chức bảng ký hiệu bằng bảng băm Kỹ thuật sử dụng bảng băm để cài đặt bảng ký hiệu thường được sử dụng vì tính hiệu quả của nó. Cấu tạo bao gồm hai phần; bảng băm và các danh sách liên kết. 0 9 20 32 210 CP m match last action ws Hình 7.22 - Bảng băm có kích thước 211 1. Bảng băm là một mảng bao gồm m con trỏ. 2. Bảng danh biểu được chia thành m danh sách liên kết, mỗi danh sách liên kết được trỏ bởi một phần tử trong bảng băm. Việc phân bổ các danh biểu vào danh sách liên kết nào do hàm băm (hash function) quy định. Giả sử s là chuỗi ký tự xác định danh biểu, hàm băm h tác động lên s trả về một giá trị nằm giữa 0 và m- 1 h(s) = t => Danh biểu s được đưa vào trong danh sách liên kết được trỏ bởi phần tử t của bảng băm. Có nhiều phương pháp để xác định hàm băm. Phương pháp đơn giản nhất như sau: 1. Giả sử s bao gồm các ký tự c1, c2, c3, ..., ck. Mỗi ký tự cho ứng với một số nguyên dương n1, n2, n3,...,nk; lấy h = n1 + n2 +...+ nk. 2. Xác định h(s) = h mod m 163 BÀI TẬP CHƯƠNG VII 7.1. Hãy dùng quy tắc tầm vực của ngôn ngữ Pascal để xác định tầm vực ý nghĩa của các khai báo cho mỗi lần xuất hiện tên a, b trong chương trình sau. Output của chương trình là các số nguyên từ 1 đến 4. Program a ( input, output); Procedure b ( u, v, x, y : integer); Var a : record a, b : integer end; b : record a, b : integer end; begin With a do begin a := u ; b := v end; With b do begin a := x ; b := y end; Writeln ( a.a, a.b, b.a, b.b ); end; Begin B ( 1, 2, 3, 4) End. 7.2. Chương trình sau sẽ in ra giá trị như thế nào nếu giả sử thông số được truyền bằng: a) trị b) quy chiếu c) trị - kết quả d) tên Program main ( input, output); Procedure p ( x, y, z ); begin y := y + 1; z := z + x; end; Begin a := 2 ; b := 3 ; p (a +b ; a, a ) print a 164 End. 7.3. Cho đoạn chương trình trong Algol như sau : begin ... Procedure A ( px); procedure px { tham số hình thức px là thủ tục } begin procedure B ( pz); procedure pz { tham số hình thức pz là thủ tục } begin .... pz; .... end; B (px); end; procedure C; begin procedure D; begin ... end; A(D); end; C; end. Hãy giải thích quá trình thực thi của chương trình trên, các bước truyền tham số (giải thích bằng hình ảnh của Stack). 7.4. Cho đoạn chương trình sau: var a, b : integer; Procedure AB Var a, c : real; k, l : integer; procedure AC Var x, y : real; b : array [ 1 .. 10] of integer; begin 165 .... end; begin .... end; begin .... end. Hãy xây dựng bảng ký hiệu thao các phương pháp sau: a) Danh sách tuyến tính b) Băm (hash), nếu giả sử ta có kết quả của hàm biến đổi băm như sau: a = 3; b = 4; c = 4; k = 2; l = 3; x = 4; y = 5; AB = 2; AC = 6; 7.5. Cho đoạn chương trình sau: Program baitap; Var a : real; procedure sub1 ; Var x, y : real; begin .... end; procedure sub2 (t :integer); Var k : integer; procedure sub3 ; Var m : real; begin .... end; procedure t; Var x, y : real; begin .... end; 166 begin .... end. Hãy vẽ bảng ký hiệu cho từng chương trình con có con trỏ trỏ đến bảng ký hiệu của chương trình bị gọi và có con trỏ trỏ ngược lại bảng ký hiệu của chương trình gọi nó. 167

Các file đính kèm theo tài liệu này:

bai_giang_nguyen_ly_ngon_ngu_lap_trinh_chuong_7_moi_truong_t.pdf