Tập trung vào các lệnh mới viết / mới
viết lại
• Các lỗi xuất hiện thất thường :
– Khó giải quyết
– Thường gán cho lỗi của máy tính, hệ điều hành
– Thực ra là do thông tin của chính CT : không phải do thuật
toán, mà do thông tin bị thay đổi qua mỗi lần chạy
– Các biến đã đc khởi tạo hết chưa ?
– Lỗi cấp phát bộ nhớ ? Vd :
char *vd( char *s) {
char m[101];
strncpy(m,s,100)
return m;
}
– Giải phóng bộ nhớ động ?
– for (p=listp; p!=NULL; p=p->next) free(p) ; ???Tập trung vào các lệnh mới viết / mới viết lại
• Phải gỡ rối ngay, không nên để sau
– Khó: Viết toàn bộ chương trình; kiểm tra toàn bộ
chương trình, gỡ rối toàn bộ chương trình
– Dễ hơn: Viết từng đoạn, kiểm tra từng đoạn, gỡ rối
từng đoạn; viết từng đoạn, kiểm tra từng đoạn, gỡ rối
từng đoạn;
• Nên giữ lại các phiên bản trước
– Khó: Thay đổi mã nguồn, đánh dấu các lỗi; cố gắng nhớ
xem đã thay đổi cái gì từ lần làm việc trước
– Dễ hơn: Backup mã nguồn, thay đổi mã nguồn, đánh
dấu các lỗi; so sánh phiên bản mới với phiên bản cũ để
xác định các điểm thay đổi
128 trang |
Chia sẻ: hachi492 | Ngày: 07/01/2022 | Lượt xem: 426 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Bài giảng Kỹ Thuật lập trình - Chương 4: Các kỹ thuật kiểm tra tính đúng đắn và tính an toàn của chương trình phần mềm - Vũ Thị Hương Giang, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ựng 1 struct và thao tác trên struct đó
Các hàm phải nhất quán (consistent)
• Nếu cần tạo ra loạt các hàm tương tự nhau, thì
nên tổ chức mã nguồn của các hàm đó sao cho
logic hay quy trình nghiệp vụ của các hàm đó là
như nhau
int write_record (char fname[],EMPLOYEE employee)
/* Trả về -1 nếu ghi bị lỗi, trả về 0 nếu ghi thành công*/
{
}
int add_record (EMPLOYEE employee, char fname[])
/* Trả về 0 nếu lỗi, trả về 1 nếu thành công*/
{
}
Hàm thứ 2 khác hẳn hàm thứ nhất
Khi tái sử dụng, khả năng gây lỗi là rất cao
Không tùy tiện thay đổi cách thức hoạt
động của hàm
• Chỉ thay đổi tham số của hàm nếu không còn lựa
chọn nào khác.
• Không thay đổi mục tiêu, nhiệm vụ của hàm: ví
dụ: nếu mục tiêu ban đầu không phải là cập nhật
mảng, thì trong hàm đừng thực hiện việc cập
nhật mảng
FILE *fptr;
char fname[]= "file.txt";
fptr= fopen (fname, "r");
if (fptr == NULL) {
printf ("Can't open %s\n",fname);
return -1;
} Nếu fopen làm thay đổi không báo trước giá trị lưu
trong fname, điều gì sẽ xảy ra?
Buffer Overflow & vấn đề truy nhập
trái phép
• Hacker có thể khai thác các lỗi (bug) của hệ điều hành
(Windows/Unix/Mac OS) hay phần mềm để truy nhập
trái phép vào máy tính
• Một trong những lỗi được khai thác rất nhiều là "buffer
overflows".
• Có nhiều cách gây ra buffer overflows
– Sử dụng cẩu thả "strcpy" (sao chép 1 xâu lớn hơn vào 1
biến có kích thước nhỏ hơn).
– Dùng lệnh gets (thư viện stdio)
– Quên không kiểm tra độ lớn của xâu vào
– ..
• Kiểm tra dữ liệu vào từ người dùng là một trong
những cách hạn chế truy nhập trái phép
Buffer Overflow
• Cái gì xảy ra nếu xâu lưu trong str2 dài hơn xâu
lưu trong str1?
void strcpy(char str1[], char str2[])
/* Copy xâu từ str2 vào str1 */
{
int i= 0;
while ((str1[i]= str2[i]) != '\0')
i++;
}
Another complex line which
assigns and compares.
Buffer overflows
• Cái gì xảy ra nếu người dùng nhập vào 10 ký tự ?
100 ký tự ?
#include
int main(void) {
char name [25];
printf("Enter your name: ");
fflush(stdout);
if (gets(name) != NULL)
printf("Hello and Goodbye %s\n", name);
return 0;
}
safe-gets
• Dùng fgets() thay thế cho gets().
– fgets() không tự loại bỏ \n (new line) ở cuối xâu như
gets()
#include
#include
char *safeget(char *buffer, int count) {
char *result = buffer, *np;
if ((buffer == NULL) || (count < 1))
result = NULL;
else if (count == 1) *result = '\0';
else if ((result = fgets(buffer, count, stdin)) != NULL)
if (np = strchr(buffer, '\n'))
*np = '\0';
return result;
}
Khai thác lỗi overflow như thế nào ?
Bộ nhớ máy tính
Mảng có
khả năng bị
tràn
Code khác Chương trình đang chạy
Ghi vào mảng (gửi dữ liệu có chứa chương
trình gây hại vào CT đang chạy )
Lots of "no operations" Chương trình gây hại
Chương trình đang chạy thử tiếp tục chạy trên phần bộ nhớ dành
cho nó, nhưng mà phần bộ nhớ này đã bị chương trình gây hại
chiếm mất khi thực hiện phép ghi vào mảng
II. LẬP TRÌNH PHÒNG
NGỪA
1. Khái niệm
• Xuất phát từ khái niệm
defensive driving.
– Khi lái xe bạn luôn phải
tâm niệm rằng bạn không
bao giờ biết chắc được
người lái xe khác sẽ làm
gì. Bằng cách đó, bạn có
thể chắc chắn rằng khi họ
làm điều gì nguy hiểm, thì
bạn sẽ không bị ảnh hưởng
(tai nạn).
– Bạn có trách nhiệm bảo vệ
bản thân, ngay cả khi
người khác có lỗi
1. Khái niệm
• Ý tưởng chính: nếu chương trình (CTC) nhận dữ
liệu vào bị lỗi thì nó vẫn chạy thông, ngay cả khi
CT khác cũng nhận dữ liệu đầu vào đó đã bị lỗi.
• Lập trình phòng ngừa là cách tự bảo vệ CT của
mình khỏi
– các ảnh hưởng tiêu cực của dữ liệu không hợp lệ
– các rủi ro đến từ các sự kiện tưởng như "không bao giờ"
xảy ra
– sai lầm của các lập trình viên khác
2. Các lỗi có thể phòng ngừa
• Lỗi liên quan đến phần cứng
– Đảm bảo các lỗi như buffer overflows hay divide by zero
được kiểm soát
• Lỗi liên quan đến chương trình
– Đảm bảo giá trị gán cho các biến luôn nằm trong vùng
kiểm soát
– Do not trust anything; verify everything
• Lỗi liên quan đến người dùng
– Đừng cho rằng người dùng luôn thực hiện đúng các thao
tác theo chỉ dẫn, hãy kiểm tra mọi thao tác của họ
• Lỗi liên quan đến các kỹ thuật phòng ngừa!
– Mã nguồn cài đặt các kỹ thuật phòng ngừa cũng có khả
năng gây lỗi, kiểm tra kỹ phần này
3. Các giai đoạn lập trình phòng ngừa
• Lập kế hoạch thực hiện công việc:
– Dành thời gian để kiểm tra và gỡ rối chương trình cẩn thận : hoàn
thành chương trình trước ít nhất 3 ngày so với hạn nộp
• Thiết kế chương trình:
– Thiết kế giải thuật trước khi viết bằng ngôn ngữ lập trình cụ thể
• Giữ vững cấu trúc chương trình:
– Viết và kiểm thử từng phần chương trình: phần chương trình nào
dùng để làm gì
– Viết và kiểm thử mối liên kết giữa các phần trong chương trình:
quy trình nghiệp vụ như thế nào
– Phòng ngừa bằng các điều kiện trước và sau khi gọi mỗi phần
chương trình: điều gì phải đúng trước khi gọi chương trình, điều gì
xảy ra sau khi chương trình thực hiện xong
– Dùng chú thích để miêu tả cấu trúc chương trình khi viết chương
trình
Kiểm tra cái gì, khi nào ?
• Testing: chỉ ra các vấn đề làm chương trình không
chạy
• Kiểm tra theo cấu trúc của chương trình: Kiểm tra
việc thực hiện các nhiệm vụ đặt ra cho từng phần
chương trình
– Ví dụ: điều gì xảy ra với chương trình căn lề văn bản, nếu
hàm ReadWord() bị lỗi ?
• Nếu chương trình không có tham số đầu vào, mà chỉ
thực thi nhiệm vụ và sinh ra kết quả thì không cần
kiểm tra nhiều. Hầu hết chương trình đều không như
vậy
– Ví dụ: điều gì xảy ra với chương trình căn lề văn bản, nếu
• Không nhập đầu vào ?
• Đầu vào không phải là xâu/file chứa các từ hay chữ cái đúng
quy định ?
a. Kiểm tra tham số đầu vào
• Một phần chương trình chạy thông 1 lần
không có nghĩa là lần tiếp theo nó sẽ chạy
thông.
• Chương trình trả ra kết quả đúng với đầu
vào 'n' không có nghĩa là nó sẽ trả ra kết
quả đúng với đầu vào ‘m’ ‘n’.
• Vậy chương trình có thực sự chạy thông
không ?
– Với bất cứ đầu vào nào chương trình cũng
phải chạy thông, không bị “crash”. Nếu có lỗi
thì chương trình phải dừng và thông báo lỗi
– Bạn có thể biết chương trình có chạy thông
hay không khi kiểm tra chương trình bằng các
tham số đầu vào sai
Tham số đầu vào sai
• Trong thực tiễn: “Garbage in,
garbage out.” – GIGO
• Trong lập trình, “rác vào – rác
ra” là dấu hiệu của những CT
tồi, không an toàn
• Với 1 CT tốt thì:
– “rác vào, không có gì ra”,
– “rác vào, có thông báo lỗi”
– “không cho phép rác vào”.
Phòng ngừa lỗi tham số vào
• Check the values of all routine input parameters
– Kiểm tra giá trị của tất cả các tham số truyền vào các
hàm cùng cần như kiểm tra dữ liệu nhập từ nguồn ngoài
khác
• Decide how to handle bad inputs
– Khi phát hiện 1 tham số hay 1 dữ liệu không hợp lệ, bạn
cần làm gì với nó? Tùy thuộc tình huống, bạn có thể
chọn 1 trong các phương án phù hợp
Phòng ngừa lỗi tham số vào
• Kiểm tra giá trị của mọi dữ liệu từ nguồn bên
ngoài
– Khi nhận dữ liệu từ file, bàn phím, mạng, hoặc từ các
nguồn ngoài khác, hãy kiểm tra để đảm bảo rằng dữ liệu
nằm trong giới hạn cho phép.
– Hãy đảm bảo rằng giá trị số nằm trong dung sai và xâu
phải đủ ngẵn để xử lý
• Nếu một chuỗi cần trong một phạm vi giới hạn của các giá
trị (như một ID giao dịch tài chính), hãy chắc chắn rằng
chuỗi đầu vào là hợp lệ cho mục đích của nó; nếu không từ
chối.
– Với ứng dụng bảo mật, hãy đặc biệt lưu ý đến những dữ
liệu có thể tấn công hệ thống: Cố làm tràn bộ nhớ,
injected SQL commands, injected html hay XML code,
tràn số
Ví dụ
• Đoạn mã nguồn sau tìm giá trị trung bình của n
giá trị kiểu doubles.
• Chương trình bị lỗi khi nào ?
double avg (double a[], int n)
/* a là mảng gồm n số kiểu doubles */
{
int i;
double sum= 0;
for (i= 0; i < n; i++) {
sum+= a[i];
}
return sum/n;
}
Phòng ngừa lỗi tham số vào
• Trong một số trường hợp, phải viết thêm các
đoạn mã nguồn để lọc giá trị đầu vào trước khi
tính toán
void class_of_degree (char degree[], double percent)
/* Xếp hạng sinh viên dựa vào tổng điểm tính theo % */
{
if (percent 100)
strcpy(degree,"Error in mark");
else if (percent >= 70)
strcpy(degree,"First");
else if (percent >= 60)
strcpy(degree,"Two-one");
.
.
}
Kiểm tra điều kiện biên
• Điều gì xảy ra nếu giá trị đầu vào quá
lớn hay quá nhỏ ?
• Hãy chắc chắn là chương trình của bạn
có thể đối phó với các tham số đầu
vào kiểu này
• Luôn kiểm tra trường hợp “divide by
zero error”
Ví dụ
• Hàm sau đây mô phỏng hàm strlen trong thư
viện chuẩn của C. Viết thêm các dòng lệnh phòng
ngừa lỗi
int my_strlen (char *string)
/* Khi tính độ dài xâu, hàm này sai ở đâu */
{
int len= 1;
while (string[len] != '\0')
len++;
return len;
}
c. Tràn số
(overflow of numbers)
• Arian 5:
• Chi phí phát triển: 7 tỷ USD
• Phụ kiện hàng hóa đi kèm : 370 triệu USD
• Thực hiện chuyển đổi 64 bit dấu phẩy động
sang 16 bit số nguyên: Việc chuyển đổi không
thành công do tràn số
• 04/06/1996: 37 giây sau khi phóng, nổ ở độ
cao 3700m
Tràn số (overflows of numbers)
• Nếu cần tính toán với các số lớn, hãy chắc chắn
là bạn biết giá trị lớn nhất mà biến bạn dùng có
khả năng lưu trữ
• Ví dụ:
– Với phần lớn trình dịch C, 1 unsigned char có giá trị từ 0
đến 255.
– Kích thước tối đa của 1 biến kiểu int có thể thay đổi
5. Kiểm soát lỗi có thể xảy ra
• Error handling: xử lý các lỗi mà ta dự kiến sẽ xảy
ra
• Tùy theo tình huống cụ thể, ta có thể trả về:
– 1 giá trị trung lập
– thay thế đoạn tiếp theo của dữ liệu hợp lệ
– trả về cùng giá trị như lần trước
– thay thế giá trị hợp lệ gần nhất
– ghi vết 1 cảnh báo vào tệp
– trả về 1 mã lỗi
– gọi 1 thủ tục hay đối tượng xử lý
– hiện 1 thông báo hay tắt máy
Chắc chắn hay chính xác ?
• Chắc chắn: CT luôn chạy thông, kể cả khi có lỗi
• Chính xác: CT không bao giờ gặp lại lỗi
• Ví dụ: Lỗi hiện thị trong các trình xử lý văn bản:
khi đang thay đổi nội dung văn bản, thỉnh thoảng
một phần của một dòng văn bản ở phía dưới màn
hình bị hiện thị sai. Khi đó người dùng phải làm
gì?
– Tắt CT
– Nhấn PgUp hoặc PgDn, màn hình sẽ làm mới
• Ưu tiên tính chắc chắn thay vì tính chính xác:
– Bất cứ kết quả nào đó bao giờ cũng thường là tốt hơn so
với Shutdown.
Khi nào phải loại bỏ hết lỗi ?
• Đôi khi, để loại bỏ 1 lỗi nhỏ, lại rất tốn kém
– Nếu lỗi đó chắc chắn không ảnh hưởng đến mục đích cơ
bản của ứng dụng, không làm chương trình bị treo, hoặc
làm sai lệch kết quả chính, người ta có thể bỏ qua, mà
không cố sửa để có thể gặp phải các nguy cơ khác.
• Phần mềm “chịu lỗi”?: Phần mềm sống chung với
lỗi, để đảm bảo tính liên tục, ổn định
5. Xử lý ngoại lệ
• Một chương trình biên dịch thành công, vẫn có thể gây ra
những lỗi khi chạy, đó chính là các ngoại lệ (exception).
– Điều kiện chủ quan: Do lập trình sai
– Điều kiện khách quan: Do nhập sai dữ liệu, do trạng thái của hệ
thống (tràn bộ nhớ).
• Ngoại lệ phá vỡ luồng bình thường của CT
• Khi xảy ra một ngoại lệ, nếu không xử lý thì chương trình
kết thúc ngay và trả lại quyền điều khiển cho hệ điều hành.
EXIT
NO HANDLER EXISTS float number1, number2;
//nhập vào 2 số
float division=number1/number2;
Báo hiệu tình tình huống bất thường
• Bắt các tình huống bất thường và phục hồi chúng về
trạng thái trước đó
• Giúp chương trình đáng tin cậy hơn, tránh kết thúc
bất thường
• Tách biệt khối lệnh có thể gây ngoại lệ và khối lệnh xử
lý ngoại lệ
IF B IS ZERO GO TO ERROR
C = A/B
PRINT C
GO TO EXIT
ERROR:
DISPLAY “DIVISION BY ZERO”
EXIT:
END
Khối xử lý lỗi
Báo hiệu điều kiện lỗi
• Thông báo cho các bộ phận khác của chương
trình về lỗi không nên bỏ qua
• Chỉ dùng ngoại lệ cho những điều kiện thực sự
ngoại lệ
– Exception được dùng trong những tình huống giống
assertion cho các sự kiện không thường xuyên, nhưng có
thể không bao giờ xảy ra
– Exception có thể bị lạm dụng và phá vỡ các cấu trúc,
điều này dễ gây ra lỗi, vì làm sai lệch luồng điều khiển
Ví dụ chia cho 0
public class ChiaCho0Demo {
public static void main(String args[]){
try {
int num = calculate(9,0);
System.out.println(num);
}
catch(Exception e) {
System.err.println("Co loi xay ra: " +
e.toString());
}
}
static int calculate(int no, int no1){
int num = no / no1;
return num;
}
}
Phục hồi tài nguyên khi có ngoại lệ
• Thường thì không phục hồi tài nguyên
• Nhưng sẽ hữu ích khi thực hiện các công việc
nhằm đảm bảo cho thông tin ở trạng thái rõ ràng
và vô hại nhất có thể
• Nếu các biến vẫn còn được truy xuất thì chúng
nên được gán các giá trị hợp lý
• Trường hợp thực thi việc cập nhật dữ liệu, nhất là
trong 1 phiên – transaction – liên quan tới nhiều
bảng chính, phụ, thì việc khôi phục khi có ngoại
lệ là vô cùng cần thiết (rollback)
Kết luận
Keeping It Simple
(KISS): complex
code is more
likely to contain
errors.
Controlling complexity is the essence of computer
programming. -- Brian Wilson Kernighan
Kiểm tra mã nguồn trong khi viết
chương trình
• 1 LTV giỏi không ngồi viết 1 lúc 10000 dòng lệnh rồi
chạy thử chương trình
• Mọi việc sẽ dễ dàng hơn khi vừa viết chương trình vừa
kiểm tra
• Xác định cấu trúc của chương trình, viết từng phần
nhỏ của chương trình và kiểm tra luôn phần vừa viết.
• Hoàn thiện từng phần chương trình, kiểm tra lại sau
khi hoàn thiện.
• Mẹo:
– Nếu có sửa đổi mã nguồn thì dịch từng đoạn một, khoảng
chục dòng
– Sử dụng nhiều cửa sổ dịch
III. KIỂM THỬ
a. Mục đích
• Khó có thể khẳng định 1 CT lớn có làm
việc chuẩn hay không
• Khi XD 1 CT lớn, 1 LTV chuyên nghiệp
sẽ dành thời gian cho việc viết test
code không ít hơn thời gian dành cho
viết CT
• LTV chuyên nghiệp là người có khả
năng, kiến thức rộng về các kỹ thuật
và chiến lược testing
b. Khái niệm
• Beizer: Testing = chứng minh tính
đúng đắn giữa 1 phần tử và các đặc tả
của nó.
• Myers: Testing = quá trình thực hiện 1
CT với mục đích tìm ra những lỗi.
• IEEE: Testing = quá trình kiểm tra hay
đánh giá 1 hệ thống hay 1 thành phần
hệ thống một cách thủ công hay tự
động để kiểm thử rằng nó thỏa mãn
những yêu cầu đặc thù hoặc để xác
định sự khác biệt giữa kết quả mong
đợi và kết quả thực tế
c. Testing vs. debugging
• Testing & debugging đi cùng với
nhau như 1 cặp:
– Testing tìm errors; debugging định vị
và sửa chúng.
– Ta có mô hình “testing/debugging
cycle”: Ta test, rồi debug, rồi lặp lại.
– Bất kỳ 1 debugging nào nên được tiếp
theo là 1 sự áp dụng lại của hàng loạt
các tests liên quan, đặc biệt là các bài
tests hồi quy. Điều này giúp tránh nảy
sinh các lỗi mới khi debugging.
– Testing & debugging không nên được
thực hiện bởi cùng 1 người.
d. Testing vs. Program Verification
• Program
verification
– Lý tưởng: Chứng
minh được rằng CT
của ta là chính xác,
đúng đắn
• Có thể chứng
minh các thuộc
tính của CT?
• Có thể CM điều
đó kể cả khi CT
kết thúc?!!!
• Testing:
– Hiện thực : Thuyết
phục bản thân rằng
CT có thể làm việc
Program
Checker program.c
Right/Wrong
Specification
?
Testing
Strategy
program.c
Probably
Right/Wrong
Specification
e. Nguyên tắc
• Ưu tiên việc kiểm thử, để khi kết thúc
quá trình kiểm thử, luôn bảo đảm là
việc kiểm thử đã được thực hiện tốt
nhất có thể trong khoảng thời gian bạn
có.
f. Các loại kiểm thử
• External testing
– Thiết kế dữ liệu để kiểm thử chương trình
• Internal testing
– Thiết kế chương trình để nó có thể kiểm
thử chính nó
Khái niệm
• External testing: Thiết kế dữ liệu để
kiểm thử chương trình
• Phân loại :
– Kiểm thử giá trị biên : Boundary testing
– Kiểm thử lệnh : Statement testing
– Kiểm thử luồng : Path testing
– Kiểm thử sốc : Stress testing
a. Boundary Testing
• Hầu hết các lỗi đều xảy ra ở các điều kiện biên -
boundary conditions
• Nếu CT làm việc tốt ở đk biên, nó có thể sẽ làm
việc đúng với các đk khác
Boundary Testing là kỹ thuật kiểm thử sử dụng
các giá trị nhập vào ở trên hoặc dưới một miền
giới hạn của 1 đầu vào và với các giá trị đầu vào
tạo ra các đầu ra ở biên của 1 đầu ra.
Ví dụ
• VD : đọc 1 dòng từ stdin và đưa vào mảng ký tự
• Xét các điều kiện biên
– Dòng rỗng –bắt đầu với '\n'
• In ra xâu rỗng (“\0”) => in ra “||” , ok
– Nếu gặp EOF trước '\n‘
• Tiếp tục gọi getchar() và lưu ӱ vào s[i], not ok
– Nếu gặp ngay EOF (empty file)
• Tiếp tục gọi getchar() và lưu ӱ vào s[i], not ok
int i;
char s[MAXLINE];
for (i=0; (s[i]=getchar()) != '\n' && i < MAXLINE-1; i++)
;
s[i] = '\0';
printf("String: |%s|\n", s);
Ví dụ
• Tiếp tục xét các ĐK biên (tt)
– Dòng chứa đúng MAXLINE-1 ký tự
• In ra đúng, với ‘\0’ tại s[MAXLINE-1]
– Dòng chứa đúng MAXLINE ký tự
• Ký tự cuối cùng bị ghi đè, và dòng mới không bao giờ đc
đọc
– Dòng dài hơn MAXLINE ký tự
• 1 số ký tự, kể cả newline, không đc đọc và sót lại trong
stdin
int i;
char s[MAXLINE];
for (i=0; (s[i]=getchar()) != '\n' && i < MAXLINE-1; i++)
;
s[i] = '\0';
printf("String: |%s|\n", s);
Boundary Testing Example (cont.)
• Rewrite the code
• Trường hợp gặp EOF
• Các trường hợp khác?
– Nearly full
– Exactly full
– Over full
int i;
char s[MAXLINE];
for (i=0; i<MAXLINE-1; i++)
if ((s[i] = getchar()) == '\n')
break;
s[i] = '\0';
for (i=0; i<MAXLINE-1; i++)
if ((s[i] = getchar()) == '\n' || s[i] == EOF)
break;
s[i] = '\0';
This is wrong.
Why?
Ví dụ
• Rewrite yet again
Output:
There’s still a problem...
Input:
Four
score and seven
years
FourØ
score anØ
sevenØ
yearsØ
Where’s
the ‘d’?
for (i=0; ; i++) {
int c = getchar();
if (c==EOF || c=='\n' || i==MAXLINE-1) {
s[i] = '\0';
break;
}
else s[i] = c;
}
Ambiguity in Specification
• Nếu dòng quá dài, xử lý thế nào?
– Giữ MAXLINE ký tự đầu, bỏ qua phần còn lại?
– Giữ MAXLINE ký tự đầu + ‘\0’, bỏ qua phần còn lại?
– Giữ MAXLINE ký tự đầu+’\0’, lưu phần còn lại cho lần gọi
sau của input function?
• Có thể phần đặc tả - specification không hề đề cập khi
MAXLINE bị quá
– Có thể người ta không muốn dòng dài quá giới hạn trong
mọi trường hợp
– Đạo đức: kiểm tra đã phát hiện ra một vấn đề thiết kế,
thậm chí có thể là một vấn đề đặc điểm kỹ thuật !
• Quyết định phải làm gì
– Cắt những dòng quá dài?
– Lưu phần còn lại để đọc như 1 dòng mới?
Kiểm tra điều kiện trước và sau
• Xác định những thuộc tính cần đi trước (điều kiện trước) và
sau (điều kiện sau) để mã nguồn được thi hành
• Ví dụ: các giá trị đầu vào phải thuộc 1 phạm vi cho trước
double avg( double a[], int n) {
int i; double sum=0.0;
for ( i = 0; i<n; i++)
sum+=a[i];
return sum/n;
}
• Nếu n=0 ?, nếu n<0 ?
• Có thể thay : return n <=0 ? 0.0: sum/n;
b. Statement Testing
• “Testing để thỏa mãn điều kiện rằng
mỗi lệnh trong 1 CT phải thực hiện ít
nhất 1 lần khi testing.”
Ví dụ
• Statement testing pseudocode:
• Đòi hỏi 2 tập dữ liệu. Ví dụ:
– condition1 là đúng và condition2 là đúng
• Thực hiện statement1 và statement3
– condition1 là sai và condition2 là sai
• Thực hiện statement2 và statement4
if (condition1)
statement1;
else
statement2;
if (condition2)
statement3;
else
statement4;
Statement testing:
Phải chắc chắn các lệnh “if”
và 4 lệnh trong các nhánh
phải được thực hiện
c. Path Testing
• Kiểm tra để đáp ứng các tiêu chuẩn đảm bảo
rằng mỗi đường dẫn logic xuyên suốt chương
trình được kiểm tra. Thường thì đường dẫn xuyên
suốt chương trình này được nhóm thành một tập
hữu hạn các lớp. Một đường dẫn từ mỗi lớp sau
đó được kiểm tra.
• Khó hơn nhiều so với statement testing
– Với các CT đơn giản, có thể liệt kê các nhánh đường dẫn
xuyên suốt code
– Ngược lại, bằng các đầu vào ngẫu nhiên tạo các đường
dẫn theo CT
Ví dụ
• Đòi hỏi 4 tập dữ liệu:
– condition1 là true và condition2 là true
– condition1 là true và condition2 là false
– condition1 là false và condition2 là true
– condition1 là false và condition2 la false
• Chương trình thực tế => bùng nổ các tổ hợp!!!
if (condition1)
statement1;
else
statement2;
if (condition2)
statement3;
else
statement4;
Path testing:
Cần đảm bảo tất cả các luồng
công việc đều được kiểm thử
Bài tập
(1) input(A,B)
if (A>0)
(2) Z = A;
else
(3) Z = 0;
if (B>0)
(4) Z = Z+B;
(5) output(Z)
What is the path condition for path ?
A>0
F
2 3
1
4
5
B>0
T
F
T
(A>0) Л (B0)
Bài tập
(1) input(A,B)
if (A>B)
(2) B = B*B;
if (B<0)
(3) Z = A;
else
(4) Z = B;
(5) output(Z)
What is the path condition for path ?
(A>B) Л (B<0)
A>B
F 2
4
1
3
5
T
F T
B<0
Consider ANOTHER example
(1) input(A,B)
if (A>B)
(2) B = B*B;
if (B<0)
(3) Z = A;
else
(4) Z = B;
(5) output(Z)
What is the path condition for path ?
(A>B) Л (B<0) (B2<0) = FALSE
A>B
F 2
4
1
3
5
T
F
T
T
B<0
d. Stress Testing
• “Tiến hành thử nghiệm để đánh giá một hệ thống
hay thành phần tại hoặc vượt quá các giới hạn
của các yêu cầu cụ thể của nó”
• Phải tạo:
– Một tập lớn đầu vào - Very large inputs
– Các đầu vào ngẫu nhiên - Random inputs (binary vs.
ASCII)
• Nên dùng máy tính để tạo đầu vào
Ví dụ: Stress Testing
• Example program:
• Mục tiêu: Copy tất cả các ký tự từ stdin vào stdout; nhưng
lưu ý bug!!!
• Làm việc với tập dữ liệu ASCII chuẩn ( tự tạo)
• Máy tính tự tạo ngẫu nhiên tập dữ liệu dạng 255 (decimal),
hay 11111111 (binary), và EOF để dừng vòng lặp
#include
int main(void) {
char c;
while ((c = getchar()) != EOF)
putchar(c);
return 0;
}
Stress testing: Phải cung cấp
các đầu vào ngầu nhiên dạng
nhị phân hay ASCII
Ví dụ: Stress Testing
• Example program:
• Mục tiêu: Đếm và in số các kỹ tự trong stdin
• Làm việc với tập dữ liệu có kích thước phù hợp
• Sẽ có lỗi với tập dữ liệu do máy tạo chứa hơn
32767 characters
#include
int main(void) {
short charCount = 0;
while (getchar() != EOF)
charCount++;
printf("%hd\n", charCount);
return 0;
}
Stress testing: Phải cung cấp
very large inputs
3. Internal Testing
• Internal testing: Thiết kế chương trình để nó tự
kiểm thử chính nó
• Internal testing techniques
(1) Kiểm tra các giá trị bất biến - Testing invariants
(2) Kiểm tra các thuộc tính cần được bảo lưu - Verifying
conservation properties
(3) Kiểm tra các giá trị trả về - Checking function return
values
(4) Thay đổi mã nguồn tạm thời - Changing code
temporarily
(5) Giữ lại phần mã kiểm tra - Leaving testing code intact
a. Testing Invariants
• Kiểm tra các điều kiện tiên nghiệm và điều kiện
hậu nghiệm
• 1 số khía cạnh của CTDL là bất biến, vì vậy, khi 1
hàm tác động lên CTDL, phải kiểm tra tính bất
biến của CTDL trước và trong khi tác động.
• Ví dụ: hàm thêm vào danh sách nối kép
– Duyệt danh sách nối kép
– Nếu node x trỏ đến node y, vậy node y có nhất định phải
trỏ đến node x hay không ?
• Ví dụ: hàm thêm nút vào cây nhị phân tìm kiếm
– Duyệt cây
– Sau khi thêm các nút còn được sắp đúng thứ tự không ?
b. Kiểm tra các đặc tính cần được bảo
lưu
• Khái quát hóa của testing invariants
• 1 hàm cần kiểm tra các cấu trúc dữ liệu bị tác
động tại các điểm đầu và cuối
• VD: hàm Str_concat()
– Tại điểm đầu, tìm độ dài của 2 xâu đã cho; tính tổng
– Tại điểm cuối, tìm độ dài của xâu kết quả
– 2 độ dài có bằng nhau không ?
• VD: Hàm chèn thêm PT vào danh sách -List
insertion function
– Tại điểm khởi đầu, tính độ dài ds
– Tại điểm cuối, Tính độ dài mới
– Độ dài mới = độ dài cũ + 1?
c. Kiểm tra các giá trị trả về
• Java/C++:
– Các phương thức phát hiện lỗi có thể bỏ qua 1 trường
hợp ngoại lệ đã được biết đến (“throw a checked
exception”)
– Việc gọi 1 phương thức cần phải kiểm soát được ngoại lệ
(hoặc lại bỏ qua ngoại lệ đó)
• C:
– Không có kỹ thuật kiểm soát các trường hợp ngoại lệ
– Hàm phát hiện ra lỗi thông qua giá trị trả về
– LTV thường quên kiểm tra giá trị trả về nên kiểm tra
giá trị trả về
Kiểm tra các giá trị trả về
– scanf() trả về số giá trị đã đọc
– printf() có thể bị lỗi nếu ghi vào file hay đĩa đầy; trả
về số các ký tự (ko phải giá trị) đã ghi
int i;
if (scanf("%d", &i) != 1)
/* Error */
int i = 100;
if (printf("%d", i) != 3)
/* Error */
int i;
scanf("%d", &i);
Bad code Good code
int i = 100;
printf("%d", i);
Bad code??? Good code, or overkill???
d. Thay đổi mã nguồn tạm thời
• Thay đổi mã nguồn tạm thời để kiểm tra các điều kiện
biên và kiểm tra trực tiếp các giá trị
• Ví dụ: chương trình sắp xếp trên mảng:
– Dùng mảng với kích thước nhỏ
– CT có kiểm soát được lỗi tràn bộ nhớ hay không ?
• Nhớ áp dụng vào bài tập
• Ví dụ: dùng bảng băm
– Tạm thời cho hàm băm trả về kết quả là 1 hằng số
– Như vậy toàn bộ các giá trị cần băm sẽ có cùng 1 chỉ số,
tức là số lượng các giá trị cần băm có cùng chỉ số là rất lớn
– CT có kiểm soát được tình huống này hay không ?
Thay đổi mã nguồn tạm thời
• Viết 1 phiên bản hàm cấp phát bộ nhớ và phát
hiện ra lỗi sớm, để kiểm thử đoạn mã nguồn bị lỗi
thiếu bộ nhớ:
void *testmalloc( size_t n) {
static int count =0;
if (++count > 10)
return NULL;
else
return malloc(n);
}
e. Giữ lại phần mã kiểm tra
• Để nguyên phần mã kiểm tra quan trọng trong mã nguồn
• Có thể khoanh vùng chúng lại như là mã gỡ rối:
#ifndef NDEBUG #endif
• Khi dịch thì dùng tùy chọn –DNDEBUG của gcc
– Kích hoạt/ tắt các assert macro
– Kích hoạt/ tắt các đoạn mã gỡ rối của LTV
• Đề phòng xung đột:
– Việc viết các đoạn mã tự kiểm tra cho CT có thể làm giảm chi phí
bảo trì chương trình
– Mã nguồn sáng sủa cũng làm giảm chi phí bảo trì chương trình
– Nhưng: việc viết các đoạn mã tự kiểm tra khắp nơi sẽ làm
giảm tính rõ ràng của chương trình
4. Các chiến lược kiểm thử tổng quát
• Kiểm thử dần dần -Testing incrementally
• So sánh các cách cài đặt khác nhau -Comparing
implementations
• Tự động kiểm thử – Automation
• Kiểm thử theo lỗi - Bug-driven testing
• Tiêm, gài lỗi - Fault injection
a. Testing Incrementally
• Test khi viết code
– Thêm tests khi tạo 1 lựa chọn mới - new cases
– Test phần đơn giản trước phần phức tạp
– Test units (tức là từng module riêng lẻ) trước khi testing
toàn hệ thống
• Thực hiện regression testing – kiểm thử hồi quy
– Xử lý đc 1 lỗi thường tạo ra những lỗi mới trong 1 he
thống lớn, vì vậy
– Phải đảm bảo chắc chắn hệ thống không “thoái lui” kiểu
như chức năng trước kia đang làm việc giờ bị broken,
nên
– Test mọi khả năng để so sanh phiên bản mới với phiên
bản cũ
Testing Incrementally (cont.)
• Tạo “giàn giáo” - scaffolds và “mẫu” -stubs để
test đoạn code mà ta quan tâm
Đoạn code cần quan tâm
Hàm được gọi
bởi đoạn code cần
quan tâm
Hàm được gọi
bởi đoạn code cần
quan tâm
Hàm gọi đến code
mà ta quan tâm
b. So sánh các cài đặt
• Hãy chắc chắn rằng các triển khai độc lập hành
xử như nhau
• Ví dụ: So sánh hành vi của chương trình mà bạn
dịch ( TB C++3.0 ) với GCC
• Ví dụ: So sánh hành vi của các hàm bạn tạo
trong str.h với các hàm trong thư viện string.h
• Trường hợp có thể tính 1 kết quả bẳng 2 cách
khác nhau (2 thuật toán giải quyết cùng 1 bài
toán): xây dựng 2 chương trình và kiểm tra kết
quả thực hiện
– Kết quả giống nhau: 2 chương trình cùng đúng
– Khác nhau: ít nhất 1 trong 2 chương trình bị sai
c. Tự động kiểm thử
• Kiểm thử thủ công rất nặng nhọc, tốn kém và nhàm
chán thậm chí không đủ độ tin cậy.
• Trong quá trình kiểm thử, phải
– Thực hiện lặp đi lặp lại các thao tác kiểm thử
– Dùng nhiều bộ dữ liệu nhập
– Nhiều lần so sánh dữ liệu đầu ra
• Tạo testing code để tránh các nhược điểm nói trên
– Viết 1 bộ kiểm thử để kiểm tra toàn bộ chương trình mỗi
khi có sự thay đổi, sau khi biên dịch thành công
– Cần biết cái gì được chờ đợi
• Tạo ra các đầu ra, sao cho dễ dàng nhận biết là đúng hay sai
– Tự động kiểm thử tốt hơn nhiều so với kiểm thử thủ công
Tự động hóa kiểm thử hồi quy
• Tuần tự so sánh kết quả thực hiện các phiên bản mới
với kết quả thực hiện những phiên bản cũ tương ứng.
• Mục đích : đảm bảo việc sửa lỗi sẽ không làm ảnh
hưởng những phần khác trừ khi chúng ta muốn
• 1 số hệ thống có công cụ trợ giúp kiểm thử tự động :
– Ngôn ngữ scripts : cho phép viết các đoạn script để test
tuần tự
– Unix : có các thao tác trên tệp tin như cmp và diff để so
sanh dữ liệu xuất, sort sắp xếp các phần tử, grep để kiểm
thử dữ liệu xuất, wc, sum va freq để tổng kết dữ liệu xuất
• Khi kiểm thử hồi quy, cần đảm bảo phiên bản cũ là
đúng, nếu sai thì rất khó xác định và kết quả sẽ
không chính xác
• Cần phải kiểm tra chính việc kiểm thử hồi quy 1 cách
định kỳ để đảm bảo nó vẫn hợp lệ
Tạo ra những kiểm thử độc lập
• Kiểm thử độc lập với các giá trị nhập và giá trị xuất mong đợi sẽ bổ
xung cho kiểm thử hồi quy
• VD: Dùng ngôn ngữ NewAwk thực hiện kiểm thử 1 CT ngắn, ghi dữ
liệu đẩu ra của CT vào 1 tệp, ghi kết quả đúng vào 1 tệp khác rồi so
sánh 2 tệp, nếu khác nhau thì thông báo lỗi
echo 3 5 | newawk ‘{i=1; print ($si)++; print $i ,i}’ > out1
echo ‘3 4 1’ > out2 #kết quả đúng
if ! Cmp –s out1 out2 # nếu kq so sánh khác nhau
then
echo ‘BAD: test failed’
Fi
• Mọt lỗi có thể cần nhiều thao tác kiểm thử hoặc phải kiểm tra toàn bộ
các lớp mới, hoặc có thể thêm vào những đoạn CT bảo vệ để có thể
bắt đc những lỗi trong CT
d. Bug-Driven Testing
• Tìm thấy 1 bug
Ngay lập tức tạo 1 test để bắt lỗi
• Đơn giản hóa việc kiểm thử hồi quy
e. Fault injection
• Chủ động (tạm thời) cài các bugs!!!
• Rồi quyết định nếu tìm thấy chúng
• Kiểm thử chính đoạn mã kiểm thử/ quy trình
kiểm thử
4. Ai kiểm thử cái gì
• Programmers: White-box testing
– Thuận lợi: Người triển khai nắm rõ mọi luồng dữ liệu
– Khó khăn: Bị ảnh hưởng bởi cách thiết kế CT hay viết
mã nguồn
• Quality Assurance (QA) engineers: Black-box
testing
– Thuận lợi: Không có khái niệm về implementation
– Khó khăn: Không muốn test mọi logical paths
• Customers: Field testing
– Thuận lợi: Có các cách sử dụng CT bất ngờ; dễ gây lỗi
– Khó khăn: Không đủ trường hợp; khách hàng không
thích tham gia vào quá trình test
Các kỹ thuật kiểm thử
• Black-Box: Testing chỉ dựa trên việc
phân tích các yêu cầu - requirements
(unit/component specification, user
documentation, v.v.). Còn được gọi là
functional testing.
• White-Box: Testing dựa trên việc
phân tích các logic bên trong - internal
logic (design, code, v.v.). (Nhưng kết
quả mong đợi vẫn đến từ
requirements.) Còn đc gọi là structural
testing.
Các mức độ kiểm thử
• Unit: testing các mẫu công việc nhỏ nhất của LTV để có thể
lập kế hoạch và theo dõi hợp lý (vd : function, procedure,
module, object class, .)
• Component: testing 1 tập hợp các units tạo thành 1 thành
phần (vd : program, package, task, interacting object
classes, )
• Product: testing các thành phần tạo thành 1 sản phẩm (
subsystem, application, )
• System: testing toàn bộ hệ thống
• Testing thường:
– Bắt đầu = functional (black-box) tests,
– Rồi thêm = structural (white-box) tests, và
– Tiến hành từ unit level đến system level với 1 hoặc một vài bước
tích hợp
Tại sao không "test everything"?
Chi phí cho 'exhaustive' testing:
20 x 4 x 3 x 10 x 2 x 100 = 480,000 tests
Nếu 1 giây cho 1 test, 8000 phút, 133 giờ, 17.7 ngày
(chưa kể nhầm lẫn hoặc test đi test lại)
nếu 10 secs = 34 wks, 1 min = 4 yrs, 10 min = 40 yrs
Kiểm thử bao nhiêu thì đủ?
• Không bao giờ đủ !
• Khi bạn thực hiện những test mà bạn đã lên kế hoạch
• Khi khách hàng/người sử dụng thấy thỏa mãn
• Khi bạn đã chứng minh đc rằng hệ thống hoạt động
đúng, chính xác
• Khi bạn tin tưởng rằng HT hoạt động tốt
• Phụ thuộc vào các rủi ro có thể xảy ra với hệ thống
– Thời gian để test luôn có giới hạn
– Dùng RISK để xác định:
• Cái gì phải test trước
• Cái gì phải test nhiều
• Mỗi phần tử cần test kỹ đến mức nào?
• Tại một thời điểm nhất định, cái gì không cần test
IV. GỠ RỐI
1. Tổng quan về gỡ rối chương trình
2. Tìm kiếm và gỡ rối
Mở đầu
• Gỡ rối chương trình lớn là công việc không đơn
giản
• 1 LTV giỏi phải biết
– Nhiều chiến lược gỡ rối khác nhau
– Các công cụ hỗ trợ việc gỡ rối
• Debuggers
• Version control systems
1. Tổng quan về gỡ rối chương trình
• Gỡ rối là gì ?
– Khi chương trình bị lỗi, gỡ rối là các công việc cần làm để làm cho chương trình dịch
thông, chạy thông
– Thật không may, gỡ rối luôn là thao tác phải làm khi lập trình, thao tác này rất tốn
kém
• Cách tốt nhất vẫn là phòng ngừa
– Khi bắt đầu gỡ rối chương trình, bạn đã biết là chương trình không chạy.
– Nếu bạn biết lý do tại sao chương trình không chạy, bạn có thể sửa được chương trình
cho nó chạy
– Nếu bạn hiểu chương trình của bạn, bạn sẽ có ít sai lầm và dễ dàng sửa chữa sai sót
hơn. Bí quyết là viết mã đơn giản, hiệu quả, chú thích hợp lý.
• Đối với mã nguồn, tiêu chí nào quan trọng hơn: rõ ràng hay chính xác ?
– Nếu mã nguồn rõ ràng, bạn có thể làm cho chương trình trở nên chính xác.
– Bạn có chắc là làm cho chương trình trở nên chính xác nếu nó không rõ ràng hay
không ?
• Nếu chương trình được thiết kế với cấu trúc tốt, được viết bằng phong cách lập
trình tốt và áp dụng các kỹ thuật viết chương trình hiệu quả, bẫy lỗi thì chi phí
cho việc gỡ rối sẽ được giảm thiểu.
2. Tìm kiếm và gỡ rối
• Khi có lỗi, ta thường đổ cho trình dịch, thư viện hay bất cứ nguyên
nhân khách quan nào khác tuy nhiên, cuối cùng thì lỗi vẫn là lỗi của
CT, và trách nhiệm gỡ rối thuộc về LTV
• Phải hiểu vấn đề xuất phát từ đâu thì mới giải quyết được:
– Lỗi xảy ra ở đâu? Hầu hết các lỗi thường đơn giản và dễ tìm. Hãy khảo sát các
đầu mối và cố gắng xác định được đoạn mã nguồn gây lỗi
– Lỗi xảy ra như thế nào? Khi đã có 1 số thông tin về lỗi và nơi xảy ra lỗi, hãy
suy nghĩ xem lỗi xảy ra như thế nào
– Đâu là nguyên nhân gây lỗi? Suy luận ngược trở lại trạng thái của CT để xác
định nguyên nhân gây ra lỗi
• Gỡ rối liên quan đến việc suy luận lùi, giỗng như phá án.
1 số vấn đề không thể xảy ra và chỉ có những thông tin xác thực mới
đáng tin cậy
Phải đi ngược từ kết quả để khám phá nguyên nhân,
Khi có lời giải thích đầy đủ, ta sẽ biết được vấn đề cần sửa và có thể
phát hiện ra 1 số vấn đề khác
2. Tìm kiếm và gỡ rối
Debugging Heuristic Áp dụng khi nào
(1) Hiểu các thông báo lỗi (error messages) Build-time (dịch)
(2) Nghĩ trước khi viết lại chương trình
Run-time (chạy)
(3) Tìm kiếm các lỗi (bug) hay xảy ra
(4) Divide and conquer
(5) Viết thêm các đoạn mã kiểm tra để
chương trình tự kiểm tra nó
(6) Hiện thị kết quả
(7) Sử dụng debugger
(8) Tập trung vào các lệnh mới viết / mới viết
lại
2.1. Hiểu các thông báo lỗi
Gỡ rối khi dịch (build-time) CT dễ hơn gỡ rối khi
chạy CT nếu LTV hiểu được các thông báo lỗi
Một số thông báo lỗi đến từ preprocessor
#include
int main(void)
/* Print "hello, world" to stdout and
return 0.
{
printf("hello, world\n");
return 0;
}
$ gcc217 hello.c -o hello
hello.c:1:20: stdioo.h: No such file or directory
hello.c:3:1: unterminated comment
hello.c:2: error: syntax error at end of input
Gõ sai tên file cần gọi
Thiếu dấu */
Hiểu các thông báo lỗi
• Một số thông báo lỗi đến từ compiler
#include
int main(void)
/* Print "hello, world" to stdout and
return 0. */
{
printf("hello, world\n")
retun 0;
}
Hiểu các thông báo lỗi
• Một số thông báo lỗi đến từ linker
#include
int main(void)
/* Print "hello, world" to stdout and
return 0. */
{
prinf("hello, world\n")
return 0;
}
2.2. Nghĩ trước khi viết lại chương
trình
Việc thay đổi mã nguồn không hợp lý có thể gây ra
nhiều vấn đề hơn là để nguyên không thay đổi gì,
nên
Phải nghĩ trước khi làm
Nghĩ trước khi viết lại chương trình
• Gỡ rối ngay khi gặp
– Khi phát hiện lỗi, hãy sửa ngay, đừng để sau mới sửa, vì có thể lỗi
không xuất hiện lại (do tình huống)
– Cân nhắc: việc sửa chữa này có ảnh hưởng tới các tình huống khác
hay không ?
• Quan sát lỗi từ góc độ khác
– Viết đoạn mã nguồn gây lỗi ra giấy
• Đừng chép hết cả đoạn không có nguy cơ gây lỗi, hoặc in toàn bộ
code ra giấy in => phá vỡ cây cấu trúc
– Vẽ hình minh họa các cấu trúc dữ liệu
• Nếu mà giải thuật làm thay đổi CTDL, vẽ lại hình trước khi viết lại
giải thuật
– Đọc trước khi gõ vào
• Đừng vội vàng, khi không rõ điều gì thực sự gây ra lỗi và sửa
không đúng chỗ sẽ có nguy cơ gây ra lỗi khác
Nghĩ trước khi viết lại chương trình
• Tạm dừng viết CT
– Khi gặp vấn đề, khó khăn, chậm tiến độ, lập tức thay đổi công việc =>
rút ra khỏi luồng quán tính sai lầm
– Bỏ qua đoạn CT có lỗi
– Khi nào cảm thấy sẵn sàng thì chữa
• Giải thích logic của đoạn mã nguồn:
– Cho chính bạn
• Tạo điều kiện để suy nghĩ lại
– Cho ai khác có thể phản bác
• Extrem programming : làm việc theo cặp, pair programming,
người này LT, người kia kiểm tra, và ngược lại
– Cho cái gì đó không thể phản bác (cây, cốc trà đá, gấu bông, cún,)
• Tạo điều kiện củng cố suy luận của mình
2.3. Tìm kiếm các lỗi hay xảy ra
• Xem lại các quy tắc lập trình
int i;
scanf("%d", i);
char c;
c = getchar();
switch (i) {
case 0:
/* missing break */
case 1:
break;
}
if (i = 5)
if (5 < i < 10)
if (i & j)
while (c = getchar() != EOF)
Chú ý: nếu đặt chế độ
cảnh báo (warnings) khi
dịch thì hầu hết các lỗi
kiểu này sẽ được phát hiện
Tìm kiếm các lỗi hay xảy ra
• Khi gặp vấn đề, hãy liên tưởng đến những trường
hợp tương tự đã gặp
– Vd1 :
int n; scanf(“%d”,n); ?
– Vd2 :
int n=1; double d=PI;
printf(“%d %f \n”,d,n); ??
• Không khởi tạo biến (với C) cũng sẽ gây ra những
lỗi khó lường.
Tìm kiếm các lỗi hay xảy ra
• Làm cho lỗi xuất hiện lại
– Cố gắng làm cho lỗi có thể xuất hiện lại khi cần
– Nếu không được, thì thử tìm nguyên nhân tại sao lại
không làm cho lỗi xuất hiện lại
Các phương pháp gỡ rối
• Tránh mắc cùng 1 lỗi 2 lần : Sau khi sửa 1 lỗi, hãy suy nghĩ
xem có lỗi tương tự ở nơi nào khác không. VD :
for (i=1;i<argc;i++) {
if (argv[i][0] !=‘-’)
break;
switch (argv[i][1]) {
case ‘o’ : /* tên tệp ouput*/
outname = argv[i]; break;
case ‘f’ : from = atoi(argv[i]); break;
case ‘t’ : to = atoi(argv[i]); break;
}
}
Chú ý :
nếu có thể code khi ngủ thì cũng đừng ngủ gật khi code
2.4. Divide and Conquer
• Thu hẹp phạm vi
• Tập trung vào dữ liệu gây lỗi
Divide and Conquer
• Khử đầu vào
– Thử chương trình với các tham số đầu vào từ đơn giản đến phức
tạp, từ nhỏ đến lớn để tìm lỗi
– Ví dụ: chương trình lỗi với file đầu vào filex
• Tạo ra phiên bản copy của filex , tên là filexcopy
• Xoá bớt nửa sau của filexcopy
• Chạy chương trình với tham số đầu vào là filexcopy
– Nếu chạy thông => nửa đầu của filex không gây lỗi, loại bỏ nửa này,
tìm lỗi trong nửa sau của filex
– Nếu không chạy => nửa đầu của filex gây lỗi, loại bỏ nửa sau, tìm lỗi
trong nửa đầu của filex
• Lặp cho đến khi không còn dòng nào trong filex có thể bị loại bỏ
– Cách khác: bắt đầu với 1 ít dòng trong filex, thêm dần các dòng
vào cho đến khi thấy lỗi
Divide and Conquer
• Khử mã nguồn
– Thử chương trình với các đoạn mã nguồn từ ngắn đến
dài để tìm lỗi
– Example: đoạn chương trình có sử dụng đến các phần
CTC khác không chạy
• Viết riêng từng lời gọi hàm trong đoạn chương trình bị lỗi
(test client)
– Hoặc viết thêm phần kiểm tra gọi hàm vào phần CTC được gọi
• Chạy thử test client
• Không chạy => lỗi liên quan đến việc gọi/ thực hiện CTC
vừa thử
• Chạy thông => lỗi nằm trong phần còn lại, tiếp tục thử gọi
các hàm khác
2.5. Viết thêm các đoạn mã kiểm tra để
chương trình tự kiểm tra nó
• Dùng internal test để khử lỗi trong CT và giảm
nhẹ công việc tìm kiếm lỗi
– Chỉ cần viết thêm 1 hàm để kiểm tra, gắn vào trước và
sau đoạn có nguy cơ, comment lại sau khi đã xử lý xong
lỗi
– Các kỹ thuật viết thêm mã tự kiểm tra cho chương trình
đã học
• Kiểm tra các giá trị không thay đổi
• Kiểm tra các đặc tính cần bảo lưu
• Kiểm tra giá trị trả về của hàm
• Thay đổi mã nguồn tạm thời
• Kiểm tra mà không làm thay đổi mã nguồn
• Dùng assertion để nhận dạng các lỗi có trong CT
Assertions
• Assertion: 1 macro hay 1 CT con dùng trong quá trình
phát triển ứng dụng, cho phép CT tự kiểm tra khi
chạy.
• Return true >> OK, false >> có 1 lỗi gì đó trong CT.
• Ghi lại những giả thiết được đưa ra trong code
• Loại bỏ những điều kiện không mong đợi
• VD :
– Nếu hệ thống cho rằng file dữ liệu về khách hàng không
bao giờ vượt quá 50 000 bản ghi, CT có thể chứa 1
assertion rằng số bản ghi là <= 50 000.
– Khi mà số bản ghi <= 50,000, assertion sẽ không có phản
ứng gì.
– Nếu đếm đc hơn 50 000 bản ghi, nó sẽ lớn tiếng “khẳng
định” rằng có 1 lỗi trong CT
Assertions
• Assertions có thể được dùng để kiểm tra các giả thiết
như :
– Các tham số đầu vào nằm trong phạm vi mong đợi (tương
tự với các tham số đầu ra)
– File hay stream đang được mở (hay đóng) khi 1 CTC bắt
đầu thực hiện (hay kết thúc)
– 1 file hay stream đang ở bản ghi đầu tiên (hay cuối cùng)
khi 1 CTC bắt đầu ( hay kết thúc) thực hiện
– 1 file hay stream được mở để đọc, để ghi, hay cả đọc và ghi
– Giá trị của 1 tham số đầu vào là không thay đổi bởi 1 CTC
– 1 pointer là non-NULL
– 1 mảng đc truyền vào CTC có thể chứa ít nhất X phần tử
– 1 bảng đã đc khởi tạo để chứa các giá trị thực
– 1 danh sách là rỗng (hay đầy) lkhi 1 CTC bắt đầu (hay kết
thúc) thực hiện
Assertions
• End users không cần thấy
các thông báo của assertion ;
• Assertions chủ yếu đc dùng
trong quá trình phát triển
hay bảo dưỡng ứng dụng.
• Dịch thành code khi phát
triển, loại bỏ khỏi code trong
sản phẩm để nâng cao hiệu
năng của chương trình
• Rất nhiều NNLT hỗ trợ
assertions : C++, Java và
Visual Basic.
• Kể cả khi NNLT không hỗ trợ,
thì cũng có thể dễ dàng xây
dựng
VD:
#define ASSERT(condition, message)
{
if ( !(condition) ) {
fprintf(
stderr,
"Assertion %s failed: %s\n",
condition,
message);
exit( EXIT_FAILURE );
}
}
Dùng assertions như thế nào ?
• Bẫy lỗi cho những tình huống lường trước (sự
kiện ta chờ đợi sẽ xảy ra);
– Error-handling : checks for bad input data Hướng tới
việc xử lý lỗi
• Dùng assertions cho các tình huống không lường
trước (sự kiện không mong đợi xảy ra hoặc không
bao giờ xảy ra)
– Assertions : check for bugs in the code hướng đến
việc hiệu chỉnh chương trình, tạo ra phiên bản mới của
chương trình
• Tránh đưa code xử lý vào trong assertions
– Điều gì xảy ra khi ta turn off the assertions ?
Dùng assertions như thế nào ?
• Các chương trình lớn:
– trước tiên xác nhận lỗi (dùng assertion),
– sau đó bẫy lỗi (dùng error-handling)
• Nguyên nhân gây lỗi đã được xác định:
– hoặc dùng assertion, hoặc dùng error-handling,
– không dùng cả 2 cùng lúc
• Các chương trình cực lớn, nhiều người cùng phát triển
trong thời gian 5-10 năm, hoặc hơn nữa ?
– Cả assertions và error handling code có thể đc dùng cho
cùng 1 lỗi.
– Ví dụ trong source code cho Microsoft Word, những điều
kiện luôn trả về true thì đc dùng assertion, nhưng đồng thời
cũng đc xử lý.
– Assertions rất có lợi vì nó giúp loại bỏ rất nhiều lỗi trong
quá trình phát triển hệ thống
Kiểm tra các giá trị không thay đổi
• Có thể sử dụng assert để kiểm tra các giá trị không thay đổi
#ifndef NDEBUG
int isValid(MyType object) {
Test invariants here.
Return 1 (TRUE) if object passes
all tests, and 0 (FALSE) otherwise.
}
#endif
void myFunction(MyType object) {
assert(isValid(object));
Manipulate object here.
assert(isValid(object));
}
2.6. Hiện thị kết quả đầu ra
• In giá trị của các biến tại các
điểm có khả năng gây lỗi để
định vị khu vực gây lỗi, hoặc
• Xác định tiến trình thực hiện :
“đến đây 1”
• Poor:
• Maybe better:
• Better:
printf("%d", keyvariable);
stdout is buffered;
CT có thể có lỗi
trước khi hiện ra
output
printf("%d", keyvariable);
fflush(stdout);
printf("%d\n", keyvariable);
Gọi fflush() để làm
sạch buffer 1 cách
tường minh
In '\n' sẽ xóa bộ nhớ
đệm stdout , nhưng
sẽ không xóa khi in
ra file
Hiện thị kết quả đầu ra
• Tạo log file
• Lưu vết
– Giúp ghi nhớ đc các vấn đề đã xảy ra,
và giải quyết các vđề tương tự sau
này, cũng như khi chuyển giao CT
cho người khác..
• Maybe even better:
• Maybe better still:
fprintf(stderr, "%d", keyvariable);
FILE *fp = fopen("logfile", "w");
fprintf(fp, "%d", keyvariable);
fflush(fp);
In debugging
output ra stderr;
debugging output
có thể tách biệt
với đầu ra thông
thường bằng cách
in ấn của CT
Ghi ra 1 a log file
Ngoài ra: stderr
không dùng buffer
2.7. Sử dụng trình gỡ rối (debugger)
• IDE : kết hợp soạn thảo, biên dịch, gỡ rối
• Các trình gỡ rối với giao diện đồ họa cho phép chạy chương
trình từng bước qua từng lệnh hoặc từng hàm, dừng ở những
dòng lệnh đặc biệt hay khi xuất hiện những đk đặc biệt, bên
canh đó có các công cụ cho phép định dạng và hiển thị giá trị
các biến, biểu thức
• Trình gỡ rối có thể được kích hoạt trực tiếp khi có lỗi hoặc gắn
vào chương trình đang chạy.
• Thường để tìm ra lỗi , ta phải xem xét thứ tự các hàm đã đc
kích hoạt ( theo vết) và hiển thị các giá trị các biến liên quan
• Nếu vẫn không phát hiện đc lỗi : dùng các BreakPoint hoạc
chạy từng bước – step by step
• Có nhiều công cụ gỡ rối mạnh và hiệu quả, tại sao ta vẫn mất
nhiều thời gian và trí lực để gỡ rối ?
• Nhiều khi các công cụ không thể giúp dễ dàng tìm lỗi, nếu đưa
ra 1 câu hỏi sai, trình gỡ rối sẽ cho 1 câu trả lời, nhưng ta có
thể không biết là nó đang bị sai
Sử dụng trình gỡ rối
• Dùng 1 trình gỡ rối để chạy từng bước là phương sách cuối cùng
• Nhiều khi vấn đề tưởng quá đơn giản nhưng lại không phát hiện được,
ví dụ các toán tử so sánh trong pascal va VB có độ ưu tiên ngang
nhau, nhưng với C ?
( == và != nhỏ hơn !)
• Thứ tự các đối số của lời gọi hàm : ví dụ : strcpy(s1,s2)
int m[6]={1,2,3,4,5,6}, *p,*q;
p=m; q=p+2; *p++ =*q++; *p=*q; ???
• Lỗi loại này khó tìm vì bản thân ý nghĩ của ta vạch ra 1 hướng suy
nghĩ sai lệch : coi điều không đúng là đúng
• Đôi khi lỗi là do nguyên nhân khách quan : Trình biên dịch, thư viện
hay hệ điều hành, hoặc lỗi phần cứng : 1994 lỗi xử lý dấu chấm
độngng trong bộ xử lý Pentium
Công cụ hỗ trợ gỡ rối
GDB: The GNU Project Debugger
• Gỡ rối được các chương trình viết bằng Ada, C,
C++, Objective-C, Pascal, v.v., chạy trên cùng
máy cài đặt GDB hay trên máy khác
• Hoạt động trên nền UNIX và Microsoft Windows
• Các chức năng hỗ trợ:
– Bắt đầu chương trình, xác định những yếu tố làm ảnh
hưởng đến hoạt động của chương trình
– Dừng chương trình với điều kiện biết trước
– Khi chương trình bị dừng, kiểm tra những gì đã xảy ra
– Thay đổi các lệnh trong chương trình để LTV có thể thử
nghiệm gỡ rối từng lỗi một
2.8. Tập trung vào các lệnh mới viết /
mới viết lại
• Kiểm tra sự thay đổi mới nhất
– Lỗi thường xảy ra ở những đoạn CT mới được bổ sung
– Nếu phiên bản cũ OK, phiên bản mới có lỗi => lỗi chắc
chắn nằm ở những đoạn CT mới
– Lưu ý, khi sửa đổi, nâng cấp : hãy giữ lại phiên bản cũ –
đơn giản là comment lại đoạn mã cũ
– Đặc biệt, với các hệ thống lớn, làm việc nhóm thì việc sử
dụng các hệ thống quản lý phiên bản mã nguồn và các
cơ chế lưu lại quá trình sửa đổi là vô cùng hữu ích (
source safe )
Tập trung vào các lệnh mới viết / mới
viết lại
• Các lỗi xuất hiện thất thường :
– Khó giải quyết
– Thường gán cho lỗi của máy tính, hệ điều hành
– Thực ra là do thông tin của chính CT : không phải do thuật
toán, mà do thông tin bị thay đổi qua mỗi lần chạy
– Các biến đã đc khởi tạo hết chưa ?
– Lỗi cấp phát bộ nhớ ? Vd :
char *vd( char *s) {
char m[101];
strncpy(m,s,100)
return m;
}
– Giải phóng bộ nhớ động ?
– for (p=listp; p!=NULL; p=p->next) free(p) ; ???
Tập trung vào các lệnh mới viết / mới viết lại
• Phải gỡ rối ngay, không nên để sau
– Khó: Viết toàn bộ chương trình; kiểm tra toàn bộ
chương trình, gỡ rối toàn bộ chương trình
– Dễ hơn: Viết từng đoạn, kiểm tra từng đoạn, gỡ rối
từng đoạn; viết từng đoạn, kiểm tra từng đoạn, gỡ rối
từng đoạn;
• Nên giữ lại các phiên bản trước
– Khó: Thay đổi mã nguồn, đánh dấu các lỗi; cố gắng nhớ
xem đã thay đổi cái gì từ lần làm việc trước
– Dễ hơn: Backup mã nguồn, thay đổi mã nguồn, đánh
dấu các lỗi; so sánh phiên bản mới với phiên bản cũ để
xác định các điểm thay đổi
Giữ lại các phiên bản trước đó
• Cách 1: Sao chép bằng tay vào 1 thư mục
• Lặp lại mỗi lần có phiên bản mới
• Cách 2: dùng công cụ như RCS (Revision Control
System), CVS, v.v.
$ mkdir myproject
$ cd myproject
Create project files here.
$ cd ..
$ cp –r myproject myprojectDateTime
$ cd myproject
Continue creating project files here.
Tóm lại
• Gỡ rối là 1 nghệ thuật mà ta phải luyện tập
thường xuyên
• Nhưng đó là nghệ thuật mà ta không muốn
• Mã nguồn viết tốt có ít lỗi hơn và dễ tìm hơn
• Đầu tiên phải nghĩ đến nguồn gốc sinh ra lỗi
• Hãy suy nghĩ kỹ càng, có hệ thống để định vị khu
vực gây lỗi
• Không gì bằng học từ chính lỗi của mình – điều
này càng đúng đối với LTV
Các file đính kèm theo tài liệu này:
- bai_giang_ky_thuat_lap_trinh_chuong_4_cac_ky_thuat_kiem_tra.pdf