Stata - Khởi động Stata

Nếu phân phối bình thường thì đường cong phân phối (đường nét đậm) sẽ trùng với đường chéo của hình chữ nhật (đường thẳng mảnh). Nếu phân phối lệch âm thì ở xác suất 0,5 đường cong phân phối nằm ở bên trái đường chéo. Nếu phân phối lệch dương thì ở xác suất 0,5 đường cong phân phối sẽ nằm ở bên phải đường chéo. Nếu độ dốc của đường cong phân phối lớn hơn một (1) có nghĩa là phân phối thực nghiệm tăng chậm hơn phân phối bình thường, nếu đường cong phân phối nhỏ hơn một (1) có nghĩa là đường cong thực nghiệm tăng nhanh hơn phân phối bình thường.

doc33 trang | Chia sẻ: huyhoang44 | Lượt xem: 594 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Stata - Khởi động Stata, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Khởi động Stata 1. Khởi động Stata Khởi động chương trình STATA bằng cách nhấp vào nút Start :: All Programs :: Medistat :: Stata 8 hoặc nhấp vào biểu tượng (icon) Stata 8 trên màn hình Desktop. 2. Mô tả giao diện của chương trình Stata Giao diện của Stata sẽ hiện ra với 3 thanh và 4 cửa sổ: 3 thanh bao gồm: 1. Thanh tiêu đề với dòng chữ "Intercooled Stata 6.0" 2. Thanh menu với các menu File (đóng mở tập tin); Edit (hiệu chỉnh); Prefs (Tùy chọn); Data (Số liệu) Graphics (Đồ họa) Statistics (Thống kê) User (Người dùng) Window (mở ra các cửa sổ) và Help (Trợ giúp) 3. Thanh công cụ (toolbar) Thanh công cụ gồm 12 nút công cụ (1- Open file; 2- Save; 3- Print Results; 4- Begin (Close) log; 5- Start Viewer (Bring Viewer to Front) ; 6- Bring results window to Front 7-Bring graph windows to Front; 8- Do-file Editor; 9-Data Editor; 10-Data Browser; 11-Clear - more - Condition và 12- Break) Ý nghĩa của từng công cụ như sau: 1- Open file (mở tập tin) 2- Save (Lưu tập tin) 3- Print Results (In kết quả) 4- Begin (Close) log: (Bắt đầu (Kết thúc) ghi biên bản kết quả) 5- Start Viewer (Bring Viewer to Front) : Bắt đầu sử dụng cửa sổ Viewer 6- Bring results window to Front : (Đưa cửa sổ kết quả ra trước) 7-Bring graph windows to Front (Đưa cửa sổ đồ họa ra trước) 8- Do-file Editor: (Biên soạn tập tin chương trình - do file) 9-Data Editor: Biên tập số liệu (sửa chữa, thêm bớt số liệu) 10-Data Browser: Duyệt số liệu (xem nhưng không sửa chữa) 11-Clear - more - Condition (Xóa lệnh more để tiếp tục thực hiện chương trình) 12- Break: (Ngưng tập tin chương trình) Bốn cửa sổ liệt kê theo ngược chiều kim đồng hồ bao gồm 1. Cửa sổ Command (cửa sổ lệnh) 2. Cửa sổ Result (cửa sổ Kết quả) 3. Cửa sổ Review (cửa sổ Lưu trữ) 4. Cửa sổ Variables (cửa số Biến số) 3. Cách cách để thực hiện lệnh trong chương trình Stata Có hai cách để thực hiện lệnh trong chương trình Stata: Dùng bàn phím để gõ lệnh vào cửa sổ lệnh (Stata Command) hay sử dụng con trỏ chuột để chọn các trình đơn (menu) giao diện đồ họa (Graphic Interface) Dùng bàn phím để gõ lệnh Dùng bàn phím để gõ lệnh vào cửa sổ lệnh (Stata Command). Đây là cách sử dụng Stata của người chuyên nghiệp vì nó cho phép thực hiện tất cả các lệnh của Stata một cách nhanh chóng với đầy đủ các chức năng phụ của lệnh. Tuy nhiên phương pháp này có thể không thích hợp cho người mới sử dụng do nó đòi hỏi người dùng phải thuộc các câu lệnh và cú pháp của nó Con trỏ chuột với giao diện đồ họa (Graphic Interface) Có thể dùng chuột thực hiện các lệnh nhằm thao tác số liệu (menu Data), vẽ đồ thị (menu Graphics) và phân tích số liệu (menu Statistics). Phương pháp sử dụng chuột và menu là phương pháp dễ sử dụng nên sẽ được ưu tiên trình bày trong tài liệu này. 4. Lưu lại kết quả phân tích Kết quả của phân tích được thể hiện trên cửa sổ Stata Result và cửa sổ này có một thanh trượt dọc cho phép xem lại những kết quả phân tích cũ. Tuy nhiên để tránh gây nhầm lẫn cho người phân tích, cửa sổ này chỉ lưu lại những kết quả gần nhất. Do đó nếu chúng ta muốn lưu trữ lại toàn bộ kết quả phân tích chúng ta cần phải mở cửa sổ log bằng cách nhấp vào nút công cụ Stata Log nằm vị trí thứ tư từ trái ở trên thanh công cụ . Khi đó cửa sổ Open Stata Log mở ra, chúng ta có thể nhập tên của tập tin lưu trữ (log file) vào hộp văn bản File name. Giả sử chúng ta chọn tập tin này là "baitap.smcl" hãy gõ "baitap" vào hộp File Name rồi nhấp OK. Khi đó trên cửa số kết quả (Stata results) sẽ hiện ra thông báo để cho biết rằng biên bản kết quả phân tích sẽ được lưu tại tập tin "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl" . log using "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl" ------------------------------------------------------------------------------ log: D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl log type: smcl opened on: 10 Oct 2004, 12:01:34 Sau đó bạn có thể thực hiện các bước phân tích. Khi muốn xem lại biên bản (kết quả phân tích) hãy nhấp vào nút công cụ log một lần nữa để hiện ra cửa sổ Stata Log Options. Sau đó chọn vào nút chọn View snapshot of log file và nhấp vào nút lệnh OK để xem biên bản. Khi muốn chấm dứt việc ghi biên bản (kết quả phân tích) hãy nhấp vào nút công cụ log để hiện ra cửa sổ Stata Log Options. Sau đó chọn vào nút chọn Close log file và nhấp vào nút OK. Lời khuyên: Người sử dụng Stata có kinh nghiệm sau khi mở tập tin số liệu luôn luôn mở tập tin log trước khi tiến hành các phân tích thống kê để không bỏ mất các kết quả của quá trình phân tích. Mô tả số liệu với Stata 8.0 for Windows Chương này sẽ hướng dẫn bạn phương pháp mô tả số liệu với phần mềm Stata 8.0 sử dụng bộ số liệu ivf.dta có trong thư mục C:\DATA sau khi bạn cài đặt các tập tin số liệu mẫu. Thông thường trước khi mô tả số liệu chúng ta cần thực hiện bước chuẩn bị và việc thao tác số liệu (data processing). Công tác chuẩn bị bao gồm việc mở tập tin số liệu, mở tập tin log (Open log file), khảo sát số liệu có bao nhiêu bản ghi và có những biến số nào cũng như nghiên cứu đề cương nghiên cứu (chủ yếu là mục tiêu nghiên cứu) để giúp việc phân loại biến số. Việc thao tác số liệu là việc rà soát số liệu có bị sai sót hay nhầm lẫn gì hay không, tạo biến số mới theo yêu cầu của phân tích và tiến hành việc dán nhãn số liệu để giúp cho việc hiểu rõ hơn số liệu và đọc kết quả của phân tích thống kê. Trước tiên chúng ta hãy khởi động Stata theo cách đã hướng dẫn ở chương Khởi động Stata. Sau đó thực hiện các bài tập 1 đến 3 cho công tác chuẩn bị và các bài tập 4 đến 6 cho công tác thao tác số liệu. 1- Mở tập tin ivf_v.dta và mở tập tin log Khởi động cửa sổ Use New Data bằng cách 1 trong 2 cách: - Nhấn nút công cụ mở file (vị trí đầu tiên trên thanh công cụ). - Chọn menu File :: Open Sau khi cửa sổ Use New Data sẽ hiện ra. Nhấp vào mũi tên bên phải hộp Look in để chọn ổ đĩa thích hợp và dùng con chuột nhấp vào các thư mục để chọn thư mục có chứa số liệu (thông thường tập tin số liệu nằm ở thư mục C:\Data). Tìm tập tin số liệu ivf_v.dta, nhấp đúp vào tên tập tin này để mở tập tin (hoặc nhấp vào tập tin này để tên tập tin rơi vào hộp File Name rồi sau đó nhấp vào nút lệnh Open để mở tập tin). Để lưu trữ lại toàn bộ kết quả phân tích sẽ được thực hiện, cần nhớ nhấp vào nút công cụ Stata Log nằm vị trí thứ tư từ trái ở trên thanh công cụ để bắt đầu log kết quả (begin log). Máy tính sẽ hiện ra hộp thoại Begin Logging Stata Output để chúng ta chọn tên tập tin (File name) và thư mục lưu (Save In) của tập tin log. Thí dụ chúng ta muốn lưu tập tin log với tên là ivf_v.smcl vào thư mục c:\data; chúng ta nhập vào các thông tin như trên. 2. Khảo sát các biến số của tập tin và nghiên cứu mục tiêu nghiên cứu để phân loại biến số Hướng dẫn: Để xem liệt kê các biến số chúng ta có thể nhấn phím chức năng F3 hay sử dụng menu (nhấp vào menu Data :: Describe data :: Describe variable in memory) để xem các biến số của số liệu Chúng ta có thể xem danh sách các biến số liệt kê ở sau: . describe Contains data from C:\DATA\ivf_v.dta obs: 641 vars: 7 15 Aug 2006 15:27 size: 20,512 (99.8% of memory free) ------------------------------------------------------------------------------- storage display value variable name type format label variable label ------------------------------------------------------------------------------- maso float %9.0g ma so tuoime float %9.0g tuoi me (nam) tangha float %9.0g tang huyet ap thai ki - 1=tang ha, 0=khong tang ha tuoithai float %9.0g tuoi thai (tuan) gioi float %9.0g gioi tinh tre - 1=trai, 0=gai tlsosinh float %9.0g trong luong so sinh (gram) nghenghiep float %9.0g nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc ------------------------------------------------------------------------------- Sorted by: maso Giả sử từ đề cương nghiên cứu chúng ta biết đây là tập tin của số liệu 641 đứa trẻ được sinh từ bà mẹ thụ thai trong ống nghiệm (in-vitro fertilisation) với mục tiêu nghiên cứu là xem tuổi thai và tăng huyết áp trong thai kì có ảnh hưởng lên trọng lượng thai hay không. Cách lí giải số liệu được minh họa STT Tên biến Ý nghĩa của biến Phân loại biến số: (Độc lập hay Phụ thuộc) – (Định tính hay định lượng) 1 Maso Mã số 2 Tuoime Tuổi của mẹ (năm tuổi) 3 Tangha Tăng huyết áp thai kì 1= có 0= không 4 Tuoithai Tuổi thai (tính theo tuần) 5 Gioi Giới tính của trẻ 1=trai 0=gái 6 Tlsosinh Trọng lượng sinh tính theo grams 7 Nghenghiep Nghề nghiệp của mẹ 1=tự do 2=công nhân 3=viên chức 3. Làm thế nào để xem số liệu Hướng dẫn: Có thể xem số liệu bằng 2 cách: - Dùng nút lệnh Data Browser (vị trí 11 tính từ bên trái của thanh công cụ) - Dùng menu Data :: Data browser (read-only editor) Sử dụng Data Browser cho phép nhìn số liệu trong lưới (như các ô của chương trình Excel) nhưng nó không cho phép in số liệu. Muốn nhìn số liệu ra của sổ kết xuất (output) để sau đó in ra hãy sử dụng menu Data:: Describe Data :: List data. 4. Hãy thực hiện thống kê mô tả tất cả các biến số trong bộ số liệu này: Hướng dẫn: trước tiên chúng ta phải xác định biến số nào là biến số định lượng và biến số nào là biến số định tính. Sau đó thực hiện thống kê mô tả cho các biến số: đối với biến định lượng, thực hiện lệnh summarize để để có trung bình và độ lệch chuẩn, đối với biến định tính thực hiện lệnh tab1 để có bảng phân phối tần suất của các biến số. Trong bộ số liệu này có các biến tuoime, tuoithai, tlsosinh là biến định lượng. Để mô tả biến số này chúng ta sử dụng menu Statistics :: Summaries, tables, & tests :: Summary Statistics. Sau khi hộp thoại Summarize hiện ra, thực hiện các bước sau: Bước 1: Đặt con trỏ vào hộp văn bản Variables Bước 2: Di chuyển con trỏ vào cửa sổ Variables, và nhấp vào các biến cần mô tả thống kê (tuoime, tuoithai, tlsosinh) để tên các biến này xuất hiện trên hộp văn bản Variables Bước 3: Nhấp vào nút lệnh OK Kết quả được trình bày nhưu sau: . summarize tuoime tuoithai tlsosinh Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- tuoime | 641 33.97192 3.87046 23 43 tuoithai | 641 38.68725 2.329931 24.69 42.35 tlsosinh | 641 3129.137 652.7827 630 4650 Các biến số định tính bao gồm tang_ha (tăng huyết áp), gioi (giới tính của trẻ), nghenghiep (nghề nghiệp của mẹ). Để tóm tắt các biến số định tính này (tang_ha, gioi, nghenghiep) chúng ta sử dụng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables. Các bước thực hiện gồm: - Bước 1: đưa con trỏ vào hộp văn bản categorical variable(s) - Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào các biến tang_ha, gioi, nghenghiep để đưa các tên biến này vào hộp văn bản Categorical variables(s) - Bước 3: nhấp nút lệnh OK để hoàn tất . tab1 tang_ha gioi nghenghiep -> tabulation of tang_ha tang huyet | ap thai ki | - 1=tang | ha, 0=khong | tang ha | Freq. Percent Cum. ------------+----------------------------------- 0 | 552 86.12 86.12 1 | 89 13.88 100.00 ------------+----------------------------------- Total | 641 100.00 -> tabulation of gioi gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------- 0 | 315 49.14 49.14 1 | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00 -> tabulation of nghenghiep nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- 1 | 104 16.22 16.22 2 | 238 37.13 53.35 3 | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00 5. Các tóm tắt số liệu như trên là đạt yêu cầu. Tuy nhiên việc mã hoá các giá trị của biến số khiến cho việc đọc bảng bảng tần suất của biến số danh định (như gioi và nghenghiep) bị khó khăn (nhất là cho những người không trực tiếp làm thống kê hay phải đọc lại kết quả sau một khoảng thời gian dài). Do đó những người làm thống kê chuyên nghiệp luôn luôn thực hiện ghi chú (dán nhãn) cho các biến số định tính. Hãy thực hiện việc dán nhãn số liệu. Hướng dẫn: Việc dán nhãn cho các giá trị mã hóa là việc làm tốn công nhưng nó giúp phân biệt người làm thống kê chuyên nghiệp và người làm thống kê không chuyên nghiệp. Mặc dù tốn công nhưng lợi ích do nó đem lại vượt qua công sức bỏ ra vì vậy chúng ta cần phải thực hiện việc dán nhãn này. Việc dán nhãn giá trị biến số được thực hiện qua 2 bước: tạo nhãn (define label value) và dán nhãn cho giá trị (Assign value label to variable). - Tạo nhãn sex, tang_ha, nhãn nghenghiep Để tạo nhãn sử dụng menu Data :: Labels & Notes :: Define value label. Cửa sổ Define value label sẽ được hiện ra. Giả sử chúng ta muốn tạo nhãn sex theo quy tắc 1 =nam và 2=nữ, các bước cụ thể như sau: -Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable - Bước 2: gõ sex vào hộp văn bản Label name - Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra - Bước 4: Nhập 1 vào hộp văn bản value - Bước 5: nhập nam vào hộp văn bản Text - Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất - Bước 7: Nhấp vào nhãn sex trong hộp văn bản Defien label names - Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 9: Nhập 0 vào hộp văn bản value - Bước 10: nhập nữ vào hộp văn bản Text - Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất Sau đó có thể nhấp vào nút lệnh Close (của hộp thoại Define value labels) để thoát ra hay nhấp vào nút lệnh Define (của hộp thoại Define value labels) để tiếp tục tạo nhãn tang_ha. Các bước cụ thể để tạo nhãn tang_ha gồm: -Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable - Bước 2: gõ tang_ha vào hộp văn bản Label name - Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra Cần lưu ý: tên nhãn có thể khác với tên biến (thí du như trường hợp trên ta đặt tên nhãn là sex trong khi tên biến là giới) hoặc tên nhãn có thể trùng với tên biến (thí dụ ta có thể đặt tên nhãn là tang_ha cho biến tăng ha). - Bước 4: Nhập 1 vào hộp văn bản value - Bước 5: nhập huyet ap tang vào hộp văn bản Text - Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất - Bước 7: Nhấp vào nhãn tang_ha trong hộp văn bản Define label names - Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 9: Nhập 0 vào hộp văn bản value - Bước 10: nhập huyet ap bt vào hộp văn bản Text - Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất Để tiếp tục tạo nhãn nghenghiep ta nhấp vào nút lệnh Define (của hộp thoại Define value labels). -Bước 1: nhấp vào nút lệnh Define để hiện ra hộp nhập liệu Define new lable - Bước 2: gõ nghenghiep vào hộp văn bản Label name - Bước 3: nhấp vào nút lệnh OK khi đó hộp nhập liệu Add value sẽ hiện ra - Bước 4: Nhập 1 vào hộp văn bản value - Bước 5: nhập tu do vào hộp văn bản Text - Bước 6: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất - Bước 7: Nhấp vào nhãn nghenghiep trong hộp văn bản Define label names - Bước 8: Nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 9: Nhập 2 vào hộp văn bản value - Bước 10: nhập cong nhan vào hộp văn bản Text - Bước 11: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất - Bước 12: Ở hộp Define label names vẫn tiếp tục chọn nhãn nghenghiep, nhấp vào nút lệnh Add để hộp nhập liệu Add value sẽ hiện ra - Bước 13: Nhập 3 vào hộp văn bản value - Bước 14: nhập vien chuc vào hộp văn bản Text - Bước 15: Nhấp vào nút lệnh OK của hộp nhập liệu Add Value. Khi đó hộp nhập liệu Add Value biến mất. Ta có kết quả như sau: - Bước 16: Để hoàn tất việc tạo nhãn ta nhấn vào nút lệnh Close Dán nhãn giá trị (Assign value label) cho các biến gioi, tang_ha, và nghenghiep Sau khi dã tạo được nhãn, chúng ta hãy dán nhãn giá trị cho biến số bằng cách dùng menu Data :: Labels & Notes :: Assign value label to variable Khi hộp thoại labels value – Attach value label hiện ra để dán nhãn cho mỗi biến số cần thực hiện 4 bước sau: - Bước 1: Đặt con trỏ vào hộp văn bản Variable - Bước 2: Đưa con trỏ vào cửa sổ Variable và nhấp vào biến gioi để tên biến này xuất hiện trên hộp văn bản Variable. - Bước 3: Đưa con trỏ vào nhãn sex trong hộp văn bản Attach value label để dán nhãn sex vào tên biến sex - Bước 4: Nhấp vào nút lệnh Submit để thực hiện việc dán nhãn. Để tiếp tục thực hiện tương tự để dán nhãn tang_ha cho biến tang_ha, hãy tiến hành các bước sau: - Bước 5: Đặt con trỏ vào hộp văn bản Variable - Bước 6: Đưa con trỏ vào cửa sổ Variable và nhấp vào biến gioi để tên biến này xuất hiện trên hộp văn bản Variable. - Bước 7: Đưa con trỏ vào nhãn sex trong hộp văn bản Attach value label để dán nhãn sex vào tên biến sex - Bước 8: Nhấp vào nút lệnh Submit để thực hiện việc dán nhãn. Để tiếp tục thực hiện tương tự để dán nhãn nghenghiep cho biến nghenghiep, hãy tiến hành các bước sau: - Bước 9: Đặt con trỏ vào hộp văn bản Variable - Bước 10: Đưa con trỏ vào cửa sổ Variable và nhấp vào biến gioi để tên biến này xuất hiện trên hộp văn bản Variable. - Bước 11: Đưa con trỏ vào nhãn sex trong hộp văn bản Attach value label để dán nhãn sex vào tên biến sex - Bước 12: Nhấp vào nút lệnh OK để thực hiện việc dán nhãn. Cần lưu ý, trong những lần dán nhãn trước chúng ta nhấp vào nút lệnh submit để hoàn thành việc dán nhãn nhưng không đóng cửa sổ label values. Sau khi dán nhãn nghenghiep cho biến nghenghiep, chúng ta không cần dán nhãn tiếp tục nên chúng ta nhấp vào nút lệnh OK để đóng cửa sổ label values sau khi hoàn thành việc dán nhãn. 6. Lập bảng phân phối tần suất cho các biến số định tính sau khi đã dán nhãn cho các biến này. Hướng dẫn: Các biến số định tính đã được dán nhãn bao gồm tang_ha sex matagegp gestcat. Để tóm tắt các biến số định tính này (tang_ha sex matagegp gestcat) chúng ta sử dụng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables. Khi hộp thoại tab1 – One-way tables hiện ra, chúng ta tiến hành 3 bước (1) đặt con trỏ vào hộp Categorical value (2) Nhấp vào cửa sổ variable để chọn các biến số tiến hành phân tích và (3) Nhấp vào nút lệnh OK. Kết quả sẽ xuất hiện như sau: . tab1 gioi tang_ha nghenghiep -> tabulation of gioi gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------- gai | 315 49.14 49.14 trai | 326 50.86 100.00 ------------+----------------------------------- Total | 641 100.00 -> tabulation of tang_ha tang huyet ap | thai ki - | 1=tang ha, | 0=khong tang | ha | Freq. Percent Cum. --------------+----------------------------------- huyet ap bt | 552 86.12 86.12 huyet ap tang | 89 13.88 100.00 --------------+----------------------------------- Total | 641 100.00 -> tabulation of nghenghiep nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------- tu do | 104 16.22 16.22 cong nhan | 238 37.13 53.35 vien chuc | 299 46.65 100.00 ------------+----------------------------------- Total | 641 100.00 7. Vẽ tổ chức đồ (histogram) của biến trọng lượng sơ sinh (tlsosinh) Hướng dẫn: Để vẽ tổ chức đồ, ta phải sử dụng menu Graphics :: Histogram Khi hộp thoại histogram hiện ra, chúng ta thực hiện các bước sau: Bước 1: đặt con trỏ vào hộp văn bản Variable Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Variable. Bước 3 – Bước 4: nhằm để xác định tổ chức đồ sẽ bắt đầu từ giá trị 600 (Lower limit of first bin) và mỗi khoảng tiếp theo (bin) có độ rộng là 300 (Width of bins) Bước 5: Cho biết tổ chức đồ sẽ ghi nhận tỉ lệ của các khoảng giá trị bằng cách nhấp vào nút chọn Fraction. Nếu muốn thể hiện mật độ của phân phối, nhấp vào nút chọn Density, nếu muốn thể hiện tần suất thì nhấp vào nút chọn Frequency. Mối liên hệ giữa các hàm phân phối này như sau: Tỉ lệ (Fraction) = Tần suất (Frequency) / Cỡ mẫu (N) Mật độ (Density) = Tỉ lệ (Fraction) / Độ rộng của khoảng chia (Width of bins) Kết quả tiếp theo sẽ được trình bày trong hình sau. 8. Đồ thị này cho chúng ta thấy hình dạng của phân phối số liệu, tuy nhiên chúng ta cũng có thể thay đổi thưc hiện việc chia khoảng cho trục hoành, ghi chú cho trục hoành, chia khoảng cho trục tung và ghi chú cho trục tung. Giả sử chúng ta muốn thực hiện các yêu cầu chia khoảng và ghi chú như sau: Trục hoành phải có khoảng giá trị từ 600 đến 4800 (biên độ là 4200). Chúng ta muốn chia làm mỗi khoảng có độ lớn là 300 như vậy cần thiết phải có 14 khoảng. Chúng ta cũng muốn ghi giá trị từ 600 đến 4200 và mỗi nhãn giá trị cách nhau 600 gram. Trục hoành được ghi chú là "trong luong so sinh (gram) cua 641 tre" Trục tung có khoảng giá trị là 0 đến 0.3, ghi nhãn cho các giá trị và các nhãn này cách nhau 0.1 Trục tung được ghi chú là "tỉ lệ" (chứ không phải là fraction). Các bước để thực hiện chia khoảng và ghi chú cho trục hoàng (trục X) như sau: Bước 1: Nhấp vào Tab X-axis Bước 2: Để nhập ghi chú cho trục hoành, Ở hộp văn bản Title, nhập vào ghi chú là "trong luong so sinh (gram) cua 641 tre" Bước 3: Để chia khoảng cho trục hoành, ở hộp văn bản Rule, nhập vào 600(600)4800. Nguyên tắc của quy tắc này là: Số đầu thang đo (Độ rộng khoảng chia) Số cuối thang đo. Các bước để thực hiện chia khoảng và ghi chú cho trục hoàng (trục Y) như sau: Bước 4: Nhấp vào Tab Y-axis Bước 5: Để nhập ghi chú cho trục tung, Ở hộp văn bản Title, nhập vào ghi chú là "Ti le" Bước 6: Để chia khoảng cho trục hoành, ở hộp văn bản Rule, nhập vào 0(0.1)0.3. Nguyên tắc của quy tắc này là: Số đầu thang đo (Độ rộng khoảng chia) Số cuối thang đo. Bước 7: Nhấp vào nút lệnh OK ở cuối cửa sổ để hoàn tất 9. Chúng ta cũng có thể vẽ đồ thị xuất (p-p plot) để xem biến số tlsosinh có tuân theo phân phối bình thường Hướng dẫn: Sử dụng menu Graph – Distributional graph - normal quantile plot Khi cửa sổ qnorm hiện ra, chúng ta tiến hành các bước sau: Bước 1: đặt con trỏ vào hộp văn bản Variable Bước 2: đưa con trỏ vào cửa sổ Variables và nhấp vào biến tlsosinh để đưa biến này vào hộp văn bản Variable. Bước 3: Đánh dấu vào hộp kiểm: Show grid at percentiles: Bước 4: Nhấp vào nút lệnh OK Kết quả như sau: Nếu phân phối bình thường thì đường cong phân phối (đường nét đậm) sẽ trùng với đường chéo của hình chữ nhật (đường thẳng mảnh). Nếu phân phối lệch âm thì ở xác suất 0,5 đường cong phân phối nằm ở bên trái đường chéo. Nếu phân phối lệch dương thì ở xác suất 0,5 đường cong phân phối sẽ nằm ở bên phải đường chéo. Nếu độ dốc của đường cong phân phối lớn hơn một (1) có nghĩa là phân phối thực nghiệm tăng chậm hơn phân phối bình thường, nếu đường cong phân phối nhỏ hơn một (1) có nghĩa là đường cong thực nghiệm tăng nhanh hơn phân phối bình thường. Như vậy, phân phối của trọng sơ sinh bị lệch trái và ở khoảng trọng lượng thấp, phân phối trọng lượng sơ sinh tăng chậm hơn phân phối chuẩn. Ở khoảng trọng lượng cao trọng lương sơ sinh tăng hơi nhanh hơn phân phối chuẩn.

Các file đính kèm theo tài liệu này:

  • docphuongphapnghiencuukhoahoc19_su_dung_stata_part_1_8032.doc