TRƯNG ÐI HC Y DƯC TP H CHÍ MINH KHOA Y T CÔNG CNG B môn Thng kê Y Hc và Tin Hc
STATA NG DNG TRONG NGHIÊN CU KHOA HC Biên son: TS. Ð Văn Dũng
THÀNH PH H CHÍ MINH 4-2008 (Lưu hành ni b)
MC LC Ði cương cương v thng kê và thng kê mô t ................................................. ...................................................................................... ..................................... 1 Mt s ñnh nghĩa ...................................................... ............................................................................................................. ................................................................. .......... 1 Bin s và các loi bin s s .................................................. .......................................................................................................... ........................................................ 1 Phương pháp mô t tóm tt và trình bày s liu ...................................................... ......................................................................... ................... 1 Các s thng kê mô t................................................ t ....................................................................................................... ................................................................. .......... 2 Phương pháp trình bày s liu ..................................................... .................................................................................................... ............................................... 5 Ði cương cương v phân tích s liu..................................................................................... ................. 13 Suy lun thng kê............................................. kê..................................................................................................... ......................................................................... ................. 14 Cài ñt chương trình Stata 10.0, s liu liu mu và các chương trình có liên quan.......................... quan................. ......... 29 Khi ñng và kt thúc Stata.................................................... Stata .......................................................................................................... ...................................................... 36 Khi ñng Stata ................................................... ........................................................................................................... ......................................................................... ................. 40 1. Khi ñng Stata ..................................................... ............................................................................................................ ............................................................... ........ 40 2. Mô t giao giao din ca chương trình Stata...................................................... Stata ................................................................................ .......................... 40 3. Cách cách ñ thc hin lnh trong chương trình Stata ................................................. ......................................................... ........ 41 4. Lưu li kt qu phân tích ........................................................ ..................................................................................................... ............................................. 42 Mt vài phân tích ñơn gin vi Stata.................................................................. Stata........ .................................................................................... .......................... 44 Mô t s liu liu vi Stata 10.0 for Windows ................................................ .................................................................................... .................................... 58 Thng kê phân tích bin s ñnh lưng vi Stata ........................................................ ......................................................................... ................. 96 Thc hành ........................................................ ................................................................................................................ ......................................................................... ................. 98
MC LC Ði cương cương v thng kê và thng kê mô t ................................................. ...................................................................................... ..................................... 1 Mt s ñnh nghĩa ...................................................... ............................................................................................................. ................................................................. .......... 1 Bin s và các loi bin s s .................................................. .......................................................................................................... ........................................................ 1 Phương pháp mô t tóm tt và trình bày s liu ...................................................... ......................................................................... ................... 1 Các s thng kê mô t................................................ t ....................................................................................................... ................................................................. .......... 2 Phương pháp trình bày s liu ..................................................... .................................................................................................... ............................................... 5 Ði cương cương v phân tích s liu..................................................................................... ................. 13 Suy lun thng kê............................................. kê..................................................................................................... ......................................................................... ................. 14 Cài ñt chương trình Stata 10.0, s liu liu mu và các chương trình có liên quan.......................... quan................. ......... 29 Khi ñng và kt thúc Stata.................................................... Stata .......................................................................................................... ...................................................... 36 Khi ñng Stata ................................................... ........................................................................................................... ......................................................................... ................. 40 1. Khi ñng Stata ..................................................... ............................................................................................................ ............................................................... ........ 40 2. Mô t giao giao din ca chương trình Stata...................................................... Stata ................................................................................ .......................... 40 3. Cách cách ñ thc hin lnh trong chương trình Stata ................................................. ......................................................... ........ 41 4. Lưu li kt qu phân tích ........................................................ ..................................................................................................... ............................................. 42 Mt vài phân tích ñơn gin vi Stata.................................................................. Stata........ .................................................................................... .......................... 44 Mô t s liu liu vi Stata 10.0 for Windows ................................................ .................................................................................... .................................... 58 Thng kê phân tích bin s ñnh lưng vi Stata ........................................................ ......................................................................... ................. 96 Thc hành ........................................................ ................................................................................................................ ......................................................................... ................. 98
Ði cương v thng kê và thng kê mô t Mt s ñnh nghĩa Thng kê là phương pháp khoa hc dùng ñ thu thp, tóm tt, trình bày và phân tích s liu. S liu: Kt qu có ñưc do vic quan sát hay thu thp mt bin s các ñi tưng khác nhau hay thi gian khác nhau. Thí d: Khi tôi quan sát gii tính ca các hc viên viên trong lp, tôi có s liu là: Nam, nam, n, n, n, nam, n, v.v Thí d: Mt nhà nghiên cu ño nng ñ hemoglobin ca 70 thai ph có kt qu như sau: 10.2 13.3 10.6 12.1 9.3 12.0 13.4 11.9 11.2 14.6
13.7 12.9 10.5 12.9 13.5 12.9 12.1 11.4 15.1 11.1
10.4 12.1 1 2.1 13.7 11.4 14.6 11.1 1 1.1 10.9 12.5 1 2.5 10.7 13.5
14.9 9.4 11.8 12.7 11.2 8.8 11.3 13.0 1 3.0 12.9 10.9
11.5 13.2 14.1 10.6 11.7 10.2 14.7 11.6 13.4 13.1
12.0 10.8 10.3 11.4 10.9 11.6 10.8 13.1 12.3 11.8
11.0 11.7 13.6 11.9 10.4 12.5 13.3 9.7 11.0 12.2
và nhng con s này ñưc gi là s liu.
Cn lưu ý s liu phi liên kt vi mt bin s nht ñnh. Nu tôi quan sát gii tính ngưi này, tui ca ngưi khác, qun áo ca mt ngưi khác na thì kt qu quan sát ñưc không phi là s liu.
Bin s và các loi bin s Bin s là nhng ñi lưng hay nhng ñc tính có th thay ñi t ngưi này sang ngưi khác hay t thi ñim này sang thi ñim khác. Như vy bin s có th th hin ñi lưng hay ñc tính. - Nu bin s th hin mt ñi lưng nó ñưc gi là bin s ñnh lưng lưng (quantitative variable). Bin s ñnh lưng có th còn ñưc chia thành bin s t s - ratio variable(có giá tr không tuyt ñi) và bin s khong – interval variable (không có giá tr không tuyt ñ) - Nu bin s nhm th hin mt ñc tính, bin s ñưc gi là bin s ñnh tính. Bin s ñnh tính còn ñưc chia làm 3 loi: - Bin s nh giá – binary variable (khi ch có 2 giá tr) - Bin s danh ñnh – nominal variable (khi có 3 hay nhiu hơn các giá tr và các bn thân các giá tr không có tính cht th t) - Bin s th t - ordinal variable (khi có 3 hay nhiu hơn các giá tr và các bn thân các giá tr có tính cht th t - Ngoài ra có khi bin c không ch ñưc quan tâm v phương din nó có xy ra hay chưa xy ra mà còn ñưc quan tâm v phương din bin c xy ra vào lúc nào. Thí d sau khi ñiu tr bnh nhân ung thư chúng ta không ch quan tâm bnh nhân có t vong hay không mà còn quan tâm bnh nhân bnh nhân t vong bao nhiêu lâu sau khi ñiu tr và nu bnh nhân chưa t vong, bnh nhân ñã sng ñưc bao lâu.
Phương pháp mô t tóm tt và trình bày s liu 1
-T l cho tng giá tr nu
là bin th t hay danh ñnh - T l cho giá tr tiêu biu
nu là bin nh giá
Các s thng kê mô t Có hai loi thng kê mô t: thng kê mô t khuynh hưng tp trung và thng kê mô t tính phân tán.
Thng kê mô t khuynh hưng tp trung Thng kê mô t khuynh hưng tp trung có th là trung bình (mean), trung v (median) và yu v (mode). Nhng thng kê này cho bit giá tr tiêu biu cho s liu. Thí d: có hai loi thuc h áp A và B. Gi s có 5 ñi tưng sau khi s dng thuc h áp A s có huyt áp 110 - 115 -120 - 125 -130 và 5 ñi tưng khác sau khi s dng thuc h áp B s có huyt áp 120 - 125 130 - 135 - 140. Con s tiêu biu nht ñ cho bit tác dng ca thuc A là huyt áp trung bình sau khi s dng thuc A và là 120. Con s huyt áp trung bình này thp hơn huyt áp trung bình sau khi s dng thuc B cho bit thuc A có tác dng mnh hơn.
Trung bình ca s liu, ñưc kí hiu là (x (ñc là x gch) là tng các giá tr ca s liu chia cho s ln quan sát (N). Σ xi x = N Thí d: S liu v huyt áp tâm thu ca 5 ñi tưng là 120, 125, 130, 135, 150. Huyt áp tâm thu trung bình s là 132 x
=
Σ xi N
=
120 + 125 + 130 + 125 + 150 = 132 5
2
Do không th thc hin các phép toán s hc trên các bin s ñnh tính (danh ñnh và th t) chúng ta ch có th tính trung bình cho s liu ca bin s ñnh lưng. Nu chúng ta sp xp s liu theo th t, giá tr ñng gia ñưc gi là trung v. Nu có hai giá tr cùng ñng gia, trung bình cng ca hai giá tr này là trung v. Thí d: S liu v huyt áp tâm thu (mmHg) ca 5 ñi tưng là 120, 125, 130, 135, 150. Trung v ca huyt áp tâm thu là giá tr ñng gia và bng 130 S liu v chiu cao (cm) ca 6 ngưi là 153, 155, 160, 162, 165, 161. Ð tính trung v, trưc tiên chúng ta phi sp xp s liu này: 153, 155, 160, 161, 162, 165. Do có hai giá tr 160 và 161 cùng gia, trung v s là (160+161)/2 = 160,5 cm
Do bn cht ca bin s danh ñnh không th sp ñưc theo th t, chúng ta ch có th tính trung v ca s liu ñnh lưng và s liu ca bin s th t. Ngoài ra yu v (mode) cũng ñưc s dng làm con s thng kê tiêu biu. Yu v là giá tr xut hin ph bin nht (có tn sut cao nht). Thí d: S liu v huyt áp tâm thu (mmHg) ca 5 ñi tưng là 120, 125, 130, 135, 150. Trong trưng hp này không có yu v. Ðim s ca 5 hc sinh là 5, 5, 6, 7, 9. Yu v ca ñim s là 5. Trong mt p có 361 gia ñình ngưi Kinh, 120 gia ñình ngưi Khmer và 27 gia ñình ngưi Hoa. Yu v ca biên s dân tc là dân tc Kinh.
Trong mt s liu c th, có th không có yu v, có th có mt yu v hoc hai hay nhiu yu v. Ðây là khuyt ñim chính ca s thng kê này. Do vy ngưi ta thưng ch dùng yu v cho bin s danh ñnh hay trong các trưng hp ñc bit Có th s dng trung bình, trung v hay yu v cho bin s ñnh lưng. Khi bin s ñnh lưng có phân phi bình thưng (hình chuông) thì ba con s này xp x bng nhau và khi ñó ngưi ta thưng tính trung bình bi vì trung bình có nhng ñc tính toán hc mnh. Tuy nhiên nu s liu b lch thì con s trung v phn ánh giá tr tiêu biu mt cách chính xác hơn. Thí d: Bnh nhân b loét d dày - tá tràng ñưc ñiu tr theo mt phác ñ dit vi khun Helicobacter. Sau ñiu tr, bnh nhân ñưc theo dõi và ghi nhn thi gian k t khi s dng thuc ñn lúc bt ñu ci thin triu chng ñau. 10 bnh nhân thi gian này (ngày ) là như sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. Bnh nhân có thi gian t lúc ñiu tr ñn lúc gim triu chng là 30 ngày trên thc cht là bnh nhân không ñáp ng vi ñiu tr. Trung v và trung bình ca s liu là 2 và 5 ngày. Con s trung v phn ánh chân thc hơn bi vì vi tư cách là mt bác sĩ lâm sàng t s liu trên có th nhn xét rng mt bnh nhân tiêu biu s gim ñau sau 2 ngày dùng thuc. Con sôs 30 trong thí d trên ñưc gi là s ngoi lai (outlier) và làm s liu b lch. Nhìn chung, khi s liu b lch thì con s trung bình s b nh hưng rt nhiu và không phn ánh giá tr tiêu biu như con s trung v.
Thng kê mô t tính phân tán: Có 3 thng kê mô t tính phân tán: ñ lch chun, khong t phân v và phm vi ca s liu. Vic la chn thng kê mô t tính phân tán ñưc trình bày trong bng 2. Thng kê mô t tính phân tán có tm quan trng th hai sau con s mô t khuynh hưng tp trung. Thí d: Thuc h áp A ñưc s dng trên 5 bnh nhân và huyt áp tâm thu sau khi dùng thuc là 110, 115, 120, 125 và 130. Thuc h áp B ñưc s dng trên 5 bnh nhân và có huyt áp sau s dng thuc là 100, 110, 120, 130, 140. Như vy hai thuc h áp này có hiu qu h áp là tương ñương (bi vì trung bình ca hai s liu là bng nhau) nhưng kt qu ca thuc B phân tán hơn và ñiu này làm thuc B tr nên kém an toàn.
Ð lch chun (standard deviation - vit tt là SD hay s) là con s ñánh giá mc ñ phân tán và
3
ñưc tính theo công thc:
( xi − x ) 2 s = ∑ i =1 N − 1 n
Như vy ñ lch chun phn ánh khong cách trung bình ca s liu so vi giá tr tiêu biu. Khái nim ñ lch chun ch có th áp dng cho bin s ñnh lưng bi vì chúng ta có th thc hin các phép toán s hc trên các ñi lưng nhưng không th thc hin trên các giá tr ca bin s ñnh tính là các ñc tính. Thí d: S liu v huyt áp tâm thu (mmHg) ca 5 ñi tưng là 120, 125, 130, 135, 150. Trung bình ca huyt áp là 132 và ñ lch chun bng
( xi − x ) 2 s = ∑ N − 1 i =1 n
(120 − 132) 2 + (125 − 132) 2 + (132 − 130) 2 + (135 − 132) 2 + (150 − 132) 2 = 5 −1 144 + 49 + 4 + 9 + 324 530 = = = 132,5 = 11,5 4 4 Phương sai v mt t nguyên là bình phương ca ñ lch chun. Phương sai (variance) có th ñưc kí hiu và Var hay s2 và ñưc tính theo công thc sau: n ( xi − x ) 2 2 s = ∑ N − 1 i =1 Phm vi ca s liu là tt c các giá tr ca s liu t giá tr nh nht ñn giá tr ln nht. Thí d: S liu v huyt áp tâm thu (mmHg) ca 5 ñi tưng là 120, 125, 130, 135, 150. Phm vi ca bin s huyt áp là 120 ñn 150. Thí d: Thuc h áp A ñưc s dng trên 5 bnh nhân và huyt áp tâm thu sau khi dùng thuc là 110, 115, 120, 125 và 130. Thuc h áp B ñưc s dng trên 5 bnh nhân và có huyt áp sau s dng thuc là 100, 110, 120, 130, 140. S liu ca thuc B có tính phân tán cao hơn do phm vi thay ñi t 100-140 trong khi ñó phm v ca s liu thuc A ch t 110-130.
Khong t phân v (inter-quartile): Nu chúng ta chia s liu sp theo th t làm 2 phn ñu nhau, khong t phân v là khong cách ca trung v phn trên và trung v phn dưi. Thí d: S liu v huyt áp tâm thu (mmHg) ca 5 ñi tưng là 120, 125, 130, 135, 150. S liu này ñưc chia làm 2 phn: phn 1 gm 120, 125, 130 và phn 2 gm 130, 135, và 150. Trung v ca phn trên là 125 - trung v ca phn dưi là 135, do ñó phm t phân v là 125-135.
Do bn cht ca khong t phân v là trung v ca phn s liu trên và phn s liu dưi, cũng ging như trung v, khong t phân v không b nh hưng bi các giá tr ngoi lai như trong trưng hp ca ñ lch chun. Cũng như trung v, khong t phân v ch có th áp dng cho bin s ñnh lưng hay th t. Câu hi: Phân tích trên máy tính v bin s hemoglobin cho kt qu sau. Hãy th ñc và lí gii kt qu: Variable
|
Obs
Mean
Std. Dev.
Min
Max
-----------+----------------------------------------------------hemoglobin | 70 11.98429 1.416122 8.8 15.1
4
Phương pháp trình bày s liu S liu có th ñưc trình bày thành bng hoc các ñ th.
Trình bày bng:
Phân phi tn sut ca bin s ñnh tính S liu ca bin s ri rc có th ñưc trình bày dưi dng mt phân phi tn sut. Phân phi tn sut là mt bng ch ra tn sut xut hin ca tng giá tr ri rc ca bin s (Bng 1). Như vy bng phân phi tn sut gm 2 ct, mt ct lit kê các giá tr ca bin s và mt ct trình bày tn sut tương ng ca các giá tr ñó. Table 1. Phân phi gii tính ca 69 hc sinh lp cơm thưng trưng mm non 23 tháng 11, Huyn Hóc môn
Gii
S tr
Phn trăm
Nam
45
65%
N
24
35%
Tng s
69
100%
Bng trên là bn phân phi tn sut ca gii tính. Bi vì gii tính có 2 giá tr nam và n nên ta lit kê 2 giá tr này mt ct. ct th nhì ta ghi tn sut tương ng ca các giá tr này. Ðôi khi bng phân phi tn sut có thêm ct phn trăm như trong thí d trên. Bng 2 là mt thí d khác v bng phân phi tn sut. Table 2. Phương pháp ñ ñ ca 600 tr trong bnh vin
Phương pháp ñ S sinh ñ Sinh thưng Sinh forceps Sinh m Tng s
478 65 57 600
Phn trăm 79,7 10,8 9,5 100,0
Phân phi tn sut ca bin s ñnh lưng Nu bin s là bin s liên tc chúng ta không th lit kê tt c các giá tr ca bin s. Trong trưng hp này chúng ta có th nhóm (làm tròn) giá tr ca bin s li. C th các bưc xây dng bng phân phi tn sut cho bin s ñnh lưng như sau: 1- Tìm phm vi (giá tr cc tiu và giá tr cc ñi) ca s liu. Trong thí d v hemoglobin ca 70 ph n phm vi là 8,8 ñn 15,1 2. Chia phm vi s liu ra làm n khong vi ñ rng ca mi khong là d. Cn lưu ý ñ rng mi khong d nên là ñi lưng chn như 1, 2, 5, 10 hay 0,5, 0,2 và s các khong n nên t 5-12 (trung
5
bình là 7-8). Trong thí d trên ta có th chia phm vi ra làm 8khong vi chiu rng khong bng 1 ñơn v. Khi ñó các khong là: 8-8,9; 9-9,9; 10-10,9; 11-11,9; 12-12,9; 13-13,9; 14-14,9; 1515,9. 3. Ðm các giá tr thích hp vào khong ñã ñnh trưc Hemoglobin (g/100ml)
Ðm
8-8,9
1
9-9,9
111
10-10,9
1111 1111 1111
11-11,9
1111 1111 1111 1111
12-12,9
1111 1111 1111
13-13,9
1111 1111 111
14-14,9
1111
15-15,9
1
4. Xây dng bng phân phi tn sut vi bin s và các khong giá tr ca bin s và tn sut tương ng vi các khong giá tr ñó. Chúng ta cũng có th thêm vào ct phn trăm và ct phn trăm tích lũy (nu thích hp) Table 3. Hemoglobin ca 70 ph n
Hemoglobin
Tn sut
Phn trăm
Phn trăm tích lũy
8-8,9
1
1.43
1.43
9-9,9
3
4.29
5.71
10-10,9
14
20.00
25.71
11-11,9
19
27.14
52.86
12-12,9
14
20.00
72.86
13-13,9
13
18.57
91.43
14-14,9
5
7.14
98.57
15-15,9
1
1.43
100.00
Thí d như nu biên s là chu vi vòng cánh tay ca tr chúng ta có th làm tròn chu vi vòng cánh tay ñn 1 cm. Khi ñó ta có th xem thang ño ca bin s là ri rc và trình bày bng phân phi tn sut ca bin s (bng 2). Table 4. Phân phi s ño vòng cánh tay ca 69 tr lp cơm thưng nhà tr 23 tháng 11, Hóc môn.
Vòng cánh tay
Tn sut
Phn trăm
Phn trăm tích lũy
6
13- <14
2
2.78
2.78
14- <15
31
43.06
45.83
15- <16
27
37.50
83.33
16- <17
9
12.50
95.83
17- <18
0
12.50
95.83
18- <19
2
2.78
98.61
19- <20
1
1.39
100.00
Biu ñ và ñ th S liu cũng có th ñưc trình bày dưi dng ñ th hoc biu ñ. Mc dù không có ranh gii tuyt ñi hoàn toàn rõ rt, nói chung ñ th (graph) có tính cht toán hc nhiu hơn, trong ñó có trc hoành và trc tung còn biu ñ (chart) là hình nh mang tính cht tưng trưng. Nu bin s là bin ri rc, có th trình bày dưi dng biu ñ hình thanh (bar chart - hình 1) hoc biu ñ hình bánh (pie chart). Nu bin s là bin liên tc, thì phân phi ca bin s có th trình bày dưi dng t chc ñ (histogram - hình 2) hoc ña giác tn sut.
Hình thc ca bng -Có ta ngn gn và rõ ràng -Ðt tên cho các hàng và ct -Trình bày tng s ca hàng và ct -Ðnh nghĩa các kí hiu và ch vit tt dưi bng -Ghi ngun s liu dưi bng
Biu ñ hình thanh Biu ñ hình thang là biu ñ nhm mô t s phân b ca bin s ri rc. Biu ñ hình thanh gm có trc hoành trên ñó xác ñnh nhng giá tr ca bin s. ng vi tng giá tr ca bin s ngưi ta v các thanh có chiu cao t l vi tn sut ca giá tr ñó. Cn lưu ý luôn luôn có khong trng gia các thanh.
7
50 40
45
30 20
24
10 0 Nam
Nöõ
Hình 1. Biu ñ hình thanh (bar chart) mô t phân b gii tính ca nhng hc sinh trong trưng mm non 23/11, Hóc môn
Chúng ta cũng có th xây dng các thanh theo chiu ngang như trong ví d sau Sinh moå
57
Sinh forceps
65
Sinh thöôøng
478 0
100
200
300
400
500
Hình 2. Phương pháp sinh ca 600 tr sanh ti bnh vin X trong năm 1998
Ði vi bin s th t, ñiu cn lưu ý là các giá tr ca bin s phi ñưc sp xp th t theo trc hoành.
8
2000
t á a u s n à a T
1000
0 muø chöõ
caá p 1
caá p 2-3
ñaï i hoï
edumat
Hình 3. Trình ñ hc vn ca các bà m trong nghiên cu
25% 20% 15%
19,5% Ñöôøng aâm ñaïo Moå laáy thai
10% 5%
4,3%
3,9% 0,8%
0% Duøng ZDV†
Khoâng duøng ZDV
Hình 4. T sut lây truyn t m sang con nhng ngưi m b nhim HIV theo ñiu tr hóa d phòng và phương pháp sinh (Ngun: The European Mode of Delivery Collaboration, Lancet, 27/3/1999)
Biu ñ hình bánh Biu ñ hình bánh cũng ñưc dùng ñ mô t s phân b ca bin s ri rc. Biu ñô hình bánh là mt vòng tròn ñưc chia làm nhiu cung tương ng vi các giá tr ca bin s. Ð ln ca cung t l vi tn sut ca giá tr bin s.
9
Nöõ 35% Nam 65%
Hình 5. Biu ñ hình bánh (pie chart) mô t phân b gii tính ca nhng hc sinh trong trưng mm non 23/11, Hóc môn
Sinh moå Sinh forceps
Sinh thöôøng
Hình 6. Biu ñ hình bánh th hin phương pháp sinh ca 600 ña tr sinh ti bnh vin X
T chc ñ và ña giác tn sut T chc ñ (histogram) và ña giác tn sut (polyline) ñưc dùng trong mô t phân b ca bin s liên tc. Ð v t chc ñ, ngưi ta chia biên ñ ca giá tr làm nhiu khong giá tr và tính tn sut ca nhng khong giá tr ñó. Nhng khong giá tr này ñưc biu th trên trc hoành. ng vi mi khong giá tr ngưi ta v nhng hình ch nht có din tích t l vi tn sut ca khong giá tr ñó. Bi vì các khong giá tr này nm sát nhau trên trc hoành, các hình ch nht ca t chc ñ cũng thưng nm sát nhau.
10
20
15
y c n e u q e r F
10
5
0 8
9
10
11
12 13 hemoglobin
14
15
16
14
15
16
Hình 7. T chc ñ mc hemoglobin ca 70 ph n.
20
15
y c n e u q e r F
10
5
0 8
9
10
11
12 13 hemoglobin
Hình 8. Ða giác tn sut ca hemoglobin ca 70 ph n.
Ð v ña giác tn sut, ngưi ta thưng v t chc ñ và ni các trung ñim ca các cnh trên ca các hình ch nht. Ða giác tn sut thưng không ñp như các t chc ñ nhưng nó có ưu ñim là có th v nhiu ña giác tn sut trên cùng mt ñ th ñ d so sánh các phân phi ca chúng. 11
15
10
5
0 8
9
10
11
12 13 hemoglobin
14
15
16
Hình 9. Ða giác tn sut hemoglobin ca 28 ph n nghèo (ñưng ñ) so vơí 42 ph n trung bình và khá (ñưng xanh)
12
Ði cương v phân tích s liu Phép ưc lưng
Dân s và mu Thông thưng chúng ta không th nghiên cu toàn b dân s mà chúng ta quan tâm. Chúng ta thưng ch có th nghiên cu ch mt phn dân s ñó, phn này ñưc gi là mu (sample) và t ñó ưc ñoán v nhng ñc tính ca dân s. Trong nghiên cu khoa hc, chúng ta ñi t ñc trưng ca cá th (bin s - variable) ñ có ñưc ñc trưng ca mu (ñưc gi là thng kê - statistics) và t ñc trưng ca mu chúng ta s dng phương pháp suy lun thng kê và lí gii ñ có ñưc ñc trưng ca dân s (ñưc gi là tham s parameter) Mt loi mu thưng ñưc gp trong nghiên cu là mu ngu nhiên ñơn. Khi ly mu ngu nhiên ñơn, chúng ta có th tính ñưc giá tr trung bình và ñ lch chun ca mu. Rõ ràng là giá tr trung bình và ñ lch chun s khác nhau vi nhng mu khác nhau. Tuy vy các nhà thng kê ñã chng minh rng giá tr trung bình ca mu s có phân phi bình thưng và các giá tr trung bình này s tp trung ti trung bình ca dân s. Do ñó nu chúng ta tính trung bình ca mu thì chúng ta hi vng trung bình ca dân s s nm ngay ti hay lân cn trung bình ca mu. Ð phân tán ca trung bình mu xung quanh chung bình dân s ñưc gi là sai s chun (standard error) và s gim ñi khi c mu càng ln: s.e. =
s n
=
s 2 n
ð lch chun và sai s chun là hai ñi lưng th hin s phân tán nhưng ñ lch chun th hin s phân tán ca cá th chung quanh giá trình trung bình dân s còn sai s chun là ñi lưng th hin s phân tán ca con s thng kê (trung bình mu hay t l ca mu) chung quanh giá tr ca tham s (trung bình dân s hay t l ca dân s).
Ưc lưng khong tin cy ca trung bình Như chúng ta ñã trình bày, trung bình ca mu s dao ñng nhưng tp trung ti giá tr trung bình ca dân s, nên chúng ta có th ưc lưng trung bình dân s bng cách tính trung bình ca mu. Nhưng do trung bình mu có dao ñng, chúng ta không chc là trung bình mu s chính xác bng trung bình ca dân s mà ch có th tin là trung bình dân s nm v trí ñâu ñó chung quanh trung bình ca dân s. Các nhà thng kê cho rng 95% các trưng hp trung bình dân s không nm xa quá 1,96 x SE so vi trung bình mu: phm vi này ñưc gi là khong tin cy 95%. Như vy khong tin cy 95% ca trung bình ca bin sô ñnh lưng Khong tin cy 95% (95% CI) : x ± 1,96s/√n Trong trưng hp c mu nh (n < 30), chúng ta không th s dng giá tr 1,96 như trong công thc trên mà cn phi s dng các giá tr hơi ln hơn (và càng ln nu c mu càng nh), giá tr này ñưc gi là giá tr ca phân phi t vi (c mu – 1) ñ t do. Khong tin cy 95% (95% CI) : x ± t(1-α/2) × s/√n Bài tp: 13
1. Mt nghiên cu ghi nhn trên c mu 1235 tr sơ sinh tnh ðng Tháp cho thy trng lưng trung bình ca tr sơ sinh là 3121 gram và ñ lch chun là 435 gram. Hãy ưc lưng khong tin cy 95% ca trng lưng trung bình ca tr sơ sinh tnh ðng Tháp. S dng công thc trên ta tính ñưc: 95%CI=3096.74 - 3145.26 gram. 2. Chiu cao ca 10 thanh niên là 160; 162; 165; 166; 169; 170; 172; 172; 176; 176. Hãy ưc lưng khong tin cy 95% ca chiu cao trung bình. Trưc tiên chúng ta phi xác ñnh trung bình ca chiu cao là 168,8 cm và ñ lch chun ca chiu cao là 5,493. Do c mu là 10 chúng ta phi dò bng phân phi t 9 ñ t do ta ñưc giá tr t (tương ng vi khong tin cy 95%) là 2,26. T ñó chúng ta tính ñưc khong tin cy 95% 95%CI=164.87 - 164.87.
Ưc lưng khong tin cy ca t l ð ưc lưng khong tin cy ca mt t l, chúng ta cn xác ñnh t l p sau ñó da vào p ñ ưc lưng khong tin cy 95% ca p p − 1,96 ×
p(1 - p)
n
ñn p + 1,96 ×
p(1 - p)
n
Bài tp ðiu tra trên 127 thanh niên có 45 thanh niên hút thuc lá. Hãy tính t l thanh niên hút thuc lá và khong tin cy 95% ca t l hút thuc lá. Chúng ta tính ñưc t l hút thuc lá thanh niên là 0.354 (35.4%). Da vào công thc trên chúng ta tính ñưc khong tin cy 95% ca t l hút thuc lá là 0,271 ñn 0,438
Suy lun thng kê Kim ñnh ý nghĩa Phương pháp kim ñnh ý nghĩa ñưc Fisher ñ xut và da trên căn bn ca phép phn chng. Phép phn chng trong logic hc s dng bng mnh ñ: Nu A kéo theo B thì không B s kéo theo không A. A⇒ B ⇔ B ⇒ A Mt thí d ca phép phn chng là khi chúng ta gp mt bnh nhân nghi ng tc rut và chúng ta hi bnh s xem bnh nhân có bí trung tin hay không. Gi s bnh nhân không bí trung tin thì chúng ta s bác c chn ñoán tc rut vi suy lun sau: Nu bnh nhân b tc rut s bí trung tin thì bnh nhân s bí trung tin, do bnh nhân không bí trung tin nên bnh nhân không b tc rut. Mt cách tng quan hơn, khi chúng ta ñưa ra gi thuyt chn ñoán (thí d như chn ñoán tc rut), chúng ta thưng s xem xét các h qu ph bin gi thuyt này (Bnh nhân tc rut thưng b ñau bng,nôn ói, bí trung tin và chưng bng). Vic không có mt trong các hu qu ph bin ca gi thuyt này (thí d như bnh nhân không có ñau bng, không có nôn ói, không b bí trung tin hay không có chưng bng) thì chúng ta có th bác b chn ñoán. Các bin c nm ngoài các h qu ph bin ca gi thuyt (bin c không có ñau bng, không có nôn ói, không b bí trung tin hay không có chưng bng) ñưc gi là min bác b ca chn ñoán. Trong kim ñnh thng kê ngưi ta cũng s dng các lp lun tương t. ð kim ñnh mt gi thuyt thng kê (ñưc gi là gi thuyt Ho) cn phi xác ñnh min xy ra ph bin ca các con 14
s thng kê (như trung bình, t l, thng kê t, thng kê z, thng kê chi bình phương, v.v.) và nu con s thng kê này nm ngoài min xy ra ph bin thì chúng ta s bác b gi thuyt Ho. Min nm ngoài min xy ra ph bin ca s thng kê ñưc gi min bác b.
Hình 1. Nguyên tc kim ñnh ý nghĩa theo Fisher. ðưng cong phân phi hình chuông th hin phân phi ca thng kê ca z khi =0 (gi thuyt Ho). Vùng din tích dưi ñưng cong màu trng th hin min các thng kê z thưng xy ra nu gi thuyt Ho là ñúng. Vùng din tích dưi ñưng cong màu sm là min bác b gi thuyt Ho và có din tích là xác sut sai lm loi 1 (5%).
Khi s dng kim ñnh ý nghĩa chúng ta cn lưu ý các ñim sau: - Kim ñnh da trên nguyên tc phn chng nghĩa là chúng ta ch có th bác b ch không th chng minh ñưc gi thuyt Ho. Vì vy nu chúng ta mun chng minh hút thuc lá là yu t nguy cơ ca ung thư phi thì phi ñt ra gi th.uyt thng kê Ho là hút thuc lá không phi là yu t nguy cơ ca ung thư phi và s dng phương pháp kim ñnh ñ bác b ñiu này. - Gi thuyt Ho phi th hin bng ñng thc (thí d như gi thuyt Ho: RR=1 hay Ho: ñim trung bình v bnh lây truyn qua ñưng tình dc nam thanh niên = ñim trung bình v bnh lây truyn qua ñưng tình dc n thanh niên ) thì mi có th tính ñưc phân phi ca thng kê. Gi thuyt Ho không th th hin bng bt ñng thc (Ho: RR>1 là sai) - Do din tích min bác b là mt con s c ñnh (thưng là 0,05), ñ xác ñnh con s thng kê T có nm trong min bác b hay không ngưi ta tính xác sut xy ra thng kê cc ñoan hơn giá tr T nu gi thuyt Ho là ñúng (ñưc th hin bng công thc: P (>T |Ho) ). Xác sut này ñưc gi là giá tr p. Và nu giá tr p nh hơn ngưng bác b nghĩa là thng kê T nm trong vùng bác b và chúng ta có th bác b gi thuyt Ho. Giá tr p ñưc kí hiu khác nhau trên các phn mm thng kê. Thí d phn mm Epi-Info, giá tr p ñưc kí hiu là p-value, phn mm SPSS, giá tr p ñưc kí hiu là Sig. phn mm Stata,
15
các giá tr p thưng ñưc kí hiu khác nhau tùy theo thng kê ñưc s dng là thng kê gì. C th, trong phn mm Stata, giá tr p ñưc kí hiu như sau: P > |T| (nu kim ñnh t) P > |z| (nu kim ñnh z) Prob > chi2 (kim ñnh chi bình phương) Prob > F (Kim ñnh F; Kim ñnh ANOVA)
Kim ñnh gi thuyt Khuyt ñim ca phương pháp kim ñnh ý nghĩa khi không bác b ñưc gi thuyt H0 chúng ta không bit ñưc xác sut H0 ñúng là bao nhiêu. Mt nhà thng kê hc khác tên là Neyman ñã ñ ra phương pháp kim ñnh gi thuyt trong ñó có xét ñn sai lm loi 2.
Phaùt bieån H0 ; Ha Tính soá thoáng keâ (z; t; chi2; F)
tra baûng tính p
Xaùc suaát sai laàm loaïi 1 Nhoû
Baùc boû giaû thuyeát
Khoâng nhoû
Xaùc suaát sai laàm loaïi 2
Khoâng nhoû
Thöïc hieän nghieân cöùu vôùi côõ maãu lôùn hôn
Nhoû
Chaáp nhaän giaû thuyeát
Sai lm loi mt và sai lm loi hai Sai lm loi mt: bác b gi thuyt H0 trong khi gi thuyt H0 là ñúng. Sai lm loi hai: Không bác b gi thuyt H0 trong khi gi thuyt H0 sai. Trong nghiên cu thng kê ngưi ta không bao gi có th chc chn. Do vy, khi nhà nghiên cu ñi ñn kt lun bác b gi thuyt H0, ngưi nghiên cu có th b sai lm (sai lm loi mt - vi mt xác sut nào ñó). Khi nhà nghiên cu không bác b gi thuyt H0, nhà nghiên cu cũng có th b sai lm (sai lm loi hai - cũng vi mt xác sut nào ñó). Mt ñiu nên nh là bng kim ñnh thng kê ngưi ta có th xác ñnh ñưc xác sut sai lm loi mt nhưng không th tính ñưc xác sut sai lm loi hai mà ch có th tính ñưc da vào ñi thuyt Ha và c mu ca nghiên cu. Ðôi khi ngưi ta còn s dng khái nim năng lc (power) ca kim ñnh thng kê. Năng lc ca kim ñnh thng kê = 1 - xác sut sai lm loi 2. Khái nim năng lc ca thng kê hay ñưc dùng trong tính c mu.
16
Bng 1. Tóm tt v sai lm loi 1, sai lm loi 2 và giá tr ngưng ca nó Chân lí là Ho ñúng (Không có s khác bit) Bác b gi thuyt H0
Sai lm loi (Xác sut = α)
Không bác b gi thuyt H0
Kt lun (Xác sut = 1-α)
Chân lí là Ha ñúng (Không có s khác bit) 1 Kt lun ñúng (Xác sut = 1-β = Power ca nghiên cu)
ñúng Sai lm loi (Xác sut = β)
II
Chn la kim ñnh phù hp Như vy nguyên lí ca kim ñnh ý nghĩa (hay kim ñnh gi thuyt là như nhau). Các kim ñnh ch khác nhau vic la chn thng kê xut phát t gi thuyt H 0. Vic la chn này ph thuc vào bin s ca vn ñ quan tâm và thit k ca nghiên cu.
17
Bng 10. Chn la kim ñnh phù hp theo thit k nghiên cu Loi thit k nghiên cu
Thang ño ca bin s ph thuc
Hai nhóm ñiu tr gm các cá nhân khác nhau
Ba (hay nhiêù) nhóm ñiu tr gm các cá nhân khác nhau
Ðnh lưng (mu rút t t-test không Phân tích mt dân s có phân phi bt cp phương sai bình thưng và phương sai hai nhóm ñng nht
Trưc và sau mt ñiu tr (hoc 2 ñiu tr) trên cùng các ñi tưng
Nhiu ñiu tr trên cùng các ñi tưng
Liên h gia hai bin s
t-test bt cp
Phân tích phương sai ño lưng lp li
Hi quy tuyn tính và tương quan pearson
Ðnh tính - Danh ñnh
χ2 bng 2 x n
χ2 bng 3 x n
test McNemar
Cochrance Q
H s ca bng n x m (phi, OR, RR)
Ðnh tính -Th t (hay bin ñnh lưng không bình thưng)
Kim ñnh tng sp hng MannWhitney
KruskalWallis
Kim ñnh sp hng có du Wilcoxon
Friedman
h s tương quan Spearman
Bng 11. Chn la kim ñnh phù hp ñ tìm s liên h gia bin ñc lp và bin ph thuc Bin ph thuc
Bin ñc lp Nh giá
Danh ñnh (hoc th ðnh lưng, ña t) bin (hoc th t)
ðnh lưng phân phi bình thưng
T-test
ANOVA
Hi quy tuyn tính
Bin ñnh lưng phân phi không bình thưng – Bin th t
Mann-Whitney
Kruskal-Wallis
TQ Spearman
Nh giá Sng còn
Chi bình phương
Chi bình phương
Wilcoxon tng quát Wilcoxon tng quát Logrank Logrank
Hi quy logistic Hi quy Cox
18
Phép kim t bt cp Tiên lưng ca bnh nhân suy hô hp mãn tính tăng carbonic thưng kém (t l t vong trong 3 năm thay ñi t 30% ñn 100%) và hin ti chưa có phương pháp ñiu tr hu hiu. Tilapur và Mir (Am J Med 1984; 77:987) cho rng ch ñ ăn gim carbonhydrate có th ci thin tình trng hô hp. Các nhà nghiên cu này tin hành thc nghim trên 8 ngưi suy hô hp mãn tính (có du hiu ca tim ln, gan ln, phù và tăng áp phi) vi ch ñ ñiu tr bng ch ñ ăn 600 Kcal và ghi nhn PaO2 (phân áp oxy ñng mch) và PaCO2 (phân áp carbon dioxide ñng mch) trưc và sau ñiu tr. Kt qu nghiên cu ñưc trình bày trong Bng 1. Hãy so sánh trung bình ca phân áp oxy ñng mch trưc và sau khi ñiu tr.
19
Bng 1. Phân áp Oxy ñng mch và phân áp CO2 ñng mch trên 8 ñi tưng trưc và sau ch ñ ñiu tr vi ch ñ ăn gim carbonhydrate ði tưng
Pa02 trưc
Pa02 sau
Hiu s
PaC02 trưc
PaC02 sau
Hiu s
1
70
82
12
49
45
-4
2
59
66
7
68
54
-14
3
53
65
12
65
60
-5
4
54
62
8
57
60
3
5
44
74
30
76
59
-17
6
58
77
19
62
54
-8
7
64
68
4
49
47
-2
8
43
59
16
53
50
-3
Thc hành: Bưc 1: Xây dng gi thuyt Ho: Ho: Phân áp oxy ñng mch trưc và sau ñiu tr không thay ñi Bưc 2: Chn kim ñnh phù hp Kim ñnh phù hơp là kim ñnh t bt cp vi 7 ñ t do Bưc 3: Tính thng kê t Tính trung bình và ñ lch chun ca bin s d (hiu s ca phân áp oxy ñng mch trưc và sau ñiu tr) ñ tính thng kê t d = 13,5; sd = 8,2; t =
d s / n
= 4,66
Bưc 4: tính xác sut ca giá tr thng kê t ð tính xác sut ca giá tr thng kê t ta s dng hàm tdist(giá tr t, ñ t do, 2). C th ñ tính p tương ng vi giá tr t = 4.63 7 ñ t do chúng ta ñánh công thc "=tdist(4.63, 7, 2) vào mt ô. Kt qu ta ñưc giá tr p= 0.002397687. Bưc 5: Kt lun Vì giá tr p= 0.002397687 nh hơn 0.05 nên chúng ta bác b gi thuyt Ho nghĩa là phân áp oxy ñng mch có ci thin sau khi ñiu tr.
Phép kim t (không bt cp) Nhm tìm hiu vai trò ca catecholamine trong tăng huyt áp vô căn, de Champlain (Circ Res 1976; 38:109) nghiên cu 22 bênh nhân tăng huyt áp vô căn (gm 13 ngưi có nng ñ catecholamine cao và 9 bình thưng), ghi nhn nhp tim, huyt áp tâm thu, huyt áp tâm trương. Kt qu ca nghiên cu ñưc trình bày trong bng 2. Hãy so sánh nhp tim hai nhóm, nhóm có tăng catecholamine và nhóm không tăng catecholamine.
20
Bng 1. Trung bình và ñ lch chun ca Lung catecholamine huyt thanh, nhp tim, huyt áp tâm thu và huyt áp tâm trung 13 bnh nhân tăng huyt áp tăng catecholamine và 9 bnh nhân tăng huyt áp không tăng catecholamine Tăng catecholamine
Không tăng
13
9
x=0.484 s=0.133
x=0.206 s=0.060
Nhp tim
x=90.7 s=11.5
x=77.8 s=13.2
Huyt áp tâm thu
x=171.3 s=13.7
x=147.4 s=9.9
Huyt áp tâm trương
x=103.0 s=8.3
x=95.6 s=12.9
S bnh nhân catecholamine huyt thanh (ug/mL)
Thc hành: Bưc 1: Xây dng gi thuyt Ho: Ho: Trung bình nhp tim nhóm bnh nhân có tăng catecholamine = nhp tim trung bình nhóm bnh nhân không tăng catecholamine Bưc 2: Chn kim ñnh phù hp Kim ñnh phù hơp là kim ñnh t vi (n1+n2-2) = 20 ñ t do Bưc 3: Tính thng kê t Trưc tiên chúng ta phi tính ñ lch chun gp (n1 − 1) s12 + (n2 − 1) s22 s p = = 12.21 (n1 − 1) + (n2 − 1) (ð d nh công thc tính ñ lch chun gp chúng ta cn lưu ý phương sai gp là trung bình ca phương sai ca mi nhóm vi trng s là ñ t do ca phương sai ñó) Sau ñó chúng ta tính thng kê t ( x1 − x2 ) t = = 2.44 s 1 / n1 + 1 / n2
Bưc 4: tính xác sut ca giá tr thng kê t S dng máy vi tính chúng ta tính ñưc giá tr p= 0,024123071 (nu s dng bng s thng kê chúng ta s tìm ñưc p <0,05) Bưc 5: Kt lun Vì giá tr p= 0,024123071 nh hơn 0,05 nên chúng ta bác b gi thuyt Ho nghĩa là gia hai nhóm bnh nhân có s khá bit v nhp tim trung bình.
Phân tích phương sai Anionwo et al. (1981, BMJ; 282:283) mun tìm hiu xem mc hemoglobin trong 3 nhóm bnh hng càu lim có khác nhau hay không bng cách ghi nhn mc hemoglobin 3 nhóm bnh nhân.
21
Bng 7. Phân tích phương sai mt chiu: s khác bit trong nng ñ hemoglobin gia các bnh nhân b các loi bnh hng cu lim khác nhau. S liu t Anionwo et al. (1981) British Medical Journal, 282, 283-6
(a) S liu Loi bnh hng cu S bnh Trung bình lim nhân (ni) ( xi)
(si)
Hb SS
Hb thalassaemia Hb SC
S/b-
s.d.
16
8,712
0,844
10
10,630
1,284
15
13,300
0,942
Giá tr ca các cá th hemoglobin g% (x) 7,2; 7,7; 8,0; 8,1; 8,3; 8,4; 8,4; 8,5; 8,6; 8,7; 9,1; 9,1; 9,1; 9,8; 10,1; 10,3 8,1; 9,2; 10,0; 10,4; 10,6; 10,9; 11,1; 11,9; 12,0; 12,1 10,7; 11,3; 11,5; 11,6; 11,7; 11,8; 12,0; 12,1; 12,3; 12,6; 12,6; 13,3; 13,8; 13,8; 13,9
Hãy s dng kim ñnh thng kê phù hp ñ so sánh nng ñ Hemoglobin trung bình 3 nhóm bnh nhân b hng cu lim.
Thc hành: Bưc 1: Xây dng gi thuyt Ho: Ho: Trung bình Nng ñ hemoglobin 3 nhóm bnh HC lim bng nhau Bưc 2: Chn kim ñnh phù hp Kim ñnh phù hp là phương pháp phân tích phương sai (ANOVA) vi thng kê F vi (s nhóm, s quan sát - s nhóm) = (2,38) ñ t do ; F ti hn= 3,32 Bưc 3: Lp bng ANOVA và Tính thng kê F Chúng ta lp thành bng phân tích phương sai như sau: Ngun bin thiên
Gia các nhóm Trong các nhóm Tng cng
SS
99,92 37,95 137,85
d.f.
2 38 40
MS=SS/d.f.
49,96 1,00
MS gia các nhóm F= ---------------------------MS bên trong nhóm 50.03 , P<0,001
Các giá tr trên có th tính theo công thc sau: Gia các nhóm SS b= Σ ni×(xi- x)2= Σ nixi2-(Σx)2/N = 16 × 8,71252+10 × 10,63002+15 × 12,3002 - 430,22/41=99,92
22
df b = k-1 = 2 MS b = SS/d.f. Trong các nhóm SSw = Σ (ni -1)si2 =15 x 0,84452 + 9 x 1,28412 + 14 x 0,9419 = 37,96 df w= N - k = 41-3 = 38 MSw = SS/d.f. Và giá tr thng kê F F = MS b/MSw Bưc 4: tính xác sut ca giá tr thng kê F Da vào máy tính chúng ta tính ñưc giá tr p= 2.26 x 10-11. Chúng ta cũng có th da vào bng thng kê F ñ tìm ñưc p <0,001 Bưc 5: Kt lun Vì giá tr rt nh nên chúng ta bác b gi thuyt Ho nghĩa là ba nhóm bnh nhân bnh hng cu lim có giá tr hemoglobin trung bình khác nhau có ý nghĩa thng kê.
Phép kim chi bình phương Có 240 ngưi ñưc tiêm vaccine phòng bnh cúm và 220 ngưi ñưc tiêm placebo. Trong nhóm tiêm vaccine có 20 ngưi b cúm và trong nhóm tiêm placebo có 80 ngưi b cúm. Hãy so sánh t l mc cúm gia 2 nhóm: nhóm tiêm vaccine và nhóm tiêm placebo? Hãy cho bit mc ñ liên h gia vaccine cúm và bnh cúm? Thc hành Bưc 1: Xây dng gi thuyt Ho: Ho: T l mc cúm nhóm tiêm vaccine = t l mc cúm nhóm không tiêm vaccine Bưc 2: Chn kim ñnh phù hp Kim ñnh phù hp là kim ñnh chi bình phương vi 1 ñ t do Bưc 3: Lp bng 2 x 2 và Tính thng kê chi bình phương Lp bng 2 x 2 như sau Kt qu Mc bnh cúm Tiêm chng
Không mc
Tng
Có
20 (8,3%)
a
220
b
240
a+b
Placebo
80 (36,4%)
c
140
d
220
c+d
Tng
100
a+c
360
b+d
460
N
ð tính thng kê chi bình phương có hai cách: Phương pháp chính thc: - Tính các giá tr kì vng (E) các ô, giá tr kì vng ca mt ô bng tích các ô biên chia cho tng s chung (thí d giá tr kì vng ca ô a Ea = (a+b) × (a+c) /N, giá tr kì vng ca ô c Ec = (a+b) × (c+d) /N) 23
- Tính giá tr chi bình phương theo công thc (O − E ) 2 2 , d . f . = (soá haøng - 1) × (soá coät - 1) χ = Σ E
Trong thí d này (20 − 52,2) 2 (80 − 47,8) 2 (220 − 187,8) 2 (140 − 172,2) 2 2 + + + χ = 52,2 47,8 187,8 172,2 = 19,86 + 21,69 + 5,52 + 6,02 = 53,09 Công thc tính tt cho bng 2 × 2 (ad − bc) 2 N 2 χ = (a + b)(a + c)(c + d )(b + d ) Bưc 4: tính xác sut ca giá tr thng kê χ2 S dng máy vi tính chúng ta ñưc giá tr p= 3,31 x 10 -13 nghĩa là giá tr ca p rt nh. S dng bng s chúng ta bit ñưc p < 0,001. Bưc 5: Kt lun Vì giá tr rt nh nên chúng ta bác b gi thuyt Ho. Chúng ta có th kt lun t l mc cúm nhóm tiêm vaccine thp hơn có ý nghĩa thng kê so vi nhóm tiêm placebo.
S tương quan ca hai bin s ñnh tính Mc ñ liên h gia tiêm chng vaccine và mc bnh cúm Mc ñ liên h gia hai bin s ñnh tính ñưc ưc lưng bng cách s dng RR (hoc OR nu trong nghiên cu bnh chng). Gi s s liu ca bng 2 x2 nm vùng C2:D3 chúng ta có th tính RR bng cách nhp công thc "=MHRR(C2:D3)" ta ñưc RR=0,23 vi khong tin cy 95% ca RR t 0,15 ñn 0,36
So sánh t l ca bin s nh giá : Kim ñnh chi-bình phương Khi hai bin s là bin s nh giá ngưi ta s dng giá tr RR hay OR ñ ño lưng mc ñ liên h (xem li phn các s ño dch t). Kt qu Mc bnh Bin s phơi Phơi nhim nhim Không phơi nhim Tng
a1 ao a1+a0
Không bnh
mc
Tng
b1 b0
N1 N0
b1+b0
N=N1+N0
T s nguy cơ (RR) là t s ca nguy cơ ca nhóm phơi nhim trên nguy cơ ca nhóm không phơi nhim: RR = (a1/N1)/(a0/N0) Khong tin cy 95% ca t s nguy cơ:
24
1, 96×
RR × ÷e
1
−
1
+
1
−
1
a1 N 1 a0 N 0
1±
hay
RR
1,96 χ
2
(test-based CI)
T s s chênh (OR) là t s ca s chênh mc bnh ca nhóm phơi nhim trên s chênh mc bnh nhóm không phơi nhim. Trong trưng hp nghiên cu bnh chng t s s chênh là t s ca s chênh phơi nhim ca nhóm bnh trên s chênh phơi nhim nhóm không chng. RR = (a1/b1)/(a0/b0) Khong tin cy 95% ca t s s chênh: 1, 96×
OR × ÷e
1
1 1 1 + + +
a1 b1 a0 b0
Bài tp Mt nghiên cu bnh chng nhm tìm mi liên h gia s ăn tht và viêm rut hoi t ñã tìm ñưc 61 trưng hp viêm rut hoi t và 57 trưng hp chng. Trong nhóm b viêm rut hoi t có 50 trưng hp có tin căn ăn tht (gn ñây) và trong nhóm chng có 16 trưng hp có tin căn ăn tht. Hãy tìm ưc lưng s ño liên h gia ăn tht và viêm rut hoi t. Table 5. S liên h gia ăn tht trong thi gian gn ñu và viêm rut hoi t Papua New Guinea (OR=11,6)
Ăn tht trong thi gian gn ñây
Không ăn tht trong thi gian gn ñây
Tng s
Nhóm bnh
50
a1
11
b1
61
Nhóm chng
16
a0
41
b0
57
Tng s
66
52
118
Nu t l ăn tht nhóm bnh (50/61) cao hơn t l ăn tht trong nhóm chng (16/57) có ý nghĩa thng kê thì chúng ta có th kt lun rng có s liên quan gia ăn tht và viêm rut hoi t. ðây là bài toán so sánh t l ca mt bin s ñnh tính hai nhóm và ñưc gii quyt bng kim ñnh chi bình phương. Tuy nhiên bng vic kim ñnh gi thuyt chúng ta ch xác ñnh có mi liên h mà không bit ñ ln ca s liên h. Bi vì ñây là nghiên cu bnh chng chúng ta không tính ñưc RR mà phi s dng OR ñ ño lưng sc mnh liên h. S dng công thc tính OR và khong tin cy ca OR ta ñưc: OR = (a1/b1)/(a0/b0) = (a1 × b0)/(a0 × b1) = 11.65 và khong tin cy 95% ca OR = 4.87 ñn 27.85 Bài tp Có 240 ngưi ñưc tiêm vaccine phòng bnh cúm và 220 ngưi ñưc tiêm placebo. Trong nhóm tiêm vaccine có 20 ngưi b cúm và trong nhóm tiêm placebo có 80 ngưi b cúm. Hãy so sánh t l mc cúm gia 2 nhóm: nhóm tiêm vaccine và nhóm tiêm placebo? Hãy cho bit mc ñ liên h gia vaccine cúm và bnh cúm?
25
Kt qu Mc bnh cúm Tiêm chng
Có
a1 20 (8,3%)
Placebo
a0 80 (36,4%)
Tng
Không mc
100
220 140 360
Tng
b1 d
240
N1
220
N0
460
N
Ta tính ñưc RR = (a 1/N1)/(a0/N0) = (20/240)/(80/220) = 0.23 Khong tin cy 95% ca t s nguy cơ: 1, 96×
RR × ÷e
1
−
1
+
1
−
1
a1 N 1 a0 N 0
= 0.15 ñn 0.36
Quan h gia hai bin s ñnh lưng
Tương quan Tương quan là s ño mc ñ hai bin s ñnh lưng cùng thay ñi vi nhau. Có nhiu loi h s tương quan, nhưng chúng ñu có giá tr t -1 ñn 1. Nu chúng có giá tr bng zero có nghĩa là hai bin s ñc lp và không quan h gì vi nhau. Nu chúng có giá tr dương có nghĩa là hai bin s ñng bin vi nhau, nu chúng có giá tr âm nghĩa là hai bin s nghch bin. Giá tr tuyt ñi ca h s tương quan càng gn mt nghĩa là hai bin s có liên h cht vi nhau và vai trò ca sai s ngu nhiên s ít hơn. Khi tr tuyt ñi ca h s tương quan bng mt có nghĩa là hoàn toàn không có sai s ngu nhiên. Loi h s tương quan ñưc s dng ph bin nht là h s tương quan Pearson r: ∑ ( xi − x )( yi − y ) = (Σ xy) / n − x × y × n r = σ x × σ y n −1 ∑ ( xi − x ) 2 ∑ ( yi − y ) 2 Lí gii ý nghĩa ca h s tương quan Pearson - H s tương quan luôn luôn nm trong ñon [-1,1] - H s tương quan r dương chng t hai bin s là ñng bin; h s tương quan r âm chng t hai bin s là nghch bin. - Tr s tuyt ñi ca h s tương quan r nói lên mc ñ liên quan gia hai bin s. Nu tr tuyt ñi ca r bng 1 (r=1 hay r=-1), quan h hoàn toàn tuyn tính nghĩa là tt c các ñim nm trên ñưng hi quy (Hình 9.2 d và 9.2f). Nu tr tuyt ñi ca r nh hơn 1 s có các ñim s liu phân tán chung quanh ñưng hi quy (hình 9.2 c và 9.2e). - Bình phương ca h s tương quan (r 2) th hin t l bin thiên ca bin s ph thuc ñưc gii thích bng s bin thiên ca bin s ñc lp (nu mi liên h này là nhân qu) - Nu r=0, không có mi liên h tuyn tính gia hai bin s. Ðiu này có nghĩa là (1) không có mi liên h gì gia hai bin s hoc (hình 9.2a) (2) mi liên h gia hai bin s không phi là tuyn tính (hình 9.2b) - Theo quy ưc, quan h vi r t 0,1 ñn 0,3 là quan h yu, t 0,3 ñn 0,5 quan h trung bình và trên 0,5 là quan h mnh.
26
Hi quy Hi quy là mt mô hình toán hc mô t s bin ñi ca mt bin s này theo nhng bin s khác. Mt phương trình hi quy có th có dng như sau: cân nng (kg) = 6,85 + 0,18 × tháng tui (phương trình hi quy tính cân nng ca tr t 9 ñn 40 tháng tui theo tháng tui) theo phương trình này ngưi ta gi: cân nng: bin s ph thuc tháng tui: bin s ñc lp 6,85: h s ca hng s, hay còn gi là ñim chn (intercept) 0,18: h s ca bin s tháng tui. Mt cách tng quát phương trình hi quy s có dng: Y = b0 + b1 x1 + b2 x2 + b3 x3 Vi y là bin s ph thuc x1, x2, x3 là các bin s ñc lp b0: ñim chn ca phương trình b1, b2, b3 : h s ca các bin s ñc lp H s ca bin s ñc lp nói lên nu bin s ñc lp tăng mt ñơn v thì bin s ph thuc y s thay ñi bao nhiêu. C th hơn nu bin s x 2 thay ñi mt ñơn v thì bin s y s tăng giá tr là b2 (bin s y s gim nu giá tr b2 âm).
Bài tp 1. Mt nhà nghiên cu ghi nhn lưng mui ăn và huyt áp tâm thu ca 5 ñi tưng trong bng 4. ði tưng Lưng mui Huyt áp 1
5
110
2
10
120
3
12
110
4
18
120
5
20
140
Hãy tìm mi liên h gia huyt áp tâm thu và lưng mui s dng. Thc hành ð tìm s liên h gia hai bin s ñnh lưng chúng ta s dng h s tương quan. Da vào công thc ta tính ñưc r = 0,771829. Như vy có mi liên quan thun gia lưng mui ăn và huyt áp tâm thu. Mi liên quan này là mnh và lưng mui ăn gii thích cho ñn 60% (0.77 × 0.77) s thay ñi ca huyt áp tâm thu. Chúng ta cũng tìm ñưc phương trình ca huyt áp theo lưng mui tiêu th s là: Huyt áp tâm thu = 99,8 mmHg + 1,55 x Lưng mui. 27
Giá tr 99,8 ñưc gi là ñim chn ca phương trình hi quy và 1,55 là h s góc ca bin s lưng mui tiêu th. ðiu này có nghĩa là nu lưng mui ăn tăng thêm 1 gram/ngày thì huyt áp tâm thu s tăng trung bình 1,55 mmHg. 2. Lý gii ý nghĩa ca phân tán ñ sau Figure 8. Trng lưng sơ sinh theo tui thai (tun) ca 641 tr sinh do th thai trong ng nghim Anh quc 5000
4000
e r t g n o u l g n o r t
3000
2000
1000
0 20
24
28
32 tuoi thai
36
40
44
28
Cài ñt chương trình Stata 10.0, s liu mu và các chương trình có liên quan 1. Cài ñt chương trình Stata và s liu mu Có nhiu cách ñ cài ñt chương trình Stata 10. Dưi ñy s trình bày cách cài ñt chương trình Stata/SE 10.0 t tp tin "Setup Stata 10 and Data.exe" (có th ti xung t website ca khoa Y t công cng ði Hc Y dưc TP H Chí Minh hay chép t ñĩa CD ca b môn Thng kê Y hc) - Tìm tp tin "Setup Stata 10 and Data.exe" ( mt s máy khi không cho phép hin phn m rng ca tên tp tin, tên tp tin ch hin ra là Setup_Stata10) - Nhp ñúp vào tp tin này (hay nhp chut ñ chn tp tin này và sau ñó nhn phím Enter). Tp tin này s thc hin vic khi ñng cài ñt trong vòng vài giây.
Và tip theo, ca s chào mng (Welcome) s hin ra
Nhp vào nút lnh Next ñ sang ca s tip theo ñ chn thư mc ca nơi cài ñt (Choose destination location).
29
Nu bưc này nu chúng ta quyt ñnh không cài ñt na hãy nhp vào nút lnh Cancel ñ thoát khi chương trình cài ñt. Nu chúng ta mun tip tc cài ñt thì cn phi quyt ñnh thư mc ca nơi cài ñt (Destination Directory). Theo mc ñnh thư mc ca nơi cài ñt s là C:\Program Files và nu không có ý ñnh gì ñt bit, chúng ta cũng nên cài ñt thư mc này bng cách ñ nguyên tên thư mc nm trong hp văn bn Destination Directory ri nhp Next. Nu mun cài ñt vào thư mc khác, nhp vào nút lnh Browse ri sau ñó chn thư mc phù hp trưc khi nhp vào nút lnh Next. Gi s chúng ta tip tc cài ñt và chn thư mc nơi cài ñt mc ñnh (C:\Program Files) thì ca s cài ñt (Setup) s hin ra và cho tip tin ñ ca vic thc hin cài ñt.
Sau quá trình cài ñt ca s hoàn tt (Finised) s hin ra.
30
Chúng ta hãy nhp vào nút lnh Close ca ca s hoàn tt ñ kt thúc quá trình cài ñt. Sau quá trình cài ñt, chương trình cài ñt s to ra mc chương trình Stata 10 trong nhóm chương trình MediStat. ðiu này có nghĩa sau khi cài ñt ñ khi ñng chương trình Stata trong Windows, chúng ta nhp chut vào nút lnh Start ca h ñiu hành Windows và sau ñó ch vào Alls Program và sau ñó di chuyn (navigate) ñn nhóm chương trình MediStat ri nhp vào mc chương trình Stata 10. Vic thc hin toàn b quá trình khi ñng chương trình Stata ñưc th hin tóm tt như sau Start :: Alls Program :: MediStat :: Stata 10 (Chú ý nút lnh ñu tiên và mc cui cùng là ñim cn phi nhp chut, các du :: th hin s di chuyn (navigate) ca con tr chut. Vic cài ñt Stata 10 cũng ñng thi cài ñt các tp tin s liu mu vào thư mc Data nm trong thư mc Stata 10 ca thư mc nơi cài ñt.
2. Cài ñt tp tin s liu mu ð có th thc tp các bài tp có trong tài liu này, các bn nên có các tp tin s liu mu. Khi bn cài ñt chương trình Stata 10 theo cách k trên thì các tp tin s liu mu ñã ñưc ñưa vào thư mc C:\Data và các bn không cn phi thao tác gì thêm ñ có tp tin s liu mu nhm thc tp. Do ñó vic cài ñt tp tin s liu mu ch nên thc hin khi các s liu mu vì mt lí do gì ñã b xóa ñi hoc hư hng. Cài ñt tp tin s liu mu cn ñòi hi tp tin Data_Stata10.exe (có th ti xung t website ca khoa Y t công cng ði Hc Y dưc TP H Chí Minh hay chép t ñĩa CD ca b môn Thng kê Y hc) - Tìm tp tin "Setup Data.exe" ( mt s máy khi không cho phép hin phn m rng ca tên tp tin, tên tp tin ch hin ra là Data_Stata10) - Nhp ñúp vào tp tin "Setup Data.exe" (hay nhp chut ñ chn tp tin này và sau ñó nhn phím Enter). Tp tin này s thc hin vic khi ñng cài ñt trong vòng vài giây.
31
Tip theo là ca s Choose Destination Location s hin ra.
Nu bưc này nu chúng ta quyt ñnh không cài ñt na hãy nhp vào nút lnh Cancel ñ thoát khi chương trình cài ñt. Nu chúng ta mun tip tc cài ñt thì cn phi quyt ñnh thư mc ca nơi cài ñt (Destination Directory). Theo mc ñnh thư mc ca nơi cài ñt s là C:\Program Files và nu không có ý ñnh gì ñt bit, chúng ta cũng nên cài ñt thư mc này bng cách ñ nguyên tên thư mc nm trong hp văn bn Destination Directory ri nhp Next. Khi ñó sau khi cài ñt tp tin s liu mu s nm thư mc C:\Data. Nu mun cài ñt vào thư mc khác, nhp vào nút lnh Browse ri sau ñó chn thư mc phù hp trưc khi nhp vào nút lnh Next. Gi s chúng ta tip tc cài ñt và chn thư mc nơi cài ñt mc ñnh (C:\Program Files) thì ca s cài ñt (Setup) ca chương trình Data Stata 10 s hin ra và cho tip tin ñ ca vic thc hin cài ñt.
Sau khi thc hin xong vic cài ñt chương trình s t ñng ñóng li. 32
3. Cài ñt chương trình chuyn ñi s liu ðôi khi chúng ta có s liu ñưc nhp bng chương trình Epi-Info 6.04, Epi-Info for Windows, Access hay Excel nhưng chúng ta li mun phân tích s liu bng Stata chúng ta cn phi s dng chương trình chuyn ñi s liu như DBMSCopy for Win hay StatTransfer. Sau ñây là hưng dn cài ñt chương trình StatTransfer 7.0 s dng tp tin StatTransfer7Setup.exe (có th ti xung t website ca khoa Y t công cng ði Hc Y dưc TP H Chí Minh hay chép t ñĩa CD ca b môn Thng kê Y hc) - Tìm tp tin "StatTransfer7Setup.exe" ( mt s máy khi không cho phép hin phn m rng ca tên tp tin, tên tp tin ch hin ra là StatTransfer7Setup) - Nhp ñúp vào tp tin này (hay nhp chut ñ chn tp tin này và sau ñó nhn phím Enter). Tp tin này s thc hin vic khi ñng cài ñt trong vòng vài giây.
Tip theo các ca s Welcome, Choose Destination Location
Nu bưc này nu chúng ta quyt ñnh không cài ñt na hãy nhp vào nút lnh Cancel ñ thoát khi chương trình cài ñt. Nu chúng ta mun tip tc cài ñt thì cn phi quyt ñnh thư mc ca nơi cài ñt (Destination Directory). Theo mc ñnh thư mc ca nơi cài ñt s là C:\Program Files\StatTransfer7 và nu không có ý ñnh gì ñt bit, chúng ta cũng nên cài ñt thư mc này bng cách ñ nguyên tên thư mc nm trong hp văn bn Destination Directory ri nhp Next.
33
Nu mun cài ñt vào thư mc khác, nhp vào nút lnh Browse ri sau ñó chn thư mc phù hp trưc khi nhp vào nút lnh Next. Gi s chúng ta tip tc cài ñt và chn thư mc nơi cài ñt mc ñnh (C:\Program Files\StatTransfer7) thì ca s Ready to Install s hin ra.
Nhp vào nút lnh Next ñ tip tc, ca s cài ñt (Setup) s hin ra và cho tip tin ñ ca vic thc hin cài ñt.
Sau khi cài ñt chương trình StatTransfer, ca s Finished s hin ra.
34
Chúng ta hãy nhp vào nút lnh Close ca ca s hoàn tt ñ kt thúc quá trình cài ñt. Sau quá trình cài ñt, chương trình cài ñt s to ra mc chương trình st32w trong nhóm chương trình MediStat . ðiu này có nghĩa sau khi cài ñt ñ khi ñng chương trình StatTransfer7 trong Windows, chúng ta nhp chut vào nút lnh Start ca h ñiu hành Windows và sau ñó ch vào Alls Program và sau ñó di chuyn (navigate) ñn nhóm chương trình MediStat ri nhp vào mc chương trình st32w. Vic thc hin toàn b quá trình khi ñng chương trình Stata ñưc th hin tóm tt bng hưng dn sau Start :: Alls Program :: MediStat :: st32w (Chú ý nút lnh ñu tiên và mc cui cùng là ñim cn phi nhp chut, các du :: th hin s di chuyn (navigate) ca con tr chut.
35
Khi ñng và kt thúc Stata 1. Khi ñng Stata ð khi ñng Stata trong Windows XP hãy thc hin
• • • •
Nhp chut vào Start Nhp chut vào “All Programs” Di chuyn chut thư mc MediStat và Nhp chut vào mc Stata 10
Hoc nu ñã có biu tưng ca Stata trên desktop ca máy tính có th khi ñng Stata bng cách nhp ñúp chut vào biu tưng ca Stata 10 (Stata icon) Ngưi dùng s nhìn thy màn hình như sau khi khi ñng Stata 10.0
36
Nu màn hình Stata không khi ñng ñưc, nguyên nhân thông thưng nht là ngưi s dng chưa ñăng kí và m khoá ñ s dng Stata. Trong trưng hp này ngưi s dng cn liên h vi công ty Stata ñ có ñưc s hiu (serial number) mã chương trình (code) và chìa khoá ch quyn (Authorization key). Cũng có th xy ra trưng hp ngưi s dng ñã m khoá ri nhưng do vô ý ñã xoá file Stata.lic. Trong trưng hp này có th chép li tp tin Stata.lic ca ngưi ñã có khóa hp l.
2. Kim tra tính hp l ca Stata Trong ln khi ñng Stata ñu tiên, bn có th mun kim tra rng bn ñã cài ñt ñúng. Hãy gõ lnh verinst và bn s thy kt xut tương t như sau: . verinst Stata/SE 10.0 for Windows Born 25 Jul 2007 Copyright (C) 1985-2007 Total physical memory:
1038712 KB
Available physical memory:
191512 KB
Unlimited-user Stata for Windows (network) perpetual license: Serial number: Licensed to:
56437637415 Khoa Y te Cong cong Dai hoc Y Duoc
Lnh verinst là mt lnh cn nh. Gi s nu chúng ta thay ñi cu hình ca máy tính và không
37
bit mình ñã làm tn thương cho Stata hay không, chúng ta có th gõ verinst ñ ñưc trn an rng Stata vn còn ñưc cài ñt ñúng.
3. Thoát khi Stata ð thoát khi Stata/SE 10.0 for Windows chúng ta có th thc hin mt trong 2 vic sau: - Nhp vào ô ñóng nm phía trên phi ca ca s Stata Lưu ý: Trong trưng hp có d liu trong b nh và d liu ñó ñã ñưc thay ñi nhưng chưa ñưc lưu vào ñĩa thì khi chúng nhp vào ô ñóng, máy tính s hi chúng ta rng chúng ta có mun thoát mà không lưu li s liu hay không. Nu chúng ta ñng ý thì Stata s thoát, nu không thì chúng ta li tr li Stata ñ chúng ta có th lưu li s liu. - Gõ lnh exit trong ca s Stata Command. Lưu ý: Trong trưng hp có d liu trong b nh và d liu ñó ñã ñưc thay ñi nhưng chưa ñưc lưu vào ñĩa thì khi chúng gõ exit, máy tính s không ñng ý cho chúng ta thoát và s thông báo “ no; data in memory would be lost”. Trong trưng hp này nu chúng mun thoát mà không lưu li s liu thì chúng ta hãy gõ exit, clear. Nu chúng ta mun lưu li s liu hãy s dng lnh save.
4. Các loi hình ca Stata Có mt s loi hình ca Stata chy trên các h ñiu hành khác nhau: Stata cho Windows 98/95/NT, Stata cho Windows 3.1, Stata cho Power Macintosh, Stata cho 680x0 Macintosh, Stata cho Linux, Stata cho RS/6000, v.v. Tuy nhiên bt k bn dùng loi hình Stata nào, Stata vn là Stata và bn có th s dng cùng mt câu lnh và Stata s cho ra cùng mt kt qu, chính xác ñn s l tn cùng. Ngay c các tp tin cũng có th chia x. Thí d tp tin s liu, tp tin chương trình, tp tin ñ ho ca Stata cho Macintosh có th dùng trên các máy tính khác mà không cn phi chuyn ñi.
5. Stata nh, Intercooled Stata và Stata bn ñc bit (Stata SE) Stata cho Windows và Stata cho Macintosh có hai kiu: Stata nh và Intercooled Stata (trên h ñiu hành Unix ch có Intercooled Stata). C hai kiu Stata này ñu có nhng nét chung nhưng Intercooled Stata có th làm vic vi tp tin d liu ln hơn và nhanh hơn. Tuỳ theo loi máy Intercooled Stata có th nhanh hơn Stata nh t 50 ñn 600%. Sau ñây là s khác bit gia v gii hn kích thưc gia Intercooled Stata và Stata nh Stata nh
Intercooled Stata
S quan sát
1.000
Tuỳ thuc vào b nh
S các bin s
99
2.047
Chiu rng s liu
200
8.192
Kích thưc ma trn ti ña
40
800
S kí t trong mt macro
1.000
18.632
S kí t trong mt dòng lnh
1.100
18.648 38
Ti sao Intercooled Stata chy nhanh hơn Stata nh? ðiu này là do s khác bit trong vic lp chương trình. Thí d ñ có tích s ca các ma trn RZR’, Intercooled Stata s s dng b nh ñ có th ghi nh kt qu tm thi là ma trân T=RZ ri sau ñó tính TR’. Stata nh do không có th s dng nhiu b nh nên phi tính toán trc tip RZR’, và do ñó mt s kt qu trung gian phi tính toán li nhiu ln và ñiu này làm Stata nh b chm . Dù sao, s khác bit ca Intercooled Stata và Stata nh mang tính kĩ thut và ni b, ñi vi ngưi dùng, vic s dng Intercooled Stata và Stata nh không có gì khác bit. Nu Stata ñã ñưc cài ñt và bn mun bit bn ñang dùng Stata gì thì có th gõ lnh about: . about Stata/SE 10.0 for Windows Born 25 Jul 2007 Copyright (C) 1985-2007 Total physical memory: 1038712 KB Available physical memory: 192392 KB Unlimited-user Stata for Windows (network) perpetual license: Serial number: 56437637415 Licensed to: Khoa Y te Cong cong Dai hoc Y Duoc Như vy, chúng ta ñang s dng Stata Phiên bn ñc bit 10.0 cho Windows.
39
Khi ñng Stata 1. Khi ñng Stata Khi ñng chương trình STATA bng cách nhp vào nút Start :: All Programs :: Medistat :: Stata 10 hoc nhp vào biu tưng (icon) Stata 10
trên màn hình Desktop.
2. Mô t giao din ca chương trình Stata Giao din ca Stata s hin ra vi 3 thanh và 4 ca s: 3 thanh bao gm: 1. Thanh tiêu ñ vi dòng ch "Intercooled Stata 6.0" 2. Thanh menu vi các menu File (ñóng m tp tin); Edit (hiu chnh); Prefs (Tùy chn); Data (S liu) Graphics (ð ha) Statistics (Thng kê) User (Ngưi dùng) Window (m ra các ca s) và Help (Tr giúp) 3. Thanh công c (toolbar) Thanh công c gm 12 nút công c (1- Open file; 2- Save; 3- Print Results; 4- Begin (Close) log; 5- Start Viewer (Bring Viewer to Front) ; 6- Bring results window to Front 7-Bring graph windows to Front; 8- Do-file Editor; 9-Data Editor; 10-Data Browser; 11-Clear more - Condition và 12- Break) Ý nghĩa ca tng công c như sau:
1- Open file (m tp tin) 2- Save (Lưu tp tin) 3- Print Results (In kt qu)
4- Begin (Close) log: (Bt ñu (Kt thúc) ghi biên bn kt qu) 5- Start Viewer (Bring Viewer to Front) : Bt ñu s dng ca s Viewer 7-Bring graph windows to Front (ðưa ca s ñ ha ra trưc)
8- Do-file Editor: (Biên son tp tin chương trình - do file) 9-Data Editor: Biên tp s liu (sa cha, thêm bt s liu) 10-Data Browser: Duyt s liu (xem nhưng không sa cha) 11-Clear - more - Condition (Xóa lnh more ñ tip tc chương trình) 40
12- Break: (Ngưng tp tin chương trình) Bn ca s lit kê theo ngưc chiu kim ñng h bao gm 1. Ca s Command (ca s lnh)
2. Ca s Result (ca s Kt qu) 3. Ca s Review (ca s Lưu tr)
4. Ca s Variables (ca s Bin s)
3. Cách cách ñ thc hin lnh trong chương trình Stata Có hai cách ñ thc hin lnh trong chương trình Stata: Dùng bàn phím ñ gõ lnh vào ca s lnh (Stata Command) hay s dng con tr chut ñ chn các trình ñơn (menu) giao din ñ ha (Graphic Interface) Dùng bàn phím ñ gõ lnh
41
Dùng bàn phím ñ gõ lnh vào ca s lnh (Stata Command). ðây là cách s dng Stata ca ngưi chuyên nghip vì nó cho phép thc hin tt c các lnh ca Stata mt cách nhanh chóng vi ñy ñ các chc năng ph ca lnh. Tuy nhiên phương pháp này có th không thích hp cho ngưi mi s dng do nó ñòi hi ngưi dùng phi thuc các câu lnh và cú pháp ca nó Con tr chut vi giao din ñ ha (Graphic Interface) Có th dùng chut thc hin các lnh nhm thao tác s liu (menu Data), v ñ th (menu Graphics) và phân tích s liu (menu Statistics). Phương pháp s dng chut và menu là phương pháp d s dng nên s ñưc ưu tiên trình bày trong tài liu này.
4. Lưu li kt qu phân tích Kt qu ca phân tích ñưc th hin trên ca s Stata Result và ca s này có mt thanh trưt dc cho phép xem li nhng kt qu phân tích cũ. Tuy nhiên ñ tránh gây nhm ln cho ngưi phân tích, ca s này ch lưu li nhng kt qu gn nht. Do ñó nu chúng ta mun lưu tr li toàn b kt qu phân tích chúng ta cn phi m ca s log bng cách nhp vào nút công c Stata Log nm v trí th tư t trái trên thanh công c . Khi ñó ca s Open Stata Log m ra, chúng ta có th nhp tên ca tp tin lưu tr (log file) vào hp văn bn File name.
Gi s chúng ta chn tp tin này là "baitap.smcl" hãy gõ "baitap" vào hp File Name ri nhp OK. Khi ñó trên ca s kt qu (Stata results) s hin ra thông báo ñ cho bit rng biên bn kt qu phân tích s ñưc lưu ti tp tin "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl"
42
. log using "D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl" -----------------------------------------------------------------------------log: log type: opened on:
D:\Dung\Science\BSCK2_Hieu_mat\baitap.smcl smcl 10 Oct 2004, 12:01:34
Sau ñó bn có th thc hin các bưc phân tích. Khi mun xem li biên bn (kt qu phân tích) hãy nhp vào nút công c log ñ hin ra ca s Stata Log Options.
mt ln na
Sau ñó chn vào nút chn View snapshot of log file và nhp vào nút lnh OK ñ xem biên bn. Khi mun chm dt vic ghi biên bn (kt qu phân tích) hãy nhp vào nút công c log hin ra ca s Stata Log Options.
ñ
Sau ñó chn vào nút chn Close log file và nhp vào nút OK. Li khuyên: Ngưi s dng Stata có kinh nghim sau khi m tp tin s liu luôn luôn m tp tin log trưc khi tin hành các phân tích thng kê ñ không b mt các kt qu ca quá trình phân tích.
43
Mt vài phân tích ñơn gin vi Stata Mc tiêu: Sau khi nghiên cu bài này các hc viên có kh năng: - Nêu ñưc s khác bit gia bin s ñnh tính và bin ñnh lưng - S dng ñưc các lnh ca Stata: edit, sum, tab1, bysort - Hiu ñưc khái nim v trng s (weight) Chúng ta s minh ha nhng lnh cơ bn trong phân tích thng kê vi Stata s dng s liu ñơn gin gi ñnh ca 5 ñi tưng nghiên cu. S liu này có 2 bin s gii và ñưng huyt (ñơn v ca ñưng huyt là mg/100mL). Hình 2. ðưng huyt và gii tính ca 5 ñi tưng nghiên cu
STT Tên 1 2 3 4 5
Truc Phuoc Han Hoa Dung
Gii tính ðưng huyt (mg/100mL) nam nam n n nam
80 90 100 110 130
Câu hi: 1- Bin s gii tính là bin ñnh lưng hay bin ñnh tính? Bin s ñưng huyt là bin ñnh lưng hay bin ñnh tính? Hãy nêu s khác bit gia bin s ñnh lưng và bin s ñnh tính. 2. Bin s tên hc là bin s ñnh lưng hay ñnh tính? 2- ð tóm tt ñc trưng v gii tính ca 5 ñi tưng nghiên cu này chúng ta s dng thng kê gì? 3- ð tóm tt ñc trưng v ñưng huyt ca 5 ñi tưng nghiên cu này chúng ta s dng thng kê gì? Hãy cho bit ñưng huyt trung bình ca 5 ngưi này? Hãy cho bit ñưng huyt trung bình ca 2 ngưi n và ñưng huyt trung bình ca 3 ngưi nam?
1. Khi ñng Stata Trưc tiên, chúng ta thc hin theo hưng dn: Start :: Alls Program :: MediStat :: Stata 10 ñ khi ñng Stata t Windows (Chú ý nút lnh ñu tiên Start và mc cui cùng Stata 10 là ñim cn phi nhp chut, các du :: th hin s di chuyn (navigate) ca con tr chut). Khi ñó chúng ta có màn hình Stata vi 4 ca s bin s (variables), lnh (command), kt qu (results) và xem li (review) như sau:
44
Hình 3. Giao din ca Stata vi 4 ca s bin s (variables), lnh (command), kt qu (results) và xem li (review) như sau
Vi Stata, chúng ta có 2 cách ñ yêu cu cho Stata thc hin các lnh v qun lí s liu, v ñ th hay phân tích thng kê (1) gõ lnh vào ca s lnh hay (2) s dng menu. Ngưi ñc ñưc khuyn khích s dng c 2 phương pháp trên ñ thc hin phân tích thng kê. Nhưng vi mc ñích giúp ngưi ñc phát trin năng lc t phát trin và năng lc phán ñoán trong thc hin phân tích thng kê bng menu, các hưng dn s tp trung vic giúp ngưi ñc chuyn mt câu lnh ñưc vit theo cú pháp vào màn hình giao din.
2. Nhp liu vi lnh Edit Trưc tiên chúng ta s dng lnh edit ñ nhp liu ñơn gin. Lnh edit ngoài kh năng nhp liu cũng có th s dng ñiu chnh s liu. Gõ edit trong ca s lnh (cn lưu ý lnh edit cũng như phn ln các lnh khác trong Stata ñưc vit ch thưng, nu chúng ta gõ lnh EDIT (hay Edit hay eDit) thì chương trình Stata s không hiu và s hin thông báo màu ñ: unrecognized command:
EDIT
Sau khi chúng ta gõ lnh edit, màn hình Editor s hin ra:
45
Trong ca s Editor mi hàng là mt ñi tưng và mi ct là mt bin s, do ñó s liu ca v tên, gii tính và ñưng huyt ca 5 ñi tưng s th hin bng 5 hàng và 3 ct. Bin s tên (là bin s hành chính) ñưc th hin Ct 1, bin gii là bin ñnh tính ñưc th hin ct 2 và bin ñưng huyt là bin ñnh lưng ñưc th hin ct 3. Trong thí d này chúng ta nhp liu 5 giá tr ca bin tên trưc và sau ñó nhp 5 giá tr ca bin gii và 5 giá tr ca bin ñưng huyt: - Trưc tiên nhp giá tr tên cho ñi tưng 1 (Truc) bng cách di chuyn con tr ñn hàng 1 ct 1 (lưu ý khi ñó nhãn trưc hp văn bn th hin là var1[1] th hin con tr ñang bin var1 ca ñi tưng s 1. Nhp "Truc" vào hp văn bn.
Khi nhn Enter thì giá tr "Truc" s ñưc ñưa vào hàng 1 ct 1 và con tr s nm xung hàng 2 ct 1 và nhãn trưc hp văn bn s th hin ch var1[2] ñ th hin con tr ñang bin var1
46
ca ñi tưng s 2
Tip tc thc hin cho ñn khi ñã nhp ñ 5 tên ca 5 ñi tưng.
Sau ñó di chuyn con tr sang hàng 1 ct 2 và quan sát nhãn trưc hp văn bn là var2[1].
Tip tc nhp các s 1,1,0,0,1 vào 5 ô trên cùng ca ct 2. Các s 1,1,0,0,1 là mã hóa ca các
47
giá tr Nam, Nam, N, N, Nam ca bin s gii tính.
Sau khi nhp các giá tr ca gii tính, chúng ta s nhp vào các giá tr ca ñưng huyt bng cách di chuyn con tr sang hàng 1 ct 2 và quan sát nhãn trưc hp văn bn là var3[1].
Tip tc nhp các giá tr ñưng huyt ca năm ñi tưng ln lưt là 80, 90, 100, 110,130 Khi nhp bin s ñnh lưng (hoc nhp giá tr ca bin ñnh tính ñưc mã hóa) cn lưu ý tránh gõ ch cái (như a, b, c, …) vào ô nhp liu ñu tiên vì khi trong ô nhp liu ñu tiên có ch cái (như 8o) thì dù sau ñó chúng ta có xóa ñi và nhp li cho ñúng (thí d như 80) thì kiu (Type) ca bin s vn là str# và không th ñưc x lí như là mt bin ñnh lưng. ð khc ph sai lm này có th s dng lnh destring vi cú pháp sau: . destring [varlist], replace (Data :: Create or Change variable :: Other variable transformation command :: Convert variable from string to numeric)
48
Sau khi nhp liu chúng ta có th nhp ñôi vào tên bin var1 ñ ñi tên bin (Name) bin thành ten.
Vic ñt tên bin (name) phi theo mt s quy tc: Tên bin phi bt ñu bng mt ch cái hoc du gch chân và không có du khong trng hoc du ni gia tên bin. Nu tên bin ñưc ñt có khong trng gia (thí d như " ho ten") thì chương trình stata s nhn nhm tên bin này là 2 tên bin ñưc ñt cnh nhau. Nu tên bin ñưc ñt có du cách gia (thí d như " ho-ten") thì chương trình stata s nhn nhm ñây là biu thc s hc (bin ho tr cho bin ten). Vì nhng hn ch này nên tên bin thưng không mô t ñy ñ ñưc ý nghĩa ca bin. Khi ñó nu mun mô t ñy ñ ý nghĩa ca bin phi s dng nhãn bin (label). Nói khác hơn tên bin là tên ngn gn ca bin, nhãn bin (label) là tên dài dòng ca bin. Trong trưng hp bin ten, nu chúng ta thy tên biên ten có ñ ý nghĩa thì chúng ta không cn s dng nhãn bin và ñ trng ô này. Chương trình Stata cho bit ñnh dng (format) ca bin này là %9s, ch s ca ñnh dng ñ ch ñnh ñây là bin chui (string) và khi ñó máy tính s không thc hin phép toán s hc trên các 49
bin s này. Sau khi ñã ñt xong tên bin và nhãn bin, chúng ta có th nhp vào nút lnh OK ñ tip tc ñt tên cho bin s gii tính ct 2 bng cách nhp ñúp vào ct s 2
Ta hãy khai báo tên bin ct này là gioi và nhãn ca bin này là gioi tinh. ðnh dng ca bin này là %8.0g. ðnh dng này nhm cho bit ñây là bin th hin bng con s ( g), bin s này có 8 ch s trưc du thp phân và 0 (không) con s nào sau du thp phân.
Do chúng ta mun th hin là 1 là mã hóa cho giá tr Nam ca bin s, 0 là mã hóa ca giá tr N ca bin gii. Chúng ta phi khai báo nhãn giá tr (Value label) bng cách nhp vào nút lnh Define/Modify. 50
Khi khi ca s "label define – Define value labels" ñã hin ra chúng ta nhp vào nút lnh Define ca ca s này ñ to ra nhãn giá tr mi. ðt tên ca nhãn (Label name) là gioi (lưu ý: có th ñt tên ca nhãn ging hoc khác vi tên ca bin – Trong trưng hp này tên ca nhãn trùng vi tên ca bin)
Và sau ñó nhp vào OK. Sau khi ca s Add value hin ra, nhp giá tr mã hóa (value) 1 vào hp văn bn value và nhp giá tr chưa mã hóa (text) nam vào hp văn bn text và sau ñó nhp nút lnh OK.
51
Ca s Add value li hin ra mt ln na, nhp giá tr mã hóa (value) 0 vào hp văn bn value và nhp giá tr chưa mã hóa (text) nu vào hp văn bn text và sau ñó nhp nút lnh OK.
Ca s Add value li hin ra thêm mt ln na. Tuy nhiên ln này chúng ta không nhp vào các hp văn bn value và hp văn bn text, mà ch nhp vào nút lnh Cancel bi vì chúng ta ñã khai báo ñy ñ cách mã hóa ca bin s gii
52
Sau ñó chúng ta nhp vào nút lnh Close ca ca s label define – Define value labels. ca s Variable properties nhp vào hp combo trên nút lnh Define/Modify ñ chn nhãn giá tr gioi.
Sau ñó nhp nút lnh OK ca ca s Variable properties ñ hoàn tt phn khai báo cho bin gii. Tương t chúng ta cũng ñi tên và nhãn ca bin var3 thành duonghuyet và duong huyet luc doi.
53
Sau khi ñã hoàn thành nhp liu và mô t thuc tính ca bin s, chúng ta ñóng s liu li bng cách Close ca s Data Editor. Khi ñó hãy quan sát ca s Variable th hin có 3 bin s ten, gioi, duonghuyet và các ñc tính ca bin này (nhãn, loi, ñnh dng). Mt cách khác ñ ñi tên bin bng cách nhp chut phi tên bin ca s Variables:
3. Thng kê mô t cho bin ñnh tính vi lnh tab1 ð làm thng kê mô t cho bin ñnh tính chúng ta s dng s dng lnh tab1: . tab1 varlist
(Statistics :: Summaries, tables, and tests :: Tables :: Multiple one-way tables) C th trong trưng hp này, ñ có bng phân phi tn sut ca gii tính, bn hãy gõ lnh 54
. tab1 gioi -> tabulation of gioi gioi |
Freq.
Percent
Cum.
------------+----------------------------------nu |
2
40.00
40.00
nam |
3
60.00
100.00
------------+----------------------------------Total |
5
100.00
bng kt qu Freq. là vit tt ca frequency có nghĩa là tn sut, Percent là phn trăm và Cum. là ch vit tt ca Cummulative percent có nghĩa là phn trăm cng dn. Cn lưu ý là ch nên s dng phn trăm cng dn trong bng tn sut ca bin ñnh lưng phân nhóm hay bin th t. Trong bng này giá tr n ñưc lit kê trưc vì nó ñưc mã hóa bng giá tr 0 nh hơn giá tr mã hóa 1 ca giá tr nam
4. Thng kê mô t cho bin ñnh lưng vi lnh sum ð làm thng kê mô t cho bin ñnh tính chúng ta s dng s dng lnh tab1: . summarize varlist
(Statistics :: Summaries, tables, and tests :: Summary and Descriptive Statistics :: Summary statistics) C th trong trưng hp này, ñ bit trung bình, ñ lch chun, giá tr ti thiu và ti ña ca bin ñưng huyt, bn hãy gõ lnh . summarize duonghuyet
Hoc ñơn gin hơn . sum
duonghuyet
Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------duonghuyet |
5
102
19.23538
80
130
bng kt qu Obs có nghĩa là s quan sát, mean là trung bình (hay chính xác hơn là trung bình cng), Std. Dev. là vit tt ca Standard Deviation có nghĩa là ñ lch chun, Min là giá tr ti thiu và Max là giá tr ti ña.
5. Thng kê phân tng theo nhóm Trong các nghiên cu có nhng trưng hp chúng ta thưng phi thc hin thng kê phân tng theo nhóm thí d như cn xác ñnh t l suy dinh dưng ca tr dưi 5 tui phân tng theo nơi cư trú (có nghĩa là xác ñnh t l suy dinh dưng ca tr dưi 5 tui ni thành và t l suy dinh dưng tr dưi 5 tui ngoi thành), t l có kin thc ñúng theo ngh nghip (t l có kin thc ñúng nhóm công nhân, nhóm nông dân, nhóm ngh nghip khác) hoc ñưng huyt trung bình theo gii tính (ñưng huyt trung bình nhóm nam và ñưng huyt trung bình nhóm n). Tin t (prefix) bysort có th s dng trưc các lnh thng kê ñ thc hin các phân tích thng kê phân tng.
55
Cú pháp cho vic s dng tin t bysort là : bysort varlist: Stata_command
C th ñ bit trung bình, ñ lch chun, giá tr ti thiu và ti ña ca bin ñưng huyt phân tng theo gii cn s dng tin t bysort gioi trưc lnh thng kê cho bin ñưng huyt . bysort gioi: sum duonghuyet -> gioi = nu Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------duonghuyet |
2
105
7.071068
100
110
------------------------------------------------------------------------------------> gioi = nam Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------duonghuyet | 3 100 26.45751 80 130
Kt qu này cho bit ñưng huyt trung bình ca 3 ngưi nam là 100 mg% và ca 2 ngưi n là 105 mg%.
6. Trng s Nu chúng ta là mt nghiên cu và bit ñưc ñưng huyt trung bình ca 3 ngưi nam là 100 mg% và ca 2 ngưi n là 105 mg%, vy ñưng huyt trung bình ca c 2 nhóm s là bao nhiêu? Nu s ngưi nhóm nam và nhóm n bng nhau thì ñưng huyt trung bình ca chung 2 nhóm s là trung bình ca ñưng huyt trung bình ca nhóm nam (100 mg%) và ñưng huyt trung bình ca nhóm n (105 mg%) và s là 102,5 mg%. Tuy nhiên trong trưng hp này không ñúng vì s ngưi nhóm nam (3 ngưi) khác vi s ngưi nhóm n. Khi ñó ñưng huyt trung bình ca chung 2 nhóm s là trung bình ca ñưng huyt trung bình ca nhóm nam (100 mg%) vi trng s là 3 và ñưng huyt trung bình ca nhóm n (105 mg%) vi trng s là 2. Chúng ta hãy minh ha các tính này vi Stata bng cách xóa b s liu cũ và nhp s liu mi vào . clear . edit
Và nhp s liu như sau:
56
Sau ñó chúng ta có th s dng lnh summarize vi trng s ñ tính ñưng huyt trung bình chung ca c 2 nhóm: . summarize duonghuyet [fweight = trongso] Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------duonghuyet |
5
102
2.738613
100
105
Có th nhn xét rng nu chúng ta s dng trung bình có trng s t các trung bình tng nhóm chúng ta s có con s trung bình chung có giá tr. ð lch chun (standard deviation) trong trưng hp này là 2,74 không sai nhưng phi lí gii khác ñi. ð lch chun này không nói lên s phân tán ca giá tr cá th chung quanh giá tr trung bình mà nói lên s phân tán ca trung bình nhóm chung quanh giá tr trung bình chung. Vì vy ñ lch chun này là ñ lch chun gia các nhóm (hay còn li là between group standard deviation) và Tng bình phương sai lch gia các nhóm s bng phương sai gia các nhóm nhân vi căn bc hai ca c mu -1 . Chúng ta s quay tr li khái nim này trong phn phân tích phương sai (analysis of variance) nhưng chúng ta cũng nhân thí d này ñ minh ha cho công thc ñưc s dng rng rãi trong phân tích phương sai là: SS =1480=4 x 19.23538 2= SS b + SSw k
SS b
= ∑ N j ( X j − X ) 2 = ( N − 1) × Var b = 4 × 2.7386132 = 30 j =1 k
SS w
= ∑ ( N j − 1) s j2 = 2 × 26.457512 + 1 × 7.071068 2 = 1450 j =1
Trong ñó kí hiu s ñi tưng trong mi nhóm là N 1, N2, …, Nk . S ñi tưng trong nhóm j ñưc kí hiu là N j. Tng s ñi tưng trong tt c các nhóm là N1+ N2+ …+ Nk = N. S liu ñưc trình bày như sau
57
Mô t s liu vi Stata 10.0 for Windows Chương này s hưng dn bn phương pháp mô t s liu vi phn mm Stata 10.0 s dng b s liu ivf.dta có trong thư mc C:\DATA sau khi bn cài ñt các tp tin s liu mu. Thông thưng trưc khi mô t s liu chúng ta cn thc hin bưc chun b và vic thao tác s liu (data processing). Công tác chun b bao gm vic m tp tin s liu, m tp tin log (Open log file), kho sát s liu có bao nhiêu bn ghi và có nhng bin s nào cũng như nghiên cu ñ cương nghiên cu (ch yu là mc tiêu nghiên cu) ñ giúp vic phân loi bin s. Vic thao tác s liu là vic rà soát s liu có b sai sót hay nhm ln gì hay không, to bin s mi theo yêu cu ca phân tích và tin hành vic dán nhãn s liu ñ giúp cho vic hiu rõ hơn s liu và ñc kt qu ca phân tích thng kê. Trưc tiên chúng ta hãy khi ñng Stata theo cách ñã hưng dn chương Khi ñng Stata. Sau ñó thc hin các bài tp 1 ñn 3 cho công tác chun b và các bài tp 4 ñn 6 cho công tác thao tác s liu. 1- M tp tin ivf_v.dta và m tp tin log Khi ñng ca s Use New Data bng cách 1 trong 2 cách: - Nhn nút công c m file ( - Chn menu File :: Open
v trí ñu tiên trên thanh công c).
Sau khi ca s Use New Data s hin ra. Nhp vào mũi tên bên phi hp Look in ñ chn ñĩa thích hp và dùng con chut nhp vào các thư mc ñ chn thư mc có cha s liu (thông 58
thưng tp tin s liu nm thư mc C:\Data). Tìm tp tin s liu ivf_v.dta, nhp ñúp vào tên tp tin này ñ m tp tin (hoc nhp vào tp tin này ñ tên tp tin rơi vào hp File Name ri sau ñó nhp vào nút lnh Open ñ m tp tin). ð lưu tr li toàn b kt qu phân tích s ñưc thc hin, cn nh nhp vào nút công c Stata Log nm v trí th tư t trái trên thanh công c ñ bt ñu log kt qu (begin log). Máy tính s hin ra hp thoi Begin Logging Stata Output ñ chúng ta chn tên tp tin (File name) và thư mc lưu (Save In) ca tp tin log.
Thí d chúng ta mun lưu tp tin log vi tên là ivf_v.smcl vào thư mc c:\data; chúng ta nhp vào các thông tin như trên. Khi ñó cui ca s kt qu có thanh trng thái vi dòng ch log on (smcl) cho bit là tt c các kt qu phân tích ñang ñưc ghi chép li (log).
2. Kho sát các bin s ca tp tin và nghiên cu mc tiêu nghiên cu ñ phân loi bin s Hưng dn: ð xem lit kê các bin s chúng ta có th nhn phím chc năng F3 hay s dng 59
menu (nhp vào menu Data :: Describe data :: Describe variable in memory) ñ xem các bin s ca s liu
Chúng ta có th xem danh sách các bin s lit kê sau: . describe Contains data from C:\DATA\ivf_v.dta obs:
641
vars:
7
size:
15 Aug 2006 15:27
20,512 (99.8% of memory free)
------------------------------------------------------------------------------storage variable name
type
display
value
format
label
variable label
------------------------------------------------------------------------------maso
float
%9.0g
ma so
tuoime
float
%9.0g
tuoi me (nam)
tangha
float
%9.0g
tang huyet ap thai ki - 1=tang ha, 0=khong tang ha
tuoithai
float
%9.0g
tuoi thai (tuan)
gioi
float
%9.0g
gioi tinh tre - 1=trai, 0=gai
tlsosinh
float
%9.0g
trong luong so sinh (gram)
nghenghiep
float
%9.0g
nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc
------------------------------------------------------------------------------Sorted by:
maso
Gi s t ñ cương nghiên cu chúng ta bit ñây là tp tin ca s liu 641 ña tr ñưc sinh t bà m th thai trong ng nghim (in-vitro fertilisation) vi mc tiêu nghiên cu là xem tui thai và tăng huyt áp trong thai kì có nh hưng lên trng lưng thai hay không. Cách lí gii s liu ñưc minh ha STT Tên bin
Ý nghĩa ca bin
Phân loi bin s: (ðc lp hay Ph thuc) – (ðnh tính hay ñnh lưng)
60
1
Maso
Mã s
2
Tuoime
Tui ca m (năm tui)
3
Tangha
Tăng huyt áp thai kì 1= có 0= không
4
Tuoithai
Tui thai (tính theo tun)
5
Gioi
Gii tính ca tr 1=trai 0=gái
6
Tlsosinh
Trng lưng sinh tính theo grams
7
Nghenghiep Ngh nghip ca m 1=t do 2=công nhân 3=viên chc
3. Làm th nào ñ xem s liu Hưng dn: Có th xem s liu bng 2 cách: - Dùng nút lnh Data Browser (v trí 3 tính t phía bên phi ca thanh công c) - Dùng menu Data :: Data browser (read-only editor)
S dng Data Browser cho phép nhìn s liu trong lưi (như các ô ca chương trình Excel) nhưng nó không cho phép in s liu. Mun nhìn s liu ra ca s kt xut (output) ñ sau ñó in ra hãy s dng menu Data:: Describe Data :: List data. 4. Hãy thc hin thng kê mô t tt c các bin s trong b s liu này: Hưng dn: trưc tiên chúng ta phi xác ñnh bin s nào là bin s ñnh lưng và bin s nào là bin s ñnh tính. Sau ñó thc hin thng kê mô t cho các bin s: ñi vi bin ñnh lưng, thc hin lnh summarize ñ ñ có trung bình và ñ lch chun, ñi vi bin ñnh tính thc hin lnh tab1 ñ có bng phân phi tn sut ca các bin s. Trong b s liu này có các bin tuoime, tuoithai, tlsosinh là bin ñnh lưng. ð mô t bin s này chúng ta s dng menu Statistics :: Summaries, tables, & tests :: Summary Statistics.
61
Sau khi hp thoi Summarize hin ra, thc hin các bưc sau:
Bưc 1: Dùng con chut nhp vào du mũi tên xung ( có danh sách các bin s ñưc s ra.
) ca hp combo Variables. Khi ñó s
Bưc 2: Di chuyn con tr trong danh sách các bin, và nhp vào các bin cn mô t thng kê 62
(tuoime, tuoithai, tlsosinh) ñ tên các bin này xut hin trên hp văn bn Variables
Bưc 3: Nhp vào nút lnh OK Kt qu ñưc trình bày nhưu sau: . summarize tuoime tuoithai tlsosinh Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------tuoime | 641 33.97192 3.87046 23 43 tuoithai | 641 38.68725 2.329931 24.69 42.35 tlsosinh | 641 3129.137 652.7827 630 4650
Các bin s ñnh tính bao gm tang_ha (tăng huyt áp), gioi (gii tính ca tr), nghenghiep (ngh nghip ca m). ð tóm tt các bin s ñnh tính này (tang_ha, gioi, nghenghiep) chúng ta s dng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.
63
Các bưc thc hin gm: - Bưc 1: Dùng con chut nhp vào du mũi tên xung ( variables. Khi ñó s có danh sách các bin s ñưc s ra.
) ca hp combo Categorical
Bưc 2: Di chuyn con tr trong danh sách các bin, và nhp vào các bin cn mô t thng kê (tang_ha, gioi, nghenghiep) ñ tên các bin này xut hin trên hp combo Categorical variables Bưc 3: nhp nút lnh OK ñ hoàn tt . tab1 tang_ha gioi nghenghiep -> tabulation of tang_ha tang huyet | ap thai ki | - 1=tang | ha, 0=khong | tang ha | Freq. Percent Cum. ------------+----------------------------------0 | 552 86.12 86.12 1 | 89 13.88 100.00 ------------+----------------------------------Total | 641 100.00 -> tabulation of gioi gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------0 | 315 49.14 49.14 1 | 326 50.86 100.00 ------------+----------------------------------Total | 641 100.00 -> tabulation of nghenghiep
64
nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------1 | 104 16.22 16.22 2 | 238 37.13 53.35 3 | 299 46.65 100.00 ------------+----------------------------------Total | 641 100.00
5. Các tóm tt s liu như trên là ñt yêu cu. Tuy nhiên vic mã hoá các giá tr ca bin s khin cho vic ñc bng bng tn sut ca bin s danh ñnh (như gioi và nghenghiep) b khó khăn (nht là cho nhng ngưi không trc tip làm thng kê hay phi ñc li kt qu sau mt khong thi gian dài). Do ñó nhng ngưi làm thng kê chuyên nghip luôn luôn thc hin ghi chú (dán nhãn) cho các bin s ñnh tính. Hãy thc hin vic dán nhãn s liu. Hưng dn: Vic dán nhãn cho các giá tr mã hóa là vic làm tn công nhưng nó giúp phân bit ngưi làm thng kê chuyên nghip và ngưi làm thng kê không chuyên nghip. Mc dù tn công nhưng li ích do nó ñem li vưt qua công sc b ra vì vy chúng ta cn phi thc hin vic dán nhãn này. Vic dán nhãn giá tr bin s ñưc thc hin qua 2 bưc: to nhãn (define label value) và dán nhãn cho giá tr (Assign value label to variable). - To nhãn sex, tang_ha, nhãn nghenghiep ð to nhãn s dng menu Data :: Labels :: label values :: Define or modify value label. Ca s Define value label s ñưc hin ra.
Khi khi ca s "label define – Define value labels" ñã hin ra chúng ta nhp vào nút lnh Define ca ca s này ñ to ra nhãn giá tr mi. ðt tên ca nhãn (Label name) là sex (lưu ý: có th ñt tên ca nhãn ging hoc khác vi tên ca bin – Trong trưng hp này tên ca nhãn (sex) khác vi tên ca bin(gioi))
65
Và sau ñó nhp vào OK.
Sau khi ca s Add value hin ra, nhp giá tr mã hóa (value) 1 vào hp văn bn value và nhp giá tr chưa mã hóa (text) nam vào hp văn bn text và sau ñó nhp nút lnh OK.
66
Ca s Add value li hin ra mt ln na, nhp giá tr mã hóa (value) 0 vào hp văn bn value và nhp giá tr chưa mã hóa (text) nu vào hp văn bn text và sau ñó nhp nút lnh OK.
Ca s Add value li hin ra thêm mt ln na. Tuy nhiên ln này chúng ta không nhp vào các hp văn bn value và hp văn bn text, mà ch nhp vào nút lnh Cancel bi vì chúng ta ñã khai báo ñy ñ cho tên nhãn sex
67
Sau ñó có th nhp vào nút lnh Close (ca hp thoi Define value labels) ñ thoát ra hay nhp vào nút lnh Define (ca hp thoi Define value labels) ñ tip tc to nhãn tang_ha.
Vi các cách mã hóa ñưc quy ñnh trong nhãn có tên tang_ha là: 1 là có tăng huyt áp và 0 là không tăng huyt áp.
68
Cn lưu ý: tên nhãn có th khác vi tên bin (thí du như trưng hp trên ta ñt tên nhãn là sex trong khi tên bin là gioi) hoc tên nhãn có th trùng vi tên bin (thí d ta có th ñt tên nhãn là tang_ha cho bin tang_ha). Tương t ta cũng tip tc to nhãn nghenghiep bng cách nhp vào nút lnh define và sau ñó nhp tên ca nhãn nghenghiep vào hp văn bn label name ri nhp OK.
Tip tc quy ñnh cách mã hóa ca nhãn có tên nhãn nghenghiep là: 1 là có nghe t do và 2 là công nhân và 3 là viên chc.
69
ð hoàn tt vic to nhãn ta nhn vào nút lnh Close
Dán nhãn giá tr (Assign value label) cho các bin gioi, tang_ha, và nghenghiep Sau khi dã to ñưc nhãn, chúng ta hãy dán nhãn giá tr cho bin s bng cách dùng menu Data :: Labels :: Label values :: Assign value label to variable
Khi hp thoi labels value – Attach value label hin ra ñ dán nhãn sex cho mi bin s gioi cn thc hin 4 bưc sau:
70
- Bưc 1: khung Add or remove value label, ñm bo là nút chn Attach a value label to variable ñưc chn. - Bưc 2: ðt con tr vào hp combo Variable; chn bin gioi trong hp combo này. - Bưc 3: ðưa con tr vào hp combo Value lable và chn nhãn sex hp combo này - Bưc 4: Nhp vào nút lnh Submit ñ thc hin vic dán nhãn. ð tip tc thc hin tương t ñ dán nhãn tang_ha cho bin tang_ha, hãy tin hành các bưc sau:
- Bưc 1: khung Add or remove value label, ñm bo là nút chn Attach a value label to variable ñưc chn. - Bưc 2: ðt con tr vào hp combo Variable; chn bin tang_ha trong hp combo này. - Bưc 3: ðưa con tr vào hp combo Value lable và chn nhãn tang_ha hp combo này 71
- Bưc 4: Nhp vào nút lnh Submit ñ thc hin vic dán nhãn. ð tip tc thc hin tương t ñ dán nhãn nghenghiep cho bin nghenghiep, hãy tin hành các bưc sau:
- Bưc 1: khung Add or remove value label, ñm bo là nút chn Attach a value label to variable ñưc chn. - Bưc 2: ðt con tr vào hp combo Variable; chn bin nghenghiep trong hp combo này. - Bưc 3: ðưa con tr vào hp combo Value lable và chn nhãn nghenghiep hp combo này - Bưc 4: Bi vy ñây là bưc dán nhãn cui cùng, do ñó không nhp vào nút lnh Submit ñ thc hin vic dán nhãn và nhp vào nút lnh OK ñ ñng thi thc hin vic dán nhãn và ñóng ca s label values 6. Lp bng phân phi tn sut cho các bin s ñnh tính sau khi ñã dán nhãn cho các bin này. Hưng dn: Các bin s ñnh tính ñã ñưc dán nhãn bao gm tang_ha sex matagegp gestcat. ð tóm tt các bin s ñnh tính này (tang_ha sex matagegp gestcat) chúng ta s dng menu Statistics :: Summaries, tables & test :: Tables :: Multiple one-way tables.
72
Khi hp thoi tab1 – One-way tables hin ra, chúng ta tin hành 3 bưc (1) ñt con tr vào hp Categorical value (2) Nhp vào ca s variable ñ chn các bin s tin hành phân tích và (3) Nhp vào nút lnh OK. Kt qu s xut hin như sau: . tab1 gioi tang_ha nghenghiep -> tabulation of gioi gioi tinh | tre - | 1=trai, | 0=gai | Freq. Percent Cum. ------------+----------------------------------gai | 315 49.14 49.14 trai | 326 50.86 100.00 ------------+----------------------------------Total | 641 100.00 -> tabulation of tang_ha tang huyet ap | thai ki - | 1=tang ha, | 0=khong tang | ha | Freq. Percent Cum. --------------+----------------------------------huyet ap bt | 552 86.12 86.12
73
huyet ap tang | 89 13.88 100.00 --------------+----------------------------------Total | 641 100.00 -> tabulation of nghenghiep nghe nghiep | me - 1=tu | do, 2=cong | nhan, | 3=vien chuc | Freq. Percent Cum. ------------+----------------------------------tu do | 104 16.22 16.22 cong nhan | 238 37.13 53.35 vien chuc | 299 46.65 100.00 ------------+----------------------------------Total | 641 100.00
7. V t chc ñ (histogram) ca bin trng lưng sơ sinh (tlsosinh) Hưng dn: ð v t chc ñ, ta phi s dng menu Graphics :: Histogram
Khi hp thoi histogram hin ra, chúng ta thc hin các bưc sau:
74
Bưc 1: ñt con tr vào hp combo Variable nhp vào mũi tên xung bên phi hp combo ñ s ra danh sách các bin Bưc 2: T trong danh sách các bin chn tlsosinh ñ ñưa bin này vào hp combo Variable. Bưc 3 – Bưc 4: nhm ñ xác ñnh t chc ñ s bt ñu t giá tr 600 (Lower limit of first bin) và mi khong tip theo (bin) có ñ rng là 300 (Width of bins) Bưc 5: Cho bit t chc ñ s ghi nhn t l phn trăm ca các khong giá tr bng cách nhp vào nút chn Percent. Nu mun th hin mt ñ ca phân phi, nhp vào nút chn Density, nu mun th hin t l thì nhp vào nút chn Fraction, nu mun th hin tn sut thì nhp vào nút chn Frequency. Mi liên h gia các hàm phân phi này như sau: T l (Fraction) = Tn sut (Frequency) / C mu (N) Mt ñ (Density) = T l (Fraction) / ð rng ca khong chia (Width of bins) Kt qu tip theo s ñưc trình bày trong hình sau.
75
5 2
0 2
5 t 1 n e c r e P 0 1
5
0
1000
2000 3000 4000 t r o ng l u on g s o s i n h ( g r a m)
5000
8. ð th này cho chúng ta thy hình dng ca phân phi s liu, tuy nhiên chúng ta cũng có th thay ñi thưc hin vic chia khong cho trc hoành, ghi chú cho trc hoành, chia khong cho trc tung và ghi chú cho trc tung. Gi s chúng ta mun thc hin các yêu cu chia khong và ghi chú như sau: • Trc hoành phi có khong giá tr t 600 ñn 4800 (biên ñ là 4200). Chúng ta mun chia làm mi khong có ñ ln là 300 như vy cn thit phi có 14 khong. Chúng ta cũng mun ghi giá tr t 600 ñn 4200 và mi nhãn giá tr cách nhau 600 gram. • Trc hoành ñưc ghi chú là "trong luong so sinh (gram) cua 641 tre" • Trc tung có khong giá tr là 0 ñn 0.3, ghi nhãn cho các giá tr và các nhãn này cách nhau 0.1 • Trc tung ñưc ghi chú là "Phn trăm" (ch không phi là Percent). Các bưc ñ thc hin chia khong và ghi chú cho trc hoàng (trc X) như sau: Bưc 1: Nhp vào Tab X-axis Bưc 2: ð nhp ghi chú cho trc hoành, hp văn bn Title, nhp vào ghi chú là "trong luong so sinh (gram)" Bưc 3: ð chia khong cho trc hoành, chn Major tick/label property, chn Range/Delta và sau ñó nhp các giá tr ti thiu, ti ña và khong delta.
76
Sau ñó nhp vào nút lnh accept. Các bưc ñ thc hin chia khong và ghi chú cho trc hoàng (trc Y) như sau:
Bưc 4: Nhp vào Tab Y-axis Bưc 5: ð nhp ghi chú cho trc tung, hp văn bn Title, nhp vào ghi chú là "Phan tram"
77
Bưc 6: ð chia khong cho trc tung, chn Major tick/label property, chn Range/Delta và sau ñó nhp các giá tr ti thiu, ti ña và khong delta.
Nhp vào nút lnh Accept. Bưc 7: Nhp vào nút lnh OK cui ca s ñ hoàn tt
m ¨ r t n Ç h P
3 2 1 0 . .
600
1200
1800 2400 3000 3600 Tr ä ng l - î n g s ¬ si n h ( g r a m)
4200
4800
9. Chúng ta cũng có th v ñ th xut (p-p plot) ñ xem bin s tlsosinh có tuân theo phân phi bình thưng 78
Hưng dn: S dng menu Graph – Distributional graph - normal quantile plot
Khi ca s qnorm hin ra, chúng ta tin hành các bưc sau: Bưc 1: ñt con tr vào hp văn bn Variable Bưc 2: ñưa con tr vào ca s Variables và nhp vào bin tlsosinh ñ ñưa bin này vào hp văn bn Variable. Bưc 3: ðánh du vào hp kim: Show grid at percentiles: Bưc 4: Nhp vào nút lnh OK
79
Kt qu như sau:
80
Nu phân phi bình thưng thì ñưng cong phân phi (ñưng nét ñm) s trùng vi ñưng chéo ca hình ch nht (ñưng thng mnh). Nu phân phi lch âm thì xác sut 0,5 ñưng cong phân phi nm bên trái ñưng chéo. Nu phân phi lch dương thì xác sut 0,5 ñưng cong phân phi s nm bên phi ñưng chéo. Nu ñ dc ca ñưng cong phân phi ln hơn mt (1) có nghĩa là phân phi thc nghim tăng chm hơn phân phi bình thưng, nu ñưng cong phân phi nh hơn mt (1) có nghĩa là ñưng cong thc nghim tăng nhanh hơn phân phi bình thưng. Như vy, phân phi ca trng sơ sinh b lch trái và khong trng lưng thp, phân phi trng lưng sơ sinh tăng chm hơn phân phi chun. khong trng lưng cao trng lương sơ sinh tăng hơi nhanh hơn phân phi chun. 5 1 .
1 . n o i t c a r F 5 0 .
0
1000
2000 3000 trong lu ong so sinh (gram)
4000
5000
10. Hãy v biu ñ hình thanh (bar chart) ca nhóm ngh nghip Hưng dn: Trưc tiên s dng menu Graphics :: Bar chart ð hin ra ca s graph bar – Chúng ta hãy ñ ý 2 th Main và th Categories là 2 th nm bên trái ca ca s.
81
th Main tin hành các bưc sau: Bưc 1: Chn mc count nonmissing trong hp Combo Statistic Bưc 2: ðt con tr vào hp văn bn variable(s) nhp vào mũi tên hưng xung dưi bên phi hp combo ñ hin ra danh sách bin s. Bưc 3: ðưa con tr chut ñ chn danh sách bin s và nhp vào bin maso ñ bin này xut hin trên hp văn bn Variable(s) Bưc 4: Nhp vào th (tab) Categories ñ hin th này ra
82
Bưc 5: Khi ñã th Categories, ñưa con tr chut vào hp văn bn Variable Bưc 6: ðt con tr vào hp văn bn variable(s) nhp vào mũi tên hưng xung dưi bên phi hp combo ñ hin ra danh sách bin s. Bưc 7: ðưa con tr chut ñ chn danh sách bin s và nhp vào bin nghenghiep ñ bin này xut hin trên hp văn bn Variable(s) Bưc 8: Nhp vào nút lnh OK ñ xem biu ñ hình thanh ñưc to ra.
83
0 0 3
0 o 0 s 2 a m f o t n u o c 0 0 1
0
t u do
cong nhan
vi en chuc
11. Hãy v biu ñ hình thanh (bar chart) trung bình trng lưng sơ sinh ca các ña tr con ca nhng bà m có ngh nghip khác nhau. Hưng dn: Trưc tiên s dng menu Graphics :: Bar chart ð hin ra ca s graph bar – Chúng ta hãy ñ ý 2 th Main và th Categories là 2 th nm bên trái ca ca s.
84
th Main tin hành các bưc sau: Bưc 1: Chn mc mean trong hp Combo Statistic Bưc 2: ðt con tr vào hp văn bn variable(s) nhp vào mũi tên hưng xung dưi bên phi hp combo ñ hin ra danh sách bin s. Bưc 3: ðưa con tr chut ñ chn danh sách bin s và nhp vào bin tlsosinh ñ bin này xut hin trên hp văn bn Variable(s) Bưc 4: Nhp vào th (tab) Categories ñ hin th này ra
85
Bưc 5: Khi ñã th Categories, ñưa con tr chut vào hp văn bn Variable Bưc 6: ðt con tr vào hp văn bn variable(s) nhp vào mũi tên hưng xung dưi bên phi hp combo ñ hin ra danh sách bin s. Bưc 7: ðưa con tr chut ñ chn danh sách bin s và nhp vào bin nghenghiep ñ bin này xut hin trên hp văn bn Variable(s) Bưc 8: Nhp vào nút lnh OK ñ xem biu ñ hình thanh ñưc to ra.
86
0 0 0 , 3
h n 0 i 0 s 0 o , s 2 l t f o n a e 0 0 m 0 , 1
0
t u do
c ong nha n
v i e n c hu c
12. Hãy v biu ñ hình bánh (Pie chart) phân phi bin s ngh nghip m (nghenghiep). Hưng dn: Trưc tiên s dng menu Graphics :: Pie Chart
ð thc hin biu ñ hình bánh, chúng ta tip tc các bưc sau: Bưc 1: Lưu ý ñ nút chn Graph by categories ñưc ñánh du Bưc 2: ðt con tr vào hp combo Category variable và nhp vào mũi tên xung bên phi ñ s ra danh sách bin. Bưc 3: Dùng con tr chn bin nghenghiep (ngh nghip m) trong danh sách bin ñ tên bin này xut hin trên hp combo Category variable. Bưc 4: Nhp vào nút lnh OK
87
Chúng ta s có ñưc biu ñ hình bánh như sau:
88
t u do v i e n c h uc uc
c o ng nh an
13. Hãy to bin mi nhomtuoi, bin này có giá tr 0 tương ng vi tui ca m t thp nht ñn 29 1 tưong ng vi tui m t 30 ñn 34 2 tưong ng vi tui m t 35 ñn 39 3 tưong ng vi tui m t 40 tr lên ðiu này có nghĩa là chúng ta chia tui m làm 4 nhóm vi 3 ñim chia là 30, 35 và 40. ðiu này có th thc hin bng cách to bin mi vi hàm irecode. 0
1 29-30
2 34-35
3 39-40
Cách thc hin vic to bin mi ñưc thc hin vi menu Create or Change variables :: Create new variable
89
Sau khi ca s generate - Generate a new variable thc hin vic to bin mi vi các bưc sau:
Bưc 1: Nhp tên bin mi (nhomtuoi) vào hp văn bn Generate variable Bưic 2: Nhp công thc to bin mi irecode(tuoime,29,34,39) Bưc 3: Nhp vào nút lnh OK ñ hoàn tt Sau khi to ra bin mi nhomtuoi, chúng ta nên thc hin thêm 2 bưc: to nhãn (define label value) và dán nhãn giá tr cho bin s (Assign value label to variable) như ñưc trình bày bưi 5. (0 là dưi 30; 1 là 30 den 34; 2 là 35-39; 3 là 40+) 14. Hãy to bin mi sinh non, bin này có giá tr 1 tương ng vi tui thai <37 0 tưong ng vi tui thai >=37 tun Yêu cu có nghĩa là chúng ta cn to ra mt bin nh giá vi 2 giá tr 0 và 1.. ðiu này có th thc hin bng cách to bin mi và s dng biu thc boolean (biu thc th hin mt mnh ñ
90
có giá tr là ñúng hay sai) Vic thc hin c th bao gm vic to bin mi ñưc thc hin vi menu Create or Change variables :: Create new variable
Sau khi ca s generate - Generate a new variable thc hin vic to bin mi vi các bưc sau:
Bưc 1: Nhp tên bin mi (sinhnon) vào hp văn bn Generate variable Bưic 2: Nhp công thc to bin mi tuoithai<37 Bưc 3: Nhp vào nút lnh OK ñ hoàn tt Sau khi to ra bin mi sinhnon, chúng ta nên thc hin thêm 2 bưc: to nhãn (define label value) và dán nhãn giá tr cho bin s (Assign value label to variable) như ñưc trình bày bưi 5. (1 là sinh non, 0 là không sinh non) 15. Lưu li s liu Hưng dn: ð lưu s liu chúng ta có th s dng menu File :: Save (hay Ctrl-S) hoc nhn
91
vào nút save file (v trí th hai ca thanh công c). Mt hp thoi s bt lên và hi chúng ta có mun chép chng vào tp tin s liu hay không. Nu ñng ý chúng ta hãy nhp vào nút OK ñ ñng ý.
Nu chúng ta không mun thay ñi tp tin s liu cũ, chúng ta nên nhp vào nút Cancel và lưu s liu vi tên mi s dng menu File :: Save As. khi ñó hp thoi "Save Stata Data File" s hin ra. Gõ tên mi vào hp File Name (thí d nu chúng ta mun ñt tên tp tin là ivf_revised.dta thì chúng ta gõ vào hp văn bn File name: ivf_revised)
nhp nút lnh Save ñ hoàn tt. 16. Hãy thoát khi chương trình Stata Hưng dn: ð thoát khi Stata/SE 10.0 for Windows chúng ta có th thc hin mt trong 2 vic sau: - Nhp vào ô ñóng nm phía trên phi ca ca s Stata
92
Lưu ý: Trong trưng hp có d liu trong b nh và d liu ñó ñã ñưc thay ñi nhưng chưa ñưc lưu vào ñĩa thì khi chúng nhp vào ô ñóng, máy tính s hi chúng ta rng chúng ta có mun thoát mà không lưu li s liu hay không.
Nu chúng ta ñng ý bng cách nhp vào nút lnh Yes thì Stata s thoát, nu không (nhp nút lnh No) thì chúng ta li tr li Stata ñ chúng ta có th lưu li s liu. - Gõ lnh exit trong ca s Stata Command. Lưu ý: Trong trưng hp có d liu trong b nh và d liu ñó ñã ñưc thay ñi nhưng chưa ñưc lưu vào ñĩa thì khi chúng gõ exit, máy tính s không ñng ý cho chúng ta thoát và s thông báo “ no; data in memory would be lost”. Trong trưng hp này nu chúng mun thoát mà không lưu li s liu thì chúng ta hãy gõ exit, clear. Nu chúng ta mun lưu li s liu hãy s dng lnh save. 17. Nu chúng ta mun xem li các kt qu phân tích ñã ñưc thc hin chúng ta có th xem li tp tin log. Cách xem li tp tin log gm các bưc sau:
93
Bưc 1: Vào menu File:: View Bưc 2: Khi hin ra hp thoi Choose file to View, nhp vào nút lnh Browse, khi ñó ca s Choose file Name s hin ra Bưc 3: Trên ca s Choose file Name, chn thưmc cha tp tin log trong hp thoi Log gin Bưc 4: Chn tp tin log cn xem li (thí d tp tin baitap.smcl) Bưc 5: Nhp vào nút lnh Open ñ ñóng ca s Choose file Name và tr v hp thoi Choose file to view
Bưc 6: Nhp vào nút lnh OK ñ xem tp tin log
94
95
Thng kê phân tích bin s ñnh lưng vi Stata Sơ lưc lí thuyt v so sánh 2 trung bình Kim ñnh t dùng ñ so sánh 2 trung bình ca ca bin s ñnh lương có phân phi bình thưng. Kim ñnh t gm có (a) Kim ñnh t bt cp ñ so sánh trung bình trưc và sau khi can thip trên mt nhóm và (b) kim ñnh t không bt cp ñ so sánh trung bình ca 2 nhóm ñc lp. Có hai loi kim ñnh t không bt cp (khi so sánh trung bình ca 2 nhóm ñc lp). Kim ñnh t có gi ñnh 2 phương sai bng nhau và kim ñnh t không có gi ñnh phương sai bng nhau. Hai loi kim ñnh này có chung nguyên lí nhưng khác nhau trong cách tính toán ñ t do (ca kim ñnh t) và cách tính sai s chun. Kim ñnh t không bt cp gi ñnh 2 phương sai bng nhau Kim ñnh t không bt cp gi ñnh 2 phương sai bng nhau dùng ñ so sánh trung bình ca 2 nhóm ñc lp và ñòi hi 2 gi ñnh. - Các giá tr ca bin s ca c 2 dân s có phân phi bình thưng - Ð lch chun 2 nhóm dân s là bng nhau . Nu chúng ta kí hiu: x1 : giá tr trung bình nhóm 1 x2 : giá tr trung bình nhóm 2 n1 : c mu ca nhóm 1 n2 : c mu ca nhóm 2 2 s1 : phương sai nhóm 1 2 s2 : phương sai nhóm 2 Chúng ta có th xác ñnh ñ t do, sai s chun và giá tr ca thng kê t theo công thc sau: - ð t do ca kim ñnh t: df = n 1 + n2 - 2 - Sai s chun: se = s p 1 / n1 + 1 / n2 vi
(n1 − 1) s12 + (n2 − 1) s22 s p = (n1 − 1) + (n2 − 1) - Giá tr thng kê t: t =
x1 − x 2 se
=
x1 − x2 s p
1 / n1 + 1 / n2
Sau khi tính ñưc giá tr thng kê t, ngưi ta tra bng phân phi t vi (n1 +n1 - 2) ñ t do và tính ñưc xác sut p. Thông thưng nu p <0,05 ngưi ta bác b gi thuyt H 0. Kim ñnh t không bt cp không có gi ñnh 2 phương sai bng nhau Kim ñnh t không bt cp gi ñnh 2 phương sai bng nhau dùng ñ so sánh trung bình ca 2 nhóm ñc lp và ch ñòi hi 1 gi ñnh. - Các giá tr ca bin s ca c 2 dân s có phân phi bình thưng Nu chúng ta kí hiu: x1 : giá tr trung bình nhóm 1 x2 : giá tr trung bình nhóm 2 96
n1 : c mu ca nhóm 1 n2 : c mu ca nhóm 2 2 s1 : phương sai nhóm 1 2 s2 : phương sai nhóm 2 Chúng ta có th xác ñnh ñ t do, sai s chun và giá tr ca thng kê t theo công thc sau: 2 s12 s 22 n + n 2 1 - ð t do ca kim ñnh t (theo công thc ca Satterthwaite): d . f . = 4 s 24 s1 + 2 2 n1 (n1 − 1) n2 (n2 − 1)
- Sai s chun: se =
s12 n1
- Giá tr thng kê t: t =
+
s22 n2
x1 − x2 se
=
x1 − x2 s12 n1
+
s 22 n2
Sau khi tính ñưc giá tr thng kê t, ngưi ta tra bng phân phi t vi ñ t do phù hp (như tính toán trên) và tính ñưc xác sut p. Thông thưng nu p <0,05 ngưi ta bác b gi thuyt H0. Kim ñnh t bt cp Gi s ñ so sánh hiu qu ca thuc A và thuc B trong ci thin th tích th ra gng sc trong 1 giây ñu tiên (FEV1) ngưi ta cho các bnh nhân tham gia nghiên cu dùng thuc A (hay thuc B) trong mt thi gian và cui thi gian này ño lưng FEV1 ca bnh nhân (gi là FEV1A). Sau ñó cho li ñi cho bnh nhân dùng thuc B (hay thuc A) trong mt khong thi gian và cui thi gian này li ño lưng FEV1 ca bnh nhân (gi là FEV1B). Thit k nghiên cu này ñưc gi là th nghim lâm sàng bt chéo. Chúng ta lưu ý các ñc ñim sau khi phân tích thng kê cho các nghiên cu có cùng loi thit k này. - Trong nghiên cu này có 2 bin s ño lưng trên cùng dân s: FEV1A và FEV1B - Các giá tr ca bin s FEV1A và FEV1B là ca cùng mt bnh nhân nên hiu s (FEV1A FEV1B) cũng là bin s ca bnh nhân ñó. Và nu không có s khác bit v hiu qu ca 2 loi thuc, trung bình ca hiu s này bng 0. - Khi ñó kim ñnh so sánh hiu qu ca thuc A và thuc B cũng kim ñnh so sánh giá tr trung bình ca FEV1A và FEV1B kim ñnh hiu s (FEV1A - FEV1B)=0 - Phép kim ñnh này ñưc gi là kim ñnh t bt cp. Kim ñnh t bt cp là trưng hp ñc bit ca kim ñnh t mt mu. Tóm li kim ñnh t bt cp là kim ñnh ñưc s dng khi thit k nghiên cu cho mt ñi tưng (hay 2 ñi tưng rt ging nhau) ñưc th nghim 2 loi thuc khác nhau. Kim ñnh phi tham s Nu phân phi không phi là bình thưng (thí d như b lch dương), có th s dng phép bin ñi (thưng là bin ñi log) ñ ñưa phân phi v bình thưng hoc dùng test phi tham s. Kim ñnh phi tham s có ưu ñim là không ñòi hi gi ñnh v phân phi ca bin s ñnh lưng nhưng có khuyt ñim là không th ưc lưng ñưc tham s, ñó là như không th ưc lưng 97
khong tin cy 95% hiu s ca trung bình gia 2 nhóm.
Sơ lưc lí thuyt v so sánh các trung bình ca 3 nhóm. Khi chúng ta cn so sánh trung bình ca nhiu nhóm, chúng ta không th dùng nhiu kim ñnh t ñ so sánh tng cp ca nhóm vì như vy chúng ta s làm tăng nguy cơ ca sai lm loi 1. Phương pháp thích hp ñ ñưc dùng cho trưng hp này ñưc gi là test ANOVA. Test ANOVA (phân tích phương sai) ñưc xem như là s tng quát hóa ca test t (test t dùng cho 2 nhóm và test ANOVA dùng cho 2 hay nhiu hơn các nhóm). Ðiu kin ñ test ANOVA hp l là các giá tr có phân phi bình thưng và phương sai ca các nhóm xp x nhau. Trong kt xut ca test ANOVA, chúng ta thy có s hin din ca thng kê F (thng kê Fisher). Trong trưng hp ch có 2 nhóm, thng kê F chính xác bng bình phương ca thng kê t và 2 phương pháp cho ra cùng mt mc ý nghĩa. n BPT: ñnh lưng
BPT: th t ðúng
ðúng
BPT:phi phânbình phithưng bình Phân
BPT: danh ñnh ðúng
Kim ñnh χ 2 Kim ñnh phi tham s
Không ñng nht
ðúng
≤ 2 nhóm
Trên 3 nhóm
Phương sai ñng nht
ðúng
Phương sai ñng nht
Không ñ ng nh t
ð ng nh t
ð ng nh t
Kim ñnh t
Kim ñnh t PS không ñng nht
ANOVA
Hình 1. Gii thut la chn kim ñnh phù hp cho bin s ph thuc là bin ñnh lưng
Thc hành 1- M tp tin ivf_v2. Chúng ta hãy khi ñng Stata. M tp tin ivf_v2.dta bng cách s dng menu File :: Open hay nhp vào nút công c Open file (Use), nm v trí th hai ca thanh công c. Khi ñó hp thoi Use New Data s hin ra. Nhp vào mũi tên bên phi hp Look in ñ chn ñĩa thích hp và dùng con chut nhp vào các thư mc ñ chn thư mc có cha s liu. Khi gp tp tin s liu 98
ivf_v2.dta, nhp ñúp vào tên tp tin này ñ m tp tin (hoc nhp vào tp tin này ñ tên tp tin rơi vào hp File Name ri sau ñó nhp vào nút lnh Open ñ m tp tin). Cn nh nhp vào nút công c Stata Log nm v trí th tư t trái trên thanh công c nu mun lưu tr li toàn b kt qu phân tích s ñưc thc hin. 2. Sau khi m tp tin, cn có thông tin gì trưc khi phân tích s liu: Trưc khi phân tích s liu, nhà nghiên cu (hay chuyên viên thng kê) cn ñc li ñ cương nghiên cu, ñc bit là s liu (bin s và s các bn ghi), mc tiêu và thit k nghiên cu. Gi s chúng ta có thông tin v nghiên cu như sau: MRC Working Party on Children Conceived by In Vitro Fertilisation. Births in Great Britain resulting from assisted conception, 1978-87. BMJ 1990;300:1229-33. Births in Great Britain resulting from assisted conception, 1978-87. MRC Working Party on Children Conceived by In Vitro Fertilisation. OBJECTIVE--To describe the characteristics at birth of children conceived by in vitro fertilisation (IVF) or by gamete intrafallopian transfer (GIFT) and to assess whether they differ from those of children conceived naturally. DESIGN--Survey of children resulting from IVF or GIFT and comparison of their characteristics at birth with national statistics. SETTING-England, Scotland, and Wales from 1978 to 1987. SUBJECTS--1267 Pregnancies conceived by IVF or GIFT, which resulted in 1581 liveborn or stillborn children. MAIN OUTCOME MEASURES--Sex ratio, multiplicity, gestational age at birth, birth weight, stillbirth rate, perinatal and infant mortality, and prevalence of congenital malformations. RESULTS--The ratio of male to female births was 1.07:1; 23% (249/1092) of the deliveries were multiple births compared with 1% for natural conceptions; 24% (278) of 1015 deliveries were preterm compared with 6% in England and Wales; 32% (406) of 1269 babies weighed less than 2500 g compared with 7% in England and Wales. The high percentage of preterm deliveries and of low birthweight babies was largely, but not entirely, due to the high frequency of multiple births. The rate of stillbirth, perinatal mortality, and infant mortality were twice the national average, these excesses being due to the high frequency of multiple births. One or more major congenital malformations were detected during the first week of life in 35 (2.2%) of 1581 babies. This figure is comparable with population based estimates of the prevalence of congenital malformations. The types of malformations reported varied, and the number of each specific type was small. The health of the children was not evaluated beyond the perinatal period. CONCLUSIONS--Multiple pregnancies often result from assisted conception and are the main determinant of the outcome of the pregnancies and of the health of the children at the time of birth. Congenital malformations are comparatively rare, so larger numbers of children need to be studied before firm conclusions can be drawn. The pooling of data from different countries is recommended. PMID: 2354290 [PubMed - indexed for MEDLINE] S liu này bao gm nhng bin s v nhng ña tr sinh mt ca nhng bà m ñưc th thai trong ng nghim (in-vitro fertilisation). Nghiên cu này ñã ñưc báo cáo trong tp chí BMJ (1990;300:1229-1233). Tp tin này bao gm 641 ña tr và gm 8 bin s có chi tit như sau: STT Tên bin
Gii thích ting Anh
Gii thích ting Vit
99
1
Maso
identity number of mother and Mã s baby
2
tuoime
maternal age in years
Tui ca m (năm tui)
3
tang_ha
hypertension 1=yes, 0=no
Tăng huyt áp thai kì 1= có 0 = không
4
tuoithai
gestational age in weeks
Tui thai (tính theo tun)
5
gioi
sex of baby 1=male, 0=female
Gii tính ca tr 1=trai 0=gái
6
tlsosinh
birth weight in gms
Trng lưng sinh tính theo grams.
7
Occupation of mother (1= self Ngh nghip m (1= ngh t do; nghenghiep employed; 2=blue collar 2=công nhân; 3=viên chc) worker; 3=white collar worker)
8
nhomtuoi
maternal age groups(0=<30; Tui ca m phân nhóm (0=<30; 1=30-34;2=35-39;3=40+) 1=30-34; 2=35-39; 3=40+)
9
sinhnon
gestational category (1= <37 Sinh non (1: dưi 37 tun; 0: ñ tháng tun; 0=37+tun) – trên 37 tun thai)
Vic nhn bit s liu cũng có th thc hin bng cách s dng lnh describe (nhn phím F3). ðiu này ñc bit có ích nu các bin s và giá tr ca bin s ñã ñưc dán nhãn ñy ñ. Trong nghiên cu này, tác gi mun xác ñnh tác ñng ca tăng huyt áp ca m và tui thai lên trng lưng thai. 3. Như vy trong các bin s k trên, bin nào là bin ñc lp, bin nào là bin s ph thuc, bin s này là gây nhiu. Hưng dn: Bng s liu viewivf này có cha nhng bin s khác nhau. Trong bng sau hãy xác ñnh tính cht ca tng bin s bng cách khoanh tròn vào la chn thích hp. Bin s
Thang ño bin s
Quan h
tuoime
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
tang_ha
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
tuoithai
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
gioi
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
tlsosinh
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
nghenghiep
- Nh giá
- Danh ñnh
- ðc lp
- Ph thuc
100
- Th t
- ðnh lưng
- Gây nhiu
nhomtuoi
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
sinhnon
- Nh giá - Th t
- Danh ñnh - ðnh lưng
- ðc lp - Gây nhiu
- Ph thuc
4. Trưc khi phân tích s liu cn thc hin thao tác s liu và các thng kê mô t. Thc hin li các bưc thao tác s liu và thng kê mô t như chương trưc 5. Hãy so sánh trng lưng ca tr nam và tr n Hưng dn: Theo gii thut ñưc trình bày ñu chương, ñ so sánh trng lưng (bin ph thuc có phân phi bình thưng) 2 nhóm trưc tiên chúng ta cn phi xem phương sai ca 2 nhóm có bng nhau hay không. Nu phương sai 2 nhóm tương ñương chúng ta có th s dng ttest thông thưng (t-test phương sai ñng nht). Nu phương sai 2 nhóm không tương ñương, chúng ta phi s dng t-test phương sai không ñng nht hay kim ñnh phi tham s. Kim ñnh 1: So sánh 2 phương sai ð so sánh trung bình ca mt bin ñnh lưng hai hay nhiu nhóm, chúng ta s dng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group variance comparison test.
101
Sau khi ca s sdtest – Two sample test of variance hin ra tin hành 5 bưc sau:
Bưc 1: ñt con tr vào hp văn bn Variable name Bưc 2: ñưa con tr vào ca s Variables và nhp vào bin tlsosinh ñ ñưa bin này vào hp văn bn Variable name Bưc 3: ñt con tr vào hp văn bn Group name variable Bưc 4: ñưa con tr vào ca s Variables và nhp vào bin gioi ñ ñưa bin này vào hp văn bn Group name variable. Bưc 5: Nhp vào nút lnh OK. Kt qu ñưc trình bày như sau: . sdtest tlsosinh , by(gioi) Variance ratio test -----------------------------------------------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 ---------+-------------------------------------------------------------------combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 -----------------------------------------------------------------------------Ho: sd(gai) = sd(trai) F(314,325) observed = F_obs = F(314,325) lower tail = F_L = F_obs = F(314,325) upper tail = F_U = 1/F_obs = Ha: sd(gai) < sd(trai) P < F_obs = 0.1518
Ha: sd(gai) != sd(trai) P < F_L + P > F_U = 0.3032
0.891 0.891 1.122
Ha: sd(gai) > sd(trai) P > F_obs = 0.8482
Vi giá tr p = 0,3032 chúng ta không th bác b gi thuyt Ho: ñ lch chun ca nhóm tr trai
102
bng ñ lch chun ca nhóm tr gái. Vì vy chúng ta có th s dng kim ñnh t phương sai ñng nhát như bưc 2. Kim ñnh 2: So sánh 2 trung bình s dng t-test phương sai ñng nht. ð so sánh trung bình ca mt bin ñnh lưng hai hay nhiu nhóm, chúng ta s dng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group mean comparison test
Ca s ttest- group mean comparision tests hin ra. Tin hành các bưc sau:
103
Bưc 1: ñt con tr vào hp văn bn Variable name Bưc 2: ñưa con tr vào ca s Variables và nhp vào bin tlsosinh ñ ñưa bin này vào hp văn bn Variable name Bưc 3: ñt con tr vào hp văn bn Group name variable Bưc 4: ñưa con tr vào ca s Variables và nhp vào bin gioi ñ ñưa bin này vào hp văn bn Group name variable. Bưc 5: Nhp vào nút lnh OK. . ttest tlsosinh , by(gioi) Two-sample t test with equal variances -----------------------------------------------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------gai | 315 3044.127 35.421 628.6603 2974.434 3113.819 trai | 326 3211.279 36.88521 665.9798 3138.715 3283.843 ---------+-------------------------------------------------------------------combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 ---------+-------------------------------------------------------------------diff | -167.1522 51.18935 -267.6718 -66.63249 -----------------------------------------------------------------------------Degrees of freedom: 639 Ho: mean(gai) - mean(trai) = diff = 0 Ha: diff < 0 t = -3.2654 P < t = 0.0006
Ha: diff != 0 t = -3.2654 P > |t| = 0.0012
Ha: diff > 0 t = -3.2654 P > t = 0.9994
Tr li: Tr trai có trng lưng sơ sinh trung bình là 3211.28 gram, ca tr gái là 3044.13 gram. Vi giá tr t = 3,2654 và mc ý nghĩa (p-value) là 0.0012 chúng ta kt lun có s khác bit v trng lưng sơ sinh gia tr trai và tr gái (p=0.0012). 6. Hãy so sánh trng lưng sơ sinh ca con bà m tăng huyt áp và bà m không tăng huyt áp. Hưng dn: Theo gii thut ñưc trình bày ñu chương, ñ so sánh trng lưng (bin ph thuc có phân phi bình thưng) 2 nhóm trưc tiên chúng ta cn phi xem phương sai ca 2 nhóm m tăng huyt áp và m không tăng huyt áp có bng nhau hay không. Nu phương sai 2 nhóm tương ñương chúng ta có th s dng t-test thông thưng (t-test phương sai ñng nht). Nu phương sai 2 nhóm không tương ñương, chúng ta phi s dng t-test phương sai không ñng nht hay kim ñnh phi tham s. Kim ñnh 1: So sánh 2 phương sai ð so sánh trung bình ca mt bin ñnh lưng hai hay nhiu nhóm, chúng ta s dng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group variance comparison test. Sau khi ca s sdtest - Group variance comparison test chúng ta ñưa bin tlsosinh vào hp văn bn Variable name và bin tang_ha vào hp văn bn Group name variable ri nhp vào nút lnh OK. Kt qu ñưc trình bày như sau: . sdtest tlsosinh , by( tang_ha ) Variance ratio test
104
-----------------------------------------------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------Ha bt | 552 3191.531 25.58435 601.0962 3141.276 3241.786 Ha tang | 89 2742.157 86.17222 812.9471 2570.908 2913.406 ---------+-------------------------------------------------------------------combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 -----------------------------------------------------------------------------Ho: sd(huyet ap) = sd(huyet ap) F(551,88) observed = F_obs = F(551,88) lower tail = F_L = F_obs = F(551,88) upper tail = F_U = 1/F_obs = Ha: sd(1) < sd(2) P < F_obs = 0.0000
Ha: sd(1) != sd(2) P < F_L + P > F_U = 0.0003
0.547 0.547 1.829 Ha: sd(1) > sd(2) P > F_obs = 1.0000
Kt qu cho thy giá tr p = 0,0003 có nghĩa là phương sai ca trng lưng lúc sinh ca 2 nhóm không ñng nht. Vì vy chúng ta không th dùng t-test phương sai ñng nht mà phi s dng ttest phương sai không ñng nht (kim ñnh 2A) hay kim ñnh phi tham s (kim ñnh 2B). Kim ñnh 2A: so sánh 2 trung bình t-test phương sai không ñng nht ð so sánh trung bình ca mt bin ñnh lưng hai hay nhiu nhóm, chúng ta s dng menu Statistics :: Summaries, tables, & tests :: Classical tests of hypothesis :: Group mean comparison test (xem li câu 4) và bin tlsosinh vào hp văn bn Variable name; bin tang_ha vào hp văn bn Group name variable ca ca s ttest- group mean comparison. Cn lưu ý ñánh du vào hp kim Unequal variances ri nhp vào nút OK.
Kt qu trình bày như sau: . ttest tlsosinh , by(tang_ha) unequal
105
Two-sample t test with unequal variances -----------------------------------------------------------------------------Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------ha bt | 552 3191.531 25.58435 601.0962 3141.276 3241.786 ha tang | 89 2742.157 86.17222 812.9471 2570.908 2913.406 ---------+-------------------------------------------------------------------combined | 641 3129.137 25.78336 652.7827 3078.507 3179.767 ---------+-------------------------------------------------------------------diff | 449.3735 89.88999 271.1197 627.6273 -----------------------------------------------------------------------------Satterthwaite's degrees of freedom: 104.069 Ho: mean(ha bt) - mean(ha tang) = diff = 0 Ha: diff < 0 t = 4.9991 P < t = 1.0000
Ha: diff != 0 t = 4.9991 P > |t| = 0.0000
Ha: diff > 0 t = 4.9991 P > t = 0.0000
Tr li: Con bà m b tăng huyt áp có trng lưng sơ sinh trung bình là 2742 gram, con ca bà m không tăng huyt áp là 3192 gram. S khác bit này có ý nghĩa thng kê vi p<0,0001. Kim ñnh 2B: so sánh 2 trung bình vi phép kim phi tham s Mann-Whitney Thc hin kim ñnh phi tham s tng sp hng Mann-Whitney (Mann-Whitney rank sum test) bng dng menu Statistics :: Summaries, tables, & tests :: Non-parametric test of hypotheses :: Mann-Whitney two-sample ranksum test.
Sau ñó ca s ranksum - Mann-Whitney two-sample statistic hin ra.
106
Tin hành các bưc sau: Bưc 1: ñt con tr vào hp văn bn Variable name Bưc 2: ñưa con tr vào ca s Variables và nhp vào bin tlsosinh ñ ñưa bin này vào hp văn bn Variable name Bưc 3: ñt con tr vào hp văn bn Group name variable Bưc 4: ñưa con tr vào ca s Variables và nhp vào bin tang_ha ñ ñưa bin này vào hp văn bn Group name variable. Bưc 5: Nhp vào nút lnh OK. Kt qu như sau: . ranksum tlsosinh , by( tang_ha ) Two-sample Wilcoxon rank-sum (Mann-Whitney) test tang_ha | obs rank sum expected -------------+--------------------------------ha bt | 552 185203 177192 ha tang | 89 20558 28569 -------------+--------------------------------combined | 641 205761 205761 unadjusted variance adjustment for ties adjusted variance
2628348.00 -144.78 ---------2628203.22
Ho: tlsosinh(tang_ha==ha bt) = tlsosinh(tang_ha==ha tang) z = 4.941 Prob > |z| = 0.0000
7. Hãy so sánh trng lưng sơ sinh ca tr sinh ra t con ca các nhóm ngh nghip khác nhau ca ngưi m. Hưng dn: ð so sánh trung bình ca mt bin ñnh lưng nhiu nhóm, chúng ta phi s dng phương pháp phân tích ANOVA mt chiu. S dng menu Statistics :: ANOVA/MANOVA :: oneway analysis of variance
107
Do chúng ta mun phân tích tác ñng ca yu t ngh nghip m (nghenghiep) lên trng lưng sinh ca tr (tlsosinh) khi ca s oneway hin lên, ta tin hành các bưc sau: Bưc 1: ñt con tr vào hp văn bn Response variable Bưc 2: ñưa con tr vào ca s Variables và nhp vào bin tlsosinh ñ ñưa bin này vào hp văn bn Response Variable. Bưc 3: ñt con tr vào hp văn bn Factor Bưc 4: ñưa con tr vào ca s Variables và nhp vào bin nghenghiep ñ ñưa bin này vào hp văn bn Factor. Bưc 5: ðánh du vào hp kim Produce summary table ñ th hin thng kê mô t trng lưng sơ sinh trung bình các nhóm ngh nghip Bưc 6: ðánh du vào hp kim Scheffe ñ có kim ñnh so sánh trng lưng trung bình tng cp ñôi ngh nghip khác nhau Bưc 7: Nhp vào nút lnh OK
108
Trên ca s Output, trên cùng thng kê mô t ca s liu v trng lưng sơ sinh theo nhóm tui ca m: nghe nghiep | me - 1=tu | do, 2=cong | Summary of trong luong so sinh nhan, | (gram) 3=vien chuc | Mean Std. Dev. Freq. ------------+-----------------------------------tu do | 2981.4135 643.76283 104 cong nhan | 3118.084 646.69338 238 vien chuc | 3189.3177 654.19649 299 ------------+-----------------------------------Total | 3129.1373 652.78265 641
Con bà m ngh nghip t do có trng lưng trung bình là 2981 gram, ca bà m vi ngh nghip là 3118 gram, ca bà m vi ngh nghip viên chc là là 3190 gram. Chúng ta bit kim ñnh ANOVA có th s dng ñ kim ñnh s khác bit v trung bình ca nhiu nhóm, nhưng trưc tiên chúng ta hãy kim tra các ñiu kin ca phân tích ANOVA là (a) bin s ph thuc có phân phi bình thưng - ñiu này ñã ñưc xác nhn t ñ th ca trng lưng sơ sinh và (b) phương sai ca bin ph thuc các nhóm bng nhau - ñiu này cũng ñưc xác nhn qua thng kê Bartlett vi p-value là 0,973. Analysis of Variance Source SS df MS F Prob > F -----------------------------------------------------------------------Between groups 3381483.56 2 1690741.78 4.00 0.0187 Within groups 269338638 638 422160.875 -----------------------------------------------------------------------Total 272720122 640 426125.19 Bartlett's test for equal variances:
chi2(2) =
0.0558
Prob>chi2 = 0.973
Vì vy trong trưng hp này kim ñnh ANOVA là có giá tr. Ta ñc kt qu ca bng ANOVA. 109
Chúng ta có ñưc giá tr F = 0.0187 và mc ý nghĩa (p-value) là 0.9723 chúng ta kt lun không có s khác bit v trng lưng sơ sinh con ca nhng bà m có ngh nghip khác nhau. Vi kt lun này chúng ta có th kt lun là có ít nht có 1 cp ñôi (2 nhóm) ngh nghip ca m có s khác bit v trng lưng con nhưng chúng ta không bit là s khác bit này cp ñôi ngh nghip nào. ð bit cp ñôi nào có s khác bit ta xem kt xut ca so sánh sau kim ñnh (posthoc test) ca Scheffe: Comparison of trong luong so sinh (gram) by nghe nghiep me - 1=tu do, 2=cong nhan, 3=vien chuc (Scheffe) Row Mean-| Col Mean | tu do cong nha ---------+---------------------cong nha | 136.671 | 0.202 | vien chu | 207.904 71.2337 | 0.020 0.451
Kt qu ca kim ñnh Scheffe ñưc trình bày theo bng và mi ô ca bng có 2 con s: con s trên th hin s khác bit v trng lưng ca ngh nghip ca hàng so vi ngh nghip ca ct và giá tr dưi th hin giá tri p (mc ý nghĩa) ca s khác bit này. Da vào giá tr p, có th kt lun có s khác bit v trng lưng sơ sinh ca con 2 nhóm ngh nghip viên chc và t do (giá tr p=0,020) và nhóm ngh nghip viên chc có trng lưng trung bình cao hơn nhóm ngh nghip t do là 207,9 gram.
Nhc li lí thuyt v Tương quan và ưc lưng Tương quan là s ño mc ñ hai bin s ñnh lưng cùng thay ñi vi nhau. Có nhiu loi h s tương quan, nhưng chúng ñu có giá tr t -1 ñn 1. Nu chúng có giá tr dương có nghĩa là hai bin s ñng bin vi nhau, nu chúng có giá tr âm nghĩa là hai bin s nghch bin. Giá tr tuyt ñi ca h s tương quan càng gn mt nghĩa là hai bin s có liên h cht vi nhau và vai trò ca sai s ngu nhiên s ít hơn. Nu h s tương quan có giá tr bng zero có nghĩa là hai bin s ñc lp và không quan h gì vi nhau. Khi tr tuyt ñi ca h s tương quan bng mt có nghĩa là hoàn toàn không có sai s ngu nhiên. Bình phương ca h s tương quan (r 2) th hin t l các bin thiên ca bin s ph thuc có th ñưc gii thích bng bin s ñc lp. Loi h s tương quan ñưc s dng ph bin nht là h s tương quan Pearson r: ∑ ( xi − x )( yi − y ) r = ∑ ( xi − x ) 2 ∑ ( yi − y ) 2 Lí gii ý nghĩa ca h s tương quan: - H s tương quan luôn luôn nm trong ñon [-1,1] - H s tương quan r dương chng t hai bin s là ñng bin; h s tương quan r âm chng t hai bin s là nghch bin; h s tương quan bng zero nu hai bin không liên h. - Tr s tuyt ñi ca h s tương quan r nói lên mc ñ liên quan gia hai bin s. Nu tr tuyt ñi ca r bng 1 (r=1 hay r=-1), quan h hoàn toàn tuyn tính nghĩa là tt c các ñim nm trên ñưng hi quy (Hình 9.2 d và 9.2f). Nu tr tuyt ñi ca r nh hơn 1 s có các ñim s liu phân tán chung quanh ñưng hi quy. 110
- Bình phương ca h s tương quan (r 2) th hin t l bin thiên ca bin s ph thuc ñưc gii thích bng s bin thiên ca bin s ñc lp (nu mi liên h này là nhân qu) - Nu r=0, không có mi liên h tuyn tính gia hai bin s. Ðiu này có nghĩa là (1) không có mi liên h gì gia hai bin s hoc (2) mi liên h gia hai bin s không phi là tuyn tính. - Theo quy ưc, quan h vi r t 0,1 ñn 0,3 là quan h yu, t 0,3 ñn 0,5 quan h trung bình và trên 0,5 là quan h mnh. Ðiu quan trng là s tương quan gia hai bin s cho thy s liên h nhưng không nht thit có nghĩa là cá quan h 'nhân qu'. ð kim ñnh h s tương quan Pearson có thc s khác 0 hay không, kim ñnh t có th ñưc s dng n− 2 có phân phi student vi n-2 ñ t do. t = r 1 − r 2
Hi quy Hi quy là mt mô hình toán hc mô t s bin ñi ca mt bin s này theo nhng bin s khác. Mt phương trình hi quy có th có dng như sau: cân nng (kg) = 6,85 + 0,18 x tháng tui (phương trình hi quy tính cân nng ca tr t 9 ñn 40 tháng tui theo tháng tui) theo phương trình này ngưi ta gi: cân nng: bin s ph thuc tháng tui: bin s ñc lp 6,85: h s ca hng s (Constant), hay còn gi là ñim chn (intercept) 0,18: h s (Coeficient) ca bin s tháng tui hay còn gi là ñ dc (Slope) ca ñưng hi quy 9. V phân tán ñ (scattergram) gia ca bin s tui thai (tuoithai) và trng lưng thai (tlsosinh). Hưng dn: s dng menu Graphics :: Overlaid twoway graph
ñ hin ra ca s twoway – Twoway graphs
111
Trên ca s twoway – Twoway graphs, nhp tên bin s ph thuc vào hp Y-axis variable và tên bin s ñc lp vào hp X-axis variable sau ñó nhp OK ñ xem biu ñ phân tán. Cách làm c th tng bưc như sau: Bưc 1: Trên hp combo Type chn Scatter Bưc 2: ðt tên bin s ñc lp (tuoithai) vào ô văn bn X Bưc 3: ðt tên bin s ph thuc (tlsosinh) vào ô văn bn Y Bưc 4: Nhp nút lnh OK
Có th cho ñ th phân tán. Tuy nhiên chúng ta có th thêm các tùy chn ñ thc hin các yêu cu sau: • B sung tiêu ñ “trng lưng tr sơ sinh (gam)" cho trc tung • Cho các giá tr trc y t 500 ñn 5000 gram và chia các khong 500 gram. • B sung tiêu ñ “tuoi thai (tuan tuoi)" cho trc hoành 112
• Cho các giá tr ca trc x t 24 tun tui ñn 42 tun tui và chia làm các khong 4 tun Bng cách trong ca s Trên ca s twoway – Twoway graphs thc hin các bưc: Trên th Plot 1: Bưc 1: Trên hp combo Type chn Scatter Bưc 2: ðt tên bin s ñc lp (tuoithai) vào ô văn bn X Bưc 3: ðt tên bin s ph thuc (tlsosinh) vào ô văn bn Y Trên th Y-Axis: Bưc 4: Trên hp văn bn Title gõ "Trong luong tre so sinh (gam)" Bưc 5: Trên hp văn bn Rule gõ quy tc "500(500)5000" Bưc 6: Trên hp combo Angle chn "Horizontal" Trên th X-Axis: Bưc 7: Trên hp văn bn Title gõ "Tuoi thai (tuan)" Bưc 8: Trên hp văn bn Rule gõ quy tc "24(2)42" Và nhp vào nút lnh OK.
Tr li: Có s tương quan thun tuyn tính gia trng lưng sơ sinh và tui thai. Mi tương quan này khá cht do ñám mây có tính cht ñi lên (khi nó ñi v phi) và có ñưng kính bé nh hơn nhiu so vi ñưng kính ln. 10. Hãy xác ñnh h s tương quan gia trng lưng sơ sinh ( tlsosinh), tui thai (tuoithai) và tui ca m (tuoime) Hưng dn: S dng menu Statistics :: Summaries, tables, & tests :: Summary statistics :: Pairwise correlations.
113
Khi ñó hp thoi pwcorr – Pairwise correlations of variables s hin ra.
114
Tin hành các bưc sau: Bưc 1: Nhp con tr chut vào hp văn bn Variables Bưc 2: ðưa con tr chut vào ca s Variables và nhp vào các bin tlsosinh, bin tuoithai và bin tuoime ñ tên 3 bin này xut hin hp văn bn Variables. Bưc 3: ðánh du vào hp kim Print significance level for each entry Bưc 4: ðánh du vào hp kim Significance level for displaying with a star. Bưc 5: Nhp vào nút lnh OK ñ xem kt qu. . pwcorr tlsosinh tuoithai tuoime, sig star(5) tuoime | tlsosinh tuoithai -------------+--------------------------tlsosinh | 1.0000 | | tuoithai | 0.7376* 1.0000 | 0.0000 | tuoime | 0.0337 0.0151 1.0000 | 0.3941 0.7026
Tr li: Chương trình cho kt qu h s tương quan ca trng lưng thai vi trng lưng thai là 1, gia trng lưng thai và tui thai là 0.7376 (giá tr p=0,0000), gia trng lưng thai và tui ca m là 0,0337 (giá tr p = 0,3941). Như vy có s tương quan mnh có ý nghĩa thng kê gia trng lưng thai và tui thai trong khi ñó s tương quan gia trng lưng thai và tui m rt yu và không có ý nghĩa thng kê. Do có s liên h có ý nghĩa thng kê (giá tr p <0,05) gia trng lưng thai và tui thai nên giá tr ca h s tương quan ñưc ñánh du sao (*). 11. Hãy xây dng phương trình hi quy ca trng lưng thai theo tui thai. Hưng dn: S dng phương pháp hi quy ñơn bng cách nhp vào menu "Statistics :: Linear regression and related :: Linear regression" ñ hin ra hp thoi regress – Linear regression
115
Nhp tên bin s ph thuc vào hp Dependent variable và tên bin s ñc lp vào hp Independent variable ri nhn OK ñ tip tc. Kt qu ñưc trình bày như sau: . regress tlsosinh tuoithai Source | SS df MS ---------+----------------------------- Model | 148354317 1 148354317 Residual | 124365805 639 194625.673 ---------+-----------------------------Total | 272720122 640 426125.19
Number of obs F( 1, 639) Prob > F R-squared Adj R-squared Root MSE
= = = = =
641 762.25 = 0.0000 0.5440 0.5433 441.16
tlsosinh |
Coef. Std. Err. t P>|t| [95% Conf. Interval] ---------+-------------------------------------------------------------------tuoithai | 206.6412 7.484572 27.609 0.000 191.9439 221.3386 _cons | -4865.245 290.0814 -16.772 0.000 -5434.873 -4295.617
Tr li: H s tương quan bình phương R-squared = 0.544 = 54.4% nói lên tui thai có th gii thích cho 54.4% s thay ñi v trng lưng sơ sinh. Bng ANOVA cho bit có tng các sai lch ca bình phương trng lưng sơ sinh 272.720.122 (272.7 triu) mà phương trình hi quy có th gii thích cho 148.3 triu ca s sai lch này (như vy còn 124.4 triu tng bình phương sai lch chưa ñưc gii thích gi là Residual Sum of Square và giá tr 0.45 chính là giá tr 148.3/272.7). Mc ý nghĩa ñưc trình bày trong bng ANOVA cho bit mc ý nghĩa ca phương trình. Da vào bng các h s chúng ta có th xây dng phương trình hi quy như sau: Trng lưng sơ sinh = -4865.245 + 206.641 x tui thai (tính theo tun). Mc ý nghĩa (P-value) ca bin s tui thai (Gestational age) là kt qu ca kim ñnh ý nghĩa ca bin s này trong phương trình có thc s khác không hay không. H s (coefficient) ca bin s ñc lp nói lên s thay ñi ca bin s ph thuc khi bin s 116
ñc lp thay ñi mt ñơn v. Trong phương trình này (vi bin s ñc lp là TUOITHAI và bin s ph thuc là TLSOSINH ) chúng ta có th lí gii nu ña tr ln hơn 1 tun tui trng lưng lúc sanh ca nó s tăng thêm 206.641 gram. 12. Hãy xây dng phương trình hi quy ca trng lưng thai theo tui thai, gii tính ca tr và huyt áp cao ca m. Hưng dn: S dng phương pháp hi quy ñơn bng cách nhp vào menu "Statistics :: Linear regression and related :: Linear regression" ñ hin ra hp thoi regress – Linear regression
Nhp tên bin s ph thuc (tlsosinh) vào hp Dpendent variable và tên các bin s ñc lp (tuoithai gioi tang_ha) vào hp Idependent variables, ri nhn OK ñ tip tc. Khi ñó hp thoi chn ñoán s hin ra. Tuy nhiên nu chúng ta không quan tâm ñn vic chn ñoán các vn ñ trong phương trình hi quy chúng ta hãy nhp vào nút Cancel. . regress tlsosinh tuoithai gioi tang_ha Source | SS df MS -------------+----------------------------- Model | 153998584 3 51332861.4 Residual | 118721538 637 186376.04 -------------+-----------------------------Total | 272720122 640 426125.19
Number of obs F( 3, 637) Prob > F R-squared Adj R-squared Root MSE
= =
641 275.43 = 0.0000 = 0.5647 = 0.5626 = 431.71
-----------------------------------------------------------------------------tlsosinh | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------tuoithai | 201.4248 7.541441 26.71 0.000 186.6157 216.2339 gioi | 167.8167 34.17884 4.91 0.000 100.6999 234.9335 tang_ha | -142.14 50.8685 -2.79 0.005 -242.0302 -42.24979 _cons | -4729.048 294.1447 -16.08 0.000 -5306.659 -4151.438 -----------------------------------------------------------------------------2
Tr li: Chúng ta tìm ñưc r (R-squared) là 0.5647 cho thy phương trình hi quy gii thích
117
ñưc 56.47% s bin thiên ca trng lưng thai và ñiu này cho thy mô hình có c gii tính và tăng huyt áp gii thích tt hơn so vi mô hình ch có tui thai (r 2=0.54). Chúng ta cũng có th vit ñưc phương trình hi quy theo kt qu trên: Trng lưng thai = -4729.048 + tui thai x 201.425 - tăng huyt áp x 142.14 + gii x 167.817 10. Bn có gi ý gì ñ trình bày phương trình hi quy mt cách d hiu hơn ñi vi ngưi không chuyên v thng kê. Hưng dn: Bi vì ngưi không chuyên v thng kê hay ngưi chưa ñưc làm quen vi phương pháp mã hoá s không bit làm sao ñ nhân tăng huyt áp vi 142.14 hay gii vi 167,817. Chúng ta nh li quy ưc ca tp tin này: Bin tăng huyt áp (tang_ha) có giá tr =0 nu m không b tăng huyt áp Bin gii tính ( gioi) có giá tr =0 nu tr là tr gái a) Do ñó phương trình hi quy ñi vi tr gái có m không tăng huyt áp là: Trng lưng thai = -4729.048 + tui thai x 201.425 (a) b) tr trai vi m không tăng huyt áp, trng bin s ph thuc ca phương trình hi quy s tăng lên 167,817 gram nên phương trình hi quy s là Trng lưng thai = -4561.23 + tui thai x 201.425 (b) c) tr gái vi m b tăng huyt áp, trng bin s ph thuc ca phương trình hi quy s s gim ñi 142,14 gram so vi phương trình (a) nên phương trình hi quy cho nhóm này là Trng lưng thai = -4871.19 + tui thai x 201.425 d) tr trai vi m b tăng huyt áp, trng bin s ph thuc ca phương trình hi quy s s gim ñi 142,14 gram so vi phương trình (b) nên phương trình hi quy cho nhóm này là Trng lưng thai = -4703.37 + tui thai x 201.425 Do các mc ý nghĩa (p-value) ca bin s ñu nh hơn 0.05 nên tt c các bin s ñc lp ca mô hình ñu có ý nghĩa thng kê và không nên loi b khi mô hình. 13. Xét hai mô hình trng lưng thai = tui thai + tăng huyt áp m + gii tính (cho h s ca bin s tui t hai là 201.4) trong khi ñó mô hình trng lưng thai = tui thai (choh s ca bin s tui thai là 206.6). H s trong mô hình nào là phù hp hơn ñ ñánh giá s tăng trưng ca trng lưng thai. Tr li: Chúng ta có th gi ñnh yu t tăng huyt áp ca m là yu t gây nhiu. Do tăng huyt áp ca m có th làm gim trng lưng ca con và trong tăng huyt áp ca m ph bin hơn nhóm sanh thiu tháng nên ña tr sinh sm 1 tun b mt trng lưng là 206.6 gram nhưng ñiu này là c do tác ñng ca sanh non và c tác ñng do tăng huyt áp mt s bà m. Tuy nhiên nhóm không b tăng huyt áp tr sanh non mt tun ch b mt có 201.4 gram và do ñó con s 201.4 là phù hp hơn ñ ñánh giá s tăng trưng ca trng lưng thai. Trên thc tin do con s 201.4 rt gn vi con s 206.6 nên có th b qua tác ñng gây nhiu ca tăng huyt áp ca m lên tc ñ phát trin thai. 14. S dng kim ñnh t chúng ta phát hin trng lưng tr con các bà m b tăng huyt áp thp hơn con nhng ngưi không tăng huyt áp là 449.37 gram. Trong khi mô hình ca trng lưng
118