Content

  1. Epi Info ของ CDC
  2. Population Survey
  3. Unmatch Case Control
  4. Cohort Study/Cross section
  5. เอกสารอ่านประกอบ
    1. Design effect and intraclass correlation coefficiency from a health facility survey in BeninDesign effect and intraclass correlation coefficiency from a health facility survey in Benin
    2. Down load โปรแกรม Epi info Down load โปรแกรม Epi info

โปรแกรม Epi Info ของ CDC

Epi Info พัฒนาโดย CDC เป้นโปรแกรมที่นักระบาดวิทยาใช้ในการคำนวณค่าต่าง ๆ ทางระบาดวิทยา ซึ่งปึจจุบันพัฒนามาเป็น Version 7.2 เป็นโปรแกรมที่ไม่มีลิขสิทธิ (Free Download) แต่คนทั่วไปจะไม่ค่อยคุ้นเคย Epi Info และระยะหลัง SPSS ก็พัฒนาให้สามารถหา Risk ทั้ง OR ,RR Mantel- Haenszel และ Adjusted OR ได้เหมือนกัน คนจึงหันมาใช้ SPSS กันมากขึ้น แต่ Epi Info ก็พัฒนาโปรแกรมให้ส่ามารถใช้งานได้มากขึ้น และหน้าจอก็มี Visualization ที่ดูดีกว่าแต่ก่อนมาก โดยเฉพาะในส่วนของ STATCALC ของ Epi Info ที่มี 2 เรื่องที่ใช้งานได้ดีกว่า SPSS คือ
  1. การหา Sample Size ของการศึกษาแบบ Survey ,Case Control และ Cohort
  2. ส่วนของ Table (2x2xN) ปกติเราจะทำ 2x2 Table เพื่อคำนวณหา OR,RR,Chi Square ได้แต่ Strata เดียว แต่ของ Epi Info ทำได้ถึง 9 strata ทำให้สามารถคำนวณค่า OR,RR,Chi ของแต่ละ Strata และคำนวณ Crude OR RR และ Adjust OR,RR ของภาพรวมทุก Strata ได้ ซึ่งมีประโยชน์ในการพิสูจน์ปัจจัยที่เป็น Covariate หรือ Confounding Factor
ก่อนที่จะเรียนรู้ในบทต่อไป ให้ Download โปรแกรม Epi Info Ver 7.2 ที่เป็น Zip File แล้วทำการ Unzip เพื่อประกอบการเรียนต่อไป Down load โปรแกรม Epi info
Epi Info ใน Module ของ STATCALC จะมี Menu ในการ Sample Size ที่ใช้บ่อย ได้แก่
  1. Population Survey เป็นการหา Sample size แบบ Survey ไม่มีกลุ่มเปรียบเทียบ
  2. Unmatch Case Control มีกลุ่ม Control
  3. Cohort Study or Cross Sectional มีกลุ่ม Control

Population Survey

  1. การหา Sample size เมื่อทำการสุ่มแบบ Simple Random Sampling (SRS) การสุ่มแบบนี้คือโดยทุกคนในพื้นที่ศึกษามีโอกาสได้รับการสุ่มเท่ากัน เช่น ประชากร 1,000,000 คน เมื่อทำการสุ่มแล้ว คนที่สุ่มมาจะอยู่กระจัดกระจาย ทำให่มีปัญหาในการเดินทางไปหา Sample ที่สุ่มมา ตัวแปรที่จะต้องมาใส่ เพื่อทำการหา Sample size ได้แก่
    1. Population Size คือ จำนวนประชากรของพื้นที่ ที่จะ Survey
    2. Expected Frequency คือ ร้อยละของ Exposure ที่จะทำการศึกษา เช่น จะสำรวจเรื่องการสูบบุหรี่ ให้ไปทบทวนวรรณกรรมว่า พื้นที่เราทำการศึกษามีคนสูบบุหรี่ร้อยละเท่าไร กรณีที่ไม่ทราบ หรือทำการสำรวจ Exposure หลายตัว ให้ใช้ 50% เพราะค่า 50% จะเป็นค่าที่ทำให้ sample Size สูงสุด
    3. Design Effect ในกรณีที่เป็น Simple Random sample (SRS) ค่า Design Effect เท่ากับ 1
    4. Clusters กรณีที่เป็น SRS แล้วไม่มีการแบ่ง Cluster = 1
    ปกติ เราจะใช้ Confidence Level = 95% เท่ากับ 384 ( ค่า Sample size ที่ได้จาก SRS ถือเป็น Effective Sample Size )
  2. กรณีมีการสุ่มแบบ Cluster Sampling การ Survey นั้นนิยทใช้ Multi stage Sampling เช่น Cluster sampling โดยมีการสุ่มอำเภอก่อน (Primary Sampling Unit :PSU) จากนั้น ถึงจะสุ่มไปถึงระดับบุคคลต่อไป การทำ Cluster sampling แตกต่างจาก Simple random sampling คือ
    1. การมี Cluster มากกว่า 1 Cluster จะทำให้ความแปรปรวน (Variance) มากขึ้น โดยถ้าแต่ละอำเภอมีความแตกต่างกันมาก เช่น อำเภอเมือง กับ อำเภออมก๋อย ของจังหวัดเชียงใหม่ แล้วค่าความแปรปรวนจะยิ่งมาก โดยค่าความแปรปรวนที่มากมากขึ้นทำให้ต้องแก้ไข โดยเพิ่มจำนวน sample size ให้มากขึ้นจากสุ่มแบบ SRS โดบต้องคูณด้วยตัวคูณตัวหนึ่งเรียกว่า Design Effect (Deff) โดย
      Actual Sample Size (Cluster Sample Size) = Deff * Effective Sample Size (SRS)
    2. Design effect (Deff)= Variance of Actual Sampling / Variance of Systematic Random Sampling
         Deff = ρ(m-1)+1
         ρ =intraclass correlation efficient.
         m=average numbers per cluster
         Deff = Actual Sample size / Effective Sample Size
         Median Deff) = 1.4 (0.8-5.7) แนะนำให้ใช้ ตั้งแต่ 2. 0-3.8
         Median ρ = 0.2 (-1.3 – 1)

กรณีที่เป็นการ Survey แบบ Cluster sampling การ Input ข้อมูล เป็นดังนี้
  1. Population Size เหมือนกับ SRS
  2. Expected Frequency เหมือนกับ SRS
  3. Design Effect กรณีที่เป็น Cluster sampling จะมี Variance เพิ่มขึ้น Design Effect >1 (ควรใช้ตัวเลขระหว่าง 2-4 )
  4. Clusters Cluster Sampling จะมี cluster >1 เช่น 4
หมายเหตุ เมื่อกำหนด Design Effect = 3.8 นั่นคือ จำนวน Sample size ทั้งหมด จะมากกว่า Effective Sample size ที่ได้จาก SRS เท่ากับ 3.8 เท่าด้วย เป็น 1,460 (384 * 3.8) ถึงแม้จำนวน sample จะมากขึ้น แต่การทำงานจะสะดวกกว่า เนื่องจากไม่จำเป็นต้องเดินทางทุกอำเภอ

Unmatch Case Control

Case Control Study คือ การศึกษาที่เร่ิมจาก Outcome (disease) แล้วย้อนไปหาว่ามี Exposure หรือไม่ ก่อนที่จะหา Sample size ต้องไปทำการ Review Litearature เพื่อหาข้อมูล 2 ตัวมาใส่ในตารางคือ
  1. ร้อยละของการมี Exposure ในกลุ่มที่ปกติที่ไม่เป็นโรค (Control Group)
  2. ค่า Odds Ratio (OR) ว่าการศึกษาต่างๆ OR ของ การเกิดโรคในกลุ่ม Exposure และ Non Exposure เท่ากับเท่าไร ซึ่งปกติการศึกษาต่างๆจะมี OR แตกต่างกัน ให้หาค่ากลางๆของ OR ที่ทำการศึกษาว่าเท่ากับเท่าไร ถ้ายังไม่มีการศึกษาในทำนองนี้ ให้ใส่ค่า OR ให้ใกล้เคียง 1 ให้มากที่สุด เช่น 1.2 เป็นต้น
ข้อมูลที่ใส่เข้าไปในตาราง เพื่อให้จำนวน Case และ Control ได้แก่่
  1. Two sides confidence level คือ โอกาสที่จะปฏิเสธสมมุติฐานที่เป็นจริง (Alpha หรือ Type 1 Error) ปกติจะใส่ 95%
  2. Power หรือ โอกาสของการยอมรับสมมุติฐานที่เป็นจริง ซึ่งก็คือ [1-beta (Type 2 Error)] ปกติจะใส่ค่า 80%
  3. Ratio of Control to case ปกติ จะเท่ากับ 2:1 หรือ 1:1
  4. Percent of Control Exposure คือ ร้อยละที่กลุ่มปกติ (Control) ที่สัมผัส Exposure โดยใส่ค่าที่ได้ทำการ Review Literature มา สมมุติเท่ากับ 10%
  5. Odd ratio โดยใส่ค่าที่ได้ทำการ Review Literature มา สมมุติเท่ากับ 1.3
  6. Percent of Cases with Exposure โปรแกรมจะคำนวณให้เอง ถ้าใส่ข้อมูลก่อนหน้ามาครบถ้วน
โปรแกรมจะทำการหา Sample size ของกลุ่ม Cases และ Controls มาให้ โดยมีให้เลือก 3 วิธี ได้แก่ Kelsey ,Fleiss,Fleiss w/CC ปกติก็จะเลือกวิธีที่ให้ sample size น้อยที่สุด ในตัวอย่างนี้คือ Cases = 1,661 ส่วน control เรากำหนดเป็น 2 เท่าของ Cases คือ 3,321 จำนวน sample size ทั้งหมดเท่ากับ 4,982 ราย

Cohort or Cross Sectional study

Cohort Study คือ การศึกษาที่เริ่มจาก Exposure แล้วติดตามไปข้างหน้าว่าเกิด Outcome เท่าไร ของทั้ง 2 กลุ่ม ก่อนที่จะหา Sample size ต้องไปทำการ Review Litearature เพื่อหาข้อมูล 2 ตัวมาใส่ในตารางคือ
  1. ร้อยละของการเกิดโรค ในกลุ่มที่ปกติที่ไม่ได้สัมผัส Exposure (Un Exposure Group)
  2. ค่า Risk Ratio หรือ Relative Risk (RR) ว่าการศึกษาต่างๆ RR ของ ความเสี่ยงต่อการเกิดโรคในกลุ่ม Expose และ Non Expusure เท่ากับเท่าไร ซึ่งปกติการศึกษาต่างๆจะมี RR แตกต่างกัน ให้หาค่ากลางๆของ RR ที่ทำการศึกษาว่าเท่ากับเท่าไร ถ้ายังไม่มีการศึกษาในทำนองนี้ ให้ใส่ค่า RR ให้ใกล้เคียง 1 ให้มากที่สุด เช่น 1.2 เป็นต้น
ข้อมูลที่ใส่เข้าไปในตาราง เพื่อให้จำนวน Exposure & Non Exposure grooup ได้แก่่
  1. Two sides confidence level คือ โอกาสที่จะปฏิเสธสมมุติฐานที่เป็นจริง (Alpha หรือ Type 1 Error) ปกติจะใส่ 95%
  2. Power หรือ โอกาสของการยอมรับสมมุติฐานที่เป็นจริง ซึ่งก็คือ [1-beta (Type 2 Error)] ปกติจะใส่ค่า 80%
  3. Ratio of Unexposure to Exposure Group ปกติ จะเท่ากับ 2:1 หรือ 1:1
  4. Percent of Outcome in Non Exposure คือ ร้อยละที่กลุ่มปกติที่ไม่ได้สัมผัส Exposure ป่วยเป็นโรคเท่ากับเท่าไร โดยใส่ค่าที่ได้ทำการ Review Literature มา สมมุติเท่ากับ 3 ต่อ 1000 หรือ 0.3 %
  5. Risk ratio = 1.5
  6. Percent of Outcome in Exposure Group โปรแกรมจะคำนวณให้เอง ถ้าใส่ข้อมูลก่อนหน้ามาครบถ้วน
โปรแกรมจะทำการหา Sample size ของกลุ่ม Exposure และ Non Exposure มาให้ โดยมีให้เลือก 3 วิธี ได้แก่ Kelsey ,Fleiss, Fleiss w/CC ปกติก็จะเลือกวิธีที่ให้ sample size น้อยที่สุด ในตัวอย่างนี้คือ Exposure group = 10,753 ส่วน Un Exposure Group เรากำหนดเป็น 2 เท่าของ Exposure Group คือ 21,505รวมทั้ง 2 กลุ่มเท่ากับ 32,258 ราย จะเห็นว่าการศึกษาแบบ Cohort นั้นจะใช้ Sample size ที่มาก