تعداد صفحه: 29
آمار تحليلي
ارائه :
مقدمه
آمار تحليلي (آناليز) در مقابل آمار توصيفي
مفاهيم اوليه در آمار تحليلي:
احتمال (Probability)
فراواني (Frequency)
نسبت (Ratio) و ميزان (Rate)
توزيع (Distribution)
توزيع فراوانيها
نمودار توزيع فراواني دفعات شير آمدن دو سكه در دويست بار پرتاب همزمان
توزيع نسبتها
نمودار توزيع نسبت دفعات شير آمدن دو سكه در دويست بار پرتاب همزمان
جمع نسبتها = ١
توزيع دو جملهاي
آن چه تا كنون ديديد را توزيع دو جملهاي ميگويند (دو جملهاي يعني اين كه فقط دو حالت براي هر يك از افراد جامعه وجود دارد.)
اين توزيع براي شاخصهاي كيفي دو حالته (dichotomous) كاربرد دارد.
توزيع نرمال
براي متغيرهاي كميِ پيوسته به كار ميرود.
شكل زنگولهي متقارن دارد.
محور تقارن = ميانگين
نمونههايي از متغيرهاي داراي توزيع نرمال
١) وزن
نمونههايي از متغيرهاي داراي توزيع نرمال
١) فشار خون سيستولي
اهميت توزيع نرمال
بسياري از شاخصهاي «كمي» و «پيوسته» در سادهترين حالت، توزيع نرمال دارند، اما عوامل مختلفي باعث پيچيدگي توزيع فراواني شاخصها و لذا فاصله گرفتن آنها از حالت نرمال ميشوند.
اهميت توزيع نرمال: بسياري از روشهاي دقيق مقايسه آماري، براي دادههايي كه از اين توزيع برخوردار باشند به كار ميروند.
شاخصهاي نمايندهي توزيع نرمال
ميانگين
انحراف معيار
مثال: توزيع نرمال فشار خون سيستولي
نكته!
بديهي است كه اگر محور عمودي نمودار به صورت نسبت باشد، سطح زير نمودار برابر با يك خواهد شد.
توزيع نمونه برداري
اگر از يك جامعه ٧٠ ميليون نفري نمونههاي ١٠٠٠ نفري بگيريم و ميانگين فشار خون سيستولي افراد هر نمونه را تعيين كنيم، اين ميانگين ها لزوماً با هم برابر نخواهند بود.
اين ميانگين ها لزوماً با ميانگين كل جامعه ي ٧٠ ميليون نفري نيز برابر نيستند.
اگر اين نمونه برداري را بار ها تكرار كنيم، ميتوان براي اين ميانگين ها هم يك نمودار توزيع رسم كرد. به چنين نموداري اصطلاحاً «نمودار توزيع ميانگينها» يا «نمودار توزيع نمونهبرداري» نام ميدهيم.
نمودار توزيع ميانگينها در نمونه برداري
اين نمودار هم توزيع نرمال دارد!
ميانگينِ ميانگينها = ميانگين كل جامعه
نمودار توزيع ميانگينها در نمونه برداري
خصوصيات نمودار توزيع نمونه برداري
ميانگين همهي توزيع نرمالها برابر ميانگين كل جامعه است.
با افزايش حجم نمونه انحراف معيار كاهش مييابد.
مقدار اين انحراف معيار (كه SD(X) يا SEM نام ميگيرد) برابر است با:
تخمين (Estimation)
عملاًً مقدور نيست كه تمام جامعه را در يك نمونهگيري مورد بررسي قرار داد.
عملاً ممكن نيست كه نمونهگيريهاي كوچكتر را به دفعات كافي انجام داد تا نمودار توزيع نمونهگيري كامل شود.
در اكثر مطالعات علوم پزشكي اگر بتوان تخميني از ميانگين كل جامعه به دست آورد كه تا ٩٥٪ صحيح برآورد شود، اين تخمين را صحيح تلقي ميكنند و در بالين به كار ميبرند.
مرور نمودار توزيع نمونهبرداري
مثال: توزيع نمونهبرداري فشار خون سيستولي
فرض كنيد در نمونهبرداري ما ميانگين فشارخون 12.5 به دست بيايد. همچنين فرض كنيد كه مقدار SEM برابر 0.1 باشد.
مثال: توزيع نمونهبرداري فشار خون سيستولي
پس اگر ميانگين ما بين نقطه A و نقطه E باشد، ميانگين جامعه بين 12.3 تا 12.7 است.
٩٥٪ ميانگين ها بين نقطه A و نقطه E است.
بازه اطمينان (Confidence Interval)
گفتيم به احتمال ٩٥٪ ميانگين جامعه بين 12.3 تا 12.7 است. بيان رياضي اين عبارت چنين است:
95% CI = 12.3 – 12.7
دقت كنيد: ما مي پذيريم كه ٥٪ هم احتمال دارد كه ميانگين جامعه در حدود فوق نباشد!
نمودار توزيع نرمال نشاندهندهي بازه اطمينان
دقت كنيد كه X ميانگيني است كه ما در يكبار نمونهگيري به دست آورده ايم و اين نمودار ميگويد كه به احتمال ٩٥٪ ميانگين واقعي جامعهي ما (μ) در چه حدودي است.
آزمون فرضيه
فرضيه: فشار خون بالا در پسرها بيشتر يافت ميشود.
طراحي فرضيه:
فرضيهي H1 : فشار با جنس ارتباط دارد.
فرضيهي H0 : فشار با جنس ارتباط ندارد.
محقق در صدد است فرضيهي H1 را اثبات كند. يك راه حل اين است كه فرضيهي H0 را رد كند.
انجام آزمايش
نتايج نوبت اول آزمايش:
ميانگين فشارخون دخترها : 11.5 سانتيمتر جيوه
ميانگين فشارخون پسـرها : 12.5 سانتيمتر جيوه
ميتوانيم دو نمودار توزيع نمونه برداري رسم كنيم، كه به ترتيب نشان بدهند به احتمال ٩٥٪ ميانگين واقعي فشارخون كل جامعهي «پسرها» و «دخترها» در چه بازهاي قرار دارد.
نمودار بازهي اطمينان ميانگين فشارخون دو جنس
تطبيق دو نمودار فوق روي هم
حالت اول:
بازههاي ٩٥٪ دو نمودار روي هم افتاده است؛ پس فرض «عدمِ وجودِ تفاوت» رد نميشود. (البته تائيد هم نميشود!)
تطبيق دو نمودار فوق روي هم
حالت دوم:
بازههاي ٩٥٪ دو نمودار روي هم نيفتاده، پس فرض «عدمِ وجودِ تفاوت» رد ميشود. (و فرض وجود تفاوت تائيد ميشود.)
توضيحات
در حالت دوم توانستيم نشان دهيم كه به احتمال ٩٥٪ ميانگين فشارخون پسرها از دخترها بيشتر است.
دقت داريد كه هنوز يك شانس پنج درصدي براي اين كه تفاوتي كه نشان دادهايم كاذب باشد (يعني نمونهها به طور اتفاقي از هم دور افتاده باشند) وجود دارد، كه به آن اصطلاحاًٌ P-value نام ميدهند.
P-value
اگر فشارخون دخترها و پسرها تفاوت بيشتري داشت، ممكن بود حالتي پيش بيايد كه حتي به احتمال ٩٩٪ هم فرض صفر رد شود، يعني P-value = 0.01 شود.
اين كه P-value كمتر باشد تنها نشان ميدهد كه تفاوت از نظر آماري كمتر تصادفي به نظر ميآيد. P-valueي كمتر نشانهي تفاوت شديدتر نيست. همچنين P-value فقط از «معنيداري آماري» سخن ميگويد، و بدون «توجيه پذيريِ علمي» فاقد اعتبار است.
دیدگاه خود را ثبت کنید