توضیحات محصول
دانلود پاورپوینت خوشه بندی مقید با فرمت ppt و در34 اسلاید قابل ویرایش
قسمتی از متن پاورپوینت
— پاورپوینت شامل تصاویر میباشد —-
اسلاید ۱ :
فهرست مطالب
- مقدمه ای بر خوشه بندی
- ارزیابی خوشه بندی
- خوشه بندی مقید
- چالشها و راهکارها
- پژوهش های انجام شده
-
اسلاید ۲ :
گروهبندی دادهها به گونهای که خصوصیات مشترک بین دادههای هر گروه زیاد و خصوصیات مشترک بین گروههای متفاوت کم باشد.
سوال ۱: خصوصیات مشترک؟ چگونگی تشخیص خصوصیات؟
یادگیری ماشین، هوش مصنوعی، الگوشناسی، وب کاوی، تحلیل پایگاه داده، پردازش متون و تصاویر، علوم پزشکی، علوم اجتماعی، اقتصاد و تجارت، علوم کامپیوتر، پزشکی
-
- خوشهبندی به عنوان یک مساله مشکل
- مهمترین دلایل مشکلبودن مساله:
- ذات بدون ناظر بودن الگوریتمهای خوشهبندی
- ابهام در تعریف خوشه مناسب
- مشکل بودن تعریف معیار فاصله مناسب
- تعریف تابع هدف مناسب به منظور خوشهبندی
- عدم وجود الگوریتم جامع برای حل همه مسائل خوشهبندی
اسلاید ۳ :
ارزیابی کلاسترینگ
- چند مساله
- تمایل به خوشه بندی شدن داده؟
- آیا یک ساختار غیر تصادفی در داده وجود دارد؟
- استفاده از تستهای آماری
- تعداد خوشه ها؟
- برخی الگوریتم ها نیاز به دانستن تعداد خوشه ها قبل از خوشه بندی دارند.
- راهکارهای تقسیم و ادغام با معیارهایی از قبیل واریانس درون و برون خوشه ای
- کیفیت خوشه بندی انجام شده؟
- خوشه بندی انجام شده چقدر خوب است؟
- ارائه معیارهای ارزیابی مناسب
اسلاید ۴ :
ویژگیهای یک معیار ارزیابی مناسب (4 شرط)
- Cluster homogeneity
- هر چه خلوص در خوشه بندی (با دانستن کلاس اصلی داده ها، داده های هم کلاس در یک خوشه قرار بگیرند) بیشتر باشد این معیار بیشتر است.
- داده های دسته های متفاوت در خوشه های متفاوت قرار داده شوند.
اسلاید ۵ :
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
- Cluster completeness
- نقطه مقابل Cluster homogeneity
- داده ها ی دسته های یکسان در خوشه های یکسان قرار داده شوند.
-
اسلاید ۶ :
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
- Rag bag
- در برخی مسایل دسته ای به نام «متفرقه» داریم که شامل داده هایی است که نمی توانند با داده های دیگر کلاسها هم خوشه شوند.
- جریمه انتساب این نوع داده ها به یک خوشه خالص بیشتر از انتساب آنها به خوشه متفرقه است .
اسلاید ۷ :
ارزیابی کلاسترینگ (کیفیت خوشه بندی انجام شده؟)
- Small cluster preservation
- هدف: ممانعت از شکسته شدن دسته های کوچک اشیا
- تقسیم یک دسته کوچک از اشیا به دسته های ریز بسیار خطرناکتر از تقسیم دسته بزرگ به دسته های کوچکتر است.
- داده ها ممکن است با فرض نویز یا outlier حذف شوند.
اسلاید ۸ :
استفاده از اطلاعات جانبي در خوشهبندي
- اطلاعات جانبی
- ساختار دادهها
- هدف خوشهبندی
- شکل خوشهها
- بیشینه اندازه خوشهها
- حداکثر اعضای هر خوشه
- قیدهای در سطح نمونه
- قیدهای باید-پیوند Must-link(ML)
- قیدهای نفی-پیوند Cannot-link(CL)
-
-
- قابلیت این قیدها در تعریف قیدهای پیچیده تر
- قید وجود حداقل یک همسایه در فاصله ε: با ایجاد قید باید-پیوند میان هر داده و حداقل یکی از نقاط موجود در همسایگی ε
اسلاید ۹ :
خوشهبنديمقيد (دستهبندي )
- مبتنی بر ارضاء قید:
- ارضاء سخت:
- ارضاء تمامی قیدها به طور کامل
- رویکرد جستجوی حریصانه، عدم یافتن یک جواب ممکن برای مساله حتی در صورت وجود جواب
- COP-KMEANS [Wagstaff01]
- ارضاء نرم: تا حد ممکن سعی در ارضاء قیدها دارند.
اسلاید ۱۰ :
خوشهبنديمقيد (دستهبندي)
- سلسله مراتبی:
- با تغییر الگوریتمهای خوشهبندی سلسلهمراتبی قابلیت برآورده کردن قیدها را نیز در آنها تعبیه مینمایند.
- خوشهبندی با ساختن دندروگرامی از دادهها
- روش پایه:
- ابتدا هر داده به عنوان یک خوشه درنظر گرفته می شود.
- عمل ادغام خوشهها تا هنگامی که ادغام آنها هیچ قیدی را نقض نکند
- روش Davidson [Davidson05]
- ابتدا بستارهای تراگذری مربوط به قیدهای باید-پیوند (ML) محاسبه میشود
- خوشهبندی را با X1+r خوشه آغاز مینماید کهX1 تعداد نمونههایی است که هیچ قید باید-پیوندی بر روی آنها اعمال نشده و r تعداد اجزاء همبند حاصل از قیدهای باید-پیوند است..
- انتخاب دو نزدیکترین خوشه و ادغام آنها تا زمانی که دو خوشه برای ادغام وجود دارند.
...
بیشتر
دیدگاه خود را ثبت کنید