دانلود پاورپوینت انتخاب ويژگی برای مقاصد داده کاوی بر مبنای ترکيب الگوريتم ژنتيک و مورچگان با فرمت ppt ودر100اسلاید قابل ویرایش
قسمتی از متن پاورپوینت
فهرست مطالب
آشنایی با داده کاوی
آشنایی با الگوریتم ژنتیک
آشنایی با الگوریتم مورچگان
روش های انتخاب ویژگی
انتخاب ویژگی توسط ترکیب الگوریتم ژنتیک و مورچگان
مراجع
گرایشات جریان داده ها
تولید داده های زیاد
بانک، دیگر تراکنش های تجاری
داده : ستاره شناسی، زیست شناسی، و غیره
وب، متن، و تجارت الکترونیکی
بزرگترین پایگاه های داده در 2003
پایگاه داده های تجاری
طبق گزارش winter Corp. 2003 Survey : France Telecom بزرگترین پایگاه داده حمایت از تصمیم گیری دارند تقریبا 30TB
وب
جستجوی Google در 4 بیلیون صفحه شامل صدها ترابایت می باشد
آرشیو اینترنت (www.archive.org) تقریبا 300 TB
نرخ رشد داده
دو برابر اطلاعات در سال 2002 نسبت به سال 1999ایجاد شده بود. (تقریبا 30 درصد نرخ رشد)
داده کمی بوسیله یک انسان مورد نگرش قرار می گیرد
کشف دانش برای حس و استفاده از داده مورد نیاز است
نواحی کاربرد یادگیری ماشین/داده کاوی
علم
ستاره شناسی، زیست شناسی، کشف دارو، و ...
تجاری
تبلیغات، مدیریت ارتباط با مشتری (CRM) ، سرمایه گذاری، کارخانه سازی، تجارت الکترونیکی، ارتباطات، مراقبت پزشکی، و ...
وب
موتورهای جستجو، و ...
دولتی
اعمال قانون، تاریخچه متقلبان مالیات، و ...
مطالعه موردی : ارزیابی مخاطره موجودی
وضعیت : شخصی برای یک وام اقدام می کند
وظیفه : آیا بانک اعطای وام را تصویب نماید؟
توجه : افرادی که بالاترین موجودی را دارند نیازی به وام ندارند، و افرادی که پایین ترین موجودی را دارند احتمالا قدرت بازپرداخت را ندارند. بهترین مشتریان بانک در میانه این دو هستند.
مخاطره موجودی - نتایج
بانک ها مدل های موجودی را با استفاده از روش های متنوع یادگیری ماشین توسعه می دهند
افزایش وام مسکن و کارت اعتباری نتایج قادر بودن به تخمین اینکه یک فرد احتمالا وام را بازپرداخت ننماید، ارائه می نمایند.
در بسیاری از کشورها توسعه یافته است
تجارت الکترونیکی موفق – مطالعه موردی
یک شخص یک کتاب (محصول) از Amazon.comخریداری می کند.
وظیفه : توصیه دیگر کتابها (محصولاتی) که این فرد احتمالا خریداری می کند.
آمازون بر اساس کتاب های خریداری شده، خوشه بندی را انجام می دهد
مشتریانی که کتاب “Advances in Knowledge Discovery and Data Mining” را خریداری کرده اند، همچنین کتاب “Data Mining: Practical MachineLearning Tools and Techniques with Java Implementations” را خریداری کرده اند.
برنامه توصیه کاملا موفق بوده است
مسائل مناسب برای داده کاوی
به تصمیمات مبتنی بر دانش نیاز دارند
دارای محیط متغیر هستند
دارای روش های جاری زیر بهینه هستند
دارای داده های قابل دسترسی، کافی، و مربوط هستند
دارای هزینه های بالایی برای تصمیمات درست می باشند
در صورتیکه نیاز به نگهداری داده های شخصی باشد به ملاحظات پنهان کاری نیاز داریم
تعریف کشف دانش
کشف دانش در داده عبارت است از
فرآیند غیر جزئی شناسایی الگوهای
معتبر
جدید
مفید
و قابل درک در داده
from Advances in Knowledge Discovery and Data Mining, Fayyad, Piatetsky-Shapiro, Smyth, and Uthurusamy, (Chapter 1), AAAI/MIT Press 1996
دیدگاه خود را ثبت کنید