دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری جهت رشته مهندسی نرم افزار در قالب 18 اسلايد و با فرمت pptx بصورت کامل و جامع و با قابليت ويرايش

 

 

 فرايندی دو مرحله ای است :
ساخت مدل :
تحليل يک مجموعه آموزشی که مجموعه‌ای از تاپل‌های پايگاه است و مشخص کردن برچسب کلاس‌های مربوط به اين تاپل‌ها .
 يک تاپل X با يک بردار صفت X=(x1,x2,…,xn) نمايش داده می‌شود . فرض می شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است .
هرکلاس با يک صفت که به آن صفت برچسب کلاس می‌گوييم مشخص می‌شود .
 مجموعه آموزشی به صورت تصادفی از پايگاه انتخاب می شود .
به اين مرحله ، مرحله يادگيری نيز می گويند .
استفاده از مدل :
از طريق يک تابع y=f(X) برچسب  کلاس هر تاپل X از پايگاه را پيش بينی می شود .
اين تابع به صورت قواعد کلاسه‌بندی ، درخت‌های تصميم گيری يا فرمول‌های رياضی است .

 

 


يکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
مدل حاصل از اين روش به صورت درختهای تصميم گيری است :
هر گره در اين درخت نشان دهنده يک آزمون بر روی يک صفت است .
هر شاخه خارج شونده از يک گره نشان دهنده خروجی های ممکن آزمون است .
هر برگ نشان دهنده يک برچسب کلاس است .
نحوه استفاده از درخت تصميم گيری :
اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار می گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد می شود .

 

 

برابری‌‌ها :
وقتی که دو يا بيشتر صفت در G بسيار شبيه هستند نمونه‌های زيادی برای تصميم‌گيری بين آنها ، با اطمينان بالا نياز است .
در اين مورد ، اينکه چه صفتی انتخاب می شود اختلاف اندکی را بوجود می‌آورد .VFDT  بصورت انتخابی تصميم می‌گيرد که يک برابری وجود دارد و شکاف را روی يکی از بهترين صفت‌های جاری انجام می‌دهد .
محاسبه G:
بخش قابل توجهی از زمان به ازای هر نمونه برای محاسبه G صرف می شود .
محاسبه دوباره G برای هر نمونه جديد ناکارا است ، چون احتمال تصميم برای شکاف در آن نقطه مشخص غير محتمل است .
 بنابراين VFDT به کاربر اجازه می‌دهد تا يک حداقل تعداد برای نمونه های جديد يا nmin  را مشخص کند که بايد در هر برگ انباشته شود قبل از اينکه G دوباره محاسبه شود .

 

 

فهرست مطالب
کلاسه بندی
درخت های تصميم گيری
مجموعه داده های آموزشی
درخت تصميم گيری برای buys_computer
الگوريتم برای درخت های تصميم گيری
چالش ها
نکات کليدی
چه تعداد نمونه کافی است ؟
الگوريتم Hoeffding Tree
درختان تصميم گيری بسيار سريع VFDT
مقايسه‌ای بين VFDT وC4.5
منابع (1)
منابع (2)