دسته | مهندسی نرم افزار |
---|---|
حجم | 33/23 کیلوبایت |
صفحه | 18 |
فرمت | pptx |
قیمت | 30000 تومان |
دانلود پاورپوينت داده کاویی جریان داده ها با درخت های تصمیم گیری
فرايندی دو مرحله ای است :
ساخت مدل :
تحليل يک مجموعه آموزشی که مجموعهای از تاپلهای پايگاه است و مشخص کردن برچسب کلاسهای مربوط به اين تاپلها .
يک تاپل X با يک بردار صفت X=(x1,x2,…,xn) نمايش داده میشود . فرض می شود که هر تاپل به يک کلاس از پيش تعريف شده متعلق است .
هرکلاس با يک صفت که به آن صفت برچسب کلاس میگوييم مشخص میشود .
مجموعه آموزشی به صورت تصادفی از پايگاه انتخاب می شود .
به اين مرحله ، مرحله يادگيری نيز می گويند .
استفاده از مدل :
از طريق يک تابع y=f(X) برچسب کلاس هر تاپل X از پايگاه را پيش بينی می شود .
اين تابع به صورت قواعد کلاسهبندی ، درختهای تصميم گيری يا فرمولهای رياضی است .
يکی از روش های کارآمد و با کاربرد گسترده کلاسه بندی است .
مدل حاصل از اين روش به صورت درختهای تصميم گيری است :
هر گره در اين درخت نشان دهنده يک آزمون بر روی يک صفت است .
هر شاخه خارج شونده از يک گره نشان دهنده خروجی های ممکن آزمون است .
هر برگ نشان دهنده يک برچسب کلاس است .
نحوه استفاده از درخت تصميم گيری :
اگر تاپلی چون X که برچسب کلاس آن نامشخص است داشته باشيم صفات اين تاپل در درخت مورد آزمون قرار می گيرند و يک مسير از ريشه به سمت يک برگ که برچسب يک کلاس را دارد ايجاد می شود .
برابریها :
وقتی که دو يا بيشتر صفت در G بسيار شبيه هستند نمونههای زيادی برای تصميمگيری بين آنها ، با اطمينان بالا نياز است .
در اين مورد ، اينکه چه صفتی انتخاب می شود اختلاف اندکی را بوجود میآورد .VFDT بصورت انتخابی تصميم میگيرد که يک برابری وجود دارد و شکاف را روی يکی از بهترين صفتهای جاری انجام میدهد .
محاسبه G:
بخش قابل توجهی از زمان به ازای هر نمونه برای محاسبه G صرف می شود .
محاسبه دوباره G برای هر نمونه جديد ناکارا است ، چون احتمال تصميم برای شکاف در آن نقطه مشخص غير محتمل است .
بنابراين VFDT به کاربر اجازه میدهد تا يک حداقل تعداد برای نمونه های جديد يا nmin را مشخص کند که بايد در هر برگ انباشته شود قبل از اينکه G دوباره محاسبه شود .
فهرست مطالب
کلاسه بندی
درخت های تصميم گيری
مجموعه داده های آموزشی
درخت تصميم گيری برای buys_computer
الگوريتم برای درخت های تصميم گيری
چالش ها
نکات کليدی
چه تعداد نمونه کافی است ؟
الگوريتم Hoeffding Tree
درختان تصميم گيری بسيار سريع VFDT
مقايسهای بين VFDT وC4.5
منابع (1)
منابع (2)