Hududni qachon ishlatish kerak?

Hududni qachon ishlatish kerak?
Hududni qachon ishlatish kerak?
Anonim

Hudud toʻplami nima? Baʼzan “sinov” maʼlumotlari deb ataladigan toʻxtash toʻplami mashinani oʻrganish modeli oʻrgatilgan va tasdiqlangandan soʻng uning ishlashigayakuniy baho beradi. Qaysi algoritmlardan foydalanish yoki algoritmlarni takomillashtirish yoki sozlash toʻgʻrisida qaror qabul qilish uchun ushlab turish toʻplamlari hech qachon ishlatilmasligi kerak.

Oʻzaro tekshirish kutishdan koʻra yaxshiroqmi?

Odatda oʻzaro tasdiqlash usuli afzal koʻriladi, chunki u sizning modelingizga bir nechta poezd-test boʻlinishlarida mashq qilish imkoniyatini beradi. Bu sizning modelingiz ko'rinmas ma'lumotlarda qanchalik yaxshi ishlashini yaxshiroq ko'rsatish imkonini beradi. Boshqa tomondan, ushlab turish faqat bitta poyezd sinoviga bog'liq.

Holdout yondashuvi nima?

Holdout metodi klassifikatorni baholashning eng oddiy usuli hisoblanadi. Ushbu usulda ma'lumotlar to'plami (ma'lumotlar to'plami yoki misollar to'plami) Trening to'plami va Test to'plami deb ataladigan ikkita to'plamga bo'linadi. Tasniflagich ma'lum to'plamdagi ma'lumotlar elementlarini maqsadli toifa yoki sinfga belgilash funktsiyasini bajaradi.

Har doim oʻzaro tekshiruvdan oʻtishim kerakmi?

Umuman olganda oʻzaro tekshirish modelning optimal parametrlarini aniqlash kerak boʻlganda har doim kerak boʻladi, logistik regressiya uchun bu C parametri boʻladi.

K-katlama oʻzaro tekshirishning afzalligi nimada?

agar siz solishtirsangiz test-MSElar LOOCVga qaraganda k-katta CVda yaxshiroq. k-katlama CV yoki har qanday CV yoki qayta namuna olish usullari bunday qilmayditest xatolarini yaxshilash. ular test xatolarini baholaydilar. k-katlama bo'lsa, u LOOCV ga qaraganda xatoni baholashda yaxshiroq ishlaydi.

Tavsiya: