Normallashtirish maʼlumotlaringiz turli miqyoslarga ega boʻlsa va siz foydalanayotgan algoritm maʼlumotlaringizning taqsimlanishi haqida faraz qilmasa foydali boʻladi, masalan, k-yaqin qoʻshnilar va sunʼiy neyron tarmoqlar. Standartlashtirish maʼlumotlaringiz Gauss (qoʻngʻiroq egri chizigʻi) taqsimotiga ega ekanligini taxmin qiladi.
Ma'lumotlarni qachon normallashtirishimiz kerak?
Barcha oʻzgaruvchilarni bir-biriga mutanosiblashtirish uchun maʼlumotlar normallashtirilgan yoki standartlashtirilgan boʻlishi kerak. Misol uchun, agar bitta oʻzgaruvchi boshqasidan 100 marta katta boʻlsa (oʻrtacha), agar siz ikkita oʻzgaruvchini taxminan ekvivalent qilib normallashtirsangiz/standartlashtirsangiz, modelingiz yaxshi ishlashi mumkin.
Normallashtirish va standartlashtirish oʻrtasidagi farq nima?
Normallashtirish odatda qiymatlarni [0, 1] diapazoniga oʻzgartirishni bildiradi. Standartlashtirish odatda maʼlumotlarni oʻrtacha 0 va standart ogʻish 1 (birlik variatsiyasi) boʻlishi uchun qayta oʻzgartirishni bildiradi.
Bizga qachon va nima uchun ma'lumotlarni normallashtirish kerak?
Oddiyroq qilib aytganda, normalizatsiya barcha maʼlumotlaringiz barcha yozuvlarda bir xil koʻrinishi va oʻqilishini taʼminlaydi. Normalizatsiya maydonlarni standartlashtiradi, jumladan kompaniya nomlari, kontakt nomlari, URL manzillari, manzil ma'lumotlari (ko'chalar, shtatlar va shaharlar), telefon raqamlari va lavozim unvonlari.
Normallashtirish va standartlashtirishni qanday tanlaysiz?
Biznes olamida "normallashtirish" odatda qiymatlar diapazonini anglatadi"0,0 dan 1,0 gacha normallashtirildi". “Standartlashtirish” odatda qiymatlar diapazoni oʻrtacha qiymatdan qancha standart ogʻish ekanligini oʻlchash uchun “standartlashtirilgan” degan maʼnoni anglatadi.