Kapan melakukan normalisasi atau standarisasi data?

Daftar Isi:

Kapan melakukan normalisasi atau standarisasi data?
Kapan melakukan normalisasi atau standarisasi data?
Anonim

Normalization berguna ketika data Anda memiliki skala yang bervariasi dan algoritma yang Anda gunakan tidak membuat asumsi tentang distribusi data Anda, seperti k-nearest neighbor dan artificial neural jaringan. Standardisasi mengasumsikan bahwa data Anda memiliki distribusi Gaussian (kurva lonceng).

Kapan normalisasi data?

Data harus dinormalisasi atau distandardisasi agar semua variabel menjadi proporsional satu sama lain. Misalnya, jika satu variabel 100 kali lebih besar dari yang lain (rata-rata), maka model Anda mungkin berperilaku lebih baik jika Anda menormalkan/menstandarkan kedua variabel menjadi kira-kira setara.

Apa perbedaan antara normalisasi dan standardisasi?

Normalization biasanya berarti mengubah skala nilai menjadi kisaran [0, 1]. Standardisasi biasanya berarti mengubah skala data agar memiliki mean 0 dan standar deviasi 1 (varian unit).

Kapan dan mengapa kita membutuhkan normalisasi data?

Dalam istilah yang lebih sederhana, normalisasi memastikan bahwa semua data Anda terlihat dan dibaca dengan cara yang sama di semua catatan. Normalisasi akan menstandardisasi bidang termasuk nama perusahaan, nama kontak, URL, informasi alamat (jalan, negara bagian dan kota), nomor telepon dan jabatan.

Bagaimana Anda memilih normalisasi dan standardisasi?

Dalam dunia bisnis, "normalisasi" biasanya berarti bahwa kisaran nilai adalah"dinormalisasi menjadi dari 0.0 ke 1.0". "Standarisasi" biasanya berarti bahwa rentang nilai "distandarisasi" untuk mengukur berapa banyak standar deviasi nilai dari rata-ratanya.

Direkomendasikan: