Last modified: 2023-06-15
Abstract
Analisis klaster adalah metode dalam analisis multivariat untuk mengelompokkan n observasi ke dalam K kelompok (K ≤ n) berdasarkan karakteristiknya. Salah satu algoritma yang cukup terkenal dalam analisis klaster adalah K-Means. K-Means menggunakan prinsip non-hierarki dimana pada inisiasi awal, perlu menentukan terlebih dahulu jumlah kelompok. Algoritma K-Means dapat diaplikasikan untuk mengelompokkan Provinsi-Provinsi yang ada di Indonesia berdasarkan indikator ekonomi makro (persentase penduduk miskin, tingkat pengangguran terbuka, dan Gini ratio) dan kriminalitas (Crime rate). Tujuan akhir dari penelitian ini tentunya mendapatkan hasil pengelompokkan yang optimal. Pengukuran kemiripan yang digunakan adalah Euclidean Distance. Jumlah kelompok yang dicobakan K=2,3,4,...,10 dan dipilih jumlah kelompok yang optimal dengan nilai Silhouette tertinggi. Berdasarkan hasil analisis, diperoleh jumlah klaster yang optimal sebanyak empat. Ke empat klaster ini memiliki karakteristik/penciri yang membedakan antara klaster yang satu dengan klaster lainnya.