ALGORITMA K-MEANS UNTUK PENGELOMPOKKAN PROVINSI-PROVINSI DI INDONESIA BERDASARKAN INDIKATOR EKONOMI MAKRO & KRIMINALITAS

Fachrian Bimantoro Putra; Andrea Tri Rian Dani; Meirinda Fauziyah; Sifriyani Sifriyani; Suyitno Suyitno; M Fathurahman

Portal Conference FMIPA, Seminar Nasional Matematika, Statistika dan Aplikasinya (SNMSA) Tahun 2023

Fachrian Bimantoro Putra, Andrea Tri Rian Dani, Meirinda Fauziyah, Sifriyani Sifriyani, Suyitno Suyitno, M Fathurahman

Last modified: 2023-06-15

Abstract

Analisis klaster adalah metode dalam analisis multivariat untuk mengelompokkan n observasi ke dalam K kelompok (K ≤ n) berdasarkan karakteristiknya. Salah satu algoritma yang cukup terkenal dalam analisis klaster adalah K-Means. K-Means menggunakan prinsip non-hierarki dimana pada inisiasi awal, perlu menentukan terlebih dahulu jumlah kelompok. Algoritma K-Means dapat diaplikasikan untuk mengelompokkan Provinsi-Provinsi yang ada di Indonesia berdasarkan indikator ekonomi makro (persentase penduduk miskin, tingkat pengangguran terbuka, dan Gini ratio) dan kriminalitas (Crime rate). Tujuan akhir dari penelitian ini tentunya mendapatkan hasil pengelompokkan yang optimal. Pengukuran kemiripan yang digunakan adalah Euclidean Distance. Jumlah kelompok yang dicobakan K=2,3,4,...,10 dan dipilih jumlah kelompok yang optimal dengan nilai Silhouette tertinggi. Berdasarkan hasil analisis, diperoleh jumlah klaster yang optimal sebanyak empat. Ke empat klaster ini memiliki karakteristik/penciri yang membedakan antara klaster yang satu dengan klaster lainnya.

Keywords

Euclidean Distance; K-Means; Kriminalitas; Silhouette