Pengelompokan Kabupaten/Kota Provinsi Sulawesi Selatan dan Barat Berdasarkan Angka Partisipasi Pendidikan SMA/SMK/MA Menggunakan K-Medoid dan CLARA

Wardianti AS(1*), Muhammad Kasim Aidid(2), Muhammad Nusrang(3),

(1) Prodi Statistika FMIPA Universita Negeri Makassar
(2) Prodi Statistika FMIPA Universita Negeri Makassar
(3) Prodi Statistika FMIPA Universita Negeri Makassar
(*) Corresponding Author




DOI: https://doi.org/10.35580/variansiunm12899

Abstract


Abstrak Analisis kelompok digunakan untuk mengelompokan objek-objek dengan kesamaan karakteristik yang tinggi dalam satu kelompok sementara objek-objek dengan ketidaksamaan karaketristik berada dalam kelompok yang berbeda. Analisis kelompok terbagi menjadi metode hierarki dan non hierarki. Metode hierarki menggunakan struktur seperti pohon pada keputusan pengelompokan objeknya. Metode tidak berhierarki menemptakan objek - objek ke pusat kelompok terdekat saat banyaknya kelompok sudah ditentukan. Pusat kelompok terbagi menjadi rataan dan median. Kelemahan dari pusat kelompok rataan yaitu tidak kekar terhadap adanya pencilan. Hal tersebut berbeda dengan pusat kelompok median yang kekar terhadap pencilan. Permasalahan data yang besar juga menjadi perhatian dalam penelitian ini, maka digunakanlah CLARA sebagai pengembangan dari metode k -medoid. Penelitian ini menerapkan metode k -medoid dan CLARA untuk mengelompokan kabupaten/kota di Sulawesi Selatan dan Barat berdasarkan indikator penyusun Angka Partisipasi Pendidikan tahun 2017. CLARA dibangun dari kelompok yang dihasilkan oleh metode k -medoid dengan banyaknya kelompok terbaik empat kelompok. Dihasilkan nilai silhouette pada metode k -medoid dan CLARA yang sama yaitu k=4 sebesar 0,49 pada masing-masing metode tersebut. Metode k -medoid dan CLARA mempunyai kriteria pengelompokan yang lebih jelas jika dilihat pada masing-masing indikatornya sehingga dapat dijadikan sebagai alternatif memetakan kabupaten/kota di Sulawesi Selatan dan Barat berdasarkan indikator penyusun Angka Partisipasi Pendidikan tahun 2017.

 

Kata Kunci: analisis kelompok, CLARA, angka Partisipasi Pendidikan, k-medoid

 

 

Abstract Cluster analysis is grouping objects by high similarity of characteristic in a cluster but high dissimilarity in another cluster. Cluster analysis is divided into hierarchical method and non hierarchical method. Hierarchical method use structur tree-like to determine its object in a cluster. The objects are placed to a similar centroid while

cluster seed was determined in non-hierarchical method. The types of centroid are mean centroid and median centroid (known as medoid). The disadvantage of mean is not robust from outlier. Otherwise, k -medoid is robust with outlier data. Big data problem is concerned, so CLARA is used to be a development from k –medoid method. K-medoid and CLARA is applicated in this paper to clustering city of South Sulawesi and West Sulawesi based on the indicator of APP year 2017. APP was categorized into four levels, hence CLARA was build from a cluster which resulted from k -medoid for four clusters. Generated silhouette value on the method k -medoid and CLARA with same value k=4 of 0,49 each methods. Furthermore, the characteristic of each group of CLARA method and k -medoid were more clear than the APP groups, hence would be an alternative to map the city of Indonesia based on APP indicators year 2017.

 

Keywords: Cluster analysis, CLARA, Educational partisipation, K-medoid.

Full Text:

PDF

References


Agresti, A. (2002). Categorial data analysis (second ed.). New York: John Wiley

& Sond, Inc

Alsulaiman ET. (2013). Classifying Technical Indicators Using K-Medoid Clustering. Journal of Trading 8(2): 29-39.

Badan Pusat Statistik. 2017. Indikator Kesejahteraan Rakyat Sulawesi Selatan 2017. Badan Pusat Statistik Provinsi Sulawesi Selatan.

Badan Pusat Statistik. (2017). Statistik Pendidikan Sulawesi Selatan 2017. Badan Pusat Statistik Provinsi Sulawesi Selatan.

Badan Pusat Statistik. (2018). Statistik Daerah Sulawesi Barat 2018. Badan Pusat Statistik Provinsi Sulawesi Barat.

Badan Pusat Statistik. (2012). Statistik Pendidikan Jawa Tengah 2012. Badan Pusat Statistik Provinsi Jawa Tengah.

Badan Perencanaan Pembangunan Nasional. (2015). Seri Analisis Pembangunan Wilayah Provinsi Jawa Timur 2015.

Bolshakova, N., & Azuaje, F. (2001). Improving Expression Data Mining through Cluster Validity. Departement of Computer Science. Ireland: Trinity College Dublin.

Bunkers M.J., & J.R. Miller. (1996). Definition of Climate Regions in the Northern Plains Usingan Objective Cluster Modification Technique. Journal of Climate, No. 9, hal 130-146.

Chu, S., John F. Roddick, J.S. Pan (2002). Efficient K-Medoids Algorthms Using Multi-Centroids With Multi-Runs Sampling Scheme. http://citeseer.nj.nec.com/537999..html.

Dewanti. (2013). Perbandingan Metode Cluster validity pada jenis data numeric dan kategori [Skripsi]. Bogor: Institut Pertanian.

Furqon, Muhammad Tanzil, Lailil Muflikhakh.2016. Clustering the potentialrisk of tsunami using Density-BasedSpatial clustering of application withnoise (DBSCAN). Journal ofEnvironmental Engineering & SustainableTechnology (JEEST) Vol. 03 No. 01, July2016, Pages 1-8.

Hair, JF, Black W.C., Babin, B.J., & Anderson,R.E. (2010). Multivariate Data Analysis Seventh Edition. New Jersey (US): Pearson.

Han J, Kamber M. (2006). Data Mining: Concept and Techniques second editions. Elsevier: Morgan Kaufman Publisher.

Han, J., & Kamber, M. (2001). Data Mining: Concepts and Techniques. USA: Academic Press.

Halkidi M, Yannis B, Michalis V. 2001. On Clustering Validation Techniques. Journal of Intelligent Information System 17(2/3):107-145. Netherlands.

Johnson, R.A. & Whinchern, D.W. (2007). Applied multivariate statistical analysis sixth edition. Prentice Hall: New Jersey.

Kaufman, Lonard, & Rousseeuw, Peter J. (1990). Finding Group in Data. John Willey & Sons, Inc. Kanada.

Karti, H.S, Irhamah. (2013). Pengelompokan Kabupaten/Kota di Provinsi Jawa Timur Berdasarkan Indikator Pendidikan SMA/SMK/MA dengan Metode C-Means dan Fuzzy C-Means. Jurnal Sains dan Seni Pomits 2(2): 288-293.

Kantardzic, M.(2011). Data Mining: Concepts, Models, Methods, and Algorithms. USA : John Wiley & Son, Inc.

Lewis,Paul D. (2010).R For Madicine and Biology.Jones and Bartlett Publisher

Mattjik, A.A., & Made Sumertajaya. (2002). Perancangan Percobaan dengan Aplikasi SAS Dan Minitab. Jilid I. Edisi kedua. Bogor: IPB Press.

Prayudho, BJ. (2009). Analisis Cluster. [terhubung berkala]. http://prayudha. wordpress.com /2008/12/30 /analisis-cluster/.[29 November 2015].

Pusat Bahasa Departemen Pendidikan Nasional. (2013). Pendidikan. Diakses dari http://www. sarjanaku .com /2012/12/pengertian-pendidikan-menurut-para-ahli.html Kamis, 28 Februari 2013.

Rizqia, Hamzulida R. (2016). Faktor-Faktor Yang Mempengaruhi Angka Partisipasi Kasar (Apk) Jenjang Pendidikan Sekolah Menengah Pertama Pada Masyarakat Pesisir Di Kecamatan Sarang Kabupaten Rembang Tahun 2015. Semarang: UNNES.

Ridwan, Mujib, Hadi Suyono, M. Sarosa. (2013). Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritme Naive Bayes Classifier. Jurnal EECCIS Vol.7, No. 1, Juni 2013.

Rizal, Annas, S. & Hakim , R.B.F. (2015). Metode K-Means Cluster dan Fuzzy C-Means Cluster (Studi Kasus : Indeks Pembangunan Manusia di Kawasan Indonesia Timur Tahun 2012). Yogyakarta : Universitas Islam Indonesia.

Syafrina M. (2015). Penggerombolan daerah Indonesia berdasarkan peubah IPM dengan Fuzzy-rataan dan K-medoid. Bogor (ID): Institut Pertanian Bogor.


Article Metrics

Abstract view : 1082 times | PDF view : 488 times

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Wardianti AS, Muhammad Kasim Aidid, Muhammad Nusrang

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Abstracted/Indexed by:

SINTADimensions

 

 

VARIANSI: Journal of Statistics and Its Application on Teaching and Research is licensed under a Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)