Naon Dupi Hierarchical Clustering Algorithm?

Apdet terakhir: 29/06/2023

Dina widang élmu data y kacerdasan buatan, salah sahiji konsép dasar pikeun analisa pola sareng clustering data nyaéta algoritma Hierarchical Clustering. Metoda ieu, dumasar kana prinsip matematik jeung statistik, ngamungkinkeun sakumpulan observasi bisa diatur kana grup atawa klaster béda dina ragam hirarkis, nyadiakeun view detil rupa hubungan antara data. Dina tulisan ieu, urang bakal ngajalajah sacara jero naon algoritma Hierarchical Clustering, kumaha éta dilaksanakeun sareng naon aplikasi utama sareng kauntungan dina widang élmu data.

1. Bubuka algoritma clustering hirarki

Algoritma klaster hirarki nyaéta téknik pengelompokan anu ngusahakeun ngabagi sakumpulan data kana grup anu leuwih leutik sarta sarupa. Algoritma ieu dumasar kana ide ngawangun hirarki klaster, dimana unggal klaster dihijikeun sareng klaster anu sami dugi ka ngabentuk klaster tunggal anu ngandung sadaya data.

Kauntungan utama tina klaster hirarki nyaéta anjeun teu kedah terang sateuacanna jumlah klaster anu anjeun hoyong kéngingkeun, sabab algoritma ngawangun hirarki klaster sacara otomatis. Salaku tambahan, éta ngamungkinkeun anjeun ningali hasil sacara grafis sareng langkung ngartos struktur data.

Aya dua pendekatan utama pikeun clustering hirarki: agglomerative jeung divisive. Dina pendekatan agglomerative, Anjeun mimitian ku klaster individu jeung iteratively ngagabungkeun klaster paling sarupa dugi ka ménta klaster tunggal nu ngandung sakabéh data. Di sisi séjén, dina pendekatan divisive, Anjeun mimitian ku klaster tunggal nu ngandung sakabéh data sarta iteratively ngabagi kana klaster nu leuwih leutik sarta sarupa.

Pikeun nerapkeun algoritma clustering hirarki, perlu pikeun nangtukeun ukuran kasaruaan antara data. Pangukuran ieu tiasa béda-béda gumantung kana jinis data anu dianalisis. Sababaraha ukuran umum kalebet jarak Euclidean, jarak Manhattan, sareng jarak korelasi. Sakali ukuran kasaruaan ditetepkeun, algoritma sapertos Ward, rata-rata pinuh, atanapi rata-rata sederhana tiasa dianggo pikeun ngawangun hirarki klaster.

Kasimpulanana, algoritma klaster hirarki mangrupikeun alat anu kuat pikeun nganalisis set data sareng milarian struktur anu sami. Pendekatan aglomeratif atanapi divisive sareng definisi ukuran kasaruaan mangrupikeun unsur konci pikeun palaksanaanna. Algoritma ieu hususna kapaké nalika jumlah klaster anu dipikahoyong henteu dipikanyaho sareng pawakilan visual tina hasil anu dicandak. Diajar kumaha ngagunakeun algoritma clustering hirarkis sarta manggihan cara grup data anjeun sacara efisien!

2. Konsep konci dina algoritma clustering hirarki

Algoritma clustering hirarki nyaéta téknik pembelajaran mesin anu loba dipaké dina analisis data. Algoritma ieu dumasar kana ide pikeun ngagolongkeun objék anu sami kana kategori atanapi grup. Pikeun leuwih hadé ngartos kumaha algoritma ieu jalan, hal anu penting pikeun nyaho sababaraha konsép konci anu fundamental dina palaksanaan na pamahaman.

Jarak: Jarak mangrupakeun konsép dasar dina algoritma clustering hirarki. Hal ieu dipaké pikeun nangtukeun sabaraha sarupa atawa béda dua objék. Milih ukuran jarak anu pas penting pisan sareng tiasa mangaruhan hasil clustering. Sababaraha ukuran jarak anu biasa dianggo nyaéta jarak Euclidean, jarak Manhattan, sareng jarak Jaccard.

Métode link: Metodeu link mangrupa bagian penting séjén tina algoritma clustering hirarki. Metoda ieu dipaké pikeun mutuskeun kumaha jarak antara grup atawa klaster diitung. Sababaraha métode linking paling umum nyaéta linking tunggal, linking pinuh, sarta linking rata. Unggal métode boga sorangan kaunggulan sareng kakurangan, jadi hal anu penting pikeun milih métode linking luyu dumasar kana tipe data jeung tujuan analisis.

Dendrogram: A dendrogram mangrupakeun representasi grafis tina hasil tina algoritma clustering hirarki. Diagram ieu nunjukkeun kumaha objék dikelompokkeun dina tingkat hirarki anu béda sareng kumaha hubunganana. Dendrogram tiasa mangpaat pikeun ngaidentipikasi pola atanapi struktur dina data sareng pikeun nangtukeun jumlah klaster anu optimal. Sajaba ti éta, ngidinan Anjeun pikeun visualize hasil clustering dina cara gampang interpretable.

3. Jinis algoritma clustering hirarki

Aya béda anu sayogi pikeun ngagolongkeun data dumasar kana kamiripanna. Algoritma ieu tiasa digolongkeun kana dua kategori utama: agglomerative sareng divisive.

Algoritma agglomerative dimimitian ku nangtukeun unggal item data ka grup sorangan lajeng laun ngagabung grup nepi ka grup tunggal ngawengku sakabéh data. Dina unggal léngkah ngahiji, ukuran kasaruaan antara grup diitung sareng diputuskeun mana anu kedah dihijikeun. Ukuran kasaruaan ieu tiasa janten jarak antara centroids tina grup atanapi jarak antara titik pangdeukeutna grup.

Di sisi séjén, algoritma divisive dimimitian ku grup tunggal ngandung sakabéh data lajeng ngabagi grup ieu kana subgroups leutik. Dina unggal léngkah pamisah, subgrup anu tos aya dipilih sareng dipisahkeun kana dua subgrup énggal. Divisi ieu dilakukeun dumasar kana ukuran kasaruaan antara titik-titik dina subgrup.

4. Kaunggulan jeung kalemahan algoritma clustering hirarki

Algoritma klaster hirarki nyaéta téknik anu loba dipaké pikeun ngagolongkeun data nu sarupa kana kategori atawa klaster. Salah sahiji kaunggulan utamina nyaeta teu perlu nangtukeun sateuacanna jumlah klaster dipikahoyong, sabab algoritma ngahasilkeun struktur hirarki nu bisa diinterpretasi dina tingkat béda tina jéntré. Hal ieu ngamungkinkeun pikeun pamahaman hadé ngeunaan struktur data sarta ngajadikeun eta gampang analisa.

Eusi ekslusif - Klik Ieuh  Kumaha Buka File LPD

Kauntungan penting séjén tina algoritma clustering hirarki nyaéta kamampuhna pikeun nanganan tipena béda data, kayaning categorical atawa numeris variabel. Hal ieu ngajantenkeun alat anu serbaguna anu tiasa diadaptasi kana masalah sareng set data anu béda. Saterusna, algoritma relatif gampang pikeun nerapkeun sarta teu merlukeun angka nu gede ngarupakeun setélan parameter.

Di sisi anu sanésna, kalemahan tina algoritma clustering hirarki nyaéta pajeulitna komputasi anu langkung ageung dibandingkeun sareng algoritma clustering anu sanés, khususna nalika damel sareng set data anu ageung. Salaku tambahan, kusabab sipat hirarkis tina algoritma, meureun hésé pikeun nangtukeun jumlah optimal klaster atanapi napsirkeun hasil dina sababaraha kasus. Éta ogé penting pikeun dicatet yén algoritma bisa jadi sénsitip kana outliers atawa data ribut, nu bisa mangaruhan kualitas klaster dihasilkeun.

5. Léngkah dasar dina palaksanaan algoritma clustering hirarki

Léngkah 1: Watesan masalah sareng pilihan data input. Léngkah munggaran dina ngalaksanakeun algoritma clustering hirarki nyaéta ngartos sacara jelas masalah anu urang badé direngsekeun. Urang kedah ngaidentipikasi jinis data anu bakal kami anggo sareng pilih anu aya hubunganana sareng masalah urang. Kadé mutuskeun naon ciri data bakal dianggap dina prosés clustering.

Léngkah 2: Preprocessing data. Sateuacan nerapkeun algoritma clustering hirarki, perlu pikeun ngalakukeun sababaraha tugas preprocessing data. Ieu ngawengku meresihan data pikeun miceun noise atawa outlier nu bisa mangaruhan hasil clustering ahir. Éta ogé umum pikeun skala data pikeun mastikeun yén sadaya fitur gaduh beurat anu sami sareng ngahindarkeun bias dina prosés clustering.

Léngkah 3: Pamilihan métrik jarak sareng metode ngagabung. Dina ngalaksanakeun algoritma klaster hirarki, urang kedah milih métrik jarak anu cocog pikeun ngukur kasaruaan antara objék dina set data urang. Aya sababaraha pilihan anu sayogi, sapertos jarak Euclidean, jarak Manhattan, atanapi jarak korelasi. Salaku tambahan, urang kedah milih metode gabung pikeun ngagabungkeun klaster dina unggal léngkah algoritma, sapertos metode tautan lengkep atanapi metode tautan rata-rata.

6. metrics jarak dipaké dina algoritma clustering hirarki

Algoritma klaster hirarkis nyaéta téknik anu digunakeun pikeun ngagolongkeun data kana klaster atawa grup dumasar kana kasaruaan karakteristik antara titik data. Pikeun nangtukeun kasaruaan antara titik data, perlu ngagunakeun metrics jarak. Métrik ieu ngitung jarak antara titik data sareng dianggo pikeun ngukur kasaruaan dina struktur klaster.

Aya sababaraha, nyorot anu paling umum sapertos:

  • Jarak Euclidean: Ngitung jarak antara dua titik data dina spasi Euclidean. Métrik ieu cocog pikeun data numeris kontinyu sareng condong masihan hasil anu akurat dina kalolobaan kasus.
  • Manhattan Jarak: Ogé katelah jarak kota, éta ngitung jarak antara dua titik data ku cara nambihan bédana mutlak antara koordinatna. Métrik ieu cocog pikeun data anu henteu sinambung atanapi diskrit.
  • Jarak korelasi: Éta ngukur kasaruaan antara dua titik data ngagunakeun ukuran korelasi statistik. Métrik ieu mangpaat nalika damel sareng data katégori atanapi data dina bentuk tabel frékuénsi.

Milih métrik jarak anu pas gumantung kana jinis data sareng struktur masalahna sorangan. Penting pikeun milih métrik anu cocog sareng karakteristik data sareng anu ngahasilkeun hasil anu bermakna dina konteks masalah anu bakal direngsekeun. Ékspérimén sareng métrik jarak anu béda tiasa ngabantosan milarian anu paling pas pikeun masalah clustering hirarkis khusus.

7. Evaluasi kualitas clustering dina algoritma clustering hirarki

Evaluating kualitas clustering mangrupa hambalan penting dina analisis data ngagunakeun algoritma clustering hirarki. Pikeun nangtukeun éféktivitas algoritma ieu, perlu ngagunakeun metrics evaluasi nu ngitung kumaha ogé data dikelompokkeun kana klaster béda.

Salah sahiji metrics paling umum dipaké pikeun evaluate kualitas clustering nyaeta koefisien silhouette. Koéfisién ieu ngagabungkeun informasi ngeunaan kasaruaan intra-cluster jeung dissimilarity antar-cluster pikeun nangtukeun nilai antara -1 jeung 1 ka unggal titik data. Nilai deukeut 1 nunjukkeun clustering alus, sedengkeun nilai deukeut -1 nunjukkeun yén titik data bisa geus ditugaskeun ka klaster séjén.

Métrik mangpaat séjén nyaéta indéks Dunn, anu ngukur pamisahan antara klaster sareng kompak unggal klaster. Nilai indéks Dunn anu langkung luhur nunjukkeun kualitas kluster anu langkung saé. Salian metrics ieu, hal anu penting pikeun visualize hasil clustering hirarki ngagunakeun parabot kayaning dendrograms na scatterplots pikeun hadé ngartos struktur data jeung distribusi klaster.

Eusi ekslusif - Klik Ieuh  Naon Strategi Pangalusna Pikeun Menang Dina Flip Runner?

8. Conto aplikasi tina algoritma clustering hirarki dina widang béda

Algoritma clustering hirarkis loba dipaké dina sagala rupa widang pikeun grup data sarupa jeung nganalisis pola. Ayeuna aranjeunna hadir sababaraha conto aplikasi praktis tina algoritma di wewengkon béda:

1. Kedokteran: Klaster hirarkis dianggo dina ubar pikeun ngaidentipikasi subtipe panyakit atanapi gangguan anu béda-béda ngaliwatan analisis data klinis sareng genetik. Salaku conto, algoritma ieu tiasa ngaidentipikasi subgrup pasien kanker anu ngaréspon sami sareng perlakuan anu tangtu, ngamungkinkeun perawatan médis janten pribadi sareng ningkat.

2. Marketing: Dina widang pamasaran, clustering hirarki dipaké pikeun bagéan konsumén kana grup homogén dumasar kana kabiasaan purchasing maranéhanana, preferensi atawa ciri demografi. Ku cara kieu, perusahaan tiasa adaptasi strategi pamasaranna sareng nawiskeun nawaran pribadi ka unggal segmen palanggan, ningkatkeun efektivitas kampanye pamasaran.

3. Bioinformatika: Dina bioinformatika, clustering hirarki dipaké pikeun analisis DNA atawa runtuyan protéin. Algoritma ieu mantuan ngaidentipikasi grup runtuyan sarupa, nyadiakeun wawasan fungsi jeung évolusi biomolekul. Saterusna, clustering hirarki ogé dipaké pikeun mengklasifikasikan gén kana propil éksprési jeung nalungtik respon organisme kana rangsangan béda atawa kaayaan lingkungan.

Kasimpulanana, algoritma klaster hirarkis diterapkeun dina sagala rupa widang sapertos ubar, pamasaran, sareng bioinformatika. Kamampuhan pikeun ngagolongkeun data anu sami sareng mendakan pola parantos kabuktosan mangpaat pisan dina nganalisa data dina kontéks anu béda. Naha pikeun ningkatkeun pangobatan médis, adaptasi strategi pemasaran, atanapi langkung ngartos organisme hirup, algoritma ieu nyayogikeun alat anu kuat pikeun ngaidentipikasi sareng nganalisis grup data.

9. Babandingan antara algoritma clustering hirarki jeung métode clustering séjén

Klaster hirarki nyaéta métode populér dipaké pikeun ngagolongkeun objék sarupa kana kategori, dumasar kana kasaruaan karakteristik maranéhanana. Sanajan aya métode clustering séjén sadia, kayaning K-means atanapi DBSCAN, clustering hirarki boga kaunggulan jeung kalemahan tangtu nu ngajadikeun eta nangtung kaluar. Perbandingan antara algoritma ieu bakal ngamungkinkeun urang langkung ngartos metode mana anu paling cocog pikeun data urang sareng masalah anu urang hoyong direngsekeun.

Salah sahiji bédana utama antara clustering hirarki jeung métode grouping séjén nyaéta cara nu grup dihasilkeun. Bari K-maksudna atawa DBSCAN napelkeun unggal obyék ka grup tunggal, clustering hirarki ngamungkinkeun formasi grup nested atawa subgroups dina grup badag. Ieu tiasa mangpaat nalika data urang gaduh struktur hirarki atanapi nalika urang hoyong gaduh pandangan anu langkung rinci ngeunaan hubungan antara objék.

Bedana penting séjén nyaéta jumlah grup anu dihasilkeun. Dina clustering hirarki, teu perlu nangtukeun jumlah grup saméméh ngajalankeun algoritma, sabab ngahasilkeun hirarki lengkep. sadaya objék. Di sisi anu sanés, dina metode sapertos K-means, kedah sateuacana nangtukeun jumlah grup anu dipikahoyong. Ieu tiasa janten masalah upami urang henteu terang sacara pasti sabaraha kelompok anu kedah dibentuk. Sanajan kitu, clustering hirarki merlukeun leuwih waktos palaksanaan sabab kasaruaan antara sakabéh pasangan objék kudu diitung.

10. Alat jeung perpustakaan sadia pikeun palaksanaan algoritma clustering hirarki

Aya sababaraha, sahingga peneliti sarta pamekar boga rupa-rupa pilihan pikeun ngalakonan jenis ieu analisis. Di handap ieu sababaraha anu paling sering dianggo sareng didokumentasikeun:

1. Diajar Scikit: Perpustakaan pembelajaran mesin ieu pikeun Python mangrupikeun pilihan populér pikeun ngalaksanakeun algoritma klaster hirarkis. Nyadiakeun rupa-rupa algoritma clustering, kaasup clustering hirarki agglomerative. Dokuméntasi lengkep sareng komunitas pangguna anu aktip ngajantenkeun pilihan anu tiasa dipercaya sareng gampang dianggo.

2. SciPy: Perpustakaan Python ieu nawiskeun rupa-rupa alat sareng algoritma ilmiah, kalebet klaster hirarkis. Eta nyadiakeun fungsi clustering kayaning beungkeut () sarta dendrogram (), nu ngajadikeun palaksanaan algoritma nu panggampangna tur efisien. dokuméntasi SciPy téh alus teuing jeung nyadiakeun tutorials léngkah demi léngkah jeung conto kumaha ngagunakeun fungsi ieu.

3. R: Basa Sunda nyaéta basa pamrograman anu loba dipaké dina statistik jeung analisis data. Éta ngagaduhan sababaraha bungkusan anu sayogi pikeun klaster hirarkis, sapertos pakét 'cluster' sareng pakét 'dendextend'. bungkusan ieu nyadiakeun rupa-rupa fungsi jeung parabot pikeun palaksanaan algoritma, kitu ogé dokuméntasi lengkep jeung tutorials lengkep.

11. Aplikasi praktis tina algoritma clustering hirarki dina analisis data

Algoritma clustering hirarkis loba dipaké dina analisis data alatan aplikasi praktis na di sagala rupa widang. Ngaliwatan algoritma ieu tiasa ngagolongkeun objék atanapi conto kana kategori atanapi klaster, dumasar kana kamiripan sareng bédana. Klaster jinis ieu ngamungkinkeun pikeun visualisasi anu langkung jelas ngeunaan struktur data sareng ngabantosan ngabongkar pola sareng hubungan anu disumputkeun.

Hiji tina aplikasi-aplikasi éta Pamakéan anu paling umum tina algoritma klaster hirarki nyaéta dina ségméntasi palanggan. Hal ieu dipaké pikeun grup konsumén kana kategori béda dumasar kana ciri maranéhanana, paripolah atawa preferensi. Ieu masihan perusahaan pandangan anu langkung lengkep ngeunaan dasar palangganna sareng ngamungkinkeun aranjeunna ngarancang strategi pemasaran anu langkung efektif.

Salaku tambahan, algoritma clustering hirarkis dianggo dina analisis gambar sareng génomics. Dina analisis gambar, éta dipaké pikeun ngagolongkeun gambar sarupa kana kategori, sahingga leuwih gampang pikeun neangan jeung mengklasifikasikan gambar. Dina génomics, dipaké pikeun ngagolongkeun gén atawa sampel biologis dumasar kana éksprési gén maranéhanana, mantuan pikeun ngaidentipikasi pola pakait sareng kasakit husus atawa kaayaan.

Eusi ekslusif - Klik Ieuh  Kumaha Pin hiji Gambar dina Word

12. Watesan jeung tinimbangan dina pamakéan algoritma clustering hirarki

Algoritma klaster hirarki nyaéta téknik anu loba dipaké dina analisis data pikeun ngaidentipikasi grup atawa klaster dina kumpulan data. Nanging, penting pikeun ngémutan watesan sareng pertimbangan anu tangtu nalika ngagunakeun algoritma ieu.

Watesan umum tina klaster hirarki nyaéta yén éta tiasa mahal sacara komputasi dina set data anu ageung. Ieu kusabab algoritma kedah sababaraha kali ngitung jarak antara sadaya pasang titik dina set data. Ku alatan éta, éta sasaena ngagunakeun algoritma ieu dina susunan data leutik atawa ngagunakeun téhnik optimasi pikeun ngaronjatkeun efisiensi komputasi.

tinimbangan penting séjénna nyaéta pilihan métode linking dipaké dina algoritma clustering hirarki. Metoda link nangtukeun sabaraha jarak antara grup diitung dina unggal hambalan tina algoritma. Aya métode linking béda sadia kayaning linking pinuh, linking rata, sarta Ward linking, antara séjén. Penting pikeun ngartos karakteristik unggal metode sareng milih anu paling cocog pikeun set data sareng tujuan analisis.

13. inovasi panganyarna na kamajuan dina widang clustering hirarki

Dina widang clustering hirarki, kamajuan signifikan geus dijieun dina taun panganyarna. Inovasi ieu ngamungkinkeun urang pikeun ningkatkeun katepatan sareng efisiensi padika pangkelompok data ieu. Salah sahiji inovasi utama nyaéta pamekaran algoritma anu langkung gancang sareng langkung kuat anu tiasa ngadamel set data anu ageung. Algoritma ieu ngagunakeun téknik optimasi sareng paralélisasi canggih pikeun nyepetkeun prosés clustering.

Inovasi penting séjénna nyaéta ngasupkeun ukuran kasaruaan anu leuwih canggih dina itungan jarak antara objék. Hal ieu ngamungkinkeun urang pikeun meunangkeun groupings leuwih tepat ku tempo teu ukur jarak Euclidean, tapi ogé ukuran séjén kayaning kasaruaan kosinus atawa korelasi Pearson. Sajaba ti éta, métode pikeun Pilihan otomatis ukuran kasaruaan geus diajukeun, nu facilitates aplikasi maranéhanana tanpa merlukeun pangaweruh husus.

Kitu ogé, pendekatan parantos dikembangkeun anu ngagabungkeun klaster hirarki sareng téknik pembelajaran mesin anu sanés, sapertos réduksi dimensi atanapi tuning parameter algoritma. Hal ieu ngamungkinkeun meunangkeun groupings leuwih luyu pikeun tipena béda data jeung domain aplikasi. Salaku tambahan, parangkat lunak sareng perpustakaan parantos dirarancang pikeun ngagampangkeun palaksanaan sareng evaluasi algoritma klaster hirarkis, anu parantos nyumbang kana panyebaran sareng nyoko dina komunitas ilmiah.

14. Kacindekan dina algoritma clustering hirarki

Pondokna, algoritma klaster hirarki nyaéta téknik pengelompokan dimana objék anu sami ditugaskeun kana grup. Sapanjang bagian ieu, kami parantos ngajalajah algoritma ieu sacara jero sareng aplikasi na.

Salah sahiji aspék anu paling kasohor tina algoritma clustering hirarki nyaéta kamampuanna pikeun nyiptakeun struktur hirarki klaster, anu ngamungkinkeun pamahaman hadé tina data jeung hubungan na. Pendekatan ieu ogé nawiskeun kalenturan, ngamungkinkeun klaster dibagi atanapi dihijikeun upami diperyogikeun.

Saterusna, urang geus katempo aya dua pendekatan utama dina algoritma clustering hirarki: clustering agglomerative jeung clustering divisive. Duanana pendekatan boga kaunggulan jeung kalemahan sorangan, sarta pilihan antara aranjeunna gumantung sakitu legana kana data jeung tujuan analisis.

Dina kacindekan, algoritma klaster hirarki nyaéta téknik pengelompokeun anu ngamungkinkeun pikeun ngatur sakumpulan data dina bentuk tangkal hirarki. Algoritma jinis ieu dianggo dina sababaraha daérah, sapertos pertambangan data, bioinformatika sareng kacerdasan buatandiantarana.

Ngaliwatan prosés clustering hirarki, data dikelompokkeun nurutkeun kamiripan atawa jarak maranéhanana, generating struktur hirarki nu ngidinan hubungan antara grup béda bisa visualized. Ieu hususna kapaké pikeun ngartos struktur alamiah data sareng mendakan pola atanapi kategori anu disumputkeun.

Aya dua pendekatan utama dina algoritma clustering hirarki: agglomerative jeung divisive. Dina pendekatan aglomeratif, data dikelompokkeun dimimitian ku objék individu jeung laun merging aranjeunna nepi ka ngahontal grup tunggal. Di sisi séjén, pendekatan divisive dimimitian ti grup tunggal jeung ngabagi kana grup leutik.

Ieu kudu dicatet yén pilihan metoda linking, nu nangtukeun sabaraha kamiripan antara grup diitung, krusial pikeun ménta hasil akurat dina clustering hirarki. Métode anu paling umum kalebet beungkeut lengkep, beungkeut rata-rata, sareng beungkeut Ward.

Salaku tambahan, penting pikeun mertimbangkeun ukuran jarak anu dianggo nalika ngitung kasaruaan antara objék. Sababaraha ukuran jarak anu paling sering dianggo nyaéta Euclidean, Manhattan sareng ukuran korelasi.

Dina kasimpulan, algoritma clustering hirarki mangrupakeun alat berharga dina analisis data. Éta ngamungkinkeun data dikelompokkeun sacara hierarki, ngungkabkeun struktur dasarna sareng ngagampangkeun idéntifikasi pola sareng kategori. Pamakéanna ngalegaan ka sababaraha daérah sareng pilihan metode tautan sareng pangukuran jarak anjeun anu leres penting pikeun kéngingkeun hasil anu akurat sareng bermakna.