Saya mencoba menjalankan K-Means menggunakan ELKI MiniGUI. Saya memiliki kumpulan data CSV dari 15 fitur (kolom) dan kolom label. Saya ingin melakukan beberapa kali K-Means dengan kombinasi yang berbeda dari kolom fitur.

Apakah ada tempat di MiniGUI tempat saya dapat menentukan indeks kolom mana yang ingin saya gunakan untuk pengelompokan?

Jika tidak, apa cara paling sederhana untuk mencapai ini dengan mengubah/memperpanjang ELKI di Jawa?

0
gregory 9 Maret 2020, 17:50

1 menjawab

Jawaban Terbaik

Ini jelas mudah dicapai dengan kode Java, atau hanya dengan melakukan pra-pemrosesan data seperlunya. Hasilkan 10 varian, lalu luncurkan ELKI melalui baris perintah.

Namun ada filter untuk memilih kolom: NumberVectorFeatureSelectionFilter. Untuk hanya menggunakan kolom 0,1,2 (di bagian numerik; label diperlakukan secara terpisah pada saat ini; ini adalah transformasi vektor):

-dbc.filter transform.NumberVectorFeatureSelectionFilter
-projectionfilter.selectedattributes 0,1,2

Filter dapat diperluas menggunakan IntRangeParameter kami yang lebih baru untuk memungkinkan spesifikasi seperti 1.3,5..8; tapi ini belum dilaksanakan.

1
Erich Schubert 10 Maret 2020, 08:16