Algoritma Nearest Neighbor

Posted: September 29, 2011 in Informatika
Tags: , , ,

Algoritma Nearest Neighbor

Klasifikasi adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat mem[erkirakan kelas dari suatu objek yang labelnya belum diketahui. Model itu sendiri dapat berupa aturan “jika-maka”, berupa decision tree, formula matematis atau neural network. Salah satu metode klasifikasi yaitu Nearest Neighbor.

Nearest Neighbor merupakan metode untuk mengklasifikasikan suatu data baru berdasarkan similaritas atau kemiripan dengan labeled data. Similaritas menggunakan metrik jarak dengan satuan Euclidian. Macam-macam algoritma  Nearest Neighbor yaitu:

  1. Algoritma 1-NN

Pengklasifikasian dilakukan terhadap 1 labeled data terdekat. Berikut ini adalah ilustrasi algoritma 1-NN:

Pada ilustrasi diatas, data baru (node warna biru) akan diklasifikasikan ke dalam kelompok hipertensi dan tidak hipertensi. Dari kelima data yang tersebar dalam kelompok hipertensi dan tidak hipertensi, data input (node biru) lebih dekat dengan salah satu pada kelompok hipertensi. Dengan demikian, dapat disimpulkan bahwa data baru tersebut termasuk ke dalam kelompok hipertensi.

Rumus euclide distance yang digunakan dalam metode 1-NN untuk mengambil keputusan dengan menghitung jarak terpendek antara input dengan masing-masing data yang penentuan bobot atau label dilakukan secara acak atau random yaitu:

  1. Algoritma K-NN

Pengklasifikasian dilakukan terhadap k labeled data terdekat. Dimana k>1. Berikut ini adalah ilustrasi algoritma K-NN:

 

Langkah-langkah dalam metode K-NN adalah sebagai berikut:

  1. Tentukan k.
  2. Hitung jarak antara data baru ke setiap labeled data.
  3. Tentukan k labeled data yang mempunyai jarak yang paling minimal.
  4. Klasifikasikan data baru ke dalam labeled data yang mayoritas.
Comments
  1. Terima kasih atas pencerahannya, jika boleh saya tahu sumber artikel ini dari mana ya? mungkin hanya ingin mencari lebih detail lagi tentang 1-nn dan k-nn

  2. Fahrozi says:

    makasih infonya. mau nanya. data dari kNN bisa dari data yang tidak pasti? contohnya seperti data pekerjaan (PNS, buruh, Wiraswasta, dll). bisa dipakai dalam kNN?

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s