해리슨 블로그

Pencarian Vektor.. Memang Terdekat, Tapi..

  • Bahasa Penulisan: Bahasa Korea
  • Negara Standar: Semua Negaracountry-flag
  • TI

Dibuat: 2024-11-23

Dibuat: 2024-11-23 17:13

Pencarian Vektor.. Memang Terdekat, Tapi..

Contoh Distribusi

Dasar dari pencarian Vektor (selanjutnya disebut pencarian) adalah menemukan hal-hal yang berjarak dekat melalui berbagai metode matematika.

Namun, tiba-tiba saya bertanya-tanya. Apakah pencarian terdekat memang benar dan secara matematis benar, tetapi apakah ini benar-benar artikel yang serupa?

Sebenarnya, pencarian yang digunakan di durumis adalah metode untuk mencari 6 artikel terdekat dalam ruang 768 dimensi dari satu artikel.

Namun, saya mulai mempertanyakan apakah artikel serupa itu benar-benar serupa. (Karena terkadang artikel yang tidak mirip juga muncul...)

Lalu apa penyebabnya?

Mari kita ambil contoh 10 titik dalam ruang dua dimensi yang disederhanakan di atas.

Untuk titik 1 sampai 7, jika kita memilih 6 titik terdekat, 6 titik lainnya pasti akan ditampilkan sebagai titik terdekat. (Secara perhitungan memang demikian)

Masalahnya ada pada titik 8 sampai 10... Misalnya, jika kita mencari 6 titik terdekat dari titik 9, hasilnya mungkin 8, 10, dan 3, 4, 7.

Nah, di sinilah masalahnya. Sebaliknya, pada titik 4, titik 9 tidak termasuk dalam 6 titik terdekat. Apakah ini masih dianggap artikel yang relevan?

Contoh di atas adalah kasus yang cukup ekstrem. Jika ada cukup banyak titik sehingga tidak ada ruang kosong yang luas seperti itu, mungkin kita bisa menganggapnya sebagai titik terdekat. (Namun, mengingat dimensi 768, ruang kosong di antara titik-titik tersebut pasti ada. Kecuali jika jumlah artikelnya sangat banyak...)

Saya masih memikirkannya, tetapi cara paling pasti adalah masalah ini akan terselesaikan jika ada cukup banyak artikel yang diisi, bukan?

Komentar0