해리슨 블로그

Vektoros keresés... Biztosan a legközelebbi a legmegfelelőbb?

  • Írás nyelve: Koreai
  • Országkód: Minden országcountry-flag
  • Informatika

Létrehozva: 2024-11-23

Létrehozva: 2024-11-23 17:13

Vektoros keresés... Biztosan a legközelebbi a legmegfelelőbb?

A szóródás mintája

A vektoros keresés (a továbbiakban: keresés) alapja, hogy különböző matematikai módszerek segítségével megtalálja a közeli elemeket.

De akkor felmerült bennem egy kérdés. Vajon a legközelebbi keresés egyértelműen helyes és matematikailag is helytálló, de vajon ez valóban hasonló bejegyzést jelent?

A durumis által használt keresés egy bejegyzést egy 768 dimenziós térben keresi meg a 6 legközelebbi bejegyzést.

De kétségeim támadtak afelől, hogy a hasonló bejegyzések valóban hasonlóak-e. (Mert néha nem hasonló bejegyzések is előfordulnak...)

Mi lehet ennek az oka?

Nézzünk egy példát a fent leegyszerűsített, 2 dimenziós tér 10 pontjával.

Az 1-7. pontoknál, ha kiválasztjuk a 6 legközelebbi pontot, akkor a fennmaradó 6 pont lesz a legközelebbi pont. (Ez számítások alapján is igaz.)

A probléma a 8-10. pontoknál van... Például, ha a keresés során megkeressük a 9. ponthoz legközelebbi 6 pontot, akkor az 8, 10, valamint a 3, 4, 7 pontok lesznek.

Ez a probléma, mert fordítva, a 4. ponthoz legközelebbi 6 pont között nem szerepel a 9. pont, akkor vajon valóban kapcsolódó bejegyzések-e?

A fenti példa egy meglehetősen szélsőséges eset, de ha elegendő pont van, és nincsenek ilyen nagy üres terek, akkor elég közelinek tekinthetők. (De ha figyelembe vesszük, hogy 768 dimenzióról van szó, akkor valószínűleg több üres tér lesz a köztük. Kivéve, ha nagyon sok bejegyzés van...)

Gondolkodom rajta, de a legbiztosabb megoldás az, ha elegendő bejegyzés van, akkor ez a probléma megoldódik?

Hozzászólások0