해리슨 블로그

वेक्टर सर्च.. निश्चित रूप से निकटतम सही है, लेकिन..

  • लेखन भाषा: कोरियाई
  • आधार देश: सभी देशcountry-flag
  • आईटी

रचना: 2024-11-23

रचना: 2024-11-23 17:13

वेक्टर सर्च.. निश्चित रूप से निकटतम सही है, लेकिन..

वितरण का नमूना (분산의 샘플)

वेक्टर सर्च (खोज) का मूल सिद्धांत विभिन्न गणितीय विधियों के माध्यम से निकटतम दूरी पर स्थित वस्तुओं को खोजना है।

लेकिन, अचानक एक सवाल उठा। क्या निकटतम खोज निश्चित रूप से सही है और गणितीय रूप से सही है, लेकिन क्या यह समान लेख है?

वास्तव में, दुरुमिस द्वारा उपयोग की जाने वाली खोज एक लेख को 768-आयामी स्थान में निकटतम 6 लेखों को खोजने की विधि है।

लेकिन, मुझे इस बात पर संदेह होने लगा कि क्या समान लेख वास्तव में समान हैं। (कभी-कभी असंबंधित लेख भी दिखाई देते हैं।)

तो इसका कारण क्या है?

आइए ऊपर दिए गए सरलीकृत 2-आयामी स्थान के 10 बिंदुओं के उदाहरण पर विचार करें।

1 से 7 तक के बिंदुओं के लिए, यदि हम निकटतम 6 बिंदुओं का चयन करते हैं, तो शेष 6 बिंदु निश्चित रूप से निकटतम बिंदु होंगे। (वास्तव में, गणना के अनुसार भी ऐसा ही है।)

समस्या 8 से 10 के साथ है। उदाहरण के लिए, यदि हम खोज के माध्यम से बिंदु 9 के निकटतम 6 बिंदुओं को ढूंढते हैं, तो वे 8, 10 और 3, 4, 7 होंगे।

लेकिन यही समस्या है। इसके विपरीत, बिंदु 4 में निकटतम 6 बिंदुओं में बिंदु 9 शामिल नहीं है, तो क्या वे संबंधित लेख हैं?

ऊपर दिया गया उदाहरण एक बहुत ही चरम मामला है। यदि पर्याप्त बिंदु हैं ताकि इतना खाली स्थान न हो, तो इसे काफी करीब माना जा सकता है। (हालांकि, 768 आयामों को ध्यान में रखते हुए, बीच-बीच में खाली स्थान होना ही होगा। जब तक बहुत सारे लेख न हों।)

मैं इस पर विचार कर रहा हूँ, लेकिन सबसे निश्चित तरीका यह है कि यदि पर्याप्त लेख हैं, तो यह समस्या हल हो जाएगी।

टिप्पणियाँ0

Bing! आखिर तुम्हारी क्या समस्या है..यह लेख बिंग सर्च इंजन की क्रॉलिंग समस्याओं पर प्रकाश डालता है। इसमें बताया गया है कि कैसे Bing robots.txt की अनदेखी करता है और गैर-मौजूद पन्नों को बार-बार क्रॉल करता है, जिससे 404 त्रुटियाँ उत्पन्न होती हैं। IndexNow के उपयोग के बावजूद, क्रॉलिंग की गति धी
해리슨의 블로그..
해리슨의 블로그..
해리슨의 블로그..
해리슨의 블로그..

November 16, 2024

निवेश विश्लेषण क्षमता में सुधार करने वाली, छोटी लेकिन महत्वपूर्ण 3 आदतेंनिवेश विश्लेषण क्षमता में सुधार के लिए 3 आदतों का परिचय। दूसरों के डेटा का सत्यापन करना, मूल डेटा की जाँच करना और संख्यात्मक रूप से याद रखने की आदत के माध्यम से आप अपनी निवेश क्षमता को बढ़ा सकते हैं।
고집스런가치투자
고집스런가치투자
고집스런가치투자
고집스런가치투자

April 3, 2024

ब्लॉग पोस्ट को दोहराकर पोस्ट करने पर, Google खोज पर क्या प्रभाव पड़ता है?ब्लॉग पोस्ट को कई जगहों पर दोहराकर पोस्ट करने पर Google खोज पर कोई नकारात्मक प्रभाव नहीं पड़ता है, लेकिन दोहराई गई पोस्ट में से केवल एक ही दिखाई दे सकती है।
durumis official blog
durumis official blog
durumis official blog
durumis official blog

March 13, 2024

क्या दुर्मिस पर लिखे गए लेख अन्य भाषाओं में भी अच्छे से खोजे जा सकते हैं?हमने पाया है कि दुर्मिस ब्लॉग पर हिंदी में लिखे गए लेखों का विभिन्न भाषाओं में अनुवाद किया जाता है और दुनिया भर में खोजा जाता है, और केवल हिंदी में दिखाई देने पर इन लेखों को मिलने वाले क्लिक और प्रदर्शन की तुलना में कहीं अधिक क्लिक और प्रदर्शन दर्ज किए गए
durumis official blog
durumis official blog
durumis official blog
durumis official blog

April 11, 2024

दुरुमिस द्वारा बहुभाषी वेबसाइट निर्माण डायरी - 104वाँ दिन: धैर्य और प्रतीक्षा104वें दिन की बहुभाषी वेबसाइट निर्माण डायरी: 5 बहुभाषी ब्लॉग चलाते हुए, खोज परिणामों में कम दिखाई देने के कारण धैर्य की परीक्षा हो रही है। कुछ ब्लॉग सैंडबॉक्स में फंसे हुए लग रहे हैं, और पता चला है कि डोमेन के प्रभाव का बड़ा योगदान है। लगातार सामग्री अपलोड
aghkuh1
aghkuh1
aghkuh1
aghkuh1

April 9, 2025