इंडेक्सर - क्लाउड में ऑनलाइन

यह कमांड इंडेक्सर है जिसे हमारे कई मुफ्त ऑनलाइन वर्कस्टेशन जैसे कि उबंटू ऑनलाइन, फेडोरा ऑनलाइन, विंडोज ऑनलाइन एमुलेटर या मैक ओएस ऑनलाइन एमुलेटर का उपयोग करके ऑनवर्क्स फ्री होस्टिंग प्रदाता में चलाया जा सकता है।

कार्यक्रम:

नाम


इंडेक्सर - स्फिंक्ससर्च फुलटेक्स्ट इंडेक्स जनरेटर

SYNOPSIS


इंडेक्सर [--कॉन्फ़िगरेशन कॉन्फिगफाइल] [--घुमाएँ] [--कोई प्रगति नहीं | --शांत] [--सभी | सूचकांक | ...]

इंडेक्सर --बिल्डस्टॉप निर्गम संचिका COUNT [--कॉन्फ़िगरेशन कॉन्फिगफाइल] [--कोई प्रगति नहीं | --शांत]
[--सभी | सूचकांक | ...]

इंडेक्सर --मर्ज MAIN_INDEX DELTA_INDEX [--कॉन्फ़िगरेशन कॉन्फिगफाइल] [--घुमाएँ] [--कोई प्रगति नहीं |
--शांत]

वर्णन


स्फिंक्स प्रोग्रामों का एक संग्रह है जिसका उद्देश्य उच्च गुणवत्ता वाली पूर्ण-पाठ खोज प्रदान करना है।

इंडेक्सर स्फिंक्स के भाग के रूप में दो प्रमुख उपकरणों में से पहला है। दोनों में से किसी एक से आह्वान किया गया
कमांड लाइन सीधे, या एक बड़ी स्क्रिप्ट के भाग के रूप में, इंडेक्सर के लिए पूर्ण रूप से जिम्मेदार है
वह डेटा एकत्र करना जो खोजने योग्य होगा।

इंडेक्सर के लिए कॉलिंग सिंटैक्स इस प्रकार है:

$ अनुक्रमणिका [विकल्प] [सूचकांकनाम1 [सूचकांकनाम2 [...]]]

मूलतः आप विभिन्न संभावित अनुक्रमणिकाओं को सूचीबद्ध करेंगे (जिन्हें आप बाद में बनाएंगे
खोज के लिए उपलब्ध है) sphinx.conf में, इसलिए कॉल करते समय इंडेक्सर, कम से कम आपको होना चाहिए
यह बताएं कि आप किस इंडेक्स (या इंडेक्स) को इंडेक्स करना चाहते हैं।

यदि sphinx.conf में 2 अनुक्रमणिका पर विवरण शामिल है, mybigindex और mysmallindex, तुम यह कर सकते थे
निम्नलिखित हैं:

$ इंडेक्सर mybigindex
$ इंडेक्सर mysmallindex mybigindex

कॉन्फ़िगरेशन फ़ाइल, sphinx.conf के भाग के रूप में, आप अपने लिए एक या अधिक अनुक्रमणिका निर्दिष्ट करते हैं
आंकड़े। आप कॉल कर सकते हैं इंडेक्सर उनमें से किसी एक को पुनः अनुक्रमित करने के लिए, तदर्थ, या आप इसे संसाधित करने के लिए कह सकते हैं
सभी अनुक्रमित - आप केवल एक या सभी को एक साथ कॉल करने तक सीमित नहीं हैं, आप हमेशा चुन सकते हैं
उपलब्ध अनुक्रमणिका का कुछ संयोजन।

विकल्प


के लिए अधिकांश विकल्प इंडेक्सर हालाँकि, कॉन्फ़िगरेशन फ़ाइल में दिए गए हैं
कुछ विकल्प हैं जिन्हें आपको कमांड लाइन पर भी निर्दिष्ट करने की आवश्यकता हो सकती है, क्योंकि वे प्रभावित कर सकते हैं
इंडेक्सिंग ऑपरेशन कैसे किया जाता है. ये विकल्प हैं:

--सब
बताता है इंडेक्सर लिस्टिंग के बजाय sphinx.conf में सूचीबद्ध प्रत्येक इंडेक्स को अपडेट करने के लिए
व्यक्तिगत सूचकांक. यह छोटे कॉन्फ़िगरेशन, या क्रॉन-प्रकार या में उपयोगी होगा
रखरखाव कार्य जहां पूरे सूचकांक सेट को प्रत्येक दिन, या सप्ताह में फिर से बनाया जाएगा
जो भी अवधि सर्वोत्तम है.

उदाहरण उपयोग:

$ अनुक्रमणिका --config /home/myuser/sphinx.conf --सभी

--बिल्डस्टॉप आउटफ़ाइल.txt NUM
सूचकांक स्रोत की समीक्षा करता है, जैसे कि यह डेटा को अनुक्रमित कर रहा हो, और इसकी एक सूची तैयार करता है
वे शब्द जिन्हें अनुक्रमित किया जा रहा है। दूसरे शब्दों में, यह खोजे जाने योग्य सभी चीज़ों की एक सूची तैयार करता है
वे शब्द जो सूचकांक का हिस्सा बन रहे हैं। टिप्पणी; यह सूचकांक को अद्यतन नहीं करता है
प्रश्न, यह बस डेटा को 'मानो' संसाधित करता है जैसे कि यह अनुक्रमणिका हो, जिसमें चलाना भी शामिल है
प्रश्नों को परिभाषित किया गया है sql_query_pre or sql_query_post. आउटपुटफ़ाइल.txt में शामिल होगा
शब्दों की सूची, प्रति पंक्ति एक, सबसे पहले आवृत्ति के आधार पर क्रमबद्ध, और NUM
सूचीबद्ध किए जाने वाले शब्दों की अधिकतम संख्या निर्दिष्ट करता है; यदि पर्याप्त रूप से बड़ा हो
सूचकांक में प्रत्येक शब्द को सम्मिलित करें, केवल उतने ही शब्द वापस आएँगे। इस तरह का एक
शब्दकोश सूची का उपयोग क्लाइंट एप्लिकेशन सुविधाओं के लिए किया जा सकता है "क्या आपका मतलब था..."
कार्यक्षमता, आमतौर पर के साथ संयोजन में --बिल्डफ़्रीक्स, नीचे.

उदाहरण:

$ इंडेक्सर myindex--बिल्डस्टॉप्स Word_freq.txt 1000

यह 1,000 के साथ वर्तमान निर्देशिका, Word_freq.txt में एक दस्तावेज़ तैयार करेगा
'मायइंडेक्स' में सबसे आम शब्द, सबसे पहले सबसे आम द्वारा क्रमबद्ध। ध्यान दें कि फ़ाइल होगी
एकाधिक अनुक्रमितों के साथ निर्दिष्ट होने पर अनुक्रमित किए गए अंतिम सूचकांक से संबंधित होता है --सब (अर्थात
कॉन्फ़िगरेशन फ़ाइल में सूचीबद्ध अंतिम)

--बिल्डफ़्रीक्स
के साथ जोड़ी में प्रयोग किया जाता है --बिल्डस्टॉप (और यदि अनदेखा किया जाता है --बिल्डस्टॉप निर्दिष्ट नहीं है) जैसा
--बिल्डस्टॉप सूचकांक के भीतर प्रयुक्त शब्दों की सूची प्रदान करता है, --बिल्डफ़्रीक्स जोड़ता है
सूचकांक में मौजूद मात्रा, जो यह स्थापित करने में उपयोगी होगी कि क्या निश्चित है
यदि शब्द बहुत अधिक प्रचलित हैं तो उन्हें स्टॉपवर्ड माना जाना चाहिए। इससे भी मदद मिलेगी
"क्या आपका मतलब था..." विशेषताएं विकसित करना जहां आप जान सकते हैं कि कोई दिया गया शब्द कितना अधिक सामान्य है
दूसरे की तुलना में, समान।

उदाहरण:

$ इंडेक्सर myindex --बिल्डस्टॉप्स Word_freq.txt 1000 --buildfreqs

इससे ऊपर जैसा शब्द_freq.txt उत्पन्न होगा, हालाँकि प्रत्येक शब्द के बाद होगा
प्रश्नगत सूचकांक में यह कितनी बार घटित हुआ।

--कॉन्फ़िगरेशन कॉन्फिगराइल, -c कॉन्फिगफाइल
दी गई फ़ाइल को कॉन्फ़िगरेशन के रूप में उपयोग करें. आम तौर पर, यह sphinx.conf को खोजेगा
स्थापना निर्देशिका (जैसे/usr/local/sphinx/etc/sphinx.conf में स्थापित है
/usr/local/sphinx), इसके बाद इंडेक्सर को कॉल करते समय आप वर्तमान निर्देशिका में हैं
खोल से. इसका सर्वाधिक उपयोग साझा परिवेशों में होता है जहां बाइनरी फ़ाइलें होती हैं
/usr/local/sphinx/ जैसे कहीं इंस्टॉल किया गया है लेकिन आप उपयोगकर्ताओं को यह प्रदान करना चाहते हैं
अपने स्वयं के कस्टम स्फिंक्स सेट-अप बनाने की क्षमता, या यदि आप एकाधिक चलाना चाहते हैं
एक ही सर्वर पर उदाहरण। ऐसे मामलों में आप उन्हें अपना निर्माण करने की अनुमति दे सकते हैं
sphinx.conf फ़ाइलों का स्वामी बनें और उन्हें पास करें इंडेक्सर इस विकल्प के साथ।

उदाहरण के लिए:

$ अनुक्रमणिका --config /home/myuser/sphinx.conf myindex

--डंप-पंक्तियाँ फ़ाइल
SQL स्रोत द्वारा लाई गई पंक्तियों को MySQL संगत में निर्दिष्ट फ़ाइल में डंप करता है
वाक्य - विन्यास। परिणामी डंप इंडेक्सर द्वारा प्राप्त डेटा का सटीक प्रतिनिधित्व है
और अनुक्रमण-समय के मुद्दों को दोहराने में मदद करें।

--मर्ज डीएसटी-सूचकांक एसआरसी-सूचकांक
भौतिक रूप से दो अनुक्रमितों को एक साथ मर्ज करें। उदाहरण के लिए यदि आपके पास मुख्य+डेल्टा योजना है,
जहां मुख्य सूचकांक शायद ही कभी बदलता है, लेकिन डेल्टा सूचकांक को बार-बार पुनर्निर्मित किया जाता है, और
--मर्ज दोनों को मिलाने के लिए उपयोग किया जाएगा। ऑपरेशन दाएं से बाएं ओर चलता है - द
की सामग्री एसआरसी-सूचकांक की सामग्री के साथ जांच और भौतिक रूप से संयोजित करें
डीएसटी-सूचकांक और परिणाम अंदर छोड़ दिया गया है डीएसटी-सूचकांक. छद्म कोड में, इसे व्यक्त किया जा सकता है
के रूप में: डीएसटी-सूचकांक += एसआरसी-सूचकांक

एक उदाहरण:

$ इंडेक्सर--मुख्य डेल्टा को मर्ज करें--घुमाएँ

उपरोक्त उदाहरण में, जहां मुख्य मास्टर है, शायद ही कभी संशोधित सूचकांक, और डेल्टा
यह कम बार संशोधित किया गया है, आप कॉल करने के लिए उपरोक्त का उपयोग कर सकते हैं इंडेक्सर सेवा मेरे
डेल्टा की सामग्री को मुख्य सूचकांक में संयोजित करें और सूचकांकों को घुमाएँ।

--मर्ज-डीएसटी-रेंज एटीटीआर न्यूनतम मैक्स
विलय पर दी गई फ़िल्टर रेंज चलाएँ। विशेष रूप से, जैसे कि मर्ज को लागू किया जाता है
गंतव्य सूचकांक (के भाग के रूप में) --मर्ज, और यदि नजरअंदाज कर दिया जाता है --मर्ज निर्दिष्ट नहीं है),
इंडेक्सर गंतव्य सूचकांक में समाप्त होने वाले दस्तावेज़ों को भी फ़िल्टर करेगा, और केवल
दस्तावेज़ दिए गए फ़िल्टर से होकर गुजरेंगे और अंतिम सूचकांक में समाप्त होंगे। यह
उदाहरण के लिए, एक सूचकांक में इस्तेमाल किया जा सकता है जहां एक 'हटाया गया' गुण है, जहां 0 है
का अर्थ है 'हटाया नहीं गया'। ऐसे सूचकांक को इसके साथ विलय किया जा सकता है:

$ इंडेक्सर --मर्ज मुख्य डेल्टा --मर्ज-डीएसटी-रेंज हटा दिया गया 0 0

हटाए गए (मान 1) के रूप में चिह्नित कोई भी दस्तावेज़ नव-विलय से हटा दिया जाएगा
गंतव्य सूचकांक. इसे जोड़ने के लिए कमांड लाइन में कई बार जोड़ा जा सकता है
मर्ज के लिए क्रमिक फ़िल्टर, किसी दस्तावेज़ के लिए इन सभी को पूरा किया जाना चाहिए
अंतिम सूचकांक का हिस्सा बनें.

--मर्ज-किललिस्ट्स, --मर्ज-क्लिस्ट्स
के साथ जोड़ी में प्रयोग किया जाता है --मर्ज. आमतौर पर विलय करते समय इंडेक्सर स्रोत अनुक्रमणिका की किल-सूची का उपयोग करता है
(अर्थात्, जिसमें विलय किया गया है) मेल खाने वाले दस्तावेज़ों को मिटाने के लिए फ़िल्टर के रूप में
गंतव्य सूचकांक. साथ ही गंतव्य की हत्या-सूची स्वयं नहीं है
बिल्कुल छुआ. उपयोग करते समय --मर्ज-किललिस्ट्स, (या इसका संक्षिप्त रूप --मर्ज-क्लिस्ट्स)
इंडेक्सर डीएसटी-इंडेक्स डॉक्स को src-index किललिस्ट के साथ फ़िल्टर नहीं करेगा, लेकिन यह मर्ज हो जाएगा
उनकी हत्या-सूचियाँ एक साथ, इसलिए अंतिम परिणाम सूचकांक में हत्या-सूची होगी
जिसमें मर्ज किए गए स्रोत किल-सूचियाँ शामिल हैं।

--कोई प्रगति नहीं
प्रगति विवरण घटित होने पर उन्हें प्रदर्शित न करें; इसके बजाय, अंतिम स्थिति विवरण (जैसे)
जैसे दस्तावेज़ों को अनुक्रमित किया गया है, अनुक्रमण की गति इत्यादि केवल पूरा होने पर ही रिपोर्ट की जाती है
अनुक्रमण। ऐसे उदाहरणों में जहां स्क्रिप्ट कंसोल (या 'tty') पर नहीं चल रही है, यह
डिफ़ॉल्ट रूप से चालू रहेगा.

उदाहरण उपयोग:

$ अनुक्रमणिका --घुमाएँ --सभी --कोई प्रगति नहीं

--प्रिंट-प्रश्न
एसक्यूएल क्वेरीज़ को प्रिंट करता है जो इंडेक्सर एसक्यूएल कनेक्शन के साथ डेटाबेस को भेजता है
और वियोग की घटनाएँ। यह SQL के साथ समस्याओं का निदान करने और उन्हें ठीक करने के लिए उपयोगी है
सूत्रों का कहना है।

--शांत
बताता है इंडेक्सर जब तक कोई त्रुटि न हो, कुछ भी आउटपुट न करें। पुनः, सबसे अधिक उपयोग किया जाता है
क्रॉन-प्रकार, या अन्य स्क्रिप्ट नौकरियां जहां आउटपुट अप्रासंगिक या अनावश्यक है, को छोड़कर
किसी प्रकार की त्रुटि होने की स्थिति में.

उदाहरण उपयोग:

$ अनुक्रमणिका --घुमाएँ --सभी --शांत

--घुमाना
अनुक्रमणिका को घुमाने के लिए उपयोग किया जाता है। जब तक आपके पास ऐसी स्थिति न हो कि आप खोज कर सकें
उपयोगकर्ताओं को परेशान किए बिना ऑफ़लाइन कार्य करना, आपको लगभग निश्चित रूप से बनाए रखना होगा
नए दस्तावेज़ों को अनुक्रमित करते समय खोज चल रही है। --घुमाना दूसरा सूचकांक बनाता है,
पहले के समानांतर (उसी स्थान पर, बस फ़ाइल नाम में .new शामिल करते हुए)।
एक बार पूरा, इंडेक्सर अधिसूचित खोजा भेजने के माध्यम से उच्छ्वास करो संकेत, और खोजा
इंडेक्स का नाम बदलने का प्रयास किया जाएगा (मौजूदा इंडेक्स का नाम बदलकर .old और शामिल किया जाएगा)।
उन्हें बदलने के लिए .new का नाम बदलना), और फिर नई फ़ाइलों से सेवा देना शुरू करें।
की सेटिंग पर निर्भर करता है सीमलेस_रोटेट, सक्षम होने में थोड़ा विलंब हो सकता है
नई अनुक्रमणिका खोजने के लिए.

उदाहरण उपयोग:

$ इंडेक्सर--रोटेट--सब

--आहें भरो-प्रत्येक
यह तब उपयोगी होता है जब आप कई बड़ी अनुक्रमणिकाओं का पुनर्निर्माण कर रहे होते हैं, और चाहते हैं कि प्रत्येक को घुमाया जाए
खोजा जितनी जल्दी हो सके। साथ --आहें भरो-प्रत्येक, इंडेक्सर एक भेज देंगे उच्छ्वास करो को संकेत
खोजा प्रत्येक सूचकांक पर कार्य सफलतापूर्वक पूरा करने के बाद। (डिफ़ॉल्ट व्यवहार है
एकल भेजने के लिए उच्छ्वास करो सभी सूचकांक निर्मित होने के बाद।)

--शब्दशः
गारंटी देता है कि प्रत्येक पंक्ति जिसके कारण अनुक्रमण में समस्याएँ उत्पन्न हुईं (डुप्लिकेट, शून्य, या अनुपलब्ध)।
दस्तावेज़ आईडी; या फ़ाइल फ़ील्ड IO मुद्दे; आदि) की सूचना दी जाएगी। डिफ़ॉल्ट रूप से, यह विकल्प
बंद है, और इसके बजाय समस्या सारांश रिपोर्ट किया जा सकता है।

onworks.net सेवाओं का उपयोग करके ऑनलाइन इंडेक्सर का उपयोग करें



नवीनतम Linux और Windows ऑनलाइन प्रोग्राम