نمایه ساز - آنلاین در ابر

این فهرستگر فرمانی است که می تواند در ارائه دهنده میزبانی رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.

برنامه:

نام


نمایه ساز - Sphinxsearch مولد فهرست کامل متن

خلاصه


ایندکس [--پیکربندی CONFIGFILE] [--چرخش] [--عدم پیشرفت | --آرام] [--همه | شاخص | ...]

ایندکس -- ساخت استاپ فایل خروجی COUNT [--پیکربندی CONFIGFILE] [--بدون پیشرفت | --ساکت]
[--همه | شاخص | ...]

ایندکس --ادغام MAIN_INDEX DELTA_INDEX [--پیکربندی CONFIGFILE] [--چرخش] [--عدم پیشرفت |
--ساکت]

شرح


Sphinx مجموعه ای از برنامه هایی است که هدف آن ارائه جستجوی تمام متن با کیفیت بالا است.

ایندکس اولین ابزار از دو ابزار اصلی به عنوان بخشی از Sphinx است. فراخوانی شده از هر دو
خط فرمان مستقیماً یا به عنوان بخشی از یک اسکریپت بزرگتر، ایندکس تنها مسئول است
جمع آوری داده هایی که قابل جستجو خواهند بود.

نحو فراخوانی ایندکسر به صورت زیر است:

نمایه ساز $ [OPTIONS] [indexname1 [indexname2 [...]]]

اساساً شما فهرست‌های مختلف ممکن را فهرست می‌کنید (که بعداً می‌سازید).
در دسترس برای جستجو) در sphinx.conf، بنابراین هنگام تماس ایندکس، حداقل باید باشید
به آن بگویید چه شاخصی (یا شاخص هایی) را می خواهید ایندکس کنید.

اگر sphinx.conf حاوی جزئیات 2 ایندکس بود، mybigindex و mysmallindex، شما می توانید انجام دهید
به شرح زیر است:

نمایه ساز $ mybigindex
نمایه ساز $ mysmallindex mybigindex

به عنوان بخشی از فایل پیکربندی، sphinx.conf، شما یک یا چند نمایه را برای خود مشخص می کنید.
داده ها. شما ممکن است تماس بگیرید ایندکس برای فهرست مجدد یکی از آنها، ad-hoc، یا می توانید به آن بگویید پردازش کند
همه ایندکس ها - شما محدود به تماس تنها با یک یا همه به یکباره نیستید، همیشه می توانید انتخاب کنید
ترکیبی از شاخص های موجود

OPTIONS


اکثر گزینه ها برای ایندکس به هر حال در فایل پیکربندی وجود دارد
برخی از گزینه ها هستند که ممکن است لازم باشد آنها را در خط فرمان نیز مشخص کنید، زیرا می توانند تأثیر بگذارند
نحوه انجام عملیات نمایه سازی این گزینه ها عبارتند از:

--همه
می گوید ایندکس برای به روز رسانی هر فهرست فهرست شده در sphinx.conf، به جای فهرست کردن
شاخص های فردی این می تواند در پیکربندی های کوچک، یا نوع cron یا
کارهای تعمیر و نگهداری که در آن کل مجموعه شاخص هر روز، یا هفته یا هر هفته بازسازی می شود
هر دوره ای که بهترین است

کاربرد مثال:

$ indexer --config /home/myuser/sphinx.conf --all

-- ساخت استاپ outfile.txt NUM
منبع ایندکس را بازبینی می‌کند، گویی که داده‌ها را نمایه می‌کند، و فهرستی از آن‌ها را تولید می‌کند
اصطلاحاتی که در حال نمایه سازی هستند به عبارت دیگر، فهرستی از تمام موارد قابل جستجو را تولید می کند
شرایطی که در حال تبدیل شدن به بخشی از شاخص هستند. توجه داشته باشید؛ ایندکس را به روز نمی کند
سوال، آن را به سادگی پردازش داده ها به عنوان انگار که در حال نمایه سازی، از جمله در حال اجرا است
پرس و جوهای تعریف شده با sql_query_pre or sql_query_post. outputfile.txt شامل
فهرستی از کلمات، یکی در هر خط، مرتب شده بر اساس فراوانی با بیشترین فراوانی اول، و NUM
حداکثر تعداد کلماتی را که فهرست می شوند مشخص می کند. اگر به اندازه کافی بزرگ باشد
هر کلمه در فهرست را در بر می گیرد، فقط تعداد زیادی کلمه برگردانده می شود. مثل
لیست فرهنگ لغت را می توان برای ویژگی های برنامه مشتری در مورد "آیا منظورت..." استفاده شود.
عملکرد، معمولا در ارتباط با -- فرکانس های ساخت، در زیر

مثال:

$ indexer myindex --buildstops word_freq.txt 1000

این یک سند در دایرکتوری فعلی، word_freq.txt با 1,000 تولید می کند
رایج ترین کلمات در "myindex"، مرتب شده بر اساس متداول ترین اول. توجه داشته باشید که فایل خواهد شد
مربوط به آخرین نمایه نمایه شده زمانی که با چند نمایه یا مشخص می شود --همه (به عنوان مثال
آخرین مورد ذکر شده در فایل پیکربندی)

-- فرکانس های ساخت
به صورت جفت استفاده می شود -- ساخت استاپ (و نادیده گرفته می شود اگر -- ساخت استاپ مشخص نشده است). مانند
-- ساخت استاپ لیستی از کلمات استفاده شده در فهرست را ارائه می دهد، -- فرکانس های ساخت اضافه می کند
مقدار موجود در شاخص، که در تعیین اینکه آیا مشخص است مفید خواهد بود
اگر کلمات بسیار رایج باشند باید به عنوان کلید واژه در نظر گرفته شوند. همچنین کمک خواهد کرد
توسعه ویژگی‌های "آیا منظورت این بود..." که در آن می‌توانید یک کلمه معین را چقدر رایج‌تر کنید
در مقایسه با دیگری، مشابه

مثال:

$ indexer myindex --buildstops word_freq.txt 1000 --buildfreqs

این عبارت word_freq.txt را مانند بالا تولید می کند، اما بعد از هر کلمه عبارت خواهد بود
تعداد دفعاتی که در شاخص مورد نظر رخ داده است.

- پیکربندی CONFIGRILE, -c CONFIGFILE
از فایل داده شده به عنوان پیکربندی استفاده کنید. به طور معمول، آن را به دنبال sphinx.conf در
دایرکتوری نصب (به عنوان مثال/usr/local/sphinx/etc/sphinx.conf در صورت نصب در
/usr/local/sphinx)، و به دنبال آن دایرکتوری فعلی که هنگام فراخوانی ایندکسر در آن قرار دارید
از پوسته این بیشتر در محیط های مشترک که فایل های باینری هستند استفاده می شود
در جایی مانند /usr/local/sphinx/ نصب شده است اما می‌خواهید به کاربران ارائه دهید
توانایی ایجاد تنظیمات سفارشی Sphinx خود، یا اگر می خواهید چندگانه را اجرا کنید
نمونه هایی در یک سرور واحد در مواردی مانند مواردی که می‌توانید به آن‌ها اجازه بسازید
فایل های sphinx.conf را داشته باشید و آنها را به آن ها ارسال کنید ایندکس با این گزینه

مثلا:

$ indexer --config /home/myuser/sphinx.conf myindex

- ردیف‌ها فایل
ردیف‌های واکشی شده توسط منبع(های) SQL را در فایل مشخص شده در یک MySQL سازگار می‌ریزد.
نحو. تخلیه های حاصل نمایش دقیق داده هایی است که توسط نمایه ساز دریافت می شود
و کمک به تکرار مسائل مربوط به زمان نمایه سازی.

--ادغام DST-INDEX SRC-INDEX
از نظر فیزیکی دو شاخص را با هم ادغام کنید. برای مثال اگر یک طرح اصلی + دلتا دارید،
جایی که شاخص اصلی به ندرت تغییر می کند، اما نمایه دلتا اغلب بازسازی می شود، و
--ادغام برای ترکیب این دو استفاده می شود. عملیات از راست به چپ حرکت می کند -
مطالب از SRC-INDEX بررسی و ترکیب فیزیکی با محتویات
DST-INDEX و نتیجه در باقی مانده است DST-INDEX. ممکن است در شبه کد بیان شود
عنوان: DST-INDEX += SRC-INDEX

یک مثال:

$ indexer --merge delta main --rotate

در مثال بالا، جایی که اصلی، اصلی، شاخص به ندرت اصلاح شده و دلتا است
یکی از مواردی است که کمتر تغییر می کند، می توانید از موارد بالا برای تماس استفاده کنید ایندکس به
محتویات دلتا را در نمایه اصلی ترکیب کرده و اندیس ها را بچرخانید.

--merge-dst-range ATTR MIN MAX
محدوده فیلتر داده شده در هنگام ادغام را اجرا کنید. به طور خاص، به عنوان ادغام به اعمال می شود
فهرست مقصد (به عنوان بخشی از --ادغام، و نادیده گرفته می شود اگر --ادغام مشخص نشده است)
ایندکس همچنین اسنادی را که به فهرست مقصد ختم می شوند و فقط فیلتر می کند
اسناد از فیلتر داده شده عبور می کنند و در فهرست نهایی قرار می گیرند. این
می تواند برای مثال، در یک شاخص که در آن یک ویژگی "حذف شده" وجود دارد، که در آن 0 وجود دارد، استفاده شود
به معنی "حذف نشده" است. چنین شاخصی را می توان با:

$ indexer --merge delta main --merge-dst-range deleted 0 0

هر سندی که به عنوان حذف شده علامت گذاری شده باشد (مقدار 1) از اسناد ادغام شده جدید حذف خواهد شد
شاخص مقصد می توان آن را چندین بار به خط فرمان اضافه کرد تا اضافه شود
فیلترهای متوالی برای ادغام، که برای یک سند باید همه آنها رعایت شوند
بخشی از شاخص نهایی شود.

-- ادغام-قاتل, ---merge-lists
به صورت جفت استفاده می شود --ادغام. معمولاً هنگام ادغام ایندکس از فهرست kill از فهرست منبع استفاده می کند
(یعنی فیلتری که در آن ادغام شده است) به عنوان فیلتری برای پاک کردن اسناد منطبق از آن
شاخص مقصد در عین حال لیست کشتار مقصد خود اینطور نیست
اصلا لمس کرد هنگام استفاده از -- ادغام-قاتل، (یا به شکل کوتاهتر است ---merge-lists)
ایندکس اسناد dst-index را با src-index killlist فیلتر نمی کند، اما ادغام می شود
لیست کشتن آنها با هم، بنابراین فهرست نتیجه نهایی دارای لیست کشتار خواهد بود
حاوی فهرست های کشتار منبع ادغام شده.

--عدم پیشرفت
جزئیات پیشرفت را همانطور که رخ می دهد نمایش ندهید. در عوض، جزئیات وضعیت نهایی (مانند
به عنوان اسناد نمایه شده، سرعت نمایه سازی و غیره فقط در تکمیل گزارش می شود
نمایه سازی در مواردی که اسکریپت روی یک کنسول (یا 'tty') اجرا نمی شود، این
به طور پیش فرض روشن خواهد بود.

کاربرد مثال:

نمایه ساز $ --rotate --all --noprogress

--چاپ-پرس و جوها
پرس و جوهای SQL را که نمایه ساز به پایگاه داده ارسال می کند، همراه با اتصال SQL چاپ می کند
و رویدادهای قطع ارتباط این برای تشخیص و رفع مشکلات SQL مفید است
منابع

--ساکت
می گوید ایندکس خروجی چیزی نباشد، مگر اینکه خطایی وجود داشته باشد. باز هم بیشترین استفاده برای
cron-type یا سایر کارهای اسکریپت که در آنها خروجی نامربوط یا غیر ضروری است، به جز
در صورت بروز نوعی خطا

کاربرد مثال:

نمایه ساز $ --rotate --all --quiet

-- چرخش
برای چرخش شاخص ها استفاده می شود. مگر اینکه موقعیتی داشته باشید که بتوانید جستجو کنید
بدون ایجاد مزاحمت برای کاربران به صورت آفلاین عمل کنید، تقریباً مطمئناً باید آن را حفظ کنید
جستجو در حین نمایه سازی اسناد جدید اجرا می شود. -- چرخش یک شاخص دوم ایجاد می کند،
به موازات اولی (در همان مکان، به سادگی .new را در نام فایل ها وارد کنید).
پس از تکمیل، ایندکس اطلاع داده شده جستجو کرد از طریق ارسال چشم انداز سیگنال، و جستجو کرد
سعی خواهد کرد نام ایندکس ها را تغییر دهد (تغییر نام فهرست های موجود به .old و
تغییر نام .new به جای آنها)، و سپس شروع به ارائه از فایل های جدیدتر.
بسته به تنظیم بدون درز_چرخش، ممکن است کمی تأخیر در توانستن وجود داشته باشد
برای جستجوی نمایه های جدیدتر

کاربرد مثال:

نمایه ساز $ --rotate --all

-- آه کشیدن-هر کدام
زمانی مفید است که شما در حال بازسازی بسیاری از ایندکس های بزرگ هستید و می خواهید هر یک به آن بچرخند
جستجو کرد در اسرع وقت. با -- آه کشیدن-هر کدام, ایندکس a ارسال خواهد کرد چشم انداز سیگنال به
جستجو کرد پس از اتمام موفقیت آمیز کار روی هر شاخص. (رفتار پیش فرض این است
برای ارسال تک آهنگ چشم انداز بعد از اینکه همه شاخص ها ساخته شدند.)

-- پرحرف
تضمین می کند که هر ردیفی که در نمایه سازی مشکل ایجاد می کند (تکراری، صفر، یا از دست رفته است).
شناسه سند؛ یا فیلد فایل مسائل IO. و غیره) گزارش خواهد شد. به طور پیش فرض این گزینه
خاموش است و به جای آن ممکن است خلاصه مشکلات گزارش شود.

با استفاده از سرویس‌های onworks.net از فهرست‌کننده آنلاین استفاده کنید



جدیدترین برنامه های آنلاین لینوکس و ویندوز