این دستور SWISH-FAQ است که می تواند در ارائه دهنده هاست رایگان OnWorks با استفاده از یکی از چندین ایستگاه کاری آنلاین رایگان ما مانند Ubuntu Online، Fedora Online، شبیه ساز آنلاین ویندوز یا شبیه ساز آنلاین MAC OS اجرا شود.
برنامه:
نام
SWISH-FAQ - سوالات متداول Swish-e. پاسخ به سوالات متداول
بررسی اجمالی
لیست سوالات متداول و پاسخ داده شده لطفاً قبل از درخواست، این سند را بررسی کنید
سوالات در لیست بحث Swish-e.
سوالات عمومی سوالات
چی is Swish-e؟
Swish-e است Sنقره زدن Web Iنمایه سازی System برای Hعمان - Enhanced با آن، شما می توانید به سرعت و
به راحتی فهرست فایل ها یا وب سایت های راه دور را فهرست بندی کنید و فهرست های تولید شده را جستجو کنید
کلمات و عبارات.
پس is Swish-e a جستجو کردن موتور؟
خب بله. احتمالاً رایج ترین استفاده از Swish-e ارائه یک موتور جستجو برای وب است
سایت های. توزیع Swish-e شامل اسکریپتهای CGI است که میتوان با آن برای افزودن a استفاده کرد
جستجو کردن موتور برای وب سایت شما اسکریپت های CGI را می توان در مثال دایرکتوری از
بسته توزیع را ببینید README برای اطلاعات در مورد اسکریپت ها فایل کنید.
اما Swish-e همچنین می تواند برای فهرست بندی انواع داده ها مانند پیام های ایمیل، داده ها استفاده شود
در یک سیستم مدیریت پایگاه داده رابطه ای، اسناد XML یا اسنادی مانند
اسناد Word و PDF -- یا هر ترکیبی از آن منابع به طور همزمان. جستجوها
را می توان به فیلدها یا محدود کرد MetaNames در یک سند، یا محدود به مناطق درون یک
سند HTML (به عنوان مثال بدنه، عنوان). برنامه هایی غیر از برنامه های CGI می توانند از Swish-e استفاده کنند،
نیز هست.
باید I ارتقاء if من هستم قبلا در حال اجرا a قبلی نسخه of Swish-e؟
تعداد زیادی رفع اشکال، افزودن ویژگیها و اصلاحات منطقی در نسخه انجام شد
2.2. علاوه بر این، سرعت نمایه سازی به شدت بهبود یافته است (گزارش های زمان نمایه سازی
تغییر از چهار ساعت به 5 دقیقه)، و بخش های اصلی تجزیه کننده های نمایه سازی و جستجو
بازنویسی شده اند. گزینه های اشکال زدایی بهتر، فرمت های خروجی پیشرفته و موارد دیگر وجود دارد
داده های متا سند (به عنوان مثال آخرین تاریخ اصلاح، خلاصه سند)، گزینه هایی برای نمایه سازی از
منابع داده خارجی، و spidering سریعتر فقط برای نام بردن چند تغییر. (تغییرات را ببینید
برای اطلاعات بیشتر فایل کنید
از آنجایی که تلاش زیادی برای نسخه 2.2 انجام شده است، پشتیبانی از نسخه های قبلی انجام خواهد شد
احتمالا محدود باشد
هستند آنجا دوتایی توزیع در دسترس برای Swish-e on سکو فوو
فوو؟ خب، بله، تعدادی توزیع باینری در دسترس هستند. لطفاً وب Swish-e را ببینید
سایت برای لیست در http://swish-e.org/.
به طور کلی توصیه می شود در صورت امکان Swish-e را از منبع بسازید.
Do I نیاز به مجدداً my سایت هر زمان I ارتقاء به a جدید Swish-e نسخه؟
گاهی اوقات ممکن است به شدت ضروری نباشد، اما از آنجایی که شما واقعاً نمی دانید که آیا چیزی وجود دارد یا خیر
در شاخص تغییر کرده است، این قانون خوبی برای فهرست مجدد است.
چه خبر la مزیت of با استفاده از la libxml2 کتابخانه برای تجزیه HTML؟
Swish-e ممکن است با libxml2 پیوند داده شود، کتابخانه ای برای کار با اسناد HTML و XML.
Swish-e می تواند از libxml2 برای تجزیه اسناد HTML و XML استفاده کند.
تجزیه کننده libxml2 تجزیه کننده بهتری نسبت به تجزیه کننده HTML داخلی Swish-e است. بیشتر ارائه می دهد
ویژگی ها، و کار بسیار بهتری در استخراج متن از یک صفحه وب انجام می دهد. که در
علاوه بر این، می توانید از تنظیمات پیکربندی "ParserWarningLevel" برای یافتن ساختار استفاده کنید
خطاهایی در اسناد شما که می تواند (و با تجزیه کننده HTML Swish-e) باعث ایجاد اسناد شود
به اشتباه ایندکس شود
Libxml2 مورد نیاز نیست، اما به شدت برای تجزیه اسناد HTML توصیه می شود. این است
همچنین برای تجزیه XML توصیه می شود، زیرا ویژگی های بسیار بیشتری نسبت به Expat داخلی ارائه می دهد
تجزیه کننده xml.c.
تجزیه کننده داخلی HTML پشتیبانی محدودی خواهد داشت و دارای تعدادی اشکال است. برای
به عنوان مثال، موجودیت های HTML ممکن است همیشه به درستی تبدیل نشده باشند و ویژگی ها نداشته باشند
موجودیت تبدیل شده است. وقتی HTML نامعتبر تجزیه می شود، تجزیه کننده داخلی گیج می شود
جایی که تجزیه کننده libxml2 اغلب گیج نمی شود. ساختار بهتر تشخیص داده می شود
با تجزیه کننده libxml2.
اگر از ماژول Perl (رابط C به کتابخانه Swish-e) استفاده می کنید، ممکن است بخواهید
دو نسخه از Swish-e بسازید، یکی با کتابخانه libxml2 که در باینری پیوند داده شده است و دیگری
بدون، و ماژول Perl را در مقابل کتابخانه بدون کد libxml2 بسازید. این هست
برای صرفه جویی در فضای کتابخانه امیدوارم روزی به زودی کتابخانه به دو قسمت تقسیم شود
نمایه سازی و جستجوی کد (از داوطلبان خوش آمدید).
میکند Swish-e شامل a CGI رابط؟
آره. نوع.
دو نمونه اسکریپت CGI وجود دارد، swish.cgi و search.cgi. هر دو در نصب شده اند
$prefix/lib/swish-e.
هر دو نیاز به کمی کار برای راه اندازی و استفاده دارند. Swish.cgi احتمالاً همان چیزی است که بیشتر مردم انجام می دهند
می خواهید از آن استفاده کنید زیرا دارای ویژگی های بیشتری است. Search.cgi برای کسانی است که می خواهند با آن شروع کنند
یک اسکریپت کوچک و سفارشی کردن آن با نیازهای آنها.
نمونه ای از استفاده از swish.cgi در صفحه man INSTALL و swish.cgi آورده شده است.
مستندات. مانند اغلب موارد، اگر ابتدا آن را بخوانید، استفاده از آن آسان تر خواهد بود
مستندات.
لطفاً در مورد اسکریپت های CGI موجود در اینترنت برای استفاده با Swish-e احتیاط کنید. برخی هستند
امن نیست
نمونههای اسکریپت CGI با در نظر گرفتن امنیت طراحی شدهاند. صرف نظر از این، شما هستید
تشویق می شود که از متخصص محلی Perl خود بخواهید آن را بررسی کند (و سایر اسکریپت های CGI که استفاده می کنید)
قبل از عرضه آن به تولید این فقط یک سیاست خوب برای دنبال کردن است.
چگونه امن is Swish-e؟
ما هیچ مشکل امنیتی در استفاده از Swish-e نمی دانیم. توجه دقیق شده است
با توجه به مشکلات امنیتی رایج مانند بیش از حد بافر هنگام برنامه نویسی Swish-e.
محتمل ترین مشکل امنیتی Swish-e زمانی است که از طریق یک CGI ضعیف اجرا می شود
رابط. این به اسکریپت های CGI نوشته شده در Perl محدود نمی شود، زیرا به همین سادگی است
یک اسکریپت CGI ناامن در C، Java، PHP یا Python بنویسید. یک منبع اطلاعات خوب است
همراه با توزیع پرل. برای اطلاعات بیشتر، "perldoc perlsec" را در درخواست محلی خود تایپ کنید
اطلاعات یکی دیگر از اسنادی که باید بخوانید در این آدرس قرار دارد
"http://www.w3.org/Security/faq/wwwsf4.html".
توجه داشته باشید که تعداد زیادی وجود دارد رایگان اسکریپت های CGI ناامن و ضعیف در دسترس --
حتی برخی برای استفاده با Swish-e طراحی شده اند. لطفاً هر اسکریپت CGI را که استفاده می کنید به دقت بررسی کنید.
وقتی سرور خود را هک می کنید، رایگان آنقدرها هم قیمت خوبی نیست...
باید I اجرا Swish-e as la فوق العاده (ریشه)؟
نه هرگز.
چی فایل ها میکند Swish-e نوشتن؟
Swish البته فایل ایندکس را می نویسد. این با "IndexFile" مشخص شده است
دستورالعمل پیکربندی یا توسط سوئیچ خط فرمان "-f".
فایل فهرست در واقع مجموعه ای از فایل ها است، اما همه با نام فایل شروع می شوند
با دستورالعمل "IndexFile" یا سوئیچ خط فرمان "-f" مشخص شده است.
به عنوان مثال، پرونده ای که به پایان می رسد پشتیبانی حاوی ویژگی های سند است.
هنگام ایجاد فایل های فهرست، Swish-e پسوند را اضافه می کند دما به نام فایل های فهرست
هنگامی که نمایه سازی کامل شد Swish-e نام را تغییر می دهد دما فایل ها به فایل های فهرست مشخص شده توسط
"IndexFile" یا "-f". این کار به گونهای انجام میشود که شاخصهای موجود تا آن زمان دست نخورده باقی بمانند
نمایه سازی را کامل می کند.
Swish-e همچنین فایل های موقتی را در برخی موارد در طول نمایه سازی می نویسد (به عنوان مثال "-s http", "-s
prog" با فیلترها)، هنگام ادغام، و هنگام استفاده از "-e"). فایل های موقت با ایجاد می شوند
la mkstemp(3) عملکرد (با مجوز 0600 در سیستم عامل های یونیکس مانند).
فایل های موقت در دایرکتوری مشخص شده توسط متغیرهای محیطی ایجاد می شوند
"TMPDIR" و "TMP" به ترتیب. اگر آنها تنظیم نشدهاند، Swish از تنظیم استفاده میکند
تنظیمات پیکربندی TmpDir. در غیر این صورت، فایل موقت در آدرس قرار خواهد گرفت
پوشه کنونی.
قوطی I شاخص PDF و مایکروسافت وورد اسناد؟
بله ، می توانید از a استفاده کنید فیلتر برای تبدیل اسناد در حین نمایه سازی، یا می توانید از یک برنامه استفاده کنید
که اسنادی را که قبلاً تبدیل شده اند به Swish-e "فید" می کند. به "نمایه سازی" در زیر مراجعه کنید.
قوطی I شاخص اسناد و مدارک on a وب سرور؟
بله، Swish-e دو راه برای فهرست بندی اسناد (عنکبوت) در یک وب سرور ارائه می دهد. دیدن
"عنکبوت" در زیر.
Swish-e می تواند اسناد را از یک سیستم فایل یا از یک وب سرور راه دور بازیابی کند. می تواند
همچنین برنامه ای را اجرا کنید که اسناد را به آن برمی گرداند. این برنامه می تواند بازیابی کند
اسناد از پایگاه داده، فیلتر فایل های اسناد فشرده، تبدیل فایل های PDF، استخراج
داده ها از بایگانی های نامه، یا وب سایت های عنکبوتی از راه دور.
قوطی I انجام کلید واژه ها in my اسناد؟
بله، Swish-e می تواند کلمات را با آن مرتبط کند MetaNames در حین نمایه سازی، و شما می توانید خود را محدود کنید
در حین جستجو، این MetaNames را جستجو می کند.
در فایل های HTML خود می توانید کلمات کلیدی را در تگ های HTML META یا در بلوک های XML قرار دهید.
تگ های متا می توانند دو قالب در اسناد منبع شما داشته باشند:
و در قالب XML (هنگام استفاده از libxml2 در اسناد HTML نیز قابل استفاده است):
مقداری محتوا
سپس برای اطلاع Swish-e از وجود نام متا در اسناد خود، آن را ویرایش کنید
خط در فایل پیکربندی شما:
MetaNames DC.subject meta1 meta2
هنگام جستجو، اکنون می توانید برخی یا همه عبارات جستجو را به آن MetaName محدود کنید. مثلا،
برای جستجوی اسنادی که حاوی کلمه سیب هستند و همچنین حاوی میوه یا آشپزی هستند
متا تگ DC.subject.
چی هستند سند خواص؟
ویژگی سند معمولاً داده ای است که سند را توصیف می کند. مثلا،
ویژگی ها ممکن است شامل نام مسیر یک سند، آخرین تاریخ تغییر آن، عنوان یا آن باشد
اندازه. Swish-e ویژگی های یک سند را در فایل فهرست ذخیره می کند و می توان آنها را گزارش کرد
بازگشت به نتایج جستجو
Swish-e همچنین از ویژگی ها برای مرتب سازی استفاده می کند. می توانید نتایج خود را بر اساس یک یا چند مرتبه مرتب کنید
خواص به ترتیب صعودی یا نزولی.
ویژگی ها را نیز می توان در اسناد شما تعریف کرد. فایل های HTML و XML می توانند برچسب ها را مشخص کنند
(به سوال قبلی مراجعه کنید) به عنوان خواص. در محتویات پس از آن می توان این برچسب ها را برگرداند
با نتایج جستجو این ویژگی های تعریف شده توسط کاربر می تواند برای مرتب سازی جستجو نیز استفاده شود
نتایج.
برای مثال اگر موارد زیر را در مدارک خود داشتید
و "خالق" به عنوان یک ویژگی تعریف می شود (به "PropertyNames" در SWISH-CONFIG مراجعه کنید) Swish-e می تواند
"بخش حسابداری" را با نتیجه آن سند برگردانید.
swish-e -w foo -p خالق
یا برای مرتب سازی:
خالق swish-e -w foo-s
چه خبر la تفاوت میان MetaNames و PropertyNames
MetaNames به جستجوی کلمات کلیدی در اسناد شما اجازه می دهد. یعنی می توانید از MetaNames استفاده کنید
جستجوها را فقط به بخش هایی از اسناد خود محدود کنید.
از طرف دیگر PropertyNames متنی را تعریف می کند که می تواند با نتایج بازگردانده شود و می تواند
برای مرتب سازی استفاده شود
هر دو استفاده می کنند متا برچسب ها در مدارک شما (همانطور که در دو سوال بالا نشان داده شده است) برای تعریف یافت می شود
متنی که می خواهید به عنوان یک ویژگی یا نام متا استفاده کنید.
شما ممکن است یک برچسب را به عنوان تعریف کنید هر دو یک ویژگی و یک نام متا. مثلا:
در اسناد شما قرار داده شده و سپس با استفاده از تنظیمات پیکربندی:
سازنده PropertyNames
خالق MetaNames
به شما امکان می دهد جستجوهای خود را به اسناد ایجاد شده توسط حسابداری محدود کنید:
swish-e -w 'foo and creator=(حسابداری)'
این همه اسناد با کلمه "foo" را پیدا می کند که دارای متا تگ سازنده نیز هستند
حاوی کلمه "حسابداری" است. این از MetaNames استفاده می کند.
و همچنین می توانید بگویید:
swish-e -w foo -p خالق
که تمام مدارک را با کلمه "foo" برمی گرداند، اما نتایج شامل موارد زیر نیز می شود
محتویات متا تگ "خالق" به همراه نتایج. این استفاده از خواص است.
همچنین می توانید از ویژگی ها و نام های متا به طور همزمان استفاده کنید:
swish-e -w creator=(حسابداری یا بازاریابی) -p creator -s creator
که فقط در "خالق" جستجو می کند متا نام برای هر یک از کلمات "حسابداری" یا
"بازاریابی"، محتویات محتوای "خالق" را چاپ می کند. ویژگی، و مرتب می کند
نتایج توسط "خالق" ویژگی نام.
(همچنین به سوئیچ فرمت خروجی "-x" در SWISH-RUN مراجعه کنید.)
قوطی Swish-e شاخص چند بایت شخصیت ها؟
خیر. این نیاز به کار زیادی برای تغییر دارد. اما Swish-e با شخصیت های هشت بیتی کار می کند،
بنابراین می توان از مجموعه کاراکترهای زیادی استفاده کرد. توجه داشته باشید که ANSI-C را صدا می کند برای کاهش() تابع
که به تنظیمات محلی فعلی بستگی دارد. دیدن محل(7) برای اطلاعات بیشتر
نمایه سازی
چگونه do I عبور Swish-e a فهرست of فایل ها به فهرست مطالب؟
در حال حاضر، دستورالعمل پیکربندی برای گنجاندن فایلی که حاوی لیست باشد وجود ندارد
از فایل ها برای نمایه سازی اما، دستورالعملی برای گنجاندن یک فایل پیکربندی دیگر وجود دارد.
IncludeConfigFile /path/to/other/config
و در "/path/to/other/config" می توانید بگویید:
IndexDir file1 file2 file3 file4 file5 ...
IndexDir file20 file21 file22
همچنین می توانید بیش از یک فایل پیکربندی را در خط فرمان مشخص کنید:
./swish-e -c config_one config_two config_three
گزینه دیگر ایجاد دایرکتوری با پیوندهای نمادین فایل ها برای فهرست و
فقط آن دایرکتوری را فهرست کنید.
چگونه میکند Swish-e دانستن که تجزیه کننده به استفاده کنید؟
Swish می تواند HTML، XML و اسناد متنی را تجزیه کند. تجزیه کننده با مرتبط کردن یک فایل تنظیم می شود
گسترش با یک تجزیه کننده توسط دستورالعمل "IndexContents". می توانید تجزیه کننده پیش فرض را تنظیم کنید
با دستورالعمل "مطالب پیش فرض". اگر به سندی یک تجزیه کننده اختصاص داده نشود، این کار انجام می شود
پیش فرض تجزیه کننده HTML (اگر HTML2 با libxml2 ساخته شده باشد).
می توانید از فیلترها یا یک برنامه خارجی برای تبدیل اسناد به HTML، XML یا متن استفاده کنید.
قوطی I مجدداً و جستجو کردن at la همان زمان؟
آره. شروع با نسخه 2.2 Swish-e به فایل های موقت فهرست می کند و سپس نام آن را تغییر می دهد.
پس از اتمام فهرست بندی فایل ها در اکثر سیستم ها، تغییر نام ها اتمی هستند. اما، از آنجایی که Swish-e
همچنین در طول نمایه سازی بیش از یک فایل تولید می کند، یک دوره بسیار کوتاه وجود خواهد داشت
زمان بین تغییر نام فایل های مختلف در زمانی که نمایه همگام نیست.
تنظیمات در src/config.h برخی از گزینه های مربوط به فایل های موقت و استفاده از آنها را کنترل کنید
در طول نمایه سازی
قوطی I شاخص عبارات؟
عبارات به طور خودکار نمایه می شوند. برای جستجوی یک عبارت، به سادگی دو نقل قول قرار دهید
اطراف عبارت
مثلا:
swish-e-w "موتور جستجوی رایگان و سریع"
چگونه می توان I جلوگیری از عبارات از جانب مطابق در میان جمله ها؟
از دستورالعمل پیکربندی BumpPositionCounterCharacters استفاده کنید.
Swish-e نه نمایه سازی a معین کلمه or جمله.
تعدادی پارامتر پیکربندی وجود دارد که Swish-e a را در نظر می گیرد
"word" و دارای یک ویژگی اشکال زدایی برای کمک به مشخص کردن مشکلات نمایه سازی است.
دستورالعمل های فایل پیکربندی (SWISH-CONFIG) "WordCharacters"، "BeginCharacters"،
«EndCharacters»، «IgnoreFirstChar» و «IgnoreLastChar» تنظیمات اصلی هستند که Swish-
e برای تعریف یک کلمه استفاده می کند. برای جزئیات بیشتر به SWISH-CONFIG و SWISH-RUN مراجعه کنید.
Swish-e همچنین از پیش فرض های زمان کامپایل برای بسیاری از تنظیمات استفاده می کند. اینها در
src/config.h فایل.
استفاده از آرگومان های خط فرمان "-k"، "-v" و "-T" در هنگام اشکال زدایی مفید است.
چالش ها و مسائل. استفاده از "-T INDEXED_WORDS" در حین نمایه سازی، هر کلمه را همانطور که هست نمایش می دهد
نمایه شده هنگام استفاده از این ویژگی باید یک فایل را مشخص کنید زیرا می تواند مقدار زیادی تولید کند
از خروجی
./swish-e -c my.conf -i problem.file -T INDEXED_WORDS
همچنین ممکن است بخواهید یک فایل منفرد را فهرست بندی کنید که حاوی کلماتی است که نمایه می شوند یا نیستند
همانطور که انتظار دارید و از -T برای خروجی اطلاعات اشکال زدایی در مورد شاخص استفاده کنید. مفید
دستور ممکن است:
./swish-e -f index.swish-e -T INDEX_FULL
هنگامی که مشاهده کردید که Swish-e چگونه کلمات شما را تجزیه و نمایه می کند، می توانید آن را تنظیم کنید
تنظیمات پیکربندی ذکر شده در بالا برای کنترل کلماتی که نمایه می شوند.
یک دستور مفید دیگر ممکن است این باشد:
./swish-e -c my.conf -i problem.file -T PARSED_WORDS INDEXED_WORDS
در این قسمت کلمات با فاصله سفید تجزیه شده از سند (PARSED_WORDS) و نحوه آنها نشان داده میشود
کلمات به کلمات جداگانه برای نمایه سازی تقسیم می شوند (INDEXED_WORDS).
چگونه do I نگه داشتن Swish-e از جانب نمایه سازی شماره؟
Swish-e کلمات را همانطور که در تنظیمات "WordCharacters" تعریف شده است، فهرست می کند. بنابراین
برای جلوگیری از نمایه سازی اعداد، به سادگی ارقام را از تنظیمات "WordCharacters" حذف می کنید.
تنظیماتی نیز در آن وجود دارد src/config.h که کنترل می کنند چه "کلماتی" نمایه می شوند. شما
می تواند چرخش را طوری پیکربندی کند که هرگز کلماتی را که همه رقم، مصوت یا صامت هستند، فهرست نکند، یا
که شامل بیش از تعدادی رقم متوالی، مصوت یا صامت است. که در
به طور کلی، شما نیازی به تغییر این تنظیمات ندارید.
همچنین، یک ویژگی آزمایشی به نام "IgnoreNumberChars" وجود دارد که به شما این امکان را می دهد
مجموعه ای از کاراکترها را تعریف کنید که یک عدد را توصیف می کنند. اگر کلمه ای از فقط کسانی که
کاراکترها ایندکس نخواهد شد.
Swish-e تصادفات و سوختگی on a معین فایل. چی می توان I انجام دادن؟
این نباید اتفاق بیفتد در صورت وجود، لطفاً جزئیات را به لیست بحث Swish-e ارسال کنید
بنابراین می توان آن را توسط توسعه دهندگان تکثیر کرد.
در عین حال، می توانید از یک دستورالعمل "FileRules" برای حذف نام فایل خاص استفاده کنید.
یا نام مسیر یا عنوان آن. اگر مشکلات جدی در نمایه سازی انواع خاصی از
فایلها، ممکن است متن معتبری در خود نداشته باشند (مثلاً ممکن است فایلهای باینری باشند). شما
می تواند از NoContents برای حذف آن نوع فایل استفاده کند.
Swish-e در صورت یافتن یک کاراکتر تهی تعبیه شده در یک سند، هشداری صادر می کند. این
اخطار نشانه ای از این خواهد بود که شما در تلاش برای ایندکس کردن داده های باینری هستید. اگه نیاز داشتی به
فایل های باینری ایندکس سعی می کنند برنامه ای را پیدا کنند که متن را استخراج کند (مثلاً رشته های(1)
catdoc(1) pdftotext(1).
چگونه به I جلوگیری از نمایه سازی of برخی از اسناد؟
هنگام استفاده از سیستم فایل برای فهرست بندی فایل های خود، می توانید از دستورالعمل "FileRules" استفاده کنید.
به غیر از "عنوان FileRules"، "FileRules" فقط با سیستم فایل کار می کند ("-S fs")
روش نمایه سازی، نه با "-S prog" یا "-S http".
اگر سایتی را که کنترل آن را در اختیار دارید، spider می کنید، از a استفاده کنید robots.txt را در سند خود فایل کنید
ریشه این یک روش استاندارد برای حذف فایل ها از موتورهای جستجو است و به طور کامل است
پشتیبانی شده توسط Swish-e. دیدن http://www.robotstxt.org/
اگر عنکبوتی یک وب سایت با گنجانده شده است spider.pl سپس هر آزمایش لازم را به برنامه اضافه کنید
فایل پیکربندی عنکبوت تایپ کنید در فهرست "prog-bin" برای
جزئیات یا مستندات عنکبوت را در وب سایت Swish-e ببینید. به دنبال بخش مربوط به
توابع پاسخ به تماس
اگر از کتابخانه libxml2 برای تجزیه HTML استفاده می کنید (که احتمالاً دارید)، می توانید از آن نیز استفاده کنید
استثنای Meta Robots در اسناد شما:
دستورالعمل obeyRobotsNoIndex را ببینید.
چگونه do I جلوگیری از نمایه سازی بخش of a سند؟
برای جلوگیری از ایندکس کردن سرصفحه، پاورقی یا نوار ناوبری مشترک Swish-e، و شما
با استفاده از libxml2 برای تجزیه HTML، سپس می توانید از یک تگ HTML جعلی در اطراف متن مورد نظر خود استفاده کنید.
برای نادیده گرفتن و استفاده از دستورالعمل "IgnoreMetaTags". این یک پیغام خطا ایجاد می کند if
"ParserWarningLevel" به عنوان HTML نامعتبر تنظیم شده است.
"IgnoreMetaTags" با اسناد XML (و اسناد HTML هنگام استفاده از libxml2 به عنوان
تجزیه کننده)، اما نه با اسناد تجزیه شده توسط تجزیه کننده متن (TXT).
اگر از تجزیه کننده libxml2 (HTML2 و XML2) استفاده می کنید، می توانید از موارد زیر استفاده کنید
نظرات در اسناد خود برای جلوگیری از نمایه سازی:
و/یا ممکن است از این موارد نیز استفاده شود:
چگونه do I تغییر la مسیر or URL of la نمایه شده اسناد.
از دستورالعمل پیکربندی "ReplaceRules" برای بازنویسی نام مسیرها و URL ها استفاده کنید. اگر شما
با استفاده از روش ورودی "-S prog" می توانید مسیر را برای هر رشته ای تنظیم کنید.
چگونه می توان I شاخص داده ها از جانب a پایگاه داده؟
از روش منبع سند "prog" برای نمایه سازی استفاده کنید. برنامه ای بنویسید تا آن را استخراج کنید
داده ها را از پایگاه داده خود، و آن را به صورت XML، HTML یا متن قالب بندی کنید. نمونه ها را در قسمت مشاهده کنید
دایرکتوری "prog-bin" و سوال بعدی.
چگونه do I شاخص my PDF ، کلمه، و فشرده اسناد؟
Swish-e به طور پیش فرض فقط می تواند فایل های HTML، XML و TXT (متن) را تجزیه داخلی کند، اما می تواند
استفاده از فیلترها برای تصفیه آب که انواع دیگر فایل ها مانند اسناد MS Word، PDF یا
فایلهای gzip را در یکی از انواع فایلهایی که Swish-e میفهمد، قرار داد.
لطفاً SWISH-CONFIG و نمونههای موجود در آن را ببینید فیلترها برای تصفیه آب و فیلتر سطل دایرکتوری برای اطلاعات بیشتر
اطلاعات.
برای آشنایی با گزینه های فیلترینگ با Swish-e به سوال بعدی مراجعه کنید.
چگونه do I فیلتر اسناد؟
اصطلاح "فیلتر" در Swish-e به معنای تبدیل یک سند از یک نوع (یک نوع
swish-e نمی تواند مستقیماً ایندکس کند) به نوعی که Swish-e می تواند ایندکس کند، یعنی HTML، ساده
متن یا XML برای اینکه به سردرگمی اضافه شود، چند راه برای انجام این کار وجود دارد
Swish-e. بنابراین در اینجا کمی پیش زمینه وجود دارد.
دستور FileFilter ابتدا به swish اضافه شد. این ویژگی به شما اجازه می دهد که a را مشخص کنید
برنامه ای برای اجرای اسنادی که با پسوند فایل معین مطابقت دارند. مثلا فیلتر کردن
فایلهای PDF (فایلهایی که به .pdf ختم میشوند) میتوانید تنظیمات پیکربندی را مشخص کنید:
FileFilter .pdf pdftotext "'%p' -"
که می گوید برنامه را اجرا کنید "pdftotext" با ارسال نام مسیر فایل (%p) و a
خط تیره (که به pdftotext می گوید که به stdout خروجی بدهد). سپس برای هر فایل pdf Swish-e اجرا می شود
این برنامه را در سند فیلتر شده از خروجی برنامه فیلتر می خواند.
این مزیت را دارد که تنظیم آن آسان است -- یک خط در فایل پیکربندی همه چیز است
که برای افزودن فیلتر به Swish-e لازم است. اما یک سری مشکلات هم دارد. برای
به عنوان مثال، اگر از یک اسکریپت پرل برای انجام فیلترینگ خود استفاده می کنید، ممکن است بسیار کند باشد
اسکریپت فیلتر باید برای هر سند پردازش شده اجرا شود (و در نتیجه کامپایل شود). این هست
با استفاده از روش -S http تشدید می شود زیرا روش -S http از یک اسکریپت Perl نیز استفاده می کند
که برای هر URL واکشی شده اجرا می شود. همچنین، هنگام استفاده از روش -S prog ورودی (خواندن
ورودی از یک برنامه) با استفاده از FileFilter به این معنی است که Swish-e باید ابتدا فایل را از داخل بخواند
برنامه خارجی و سپس فایل را قبل از اجرای آن در یک فایل موقت بنویسید
فیلتر کردن
با -S prog فیلتر کردن سند در برنامه ای که هست بسیار منطقی تر است
واکشی اسناد به جای خواندن swish-e فایل در حافظه، آن را در a بنویسید
فایل موقت و سپس یک برنامه خارجی اجرا کنید.
توزیع Swish-e شامل چند نمونه برنامه -S prog است. spider.pl هست یک
وب عنکبوت کاملاً منطقی که گزینه های بسیار بیشتری نسبت به روش -S http ارائه می دهد.
و بسیار سریعتر از اجرای -S http است.
عنکبوت یک فایل پیکربندی پرل دارد، به این معنی که می توانید منطق برنامه نویسی را درست اضافه کنید
بدون ویرایش برنامه spider وارد فایل تنظیمات شوید. یک ذره منطق است
ارائه شده در فایل پیکربندی عنکبوت، یک تابع "بازخوانی" است که به شما امکان می دهد
محتوا را فیلتر کنید به عبارت دیگر، قبل از اینکه عنکبوت یک سند وب واکشی شده را به آن ارسال کند
چرخش برای نمایه سازی عنکبوت می تواند یک زیربرنامه ساده در پیکربندی عنکبوت فراخوانی کند.
فایل ارسالی سند و نوع محتوای آن. سپس زیربرنامه می تواند به آن نگاه کند
محتوا را تایپ کنید و تصمیم بگیرید که آیا سند نیاز به فیلتر دارد یا خیر.
به عنوان مثال، هنگام پردازش یک سند از نوع "application/msword"، تماس مجدد را انجام دهید
زیر روال ممکن است ماژول doc2txt.pm perl و یک سند از نوع "appliation/pdf" را فراخوانی کند.
می تواند از ماژول pdf2html.pm استفاده کند. در prog-bin/SwishSpiderConfig.pl فایل این را نشان می دهد
استفاده
این سیستم به خوبی کار می کند، اما همچنین به این معنی است که برای راه اندازی به کار بیشتری نیاز است
فیلترها ابتدا باید به صراحت انواع محتوای خاص را بررسی کنید و سپس با آن تماس بگیرید
ماژول Perl مناسب است، و دوم، شما باید بدانید که چگونه هر ماژول باید فراخوانی شود و
چگونه هر کدام محتوای احتمالاً اصلاح شده را برمی گرداند.
SWISH::Filter وارد می شود.
برای آسانتر کردن کارها، ماژول SWISH::Filter Perl ایجاد شد. ایده این ماژول
این است که یک رابط برای فیلتر کردن انواع اسناد استفاده می شود. بنابراین به جای
با بررسی انواع خاصی از محتوا، فقط نوع محتوا و سند را به آن ارسال می کنید
ماژول SWISH::Filter و در صورت وجود، نوع محتوا و سند جدیدی را برمی گرداند
فیلتر شده. فیلترهایی که کار واقعی را انجام می دهند با رابط استاندارد و
مانند فیلتر "پلاگین" کار کنید. افزودن فیلترهای جدید به معنای دانلود کردن فیلتر در a
دایرکتوری و هیچ تغییری در فایل پیکربندی عنکبوت مورد نیاز نیست. فیلتر را دانلود کنید
برای Postscript و دفعه بعد که ایندکس را اجرا می کنید، فایل های Postscript شما ایندکس می شوند.
از آنجایی که فیلترها استاندارد هستند، امیدواریم زمانی که نیاز به فیلتر کردن اسناد دارید
از یک نوع خاص، فیلتری برای استفاده شما آماده است.
اکنون، توجه داشته باشید که ماژول های perl ممکن است تبدیل واقعی یک سند را انجام دهند یا نکنند.
به عنوان مثال، ماژول تبدیل PDF برنامه های pdfinfo و pdftotext را فراخوانی می کند. آن ها
برنامه ها (بخشی از بسته Xpfd) باید جدا از فیلترها نصب شوند.
فایل پیکربندی spider examle SwishSpiderConfig.pl نحوه استفاده از
SWISH:: ماژول فیلتر برای فیلتر کردن. این فایل در نصب شده است
$prefix/share/doc/swish-e/examples/prog-bin، جایی که $پیشوند معمولاً / usr / محلی در یونیکس-
ماشین آلات نوع
روش فیلتر SWISH::Filter را می توان با روش -S http نیز استفاده کرد
نمایه سازی به طور پیش فرض اسپایدر برنامه (اسکریپت کمکی پرل که واکشی می شود
اسناد از وب) سعی خواهد کرد از ماژول SWISH::Filter در صورت یافتن در آن استفاده کند
مسیر کتابخانه پرلز این مسیر به طور خودکار برای spider.pl تنظیم شده است اما برای swishspider تنظیم نشده است
(زیرا روشی را که قبلاً کند است کند می کند و spider.pl دوباره توصیه می شود
روش -S http).
بنابراین، تنها چیزی که برای استفاده از این سیستم با -S http لازم است، تنظیم آرایه @INC است
برای اشاره به دایرکتوری فیلتر.
به عنوان مثال، اگر توزیع swish-e در آن باز شده باشد ~/swish-e:
PERL5LIB=~/swish-e/filters swish-e -c conf -S http
به روش -S http اجازه می دهد تا از ماژول SWISH::Filter استفاده کند.
توجه داشته باشید که اگر از ماژول SWISH::Filter استفاده نمی کنید، ممکن است بخواهید آن را ویرایش کنید
اسپایدر با استفاده از این تنظیمات استفاده از ماژول SWISH::Filter را برنامه ریزی کرده و غیرفعال کنید:
استفاده از USE_FILTERS ثابت => 0; # SWISH::Filter را غیرفعال کنید
این مانع از تلاش برنامه برای استفاده از ماژول SWISH::Filter برای هر غیر
URL متنی که واکشی شده است. البته، اگر نگران سرعت ایندکس کردن هستید، باید
به جای -S http از روش -S prog با spider.pl استفاده کنید.
اگر عنکبوتی نیستید، اما همچنان می خواهید از ماژول SWISH::Filter برای
با فیلتر کردن می توانید از برنامه DirTree.pl (در $prefix/lib/swish-e) استفاده کنید. این ساده است
برنامه ای که از سیستم فایل عبور می کند و از SWISH::Filter برای فیلتر کردن استفاده می کند.
در اینجا دو مثال از نحوه اجرای یک برنامه فیلتر، یکی با استفاده از "FileFilter" Swish-e آورده شده است.
دستورالعمل، دیگری با استفاده از برنامه روش ورودی "prog". را ببینید SwishSpiderConfig.pl پرونده
برای مثال استفاده از ماژول SWISH::Filter.
این فیلترها به سادگی از برنامه استفاده می کنند "/bin/cat" به عنوان یک فیلتر و فقط فایل های html. را فهرست می کند.
ابتدا، با استفاده از روش "FileFilter"، در اینجا کل فایل پیکربندی (swish.conf) آمده است:
IndexDir .
IndexOnly .html
FileFilter .html "/bin/cat" "'٪پ'"
و با دستور ایندکس کنید
swish-e -c swish.conf -v 1
در حال حاضر، همان چیزی است که با استفاده از روش ورودی منبع سند "-S prog" و یک Perl
برنامه ای به نام catfilter.pl. می توانید ببینید که کار بسیار بیشتر از استفاده از آن است
روش "FileFilter" در بالا، اما مکانی را برای انجام پردازش اضافی فراهم می کند. در این
به عنوان مثال، روش "prog" فقط کمی سریعتر است. اما اگر به یک اسکریپت پرل نیاز داشتید
به عنوان یک FileFilter اجرا شود سپس "prog" به طور قابل توجهی سریعتر خواهد بود.
#!/usr/local/bin/perl -w
سخت استفاده کنید
استفاده از File::Find; # برای بازگشت درخت دایرکتوری
$/ = unef;
پیدا کردن(
{خواسته => \&خواسته، no_chdir => 1، }،
'.'،
);
زیر درخواست {
بازگشت اگر -d;
بازگشت مگر اینکه /\.html$/;
my $mtime = (state)[9];
my $child = open( FH, '-⎪' );
die "در فورک $ ناموفق بود!" مگر اینکه $child تعریف شده باشد.
exec'/bin/cat'، $_ مگر اینکه $child;
محتوای $ من = ;
my $size = طول $content;
چاپ <
طول محتوا: اندازه $
Last-Mtime: $mtime
نام مسیر: $_
EOF
چاپ ;
}
و با دستور ایندکس کنید:
swish-e -S prog -i ./catfilter.pl -v 1
این مثال به دلیل باز بودن «-⎪» احتمالاً در ویندوز کار نخواهد کرد. یک لوله ساده
باز ممکن است به همین خوبی کار کند:
یعنی جایگزین کنید:
my $child = open( FH, '-⎪' );
die "در فورک $ ناموفق بود!" مگر اینکه $child تعریف شده باشد.
exec'/bin/cat'، $_ مگر اینکه $child;
با این:
باز کردن (FH, "/bin/cat $_ ⎪" ) یا بمیر $!;
اگر کاراکترهای متا نباشند، پرل سعی خواهد کرد از اجرای دستور از طریق پوسته جلوگیری کند
به فضای باز منتقل شد. برای اطلاعات بیشتر به "perldoc -f open" مراجعه کنید.
سلام ، اما I تنها می خواهم به دانستن چگونه به شاخص PDF اسناد!
نمونه ها را در قسمت مشاهده کنید کنفرانس دایرکتوری و نظرات در SwishSpiderConfig.pl فایل.
برای اطلاع از جزئیات فیلترینگ به سوال قبلی مراجعه کنید. روشی که شما تصمیم به استفاده از آن دارید خواهد بود
به سرعتی که می خواهید ایندکس کنید و سطح راحتی شما با استفاده از ماژول های Perl بستگی دارد.
صرف نظر از روش فیلتری که استفاده می کنید، باید بسته های Xpdf را نصب کنید
موجود از http://www.foolabs.com/xpdf/.
من هستم با استفاده از ویندوز و نمیتونم دریافت کنید فیلترها or la پرسه زدن ورودی روش به کار می کنند!
هم روش ورودی "-S prog" و هم فیلترها از فراخوانی سیستم "popen()" برای اجرای
برنامه خارجی اگر برنامه خارجی شما مثلاً یک اسکریپت پرل است، باید این کار را انجام دهید
به Swish-e بگویید به جای اسکریپت، پرل را اجرا کند. Swish-e اسلش های جلو را به تبدیل می کند
هنگام اجرا تحت ویندوز اسلش می کند.
به عنوان مثال، شما باید مسیر perl را به صورت مشخص کنید (با فرض اینکه perl اینجاست
در سیستم شما):
IndexDir e:/perl/bin/perl.exe
یا فیلتری مانند:
FileFilter .foo e:/perl/bin/perl.exe 'myscript.pl "%p"'
اغلب نصب لینوکس ساده تر است.
چگونه do I شاخص غیر انگلیسی کلمات؟
Swish-e فقط کاراکترهای 8 بیتی را فهرست می کند. این مجموعه کاراکترهای ISO 8859-1 Latin-1 است و
شامل بسیاری از حروف (و نمادهای) غیر انگلیسی است. تا زمانی که آنها در لیست هستند
"WordCharacters" آنها نمایه خواهند شد.
در واقع، شما احتمالاً می توانید هر مجموعه کاراکتر 8 بیتی را ایندکس کنید، البته تا زمانی که ترکیب نکنید
کاراکترها در یک شاخص قرار می گیرند و از libxml2 برای تجزیه استفاده نکنید (به زیر مراجعه کنید).
دستورالعمل "TranslateCharacters" (SWISH-CONFIG) می تواند کاراکترها را هنگام نمایه سازی ترجمه کند.
و جستجو می توانید نگاشت یک کاراکتر به کاراکتر دیگر را با
دستورالعمل «ترجمه کاراکترها».
"TranslateCharacters :ascii7:" مجموعه ای از کاراکترهای از پیش تعریف شده است که ترجمه می شود
کاراکترهای هشت بیتی به کاراکترهای ascii7. برای مثال، با استفاده از قانون ":ascii7:"
"Ääç" را به "aac" ترجمه کنید. این به این معنی است: جستجوی "چلیک"، "چلیک" یا "چلیک" همه خواهد بود
مطابق با همان کلمه
توجه: هنگام استفاده از libxml2 برای تجزیه، اسناد تجزیه شده به صورت داخلی تبدیل می شوند (در داخل
libxml2) به UTF-8. این در هنگام نمایه سازی به ISO 8859-1 Latin-1 تبدیل می شود. در مواردی که
یک رشته را نمی توان از UTF-8 به ISO 8859-1 تبدیل کرد (زیرا شامل غیر 8859-1 است
کاراکترها)، رشته با رمزگذاری UTF-8 به Swish-e ارسال می شود. این نتیجه خواهد داد
برخی از کلمات به اشتباه نمایه شده اند تنظیم "ParserWarningLevel" روی 1 یا بیشتر نمایش داده می شود
در صورت عدم موفقیت تبدیل UTF-8 به 8859-1 هشدار می دهد.
قوطی I اضافه کردن حذف فایل ها از جانب an فهرست مطالب؟
ساخت swish-e را با گزینه "--enable-incremental" امتحان کنید.
بقیه این سؤالات متداول برای قالب پیشفرض swish-e اعمال میشود.
Swish-e در حال حاضر راهی برای افزودن یا حذف موارد از فهرست خود ندارد. اما، شاخص های Swish-e
آنقدر سریع که اغلب ممکن است در صورت نیاز یک فایل، کل مجموعه سند را مجدداً نمایه کرد
اضافه، اصلاح یا حذف شود. اگر یک سایت از راه دور را دنبال می کنید، آن را در نظر بگیرید
ذخیره اسناد به صورت محلی فشرده شده است.
بسته به موقعیت شما، افزودنی های افزایشی را می توان به چند روش انجام داد.
ایجاد یک شاخص اصلی هر شب (یا هر هفته)، و سپس، احتمالاً سادهترین کار است
یک فهرست فقط از فایل های جدید بین کارهای نمایه سازی اصلی ایجاد کنید و از گزینه "-f" استفاده کنید
برای ارسال هر دو ایندکس به Swish-e در حین جستجو.
شما می توانید ایندکس ها را در یک شاخص ادغام کنید (به جای استفاده از -f)، اما مشخص نیست که
این مزیت نسبت به جستجوی چند فهرست دارد.
چگونه می توان شاخص افزایشی را ایجاد کرد؟
یکی از روش ها استفاده از سوئیچ "-N" برای ارسال مسیر فایل به Swish-e هنگام نمایه سازی است. آی تی
فقط فایلهایی را فهرستبندی میکند که تاریخ آخرین تغییرشان «جدیدتر» از فایل ارائهشده باشد
با سوئیچ "-N".
این گزینه این عیب را دارد که Swish-e باید هر فایلی را در هر دایرکتوری پردازش کند
انگار قرار است ایندکس شوند (آزمون "-N" آخرین بار درست قبل از نمایه سازی انجام می شود
از محتویات فایل شروع می شود و پس از اتمام تمام تست های دیگر روی فایل) --
همه اینها فقط برای یافتن چند فایل جدید.
همچنین، اگر از فایل فهرست Swish-e به عنوان فایل ارسال شده به "-N" استفاده کنید، ممکن است فایل هایی وجود داشته باشند که
پس از شروع نمایه سازی، اما قبل از نوشتن فایل فهرست اضافه شدند. این می تواند
باعث می شود فایلی به فهرست اضافه نشود.
گزینه دیگر حفظ یک درخت دایرکتوری موازی است که حاوی پیوندهای نمادین است
فایل های اصلی هنگامی که یک فایل جدید به درخت دایرکتوری اصلی اضافه می شود (یا تغییر می کند).
یک پیوند نمادین به فایل واقعی در درخت دایرکتوری موازی ایجاد کنید. سپس فقط ایندکس کنید
دایرکتوری symlink برای تولید ایندکس افزایشی.
این گزینه این عیب را دارد که باید یک برنامه مرکزی داشته باشید که آن را ایجاد کند
فایل های جدیدی که می توانند سیملینک ها را نیز ایجاد کنند. اما، نمایه سازی از Swish-e بسیار سریع است
فقط باید به فایل هایی که باید ایندکس شوند نگاه کرد. هنگامی که شما را به طور کامل فهرست بندی می کنید
به سادگی تمام پیوندهای نمادین را لغو (حذف) کنید.
هر دوی این روشها مشکلاتی دارند که ممکن است فایلها در هر دو فهرست یا فایلها قرار بگیرند
از یک شاخص حذف شده است. استفاده از قفل فایل در حین نمایه سازی و جستجوی هش در طول جستجوها
می تواند به جلوگیری از این مشکلات کمک کند.
I اجرا خارج of حافظه تلاش به شاخص my فایل های.
درست است که نمایه سازی می تواند حافظه زیادی را اشغال کند! Swish-e بسیار سریع است
نمایه سازی، اما این به قیمت حافظه تمام می شود.
بهترین پاسخ نصب حافظه بیشتر است.
گزینه دیگر استفاده از سوئیچ "-e" است. این به حافظه کمتری نیاز دارد، اما ایندکس کردن نیاز خواهد داشت
بیشتر طول می کشد زیرا در حین نمایه سازی همه داده ها در حافظه ذخیره نمی شوند. چقدر حافظه کمتر
و اینکه چقدر زمان بیشتر به اسنادی که در حال نمایه سازی هستید و سخت افزار آن بستگی دارد
شما با استفاده از
در اینجا نمونه ای از نمایه سازی همه فایل های html در /usr/doc در لینوکس آورده شده است. این اولین مثال است
بدون "-e" و حدود 84M حافظه استفاده می کند:
270279 کلمه منحصر به فرد نمایه شده است.
23841 فایل نمایه شده است. 177640166 کل بایت.
زمان سپری شده: 00:04:45 زمان CPU: 00:03:19
این هست با "-e"، و حدود 26M یا حافظه استفاده می شود:
270279 کلمه منحصر به فرد نمایه شده است.
23841 فایل نمایه شده است. 177640166 کل بایت.
زمان سپری شده: 00:06:43 زمان CPU: 00:04:12
همچنین می توانید تعدادی شاخص کوچکتر بسازید و سپس با "-M" ادغام کنید. استفاده كردن
"-e" در حین ادغام باعث صرفه جویی در حافظه می شود.
در نهایت، اگر تعدادی ایندکس کوچکتر بسازید، می توانید بیش از یک ایندکس را مشخص کنید
هنگام جستجو با استفاده از سوئیچ "-f". مرتب سازی مجموعه نتایج بزرگ توسط یک ویژگی خواهد بود
در هنگام تعیین چندین فایل فهرست هنگام جستجو کندتر است.
"هم بسیاری باز کن فایل ها" چه زمانی نمایه سازی با -e انتخاب
برخی از پلتفرمها هنگام استفاده از گزینه اقتصاد -e، «فایلهای باز زیاد» را گزارش میکنند. -e
این ویژگی از بسیاری از فایل های موقت (چیزی مانند 377) به اضافه فایل های فهرست استفاده می کند و این ممکن است
از محدودیت های سیستم خود فراتر بروید.
بسته به پلتفرم خود، ممکن است لازم باشد "ulimit" یا "unlimit" را تنظیم کنید.
به عنوان مثال، تحت پوسته bash لینوکس:
ulimit $ -n 1024
یا زیر یک اسپارک قدیمی
% فایل های باز نامحدود
My سیستم مدیر سایت می گوید: Swish-e استفاده هم بسیار of la سی پی یو!
این چیز خوبی است! اون CPU گران قیمت قراره شلوغ باشه.
نمایه سازی کار زیادی را می طلبد -- برای اینکه نمایه سازی سریع انجام شود بسیاری از کارها در حافظه انجام می شود
که مدت زمان انتظار Swish-e در I/O را کاهش می دهد. اما، دو چیز شما وجود دارد
می توان سعی کرد:
گزینه "-e" Swish-e را در حالت اقتصادی اجرا می کند، که از دیسک برای ذخیره داده ها استفاده می کند
نمایه سازی این باعث می شود Swish-e تا حدودی کندتر شود، اما از حافظه کمتری نیز استفاده می کند. از زمانی که بوده است
نوشتن بر روی دیسک بیشتر اوقات باعث صرف زمان بیشتر در انتظار I/O و زمان کمتری برای ورود می شود
CPU. شاید.
نکته دیگر این است که به سادگی اولویت کار را با استفاده از آن کاهش دهید خوب(1) دستور:
/bin/nice -15 swish-e -c search.conf
اگر نگران زمان جستجو هستید، مطمئن شوید که فقط از کلیدهای -b و -m استفاده می کنید
یک صفحه را در یک زمان برگردانید اگر می دانید که مجموعه نتایج شما بزرگ خواهد بود و شما
می خواهید نتایج را یک صفحه در یک زمان برگردانید، و اغلب چندین صفحه از همان صفحه را نشان می دهد
پرس و جو درخواست خواهد شد، ممکن است هوشمندانه تمام اسناد را در ابتدا درخواست کنید
درخواست کنید و سپس نتایج را در یک فایل موقت ذخیره کنید. ماژول perl File::Cache
انجام این کار را بسیار ساده می کند.
عنکبوتی
چگونه می توان I شاخص اسناد و مدارک on a وب سرور؟
در صورت امکان، از روش سیستم فایل "-S fs" نمایه سازی برای نمایه سازی اسناد در وب خود استفاده کنید
ناحیه فایل سیستم این امر از هزینه های سربار spidering یک وب سرور جلوگیری می کند و بسیار زیاد است
سریعتر (اگر "-S" مشخص نشده باشد، "-S fs" روش پیش فرض است).
اگر این غیرممکن است (وب سرور محلی نیست، یا اسناد به صورت پویا هستند
تولید شده)، Swish-e دو روش عنکبوتی را ارائه می دهد. ابتدا شامل متد http می شود
نمایه سازی "-S http". تعدادی دستورالعمل پیکربندی خاص موجود است که
کنترل spidering (به «دستورالعملهای فقط روش دسترسی HTTP» در SWISH-CONFIG مراجعه کنید). آ
اسکریپت کمکی پرل (swishspider) در گنجانده شده است " دایرکتوری برای کمک به عنکبوت
وب سرورها پیکربندیهای نمونهای برای عنکبوت در آن وجود دارد کنفرانس دایرکتوری.
از Swish-e 2.2، یک منبع سند "prog" با هدف کلی وجود دارد که یک برنامه می تواند
اسناد را برای نمایه سازی به آن بدهید. تعدادی از برنامه های نمونه را می توان در
دایرکتوری "prog-bin"، شامل برنامه ای برای سرورهای وب عنکبوتی. spider.pl ارائه شده است
برنامه دارای امکانات کامل است و به راحتی سفارشی می شود.
مزیت ویژگی منبع سند "prog" نسبت به روش "http" این است که
برنامه فقط یک بار اجرا می شود، جایی که برنامه swishspider.pl در "http" استفاده می شود.
روش برای هر سند خوانده شده از وب سرور یک بار اجرا می شود. انشعاب از
Swish-e و کامپایل کردن اسکریپت perl می تواند از نظر زمان بسیار گران باشد.
مزیت دیگر برنامه "spider.pl" این است که اضافه کردن آن ساده و کارآمد است
فیلتر کردن (مانند اسناد PDF یا MS Word) مستقیماً در پیکربندی spider.pl، و
این شامل ویژگی هایی مانند بررسی MD5 برای جلوگیری از نمایه سازی تکراری، گزینه هایی برای اجتناب است
spidering برخی از فایل ها، یا فهرست، اما از spidering اجتناب کنید. و از آنجایی که این یک برنامه پرل است، وجود دارد
بدون محدودیت در ویژگی هایی که می توانید اضافه کنید.
چرا میکند swish گزارش "./swishspider: نه پیدا شد"؟
فایل را انجام می دهد اسپایدر جایی که پیام خطا نمایش داده می شود وجود دارد؟ اگر نه، یکی را تنظیم کنید
گزینه پیکربندی SpiderDirectory برای اشاره به دایرکتوری که در آن اسپایدر
برنامه پیدا می شود، یا آن را قرار دهید اسپایدر برنامه در دایرکتوری فعلی هنگام اجرا
swish-e.
اگر از ویندوز استفاده می کنید، مطمئن شوید که "perl" در مسیر شما قرار دارد. سعی کنید تایپ کنید پرل از
خط فرمان
اگر ویندوز را اجرا نمی کنید، مطمئن شوید که خط shebang (خط اول از
برنامه swishspider که با # شروع می شود به محل صحیح پرل اشاره می کند.
به طور معمول این خواهد بود /usr/bin/perl or /usr/local/bin/perl. همچنین، مطمئن شوید که شما
دارای مجوزهای اجرا و خواندن اسپایدر.
La اسپایدر اسکریپت perl فقط با روش -S http برای نمایه سازی استفاده می شود.
من هستم با استفاده از la spider.pl برنامه به عنکبوت my وب سایت، اما برخی از بزرگ فایل ها هستند نه
نمایه شده
برنامه "spider.pl" دارای محدودیت پیش فرض 5 مگابایت حجم فایل است. این را می توان با تغییر داد
تنظیم پارامتر "max_size". برای اطلاعات بیشتر به "perldoc spider.pl" مراجعه کنید.
I هنوز نکن فکر می کنم تمام my وب صفحات هستند بودن نمایه شده
La spider.pl برنامه دارای تعدادی سوئیچ اشکال زدایی است و می تواند کاملاً پرمخاطب باشد
به شما بگویم که چه اتفاقی می افتد، و چرا. برای دستورالعمل ها به "perldoc spider.pl" مراجعه کنید.
swish is نه عنکبوت جاوا اسکریپت پیوندها!
Swish نمی تواند پیوندهای ایجاد شده توسط جاوا اسکریپت را دنبال کند، زیرا آنها توسط مرورگر ایجاد می شوند
و جزء سند نیستند.
چگونه do I عنکبوت دیگر وب سایت و ترکیب it با my خود (سیستم فایل) فهرست مطالب؟
میتوانید دو شاخص "-M" را در یک فهرست واحد ادغام کنید یا از "-f" برای تعیین موارد بیشتر استفاده کنید.
بیش از یک فهرست در هنگام جستجو
با روش "-f" نتایج بهتری خواهید داشت.
جستجو
چگونه do I محدود کردن جستجو به تنها بخش of la فهرست مطالب؟
اگر بتوانید «بخشهایی» از فهرست خود را با نام مسیر شناسایی کنید، دو گزینه دارید.
اولین گزینه با فهرست کردن مسیر سند است. این را به پیکربندی خود اضافه کنید:
MetaNames swishdocpath
اکنون می توانید کلمات یا عبارات را در نام مسیر جستجو کنید:
swish-e -w 'foo AND swishdocpath=(فروش)'
بنابراین فقط اسنادی با کلمه "foo" و جایی که مسیر فایل در آن قرار دارد را پیدا می کند
"حراجی". اگرچه ممکن است آنطور که دوست دارید کار نکند، زیرا هر دوی این مسیرها این کار را انجام خواهند داد
همخوانی داشتن:
/web/sales/products/index.html
/web/accounting/private/sales_we_messed_up.html
این را می توان با جستجو با یک عبارت حل کرد (با فرض اینکه "/" یک کاراکتر Word نیست):
swish-e -w 'foo AND swishdocpath=("/web/sales/")'
swish-e -w 'foo AND swishdocpath=("فروش وب")' (همان چیز)
گزینه دوم کمی قدرتمندتر است. با دستورالعمل "ExtractPath" می توانید از a استفاده کنید
عبارت منظم برای استخراج زیر مجموعه ای از مسیر و ذخیره آن به عنوان متای جداگانه
نام:
بخش MetaNames
ExtractPath Department regex !^/web/([^/]+).+$!$1/
که می گوید مسیری را که با "/web/" شروع می شود مطابقت دهید و بعد از آن همه چیز را استخراج کنید
به، اما "/" بعدی را شامل نمی شود و آن را در متغیر $1 ذخیره کنید، و سپس همه چیز را مطابقت دهید
از "/" به بعد. سپس کل رشته مسابقات را با $1 جایگزین کنید. و این می شود
ایندکس شده به عنوان متا نام "بخش".
اکنون می توانید مانند:
swish-e -w 'foo AND Department = sales'
و مطمئن باشید که فقط مدارک را در مسیر /www/sales/* مطابقت می دهید. توجه داشته باشید که
می توانید مناطق کاملاً متفاوتی از سیستم فایل خود را به یک متا نام نگاشت کنید:
# صفحات خاص بازاریابی را پرچم گذاری کنید
ExtractPath بخش regex!^/web/(بازاریابی⎪فروش)/.+$!بازاریابی/
ExtractPath Department regex !^/internal/marketing/.+$!marketing/
# صفحات بخش های فنی را پرچم گذاری کنید
ExtractPath بخش regex !^/web/(tech⎪bugs)/.+$!تکنولوژی/
در نهایت، اگر چیز پیچیده تری دارید، از "-S prog" استفاده کنید و یک برنامه perl بنویسید
از یک فیلتر برای تنظیم متا تگ هنگام پردازش هر فایل استفاده کنید.
چگونه is رتبه بندی محاسبه شد؟
مقدار ویژگی "swishrank" بر اساس طرح رتبه بندی (یا الگوریتم) محاسبه می شود
شما انتخاب کرده اید در این بحث، هر زمان کلمه علاقه داشتن به استفاده می شود، باید مشورت کنید
کد واقعی برای جزئیات بیشتر بالاخره منبع باز است.
کارهایی که می توانید انجام دهید تا بر رتبه بندی تأثیر بگذارد:
MetaNamesRank
میتوانید نمایه خود را طوری پیکربندی کنید که مقادیر فرانام خاصی را بیشتر یا کمتر از سایرین سوگیری کند.
گزینه پیکربندی "MetaNamesRank" را در SWISH-CONFIG ببینید.
نادیده گرفتن TotalWordCount هنگام رتبه بندی
در فایل پیکربندی خود روی 1 (پیش فرض) یا 0 تنظیم کنید. SWISH-CONFIG را ببینید. توجه: باید تنظیم کنی
این را به 0 برای استفاده از طرح رتبه بندی IDF.
ساختار
موقعیت هر عبارت در هر سند HTML بر اساس مقدار ساختار داده می شود
زمینه ای که کلمه در آن ظاهر می شود. مقدار ساختار برای باد کردن مصنوعی استفاده می شود
فراوانی هر عبارت در آن سند خاص. این ارزش های ساختاری هستند
تعریف شده در پیکربندی:
#define RANK_TITLE 7
#define RANK_HEADER 5
#define RANK_META 3
#define RANK_COMMENTS 1
#define RANK_EMPHASIZED 0
به عنوان مثال، اگر کلمه "foo" در عنوان یک سند ظاهر شود، Scheme این کار را انجام می دهد
با آن سند طوری رفتار کنید که گویی "foo" 7 بار دیگر ظاهر شده است.
همه طرح ها دارای ویژگی های زیر هستند:
و جستجو می کند
مقدار رتبه برای همه AND'd عبارت ها متوسط است. اصطلاحات در مجموعه ای از پرانتز ()
بهعنوان یک ترم بهطور میانگین میشوند (این یک ضعف تأیید شده است و در TODO است
لیست)
یا جستجو می کند
مقدار رتبه جمع می شود و سپس برای هر جفت عبارت OR'd دو برابر می شود. این منجر به
رتبه های بالاتر برای اسنادی که دارای چند عبارت OR'd هستند.
رتبه مقیاس شده
پس از محاسبه امتیاز رتبه خام یک سند، امتیاز رتبه نهایی محاسبه می شود
با استفاده از یک تابع "log()" فانتزی. سپس تمام اسناد در برابر یک امتیاز پایه مقیاس بندی می شوند
از 1000. بنابراین، سند دارای رتبه برتر همیشه دارای مقدار "swishrank" خواهد بود.
1000.
در اینجا مروری مختصر از نحوه عملکرد طرح های مختلف است. عدد داخل پرانتز
بعد از نام مقداری است که آن طرح را با "swish-e -R" یا "RankScheme()" فراخوانی می کند.
پیش فرض (0)
طرح رتبهبندی پیشفرض تعداد دفعاتی که یک عبارت در یک سند ظاهر میشود را در نظر میگیرد
(فرکانس)، MetaNamesRank و مقدار ساختار. رتبه ممکن است خلاصه شود
عنوان:
DocRank = مجموع (ساختار + متابیاها)
این خروجی را با مجموعه متغیر DEBUG_RANK در زمان کامپایل در نظر بگیرید:
طرح رتبه بندی: 0
ورودی کلمه 0 در موقعیت 6 دارای ساختار 7 است
ورودی کلمه 1 در موقعیت 64 دارای ساختار 41 است
ورودی کلمه 2 در موقعیت 71 دارای ساختار 9 است
ورودی کلمه 3 در موقعیت 132 دارای ساختار 9 است
ورودی کلمه 4 در موقعیت 154 دارای ساختار 9 است
ورودی کلمه 5 در موقعیت 423 دارای ساختار 73 است
ورودی کلمه 6 در موقعیت 541 دارای ساختار 73 است
ورودی کلمه 7 در موقعیت 662 دارای ساختار 73 است
شماره فایل: 1104. رتبه خام: 21. فراوانی: 8 رتبه بندی شده: 30445
آمار ساختار:
ساختار 0x7 = تعداد 1 ( HEAD TITLE FILE ) x نقشه رتبه 8 = 8
ساختار 0x9 = تعداد 3 ( BODY FILE ) x نقشه رتبه 1 = 3
ساختار 0x29 = تعداد 1 ( HEADING BODY FILE ) x نقشه رتبه 6 = 6
ساختار 0x49 = تعداد 3 ( EM BODY FILE ) x نقشه رتبه 1 = 3
هر نمونه کلمه با نمره پایه 1 شروع می شود. سپس برای هر نمونه از شما
کلمه، یک جمع در حال اجرا از ارزش ساختاری آن موقعیت کلمه به اضافه هر یک گرفته می شود
تعصبی که شما پیکربندی کرده اید. در مثال بالا، رتبه خام "1 + 8 + 3 + 6 + 3 = است
21 "
این خط را در نظر بگیرید:
ساختار 0x7 = تعداد 1 ( HEAD TITLE FILE ) x نقشه رتبه 8 = 8
یعنی یک نمونه از کلمه ما در عنوان فایل وجود داشت. زمینه است
در بود مجموعه برچسب، در داخل . <title> خاص ترین است
ساختار، بنابراین امتیاز RANK_TITLE را دریافت می کند: 7. رتبه پایه 1 به اضافه ساختار
نمره 7 برابر با 8 است. اگر دو مورد از این کلمه در عنوان وجود داشت، پس
امتیاز "8 + 8 = 16" بود.
ارتش اسرائیل (1)
IDF مخفف عبارت Inverse Document Frequency است. این لغت رتبه بندی فانتزی برای گرفتن است
فراوانی کل یک عبارت در کل شاخص، علاوه بر
فراوانی اصطلاح در یک سند واحد رتبه بندی ارتش اسرائیل نیز از چگالی نسبی a استفاده می کند
کلمه در یک سند برای قضاوت درباره مرتبط بودن آن. کلماتی که بیشتر در یک سند ظاهر می شوند، می سازند
آن سند رتبه بالاتری دارد و اسناد طولانی تر از اسناد کوتاهتر وزن بیشتری ندارند.
طرح ارتش اسرائیل را می توان به صورت زیر خلاصه کرد:
DocRank = مجموع ( چگالی * idf * ( ساختار + متابیاها ))
این خروجی از DEBUG_RANK را در نظر بگیرید:
طرح رتبه بندی: 1
تعداد فایل: 1104 امتیاز کلمه: 1 فراوانی: 8 تعداد فایل: 1451
تعداد کل کلمات: 108 IDF: 2564
کل کلمات: 1145877 کلمه نمایه شده در این سند: 562
میانگین کلمات: 789 تراکم: 1120 وزن کلمه: 28716
ورودی کلمه 0 در موقعیت 6 دارای ساختار 7 است
ورودی کلمه 1 در موقعیت 64 دارای ساختار 41 است
ورودی کلمه 2 در موقعیت 71 دارای ساختار 9 است
ورودی کلمه 3 در موقعیت 132 دارای ساختار 9 است
ورودی کلمه 4 در موقعیت 154 دارای ساختار 9 است
ورودی کلمه 5 در موقعیت 423 دارای ساختار 73 است
ورودی کلمه 6 در موقعیت 541 دارای ساختار 73 است
ورودی کلمه 7 در موقعیت 662 دارای ساختار 73 است
رتبه بعد از وزن ارتش اسرائیل: 574321
رتبه مقیاس شده: 132609
آمار ساختار:
ساختار 0x7 = تعداد 1 ( HEAD TITLE FILE ) x نقشه رتبه 8 = 8
ساختار 0x9 = تعداد 3 ( BODY FILE ) x نقشه رتبه 1 = 3
ساختار 0x29 = تعداد 1 ( HEADING BODY FILE ) x نقشه رتبه 6 = 6
ساختار 0x49 = تعداد 3 ( EM BODY FILE ) x نقشه رتبه 1 = 3
این شبیه به طرح پیشفرض است، اما توجه کنید که تعداد کل فایلهای موجود در آن چگونه است
شاخص و فراوانی کل کلمه (برخلاف فراوانی سند) هر دو هستند
بخشی از معادله
رتبه بندی موضوع پیچیده ای است. SWISH-E اجازه می دهد تا طرح های رتبه بندی بیشتری ایجاد شود
و با استفاده از گزینه -R (از دستور swish-e) و RankScheme آزمایش کرد.
(به مستندات API مراجعه کنید). یافته های خود را از طریق لیست بحث آزمایش کنید و به اشتراک بگذارید.
چگونه می توان I محدود کردن جستجو به la عنوان، بدن or چگونه؟ یا 'چه؟
از سوئیچ "-t" استفاده کنید.
I نمیتونم محدود کردن جستجو به عنوان / بدن / نظر.
یا، I نمیتونم جستجو کردن با متا نام ها ، تمام la نام هستند نمایه شده as "جلگه".
اگر #define INDEXTAGS روی 1 تنظیم شده است، فایل config.h را بررسی کنید. اگر اینطور است، آن را به 0 تغییر دهید.
دوباره کامپایل کنید و دوباره ایندکس کنید. وقتی INDEXTAGS 1 باشد، همه تگ ها به صورت متن ساده نمایه می شوند.
یعنی شما "title"، "h1" و غیره را ایندکس می کنید، و آنها معنای نمایه سازی خود را از دست می دهند. اگر
INDEXTAGS روی 0 تنظیم شده است، شما همچنان متا تگ ها و نظرات را ایندکس می کنید، مگر اینکه داشته باشید
در غیر این صورت در فایل پیکربندی کاربر با دستورالعمل IndexComments نشان داده شده است.
همچنین، تنظیمات "UndefinedMetaTags" را در فایل پیکربندی خود بررسی کنید.
من داشتم سعی در حال اجرا la مشمول CGI خط و I دریافت کنید a "درونی؛ داخلی سرور خطا"
اشکال زدایی اسکریپت های CGI خارج از محدوده این سند است. خطای سرور داخلی
اساساً به معنای "بررسی گزارش وب سرور برای یک پیام خطا" است، زیرا می تواند به معنای بد باشد
خط shebang (#!)، یک ماژول perl گم شده، خطای انتقال FTP، یا به سادگی یک خطا در
برنامه اسکریپت CGI swish.cgi در مثال دایرکتوری حاوی مقداری اشکال زدایی است
پیشنهادات. برای اطلاعات "perldoc swish.cgi" را تایپ کنید.
همچنین سوالات متداول CGI بسیار زیادی در اینترنت موجود است. یک جستجوی وب سریع باید
پیشنهاد کمک. به عنوان آخرین راه، ممکن است از وبدمین خود کمک بخواهید...
چه زمانی I امتحان به حبه la swish.cgi با ما I دیدن la محتویات of la پرل برنامه است.
وب سرور شما برای اجرای برنامه به عنوان یک اسکریپت CGI پیکربندی نشده است. این مشکل است
شرح داده شده در "perldoc swish.cgi".
چگونه do I ساخت Swish-e برجسته کلمات in جستجو کردن نتایج؟
جواب کوتاه:
از اسکریپت های ارائه شده swish.cgi یا search.cgi واقع در مثال دایرکتوری.
پاسخ طولانی:
Swish-e نمی تواند زیرا هنگام بازگشت به اسناد منبع دسترسی ندارد
نتایج البته اما یک برنامه جلویی ایجاد شده شما می تواند شرایط را برجسته کند. شما
برنامه می تواند اسناد منبع را باز کند و سپس از عبارات منظم برای جایگزینی استفاده کند
عبارات را با کلمات برجسته یا پررنگ جستجو کنید.
اما، این با همه به جز ساده ترین اسناد منبع شکست خواهد خورد. برای اسناد HTML،
به عنوان مثال، شما باید سند را به کلمات و برچسب ها (و نظرات) تجزیه کنید. یک کلمه تو
مایل به برجسته کردن ممکن است شامل چندین تگ HTML باشد یا یک کلمه در یک URL باشد و شما می خواهید
کل متن پیوند را برجسته کنید.
ماژول های پرل مانند HTML::Parser و XML::Parser استخراج کلمه را امکان پذیر می کنند. بعد،
باید در نظر داشته باشید که Swish-e از تنظیماتی مانند WordCharacters، BeginCharacters،
EndCharacters، IgnoreFirstChar، و IgnoreLast، char برای تعریف یک کلمه. این تویی
نمی توان در نظر گرفت که یک رشته کاراکتر با فاصله سفید در هر طرف یک کلمه است.
سپس چیزهایی مانند TranslateCharacters و HTML Entities ممکن است یک کلمه منبع را به آن تبدیل کنند
چیز دیگری، تا آنجا که به Swish-e مربوط می شود. در نهایت، جستجو را می توان محدود کرد
فرانام ها، بنابراین ممکن است لازم باشد برجسته سازی خود را فقط به بخش هایی از منبع محدود کنید
سند جستجوهای عبارت و کلید واژه ها را در معادله قرار دهید و می توانید ببینید که اینطور است
مشکلی پیش پا افتاده برای حل نیست
فکر می کنم تمام امیدها از بین نمی رود، زیرا Swish-e کمک می کند. با استفاده از گزینه "-H".
تنظیمات شاخص (یا نمایهها) فعلی برای WordCharacters را در هدرها برمیگرداند
(و سایرین) مورد نیاز برای تجزیه اسناد منبع شما همانطور که آنها را در طول نمایه سازی تجزیه می کند،
و یک هدر "Parsed Words:" برمی گرداند که نشان می دهد چگونه پرس و جو را تجزیه کرده است
داخلی اگر از نمایه سازی فازی (اصول کلمه، soundex یا متافون) استفاده می کنید، پس شما
همچنین باید قبل از مقایسه با "تجزیه شده" هر کلمه را در سند خود ریشه کنید
کلمات: "بازگردانده شده توسط Swish-e.
کد پایه Swish-e یا با استفاده از ماژول Swish-e Perl در دسترس است
(SWISH::API) یا کتابخانه C (شامل توزیع swish-e)، یا با استفاده از
SWISH:: ماژول Stemmer در CPAN موجود است. همچنین در CPAN ماژول است
متن::متافون دوبل. استفاده از SWISH::API احتمالا بهترین پشتیبانی ریشه ای را فراهم می کند.
Do فیلترها برای تصفیه آب اثر la کارایی در طی جستجو کردن؟
خیر. فیلترها (FileFilter یا از طریق روش "prog") فقط برای ساخت فهرست جستجو استفاده می شود.
پایگاه داده در طول درخواست های جستجو، هیچ تماس فیلتری وجود نخواهد داشت.
I داشته باشد خواندن la سوالات متداول اما I هنوز داشته باشد پرسش در باره با استفاده از Swish-e.
لیست بحث Swish-e جایی است که باید رفت. http://swish-e.org/. لطفا ایمیل ندهید
توسعه دهندگان به طور مستقیم لیست بهترین مکان برای پرسیدن سوال است.
قبل از ارسال لطفا بخوانید سوالات و عیب یابی واقع در صفحه INSTALL.
شما همچنین باید آرشیو لیست بحث Swish-e را جستجو کنید که در آن یافت می شود
وب سایت swish-e.
به طور خلاصه، هنگام درخواست کمک حتما موارد زیر را لحاظ کنید.
* نسخه swish-e (./swish-e -V)
* آنچه را که نمایه می کنید (و شاید یک نمونه) و تعداد فایل ها
* فایل پیکربندی Swish-e شما
* هر گونه پیام خطایی که Swish-e گزارش می کند
سند اطلاعات
$ID: SWISH-FAQ.pod 2147 2008-07-21 02:48:55Z فرش $
.
از SWISH-FAQ به صورت آنلاین با استفاده از خدمات onworks.net استفاده کنید