webStraktor എന്ന് പേരിട്ടിരിക്കുന്ന Linux ആപ്പാണിത്, ഇതിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് webStraktor-20140420-R01.zip ആയി ഡൗൺലോഡ് ചെയ്യാം. വർക്ക്സ്റ്റേഷനുകൾക്കായുള്ള സൗജന്യ ഹോസ്റ്റിംഗ് ദാതാവായ OnWorks-ൽ ഇത് ഓൺലൈനായി പ്രവർത്തിപ്പിക്കാം.
WebStraktor എന്ന് പേരിട്ടിരിക്കുന്ന ഈ ആപ്പ് OnWorks-നൊപ്പം സൗജന്യമായി ഓൺലൈനായി ഡൗൺലോഡ് ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
ഈ ആപ്പ് പ്രവർത്തിപ്പിക്കുന്നതിന് ഈ നിർദ്ദേശങ്ങൾ പാലിക്കുക:
- 1. നിങ്ങളുടെ പിസിയിൽ ഈ ആപ്ലിക്കേഷൻ ഡൗൺലോഡ് ചെയ്തു.
- 2. ഞങ്ങളുടെ ഫയൽ മാനേജറിൽ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിൽ നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമം നൽകുക.
- 3. അത്തരം ഫയൽമാനേജറിൽ ഈ ആപ്ലിക്കേഷൻ അപ്ലോഡ് ചെയ്യുക.
- 4. ഈ വെബ്സൈറ്റിൽ നിന്ന് OnWorks Linux ഓൺലൈനോ Windows ഓൺലൈൻ എമുലേറ്ററോ MACOS ഓൺലൈൻ എമുലേറ്ററോ ആരംഭിക്കുക.
- 5. നിങ്ങൾ ഇപ്പോൾ ആരംഭിച്ച OnWorks Linux OS-ൽ നിന്ന്, നിങ്ങൾക്ക് ആവശ്യമുള്ള ഉപയോക്തൃനാമത്തോടുകൂടിയ ഞങ്ങളുടെ ഫയൽ മാനേജർ https://www.onworks.net/myfiles.php?username=XXXXX എന്നതിലേക്ക് പോകുക.
- 6. ആപ്ലിക്കേഷൻ ഡൌൺലോഡ് ചെയ്യുക, അത് ഇൻസ്റ്റാൾ ചെയ്ത് പ്രവർത്തിപ്പിക്കുക.
സ്ക്രീൻഷോട്ടുകൾ
Ad
webStraktor
വിവരണം
webStraktor ഒരു പ്രോഗ്രാമബിൾ വേൾഡ് വൈഡ് വെബ് ഡാറ്റ എക്സ്ട്രാക്ഷൻ ക്ലയന്റാണ്. HTTP പ്രോട്ടോക്കോൾ വഴി HTML അധിഷ്ഠിത ഉള്ളടക്കം സ്ക്രാപ്പ് ചെയ്ത് പ്രസക്തമായ വിവരങ്ങൾ എക്സ്ട്രാക്റ്റുചെയ്യുക എന്നതാണ് ഇതിന്റെ ഉദ്ദേശ്യം. ഇമേജുകൾ ഉൾപ്പെടെ വെബിൽ ലഭ്യമായ വിവരങ്ങളുടെ ശേഖരണം, വേർതിരിച്ചെടുക്കൽ, സംഭരണം എന്നിവ സുഗമമാക്കുന്നതിന് webStraktor ഒരു സ്ക്രിപ്റ്റിംഗ് ഭാഷ അവതരിപ്പിക്കുന്നു. സ്ക്രിപ്റ്റിംഗ് ഭാഷയിൽ റെഗുലർ എക്സ്പ്രഷൻ, എക്സ്പാത്ത് വാക്യഘടന എന്നിവയുടെ ഘടകങ്ങൾ ഉപയോഗിക്കുന്നു. webStraktor സ്ക്രിപ്റ്റിംഗ് ഭാഷയ്ക്ക് ഒരു ചെറിയ നിർദ്ദേശ സെറ്റ് ഉണ്ട്, അതിന്റെ വാക്യഘടന മാസ്റ്റർ ചെയ്യാൻ എളുപ്പമാണ്.
സാധാരണ webStraktor ഔട്ട്പുട്ട് ഫോർമാറ്റ് ASCII, UTF-8 അല്ലെങ്കിൽ ISO-8859-1 (Latin1) കോഡ് പേജുകളിൽ XML അടിസ്ഥാനമാക്കിയുള്ളതാണ്.
HTTP പ്രോട്ടോക്കോൾ വഴി ഉള്ളടക്കം വീണ്ടെടുക്കുന്നതിന് webStraktor Apache HttpClient-നെ ആശ്രയിക്കുന്നു. ഇത് റോബോട്ട് എക്സ്ക്ലൂഷൻ പ്രോട്ടോക്കോൾ പാലിക്കുന്നു, കൂടാതെ വെബ് പ്രോക്സി സെർവറുകളുടെ പ്രബലമായ തരങ്ങളിലേക്ക് കണക്റ്റ് ചെയ്ത് അജ്ഞാത രീതിയിൽ പ്രവർത്തിക്കാൻ ഇത് കോൺഫിഗർ ചെയ്യാനാകും.
സ്ക്രാപ്പിംഗ്, ക്രാളിംഗ് കഴിവുകൾ സമന്വയിപ്പിച്ച് വെബ് ക്രാളറുകൾ, സ്പൈഡറുകൾ അല്ലെങ്കിൽ ബോട്ടുകൾ എന്നിവയുടെ പ്രവർത്തനക്ഷമത webStraktor വിപുലീകരിക്കുന്നു.
സവിശേഷതകൾ
- പ്രോഗ്രാമബിൾ വെബ് ക്രാളർ (വെബ് സ്പൈഡർ അല്ലെങ്കിൽ വെബ് ബോട്ട്)
- സ്ക്രിപ്റ്റിംഗ് ഭാഷ കൈകാര്യം ചെയ്യാൻ എളുപ്പമാണ്
- ജാവ സ്വിംഗ് അടിസ്ഥാനമാക്കിയുള്ള ഗ്രാഫിക്കൽ വികസന പരിസ്ഥിതി
- UTF8 അല്ലെങ്കിൽ ISO-8859-1 XML ഔട്ട്പുട്ട്
- എളുപ്പത്തിൽ ലഭ്യമായ ഷെഡ്യൂളിംഗ് ആപ്ലിക്കേഷനുകളുമായി സംയോജിപ്പിക്കുന്നു
- സമഗ്രമായ കോൺഫിഗറേഷൻ
- വെബ് പ്രോക്സി സെർവർ പിന്തുണ
- റോബോട്ട് ഒഴിവാക്കൽ പ്രോട്ടോക്കോൾ പിന്തുണ
- ക്രമീകരിക്കാവുന്ന ഉപയോക്തൃ ഏജന്റ് ഒപ്പ്
- ഘട്ടം ഘട്ടമായുള്ള ട്യൂട്ടോറിയലും ഉദാഹരണ സ്ക്രിപ്റ്റുകളും
- Apache HttpClient അടിസ്ഥാനമാക്കിയുള്ളതാണ്
പ്രേക്ഷകർ
ഡെവലപ്പർമാർ, ആർക്കിടെക്റ്റുകൾ
ഉപയോക്തൃ ഇന്റർഫേസ്
ജാവ സ്വിംഗ്
പ്രോഗ്രാമിംഗ് ഭാഷ
ജാവ
ഡാറ്റാബേസ് പരിസ്ഥിതി
XML അടിസ്ഥാനമാക്കിയുള്ളത്
ഇത് https://sourceforge.net/projects/webstraktor/ എന്നതിൽ നിന്നും ലഭിക്കാവുന്ന ഒരു ആപ്ലിക്കേഷനാണ്. ഞങ്ങളുടെ സൗജന്യ ഓപ്പറേറ്റീവ് സിസ്റ്റങ്ങളിലൊന്നിൽ നിന്ന് ഏറ്റവും എളുപ്പമുള്ള രീതിയിൽ ഓൺലൈനിൽ പ്രവർത്തിപ്പിക്കുന്നതിനായി ഇത് OnWorks-ൽ ഹോസ്റ്റ് ചെയ്തിരിക്കുന്നു.