Este é o aplicativo do Windows denominado crwlr, cuja versão mais recente pode ser baixada como v1.2.2.zip. Ele pode ser executado online no provedor de hospedagem gratuito OnWorks para estações de trabalho.
Baixe e execute online este aplicativo chamado crwlr com OnWorks gratuitamente.
Siga estas instruções para executar este aplicativo:
- 1. Baixe este aplicativo em seu PC.
- 2. Entre em nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que você deseja.
- 3. Carregue este aplicativo em tal gerenciador de arquivos.
- 4. Inicie qualquer emulador on-line OS OnWorks a partir deste site, mas um emulador on-line melhor do Windows.
- 5. No sistema operacional OnWorks Windows que você acabou de iniciar, acesse nosso gerenciador de arquivos https://www.onworks.net/myfiles.php?username=XXXXX com o nome de usuário que deseja.
- 6. Baixe o aplicativo e instale-o.
- 7. Baixe o Wine de seus repositórios de software de distribuição Linux. Depois de instalado, você pode clicar duas vezes no aplicativo para executá-lo com o Wine. Você também pode experimentar o PlayOnLinux, uma interface sofisticada do Wine que o ajudará a instalar programas e jogos populares do Windows.
Wine é uma forma de executar software Windows no Linux, mas sem a necessidade de Windows. Wine é uma camada de compatibilidade do Windows de código aberto que pode executar programas do Windows diretamente em qualquer desktop Linux. Essencialmente, o Wine está tentando reimplementar o suficiente do Windows do zero para que possa executar todos os aplicativos do Windows sem realmente precisar do Windows.
SCREENSHOTS
Ad
crwlr
DESCRIÇÃO
Essa biblioteca fornece uma espécie de estrutura e muitas etapas prontas para uso, que você pode usar como blocos de construção para criar seus próprios crawlers e scrapers. Antes de mergulhar na biblioteca, vamos dar uma olhada nos termos crawling e scraping. Para a maioria dos casos de uso do mundo real, essas duas coisas andam de mãos dadas, e é por isso que esta biblioteca ajuda e combina ambas. Um rastreador (web) é um programa que (baixa) carrega documentos e segue os links para carregá-los também. Um rastreador poderia apenas carregar todos os links que está encontrando (e pode carregar de acordo com o arquivo robots.txt), então ele carregaria toda a Internet (se o(s) URL(s) com o qual ele começa não forem becos sem saída). Ou pode ser restrito para carregar apenas links que correspondam a determinados critérios (no mesmo domínio/host, o caminho do URL começa com "/foo",...) ou apenas até uma certa profundidade. Uma profundidade de 3 significa 3 níveis de profundidade. Os links encontrados nas URLs iniciais fornecidas ao rastreador são de nível 1 e assim por diante.
Recursos
- Polidez do rastreador (respeitando robots.txt, limitação,...)
- Obtenha links absolutos de documentos HTML
- Obtenha sitemaps de robots.txt e obtenha todos os URLs desses sitemaps
- Rastrear (carregar) todas as páginas de um site
- Use qualquer método HTTP (GET, POST,...) e envie qualquer cabeçalho ou corpo
- Iterar sobre páginas de lista paginadas
Linguagem de Programação
PHP
Categorias
Este é um aplicativo que também pode ser obtido em https://sourceforge.net/projects/crwlr.mirror/. Ele foi hospedado em OnWorks para ser executado online da maneira mais fácil a partir de um de nossos Sistemas Operativos gratuitos.