Esta es la aplicación de Windows llamada Headless Chrome Crawler cuya última versión se puede descargar como 1.8.0.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Headless Chrome Crawler con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie cualquier emulador en línea de OS OnWorks desde este sitio web, pero mejor emulador en línea de Windows.
- 5. Desde el sistema operativo OnWorks Windows que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación e instálala.
- 7. Descargue Wine desde los repositorios de software de sus distribuciones de Linux. Una vez instalada, puede hacer doble clic en la aplicación para ejecutarla con Wine. También puedes probar PlayOnLinux, una elegante interfaz sobre Wine que te ayudará a instalar programas y juegos populares de Windows.
Wine es una forma de ejecutar software de Windows en Linux, pero no requiere Windows. Wine es una capa de compatibilidad de Windows de código abierto que puede ejecutar programas de Windows directamente en cualquier escritorio de Linux. Esencialmente, Wine está tratando de volver a implementar una cantidad suficiente de Windows desde cero para poder ejecutar todas esas aplicaciones de Windows sin necesidad de Windows.
SCREENSHOTS
Ad
Rastreador de cromo sin cabeza
DESCRIPCIÓN
Los rastreadores basados en solicitudes simples a archivos HTML son generalmente rápidos. Sin embargo, a veces termina capturando cuerpos vacíos, especialmente cuando los sitios web están construidos en marcos frontend modernos como AngularJS, React y Vue.js. Desarrollado por Headless Chrome, el rastreador proporciona API simples para rastrear sitios web dinámicos. Admite tanto la búsqueda en profundidad como el algoritmo de búsqueda en amplitud. Guarde capturas de pantalla para la evidencia de rastreo, emule dispositivos y agentes de usuario, ponga en cola de prioridad para la eficiencia del rastreo, obedezca robots.txt y más. Los rastreadores estáticos se basan en solicitudes simples a archivos HTML. Generalmente son rápidos, pero fallan al raspar el contenido cuando el HTML cambia dinámicamente en los navegadores. Los rastreadores dinámicos basados en PhantomJS y Selenium funcionan mágicamente en estas aplicaciones dinámicas. Sin embargo, el encargado de mantenimiento de PhantomJS ha renunciado y recomendó cambiar a Headless Chrome, que es rápido y estable. Este rastreador es dinámico y está basado en Headless Chrome.
Caracteristicas
- Rastreo distribuido
- Configurar concurrencia, retraso y reintento
- Almacenamientos de caché conectables como Redis
- Admite líneas CSV y JSON para exportar resultados
- Haga una pausa en la solicitud máxima y reanude en cualquier momento
- Inserte jQuery automáticamente para raspar
Lenguaje de programación
JavaScript
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/headless-chrome-crawler.mirror/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.