Esta es la aplicación de Windows denominada Calidad de datos de código abierto y creación de perfiles cuya última versión se puede descargar como ProfileV6.3.3.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Calidad de datos de código abierto y creación de perfiles con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie cualquier emulador en línea de OS OnWorks desde este sitio web, pero mejor emulador en línea de Windows.
- 5. Desde el sistema operativo OnWorks Windows que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación e instálala.
- 7. Descargue Wine desde los repositorios de software de sus distribuciones de Linux. Una vez instalada, puede hacer doble clic en la aplicación para ejecutarla con Wine. También puedes probar PlayOnLinux, una elegante interfaz sobre Wine que te ayudará a instalar programas y juegos populares de Windows.
Wine es una forma de ejecutar software de Windows en Linux, pero no requiere Windows. Wine es una capa de compatibilidad de Windows de código abierto que puede ejecutar programas de Windows directamente en cualquier escritorio de Linux. Esencialmente, Wine está tratando de volver a implementar una cantidad suficiente de Windows desde cero para poder ejecutar todas esas aplicaciones de Windows sin necesidad de Windows.
SCREENSHOTS
Ad
Perfiles y calidad de datos de código abierto
DESCRIPCIÓN
Este proyecto está dedicado a las soluciones de preparación de datos y calidad de datos de código abierto. La calidad de los datos incluye la creación de perfiles, el filtrado, la gobernanza, la verificación de similitudes, la alteración del enriquecimiento de datos, las alertas en tiempo real, el análisis de la cesta, el gráfico de burbujas, la validación del almacén, la vista de un solo cliente, etc. definido por la estrategia.
Esta herramienta está desarrollando una plataforma de gestión de datos integrada de alto rendimiento que hará sin problemas la integración de datos, la creación de perfiles de datos, la calidad de los datos, la preparación de datos, la creación de datos ficticios, el descubrimiento de metadatos, el descubrimiento de anomalías, la limpieza de datos, la generación de informes y el análisis.
También tenía compatibilidad con Hadoop (Big data) para mover archivos hacia / desde Hadoop Grid, Create, Load y Profile Hive Tables. Este proyecto también se conoce como "Aggregate Profiler".
La API de Resful para este proyecto se está construyendo como (Versión Beta) https://sourceforge.net/projects/restful-api-for-osdq/
La calidad de datos basada en apache Spark se está construyendo en https://sourceforge.net/projects/apache-spark-osdq/
Caracteristicas
- Soporte de Big Data certificado por Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server - HIVE
- Crear tabla Hive, tabla Profile Hive, mover archivo a / desde Profiler System y Hadoop Grid
- Comprobación de similitud basada en lógica difusa, comprobación de Cardinailty entre tablas y archivos
- Exportación e importación desde formato XML, XLS o CSV, exportación PDF
- Análisis de archivos, búsqueda de expresiones regulares, estandarización, búsqueda de bases de datos
- Escaneo de base de datos completo, interfaz SQL, diccionario de datos, comparación de esquemas
- Análisis estadístico, informes (basados en dimensiones y medidas), informes ad hoc y análisis
- Coincidencia de patrones, desduplicación, coincidencia de casos, análisis de cesta, gráfico de distribución
- Funciones de generación de datos, preparación de datos y enmascaramiento de datos
- Información de metadatos, ingeniería inversa del modelo de datos
- Análisis de puntualidad, análisis de longitud de cadena, KMean, predicción, regresión
- Corrección de dirección, vista única del cliente, producto, combinación dorada para registros
- Record Match, Linkage y Merge agregados basados en lógica difusa
- Creación de formato, coincidencia de formato (teléfono, fecha, cadena y número), estandarización de formato
- Preparación de datos: ordinal, normalización, agrupamiento, regresión
- enmascaramiento de datos, cifrado, aleatorización de datos
Audiencia
Usuarios finales avanzados, desarrolladores, ingenieros de calidad, gestión
Interfaz de usuario
Swing de Java
Lenguaje de programación
Java
Entorno de base de datos
JDBC, ODBC
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/dataquality/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.