Esta es la aplicación de Linux llamada Calidad de datos de código abierto y creación de perfiles para ejecutarse en Linux en línea, cuya última versión se puede descargar como ProfilerV6.3.1.zip. Se puede ejecutar en línea en el proveedor de alojamiento gratuito OnWorks para estaciones de trabajo.
Descargue y ejecute en línea esta aplicación llamada Calidad de datos de código abierto y creación de perfiles para ejecutar en Linux en línea con OnWorks de forma gratuita.
Siga estas instrucciones para ejecutar esta aplicación:
- 1. Descargue esta aplicación en su PC.
- 2. Ingrese en nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 3. Cargue esta aplicación en dicho administrador de archivos.
- 4. Inicie el emulador en línea OnWorks Linux o Windows en línea o el emulador en línea MACOS desde este sitio web.
- 5. Desde el SO OnWorks Linux que acaba de iniciar, vaya a nuestro administrador de archivos https://www.onworks.net/myfiles.php?username=XXXXX con el nombre de usuario que desee.
- 6. Descarga la aplicación, instálala y ejecútala.
SCREENSHOTS
Ad
Perfiles y calidad de datos de código abierto para ejecutar en Linux en línea
DESCRIPCIÓN
Este proyecto está dedicado a las soluciones de preparación de datos y calidad de datos de código abierto. La calidad de los datos incluye la creación de perfiles, el filtrado, la gobernanza, la verificación de similitudes, la alteración del enriquecimiento de datos, las alertas en tiempo real, el análisis de la cesta, el gráfico de burbujas, la validación del almacén, la vista de un solo cliente, etc. definido por la estrategia.Esta herramienta está desarrollando una plataforma de gestión de datos integrada de alto rendimiento que hará sin problemas la integración de datos, la creación de perfiles de datos, la calidad de los datos, la preparación de datos, la creación de datos ficticios, el descubrimiento de metadatos, el descubrimiento de anomalías, la limpieza de datos, la generación de informes y el análisis.
También tenía compatibilidad con Hadoop (Big data) para mover archivos hacia / desde Hadoop Grid, Create, Load y Profile Hive Tables. Este proyecto también se conoce como "Aggregate Profiler".
La API de Resful para este proyecto se está construyendo como (Versión Beta) https://sourceforge.net/projects/restful-api-for-osdq/
La calidad de datos basada en apache Spark se está construyendo en https://sourceforge.net/projects/apache-spark-osdq/
Caracteristicas
- Soporte de Big Data certificado por Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server - HIVE
- Crear tabla Hive, tabla Profile Hive, mover archivo a / desde Profiler System y Hadoop Grid
- Comprobación de similitud basada en lógica difusa, comprobación de Cardinailty entre tablas y archivos
- Exportación e importación desde formato XML, XLS o CSV, exportación PDF
- Análisis de archivos, búsqueda de expresiones regulares, estandarización, búsqueda de bases de datos
- Escaneo de base de datos completo, interfaz SQL, diccionario de datos, comparación de esquemas
- Análisis estadístico, informes (basados en dimensiones y medidas), informes ad hoc y análisis
- Coincidencia de patrones, desduplicación, coincidencia de casos, análisis de cesta, gráfico de distribución
- Funciones de generación de datos, preparación de datos y enmascaramiento de datos
- Información de metadatos, ingeniería inversa del modelo de datos
- Análisis de puntualidad, análisis de longitud de cadena, KMean, predicción, regresión
- Corrección de dirección, vista única del cliente, producto, combinación dorada para registros
- Record Match, Linkage y Merge agregados basados en lógica difusa
- Creación de formato, coincidencia de formato (teléfono, fecha, cadena y número), estandarización de formato
- Preparación de datos: ordinal, normalización, agrupamiento, regresión
- enmascaramiento de datos, cifrado, aleatorización de datos
Audiencia
Usuarios finales avanzados, desarrolladores, ingenieros de calidad, gestión
Interfaz de usuario
Swing de Java
Lenguaje de programación
Java
Entorno de base de datos
JDBC, ODBC
Esta es una aplicación que también se puede obtener de https://sourceforge.net/projects/dataquality/. Se ha alojado en OnWorks para poder ejecutarlo online de la forma más sencilla desde uno de nuestros Sistemas Operativos gratuitos.