Questa è l'app Linux denominata Open Source Data Quality and Profiling la cui ultima versione può essere scaricata come ProfileV6.3.3.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app denominata Open Source Data Quality e Profilazione con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avviare l'emulatore online OnWorks Linux o Windows online o l'emulatore online MACOS da questo sito Web.
- 5. Dal sistema operativo OnWorks Linux che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione, installala ed eseguila.
IMMAGINI:
Qualità e profilazione dei dati open source
DESCRIZIONE:
Questo progetto è dedicato alla qualità dei dati open source e alle soluzioni di preparazione dei dati. La qualità dei dati include la profilazione, il filtraggio, la governance, il controllo della somiglianza, l'alterazione dell'arricchimento dei dati, gli avvisi in tempo reale, l'analisi del paniere, la convalida del magazzino con grafico a bolle, la visualizzazione del singolo cliente ecc. definita da Strategia.
Questo strumento sta sviluppando una piattaforma di gestione dei dati integrata ad alte prestazioni che eseguirà perfettamente integrazione dei dati, profilazione dei dati, qualità dei dati, preparazione dei dati, creazione di dati fittizi, rilevamento di metadati, rilevamento di anomalie, pulizia dei dati, reporting e analisi.
Aveva anche il supporto Hadoop ( Big data ) per spostare i file da/a Hadoop Grid, Crea, Carica e Profile Hive Tables. Questo progetto è anche conosciuto come "Aggregate Profiler"
L'API Resful per questo progetto viene creata come (versione beta) https://sourceforge.net/projects/restful-api-for-osdq/
La qualità dei dati basata su apache spark viene costruita su https://sourceforge.net/projects/apache-spark-osdq/
Caratteristiche
- Certificato Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server Supporto Big Data - HIVE
- Crea tabella Hive, tabella Profile Hive, sposta file da/a Profiler System e Hadoop Grid
- Controllo di somiglianza basato su Fuzzy Logic, controllo Cardinailty tra tabelle e file
- Esporta e importa da formato XML, XLS o CSV, esportazione PDF
- Analisi file, ricerca Regex, standardizzazione, ricerca DB
- Scansione completa del DB, interfaccia SQL, dizionario dati, confronto schemi
- Analisi statistica, reportistica (basata su dimensioni e misure), report ad hoc e analisi
- Corrispondenza dei modelli, deduplicazione, corrispondenza dei casi, analisi del paniere, grafico di distribuzione
- Funzioni di generazione dati, preparazione dati e mascheramento dati
- Informazioni sui metadati, reverse engineering del modello di dati
- Analisi della tempestività, analisi della lunghezza delle stringhe, KMean, Previsione, Regressione
- Correzione dell'indirizzo, vista singola del cliente, prodotto, unione d'oro per i record
- Record Match, Linkage e Merge aggiunti in base alla logica fuzzy
- Creazione del formato, corrispondenza del formato (telefono, data, stringa e numero), standardizzazione del formato
- Preparazione dei dati: Ordinale,Normalizzazione,Bucketing,Regressione
- mascheramento dei dati, crittografia, randomizzazione dei dati
Pubblico
Utenti finali avanzati, sviluppatori, ingegneri della qualità, gestione
Interfaccia utente
Altalena Java
Linguaggio di programmazione
Java
Ambiente database
JDB, ODBC
Categorie
Questa è un'applicazione che può anche essere scaricata da https://sourceforge.net/projects/dataquality/. È stato ospitato in OnWorks per essere eseguito online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.