Questa è l'app di Windows denominata Open Source Data Quality and Profiling la cui ultima versione può essere scaricata come ProfileV6.3.3.zip. Può essere eseguito online nel provider di hosting gratuito OnWorks per workstation.
Scarica ed esegui online gratuitamente questa app denominata Open Source Data Quality e Profilazione con OnWorks.
Segui queste istruzioni per eseguire questa app:
- 1. Scaricata questa applicazione sul tuo PC.
- 2. Entra nel nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 3. Carica questa applicazione in tale file manager.
- 4. Avvia qualsiasi emulatore online OS OnWorks da questo sito Web, ma migliore emulatore online Windows.
- 5. Dal sistema operativo OnWorks Windows che hai appena avviato, vai al nostro file manager https://www.onworks.net/myfiles.php?username=XXXXX con il nome utente che desideri.
- 6. Scarica l'applicazione e installala.
- 7. Scarica Wine dai repository software delle tue distribuzioni Linux. Una volta installato, puoi quindi fare doppio clic sull'app per eseguirli con Wine. Puoi anche provare PlayOnLinux, un'interfaccia fantasiosa su Wine che ti aiuterà a installare programmi e giochi Windows popolari.
Wine è un modo per eseguire il software Windows su Linux, ma senza Windows richiesto. Wine è un livello di compatibilità Windows open source in grado di eseguire programmi Windows direttamente su qualsiasi desktop Linux. Essenzialmente, Wine sta cercando di re-implementare abbastanza Windows da zero in modo che possa eseguire tutte quelle applicazioni Windows senza effettivamente bisogno di Windows.
IMMAGINI
Ad
Qualità e profilazione dei dati open source
DESCRIZIONE
Questo progetto è dedicato alla qualità dei dati open source e alle soluzioni di preparazione dei dati. La qualità dei dati include la profilazione, il filtraggio, la governance, il controllo della somiglianza, l'alterazione dell'arricchimento dei dati, gli avvisi in tempo reale, l'analisi del paniere, la convalida del magazzino con grafico a bolle, la visualizzazione del singolo cliente ecc. definita da Strategia.
Questo strumento sta sviluppando una piattaforma di gestione dei dati integrata ad alte prestazioni che eseguirà perfettamente integrazione dei dati, profilazione dei dati, qualità dei dati, preparazione dei dati, creazione di dati fittizi, rilevamento di metadati, rilevamento di anomalie, pulizia dei dati, reporting e analisi.
Aveva anche il supporto Hadoop ( Big data ) per spostare i file da/a Hadoop Grid, Crea, Carica e Profile Hive Tables. Questo progetto è anche conosciuto come "Aggregate Profiler"
L'API Resful per questo progetto viene creata come (versione beta) https://sourceforge.net/projects/restful-api-for-osdq/
La qualità dei dati basata su apache spark viene costruita su https://sourceforge.net/projects/apache-spark-osdq/
Caratteristiche
- Certificato Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server Supporto Big Data - HIVE
- Crea tabella Hive, tabella Profile Hive, sposta file da/a Profiler System e Hadoop Grid
- Controllo di somiglianza basato su Fuzzy Logic, controllo Cardinailty tra tabelle e file
- Esporta e importa da formato XML, XLS o CSV, esportazione PDF
- Analisi file, ricerca Regex, standardizzazione, ricerca DB
- Scansione completa del DB, interfaccia SQL, dizionario dati, confronto schemi
- Analisi statistica, reportistica (basata su dimensioni e misure), report ad hoc e analisi
- Corrispondenza dei modelli, deduplicazione, corrispondenza dei casi, analisi del paniere, grafico di distribuzione
- Funzioni di generazione dati, preparazione dati e mascheramento dati
- Informazioni sui metadati, reverse engineering del modello di dati
- Analisi della tempestività, analisi della lunghezza delle stringhe, KMean, Previsione, Regressione
- Correzione dell'indirizzo, vista singola del cliente, prodotto, unione d'oro per i record
- Record Match, Linkage e Merge aggiunti in base alla logica fuzzy
- Creazione del formato, corrispondenza del formato (telefono, data, stringa e numero), standardizzazione del formato
- Preparazione dei dati: Ordinale,Normalizzazione,Bucketing,Regressione
- mascheramento dei dati, crittografia, randomizzazione dei dati
Pubblico
Utenti finali avanzati, sviluppatori, ingegneri della qualità, gestione
Interfaccia utente
Altalena Java
Linguaggio di programmazione
Java
Ambiente database
JDB, ODBC
Questa è un'applicazione che può anche essere scaricata da https://sourceforge.net/projects/dataquality/. È stato ospitato in OnWorks per essere eseguito online nel modo più semplice da uno dei nostri sistemi operativi gratuiti.