Dit is de Linux-app genaamd Open Source Data Quality and Profiling, waarvan de nieuwste release kan worden gedownload als ProfileV6.3.3.zip. Het kan online worden uitgevoerd in de gratis hostingprovider OnWorks voor werkstations.
Download en voer deze app genaamd Open Source Data Quality and Profiling met OnWorks gratis online uit.
Volg deze instructies om deze app uit te voeren:
- 1. Download deze applicatie op uw pc.
- 2. Voer in onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX in met de gebruikersnaam die u wilt.
- 3. Upload deze applicatie in zo'n bestandsbeheerder.
- 4. Start de OnWorks Linux online of Windows online emulator of MACOS online emulator vanaf deze website.
- 5. Ga vanuit het OnWorks Linux-besturingssysteem dat u zojuist hebt gestart naar onze bestandsbeheerder https://www.onworks.net/myfiles.php?username=XXXXX met de gewenste gebruikersnaam.
- 6. Download de applicatie, installeer hem en voer hem uit.
SCREENSHOTS
Ad
Open source datakwaliteit en profilering
PRODUCTBESCHRIJVING
Dit project is gewijd aan oplossingen voor open source datakwaliteit en datavoorbereiding. Gegevenskwaliteit omvat profilering, filtering, governance, controle op overeenkomsten, wijziging van gegevensverrijking, real-time waarschuwingen, mandanalyse, bellengrafiek Magazijnvalidatie, enkel klantbeeld enz. Gedefinieerd door Strategie.
Deze tool ontwikkelt een hoogwaardig geïntegreerd gegevensbeheerplatform dat naadloos gegevensintegratie, gegevensprofilering, gegevenskwaliteit, gegevensvoorbereiding, dummygegevenscreatie, metagegevensdetectie, anomaliedetectie, gegevensopschoning, rapportage en analyse zal uitvoeren.
Het had ook Hadoop (Big data) ondersteuning om bestanden van/naar Hadoop Grid, Create, Load en Profile Hive Tables te verplaatsen. Dit project staat ook bekend als "Aggregate Profiler"
Resful API voor dit project wordt gebouwd als (bètaversie) https://sourceforge.net/projects/restful-api-for-osdq/
Op Apache Spark gebaseerde gegevenskwaliteit wordt gebouwd https://sourceforge.net/projects/apache-spark-osdq/
Kenmerken
- Teiid, Mysql, Oracle,Postgres,Access,Db2,SQL Server-gecertificeerde Big data-ondersteuning - HIVE
- Maak Hive-tabel, profiel Hive-tabel, verplaats bestand van/naar Profiler-systeem en Hadoop Grid
- Op Fuzzy Logic gebaseerde gelijkeniscontrole, Cardinailty-controle tussen tabellen en bestanden
- Exporteren en importeren vanuit XML-, XLS- of CSV-formaat, PDF-export
- Bestandsanalyse, Regex-zoekopdracht, Standaardisatie, DB-zoekopdracht
- Volledige DB-scan, SQL-interface, gegevenswoordenboek, schemavergelijking
- Statistische analyse, rapportage (gebaseerd op dimensies en metingen), ad-hocrapporten en analyses
- Pattern Matching, DeDuplicatie, Case matching, Mandanalyse, Distributiekaart
- Functies voor gegevensgeneratie, gegevensvoorbereiding en gegevensmaskering
- Metadata-informatie, reverse engineering van datamodel
- Tijdigheidsanalyse, Stringlengte-analyse, KMean, Voorspelling, Regressie
- Adrescorrectie, enkele klantweergave, product, gouden samenvoeging voor records
- Record Match, Linkage en Merge toegevoegd op basis van vage logica
- Formaat Creatie, Formaat Matching (Telefoon, Datum, String en Nummer), Formaat standaardisatie
- Gegevensvoorbereiding: Ordinaal,Normalisatie,Bucketing,Regressie
- gegevensmaskering, codering, randomisatie van gegevens
Toehoorders
Geavanceerde eindgebruikers, ontwikkelaars, kwaliteitsingenieurs, management
Gebruikersinterface
Java-swing
Programmeertaal
Java
Database-omgeving
JDBC, ODBC
Categorieën
Dit is een applicatie die ook kan worden opgehaald van https://sourceforge.net/projects/dataquality/. Het is gehost in OnWorks, zodat het op de gemakkelijkste manier online kan worden uitgevoerd vanaf een van onze gratis besturingssystemen.