이것은 최신 릴리스를 ProfileV6.3.3.zip으로 다운로드할 수 있는 Open Source Data Quality and Profiling이라는 Linux 앱입니다. 워크스테이션용 무료 호스팅 제공업체 OnWorks에서 온라인으로 실행할 수 있습니다.
Open Source Data Quality and Profiling with OnWorks라는 이름의 이 앱을 온라인에서 무료로 다운로드하여 실행하십시오.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린 샷
Ad
오픈 소스 데이터 품질 및 프로파일링
기술
이 프로젝트는 오픈 소스 데이터 품질 및 데이터 준비 솔루션에 전념합니다. 데이터 품질에는 프로파일링, 필터링, 거버넌스, 유사성 확인, 데이터 강화 변경, 실시간 경고, 바구니 분석, 거품형 차트 창고 유효성 검사, 단일 고객 보기 등이 포함됩니다.
이 도구는 데이터 통합, 데이터 프로파일링, 데이터 품질, 데이터 준비, 더미 데이터 생성, 메타 데이터 발견, 이상 징후 발견, 데이터 정리, 보고 및 분석을 원활하게 수행할 고성능 통합 데이터 관리 플랫폼을 개발하고 있습니다.
또한 Hadoop 그리드로/에서 파일을 이동하고 Hive 테이블을 생성, 로드 및 프로파일링하는 Hadoop(빅 데이터) 지원이 있었습니다. 이 프로젝트는 "집계 프로파일러"라고도 합니다.
이 프로젝트의 Resful API는 (베타 버전)으로 빌드됩니다. https://sourceforge.net/projects/restful-api-for-osdq/
Apache Spark 기반 데이터 품질이 구축되고 있습니다. https://sourceforge.net/projects/apache-spark-osdq/
기능
- Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server 인증 빅 데이터 지원 - HIVE
- Hive 테이블 생성, Profile Hive 테이블, Profiler 시스템 및 Hadoop 그리드 간에 파일 이동
- Fuzzy Logic 기반 유사성 검사, 테이블과 파일 간의 Cardinailty 검사
- XML, XLS 또는 CSV 형식에서 내보내기 및 가져오기, PDF 내보내기
- 파일 분석, 정규식 검색, 표준화, DB 검색
- 완전한 DB 스캔, SQL 인터페이스, 데이터 사전, 스키마 비교
- 통계 분석, 보고(차원 및 측정 기준), 임시 보고서 및 분석
- 패턴 매칭 , 중복 제거 , 케이스 매칭 , 바구니 분석 , 분포 차트
- 데이터 생성, 데이터 준비 및 데이터 마스킹 기능
- 메타 데이터 정보, 데이터 모델의 리버스 엔지니어링
- 적시성 분석, 스트링 길이 분석, KMean, 예측, 회귀
- 주소 수정, 고객 단일 보기, 제품, 기록을 위한 골든 머지
- Fuzzy logic 기반의 Record Match, Linkage, Merge 추가
- 형식 생성, 형식 일치(전화, 날짜, 문자열 및 숫자), 형식 표준화
- 데이터 준비: 서수,정규화,버케팅,회귀
- 데이터 마스킹, 암호화, 데이터 무작위화
오디언스 (Audience)
고급 최종 사용자, 개발자, 품질 엔지니어, 관리
사용자 인터페이스
자바 스윙
프로그래밍 언어
자바
데이터베이스 환경
JDBC, ODBC
카테고리
https://sourceforge.net/projects/dataquality/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 체제 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.