English프랑스어스페인어

온웍스 파비콘

Linux용 오픈 소스 데이터 품질 및 프로파일링 다운로드

Ubuntu 온라인, Fedora 온라인 또는 Debian 온라인에서 실행할 수 있는 Open Source Data Quality 및 Profiling Linux 앱 무료 다운로드

이것은 최신 릴리스를 ProfileV6.3.3.zip으로 다운로드할 수 있는 Open Source Data Quality and Profiling이라는 Linux 앱입니다. 워크스테이션용 무료 호스팅 제공업체 OnWorks에서 온라인으로 실행할 수 있습니다.

Open Source Data Quality and Profiling with OnWorks라는 이름의 이 앱을 온라인에서 무료로 다운로드하여 실행하십시오.

이 앱을 실행하려면 다음 지침을 따르세요.

- 1. 이 애플리케이션을 PC에 다운로드했습니다.

- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.

- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.

- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.

- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.

- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.

스크린 샷

Ad


오픈 소스 데이터 품질 및 프로파일링


기술

이 프로젝트는 오픈 소스 데이터 품질 및 데이터 준비 솔루션에 전념합니다. 데이터 품질에는 프로파일링, 필터링, 거버넌스, 유사성 확인, 데이터 강화 변경, 실시간 경고, 바구니 분석, 거품형 차트 창고 유효성 검사, 단일 고객 보기 등이 포함됩니다.

이 도구는 데이터 통합, 데이터 프로파일링, 데이터 품질, 데이터 준비, 더미 데이터 생성, 메타 데이터 발견, 이상 징후 발견, 데이터 정리, 보고 및 분석을 원활하게 수행할 고성능 통합 데이터 관리 플랫폼을 개발하고 있습니다.

또한 Hadoop 그리드로/에서 파일을 이동하고 Hive 테이블을 생성, 로드 및 프로파일링하는 Hadoop(빅 데이터) 지원이 있었습니다. 이 프로젝트는 "집계 프로파일러"라고도 합니다.

이 프로젝트의 Resful API는 (베타 버전)으로 빌드됩니다. https://sourceforge.net/projects/restful-api-for-osdq/

Apache Spark 기반 데이터 품질이 구축되고 있습니다. https://sourceforge.net/projects/apache-spark-osdq/



기능

  • Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server 인증 빅 데이터 지원 - HIVE
  • Hive 테이블 생성, Profile Hive 테이블, Profiler 시스템 및 Hadoop 그리드 간에 파일 이동
  • Fuzzy Logic 기반 유사성 검사, 테이블과 파일 간의 Cardinailty 검사
  • XML, XLS 또는 CSV 형식에서 내보내기 및 가져오기, PDF 내보내기
  • 파일 분석, 정규식 검색, 표준화, DB 검색
  • 완전한 DB 스캔, SQL 인터페이스, 데이터 사전, 스키마 비교
  • 통계 분석, 보고(차원 및 측정 기준), 임시 보고서 및 분석
  • 패턴 매칭 , 중복 제거 , 케이스 매칭 , 바구니 분석 , 분포 차트
  • 데이터 생성, 데이터 준비 및 데이터 마스킹 기능
  • 메타 데이터 정보, 데이터 모델의 리버스 엔지니어링
  • 적시성 분석, 스트링 길이 분석, KMean, 예측, 회귀
  • 주소 수정, 고객 단일 보기, 제품, 기록을 위한 골든 머지
  • Fuzzy logic 기반의 Record Match, Linkage, Merge 추가
  • 형식 생성, 형식 일치(전화, 날짜, 문자열 및 숫자), 형식 표준화
  • 데이터 준비: 서수,정규화,버케팅,회귀
  • 데이터 마스킹, 암호화, 데이터 무작위화


오디언스 (Audience)

고급 최종 사용자, 개발자, 품질 엔지니어, 관리


사용자 인터페이스

자바 스윙


프로그래밍 언어

자바


데이터베이스 환경

JDBC, ODBC



카테고리

데이터 웨어하우징, 프런트 엔드, 정보 분석

https://sourceforge.net/projects/dataquality/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 체제 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.


무료 서버 및 워크스테이션

Windows 및 Linux 앱 다운로드

Linux 명령

Ad