Đây là ứng dụng Windows có tên Chất lượng và Hồ sơ Dữ liệu Nguồn Mở có bản phát hành mới nhất có thể được tải xuống dưới dạng ProfileV6.3.3.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên Chất lượng và Cấu hình Dữ liệu Nguồn Mở với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.
- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng và cài đặt nó.
- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.
Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.
MÀN HÌNH
Ad
Hồ sơ và chất lượng dữ liệu nguồn mở
MÔ TẢ
Dự án này dành riêng cho chất lượng dữ liệu nguồn mở và các giải pháp chuẩn bị dữ liệu. Chất lượng dữ liệu bao gồm lập hồ sơ, lọc, quản trị, kiểm tra tính tương tự, thay đổi làm giàu dữ liệu, cảnh báo thời gian thực, phân tích giỏ hàng, biểu đồ bong bóng Xác thực kho, chế độ xem khách hàng đơn lẻ, v.v. do Chiến lược xác định.
Công cụ này đang phát triển nền tảng quản lý dữ liệu tích hợp hiệu suất cao sẽ liên tục thực hiện Tích hợp dữ liệu, Lập hồ sơ dữ liệu, Chất lượng dữ liệu, Chuẩn bị dữ liệu, Tạo dữ liệu giả, Khám phá dữ liệu siêu nhỏ, Khám phá bất thường, Làm sạch dữ liệu, Báo cáo và phân tích.
Nó cũng có hỗ trợ Hadoop (Dữ liệu lớn) để di chuyển tệp đến / từ Hadoop Grid, Create, Load và Profile Hive Tables. Dự án này còn được gọi là "Hồ sơ tổng hợp"
API Resful cho dự án này đang được xây dựng dưới dạng (Phiên bản Beta) https://sourceforge.net/projects/restful-api-for-osdq/
chất lượng dữ liệu dựa trên tia lửa apache đang được xây dựng tại https://sourceforge.net/projects/apache-spark-osdq/
Tính năng
- Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server được chứng nhận Hỗ trợ dữ liệu lớn - HIVE
- Tạo bảng Hive, bảng Hồ sơ Hive, Di chuyển tệp đến / từ Hệ thống hồ sơ và Lưới Hadoop
- Kiểm tra độ tương tự dựa trên lôgic mờ, kiểm tra độ tương đồng giữa các bảng và tệp
- Xuất và nhập từ định dạng XML, XLS hoặc CSV, xuất PDF
- Phân tích tệp, tìm kiếm Regex, Chuẩn hóa, tìm kiếm DB
- Toàn bộ Quét DB, giao diện SQL, Từ điển Dữ liệu, So sánh Lược đồ
- Phân tích thống kê, Báo cáo (dựa trên thứ nguyên và đo lường), báo cáo Ad Hoc và Phân tích
- So khớp mẫu, DeDuplication, So khớp trường hợp, Phân tích giỏ hàng, Biểu đồ phân phối
- Các tính năng tạo dữ liệu, chuẩn bị dữ liệu và che dữ liệu
- Thông tin dữ liệu meta, kỹ thuật đảo ngược của mô hình dữ liệu
- Phân tích tính kịp thời, Phân tích độ dài chuỗi, KMean, Dự đoán, Hồi quy
- Chỉnh sửa địa chỉ, Xem một lượt khách hàng, Sản phẩm, Hợp nhất vàng cho hồ sơ
- Ghi đối sánh, liên kết và hợp nhất được thêm vào dựa trên logic mờ
- Tạo định dạng, Đối sánh định dạng (Điện thoại, Ngày, Chuỗi và Số), Chuẩn hóa định dạng
- Chuẩn bị dữ liệu: Thứ tự, Chuẩn hóa, Bán vé, Hồi quy
- che dữ liệu, mã hóa, ngẫu nhiên hóa dữ liệu
Khán giả
Người dùng cuối nâng cao, Nhà phát triển, Kỹ sư chất lượng, Ban quản lý
Giao diện người dùng
Đu quay Java
Ngôn ngữ lập trình
Java
Môi trường cơ sở dữ liệu
JDBC, ODBC
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/dataquality/. Nó đã được lưu trữ trên OnWorks để có thể chạy trực tuyến một cách dễ dàng nhất từ một trong những Hệ thống hoạt động miễn phí của chúng tôi.