นี่คือแอป Linux ที่ชื่อว่า Open Source Data Quality และ Profiling เพื่อทำงานใน Linux ออนไลน์ ซึ่งสามารถดาวน์โหลดรีลีสล่าสุดเป็น ProfilerV6.3.1.zip สามารถเรียกใช้ออนไลน์ใน OnWorks ผู้ให้บริการโฮสต์ฟรีสำหรับเวิร์กสเตชัน
ดาวน์โหลดและเรียกใช้แอปนี้ทางออนไลน์ที่ชื่อว่า Open Source Data Quality และ Profiling เพื่อทำงานใน Linux ออนไลน์ด้วย OnWorks ฟรี
ทำตามคำแนะนำเหล่านี้เพื่อเรียกใช้แอปนี้:
- 1. ดาวน์โหลดแอปพลิเคชั่นนี้ในพีซีของคุณ
- 2. เข้าไปที่ file manager https://www.onworks.net/myfiles.php?username=XXXXX ด้วยชื่อผู้ใช้ที่คุณต้องการ
- 3. อัปโหลดแอปพลิเคชันนี้ในตัวจัดการไฟล์ดังกล่าว
- 4. เริ่มโปรแกรมจำลองออนไลน์ของ OnWorks Linux หรือ Windows ออนไลน์ หรือโปรแกรมจำลองออนไลน์ MACOS จากเว็บไซต์นี้
- 5. จาก OnWorks Linux OS คุณเพิ่งเริ่มต้น ไปที่ตัวจัดการไฟล์ของเรา https://www.onworks.net/myfiles.php?username=XXXXX พร้อมชื่อผู้ใช้ที่คุณต้องการ
- 6. ดาวน์โหลดแอปพลิเคชั่น ติดตั้ง และเรียกใช้
ภาพหน้าจอ
Ad
คุณภาพข้อมูลโอเพ่นซอร์สและการทำโปรไฟล์เพื่อทำงานใน Linux ออนไลน์
DESCRIPTION
โปรเจ็กต์นี้จัดทำขึ้นเพื่อแก้ปัญหาคุณภาพของข้อมูลโอเพนซอร์สและการเตรียมข้อมูล คุณภาพของข้อมูลรวมถึงการทำโปรไฟล์ การกรอง การกำกับดูแล การตรวจสอบความคล้ายคลึงกัน การเปลี่ยนแปลงการตกแต่งข้อมูล การแจ้งเตือนแบบเรียลไทม์ การวิเคราะห์ตะกร้าสินค้า แผนภูมิฟอง การตรวจสอบคลังสินค้า มุมมองลูกค้ารายเดียว ฯลฯ ที่กำหนดโดยกลยุทธ์เครื่องมือนี้กำลังพัฒนาแพลตฟอร์มการจัดการข้อมูลแบบบูรณาการที่มีประสิทธิภาพสูง ซึ่งจะทำการรวมข้อมูล การทำโปรไฟล์ข้อมูล คุณภาพข้อมูล การเตรียมข้อมูล การสร้างข้อมูลจำลอง การค้นพบข้อมูลเมตา การค้นพบความผิดปกติ การล้างข้อมูล การรายงาน และการวิเคราะห์อย่างราบรื่น
นอกจากนี้ยังรองรับ Hadoop ( Big data ) เพื่อย้ายไฟล์ไปยัง/จาก Hadoop Grid, Create, Load และ Profile Hive Tables โครงการนี้เรียกอีกอย่างว่า "ตัวสร้างโปรไฟล์รวม"
Resful API สำหรับโปรเจ็กต์นี้กำลังสร้างเป็น (เวอร์ชันเบต้า) https://sourceforge.net/projects/restful-api-for-osdq/
คุณภาพข้อมูลตาม apache spark กำลังถูกสร้างขึ้นที่ https://sourceforge.net/projects/apache-spark-osdq/
คุณสมบัติ
- Teiid, Mysql, Oracle, Postgres, Access, Db2, SQL Server ได้รับการรับรอง รองรับข้อมูลขนาดใหญ่ - HIVE
- สร้างตาราง Hive, ตาราง Profile Hive, ย้ายไฟล์ไปยัง/จาก Profiler System และ Hadoop Grid
- การตรวจสอบความคล้ายคลึงกันแบบ Fuzzy Logic, การตรวจสอบ Cardinailty ระหว่างตารางและไฟล์
- ส่งออกและนำเข้าจากรูปแบบ XML, XLS หรือ CSV, การส่งออก PDF
- การวิเคราะห์ไฟล์, การค้นหา Regex, การกำหนดมาตรฐาน, การค้นหาฐานข้อมูล
- สแกน DB, อินเทอร์เฟซ SQL, พจนานุกรมข้อมูล, การเปรียบเทียบสคีมา
- การวิเคราะห์ทางสถิติ การรายงาน (ตามมิติข้อมูลและการวัด) รายงานเฉพาะกิจและการวิเคราะห์
- การจับคู่รูปแบบ , DeDuplication , การจับคู่กรณี , การวิเคราะห์ตะกร้า , แผนภูมิการกระจาย
- การสร้างข้อมูล การเตรียมข้อมูล และคุณสมบัติการปิดบังข้อมูล
- ข้อมูล Meta Data, วิศวกรรมย้อนกลับของ Data Model
- การวิเคราะห์ความทันเวลา, การวิเคราะห์ความยาวสตริง, KMean, การทำนาย, การถดถอย
- การแก้ไขที่อยู่, มุมมองเดียวของลูกค้า, ผลิตภัณฑ์, การรวมสีทองสำหรับบันทึก
- เพิ่มบันทึกการจับคู่ เชื่อมโยง และผสานตามลอจิกคลุมเครือ
- การสร้างรูปแบบ, การจับคู่รูปแบบ (โทรศัพท์, วันที่, สตริงและตัวเลข), การจัดรูปแบบมาตรฐาน
- การเตรียมข้อมูล: ลำดับ, Normalization, Bucketing, Regression
- การปกปิดข้อมูล การเข้ารหัส การสุ่มข้อมูล
ผู้ชม
ผู้ใช้ขั้นสูง นักพัฒนา วิศวกรคุณภาพ การจัดการ
ส่วนติดต่อผู้ใช้
ชวา สวิง
ภาษาโปรแกรม
ชวา
สภาพแวดล้อมฐานข้อมูล
เจดีบีซี, โอดีบีซี
นี่คือแอปพลิเคชันที่สามารถดึงข้อมูลจาก https://sourceforge.net/projects/dataquality/ มีการโฮสต์ใน OnWorks เพื่อให้ทำงานออนไลน์ในวิธีที่ง่ายที่สุดจากหนึ่งในระบบปฏิบัติการฟรีของเรา