ນີ້ແມ່ນແອັບ Linux ທີ່ມີຊື່ວ່າ tika-python ເຊິ່ງລຸ້ນຫຼ້າສຸດສາມາດດາວໂຫຼດໄດ້ໃນນາມ ApacheTika2.6.0Release.zip. ມັນສາມາດດໍາເນີນການອອນໄລນ໌ຢູ່ໃນຜູ້ໃຫ້ບໍລິການໂຮດຕິ້ງຟຣີ OnWorks ສໍາລັບສະຖານີບ່ອນເຮັດວຽກ.
ດາວນ໌ໂຫລດແລະດໍາເນີນການອອນໄລນ໌ app ນີ້ມີຊື່ tika-python ກັບ OnWorks ໄດ້ຟຣີ.
ປະຕິບັດຕາມຄໍາແນະນໍາເຫຼົ່ານີ້ເພື່ອດໍາເນີນການ app ນີ້:
- 1. ດາວໂຫຼດຄໍາຮ້ອງສະຫມັກນີ້ໃນ PC ຂອງທ່ານ.
- 2. ໃສ່ໃນຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 3. ອັບໂຫລດແອັບພລິເຄຊັນນີ້ຢູ່ໃນຕົວຈັດການໄຟລ໌ດັ່ງກ່າວ.
- 4. ເລີ່ມ OnWorks Linux ອອນລາຍ ຫຼື Windows online emulator ຫຼື MACOS online emulator ຈາກເວັບໄຊທ໌ນີ້.
- 5. ຈາກ OnWorks Linux OS ທີ່ເຈົ້າຫາກໍ່ເລີ່ມຕົ້ນ, ໄປທີ່ຕົວຈັດການໄຟລ໌ຂອງພວກເຮົາ https://www.onworks.net/myfiles.php?username=XXXXX ດ້ວຍຊື່ຜູ້ໃຊ້ທີ່ທ່ານຕ້ອງການ.
- 6. ດາວນ໌ໂຫລດຄໍາຮ້ອງສະຫມັກ, ຕິດຕັ້ງມັນແລະດໍາເນີນການ.
ພາບຫນ້າຈໍ:
tika-python
DESCRIPTION:
ພອດ Python ຂອງຫ້ອງສະຫມຸດ Apache Tika ທີ່ເຮັດໃຫ້ Tika ສາມາດໃຊ້ໄດ້ໂດຍໃຊ້ Tika REST Server. ນີ້ເຮັດໃຫ້ Apache Tika ມີເປັນຫ້ອງສະຫມຸດ Python, ສາມາດຕິດຕັ້ງໄດ້ຜ່ານ Setuptools, Pip ແລະງ່າຍຕໍ່ການຕິດຕັ້ງ. ເພື່ອໃຊ້ຫ້ອງສະຫມຸດນີ້, ທ່ານຈໍາເປັນຕ້ອງມີ Java 7+ ຕິດຕັ້ງຢູ່ໃນລະບົບຂອງທ່ານຍ້ອນວ່າ tika-python ເລີ່ມເຊີບເວີ Tika REST ໃນພື້ນຫລັງ. ເພື່ອເຮັດໃຫ້ການເຮັດວຽກນີ້ເຮັດວຽກຢູ່ໃນສະພາບແວດລ້ອມທີ່ຕັດການເຊື່ອມຕໍ່, ດາວໂຫຼດໄຟລ໌ເຊີບເວີ tika (ທັງ tika-server.jar ແລະ tika-server.jar.md5, ເຊິ່ງສາມາດພົບໄດ້ທີ່ນີ້) ແລະຕັ້ງຕົວແປສະພາບແວດລ້ອມ TIKA_SERVER_JAR ເປັນ TIKA_SERVER_JAR="file://. //tika-server.jar" ເຊິ່ງປະສົບຜົນສໍາເລັດບອກ python-tika "ດາວໂຫລດ" ໄຟລ໌ນີ້ແລະຍ້າຍໄປ /tmp/tika-server.jar ແລະດໍາເນີນການເປັນຂະບວນການພື້ນຖານ. ນີ້ແມ່ນວິທີດຽວທີ່ຈະດໍາເນີນການ python-tika ໂດຍບໍ່ມີການເຂົ້າເຖິງອິນເຕີເນັດ. ໂດຍບໍ່ມີຊຸດນີ້, ຄ່າເລີ່ມຕົ້ນແມ່ນການກວດສອບສະບັບ tika ແລະດຶງຫລ້າສຸດທຸກໆຄັ້ງຈາກ Apache.
ຄຸນລັກສະນະ
- Parser Interface (ການປຽບທຽບກັບຫຼັງກ່ອນ REST)
- ອິນເຕີເຟດ parser ສະກັດຂໍ້ຄວາມ ແລະ metadata ໂດຍໃຊ້ /rmeta interface
- ທາງເລືອກອື່ນ, ທ່ານສາມາດຜ່ານ Tika server URL ພ້ອມກັບການໂທສິ່ງທີ່ເປັນປະໂຫຍດສໍາລັບການປະຕິບັດຫຼາຍຕົວຢ່າງ.
- ລະບຸຮູບແບບຜົນຜະລິດເປັນ XHTML
- ການໂຕ້ຕອບ unpack ຈັດການທັງ metadata ແລະການສະກັດຂໍ້ຄວາມໃນການໂທດຽວ
- ພາຍໃນສົ່ງຄືນ tarball ຂອງ metadata ແລະຂໍ້ຄວາມທີ່ບໍ່ໄດ້ບັນຈຸພາຍໃນ
ພາສາການຂຽນໂປຣແກຣມ
Python
ປະເພດ
ນີ້ແມ່ນແອັບພລິເຄຊັນທີ່ຍັງສາມາດເອົາມາຈາກ https://sourceforge.net/projects/tika-python.mirror/. ມັນໄດ້ຖືກຈັດຢູ່ໃນ OnWorks ເພື່ອໃຫ້ດໍາເນີນການອອນໄລນ໌ດ້ວຍວິທີທີ່ງ່າຍທີ່ສຸດຈາກຫນຶ່ງໃນລະບົບປະຕິບັດງານຟຣີຂອງພວກເຮົາ.