Đây là ứng dụng Windows có tên Arthur Bench có bản phát hành mới nhất có thể được tải xuống dưới dạng 0.2.3sourcecode.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên Arthur Bench với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động bất kỳ trình giả lập trực tuyến OS OnWorks nào từ trang web này, nhưng trình giả lập trực tuyến Windows tốt hơn.
- 5. Từ Hệ điều hành Windows OnWorks bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng và cài đặt nó.
- 7. Tải xuống Wine từ kho phần mềm phân phối Linux của bạn. Sau khi cài đặt, bạn có thể nhấp đúp vào ứng dụng để chạy chúng với Wine. Bạn cũng có thể thử PlayOnLinux, một giao diện đẹp mắt trên Wine sẽ giúp bạn cài đặt các chương trình và trò chơi phổ biến của Windows.
Wine là một cách để chạy phần mềm Windows trên Linux, nhưng không cần Windows. Wine là một lớp tương thích Windows mã nguồn mở có thể chạy các chương trình Windows trực tiếp trên bất kỳ máy tính để bàn Linux nào. Về cơ bản, Wine đang cố gắng triển khai lại đủ Windows từ đầu để nó có thể chạy tất cả các ứng dụng Windows đó mà không thực sự cần đến Windows.
MÀN HÌNH
Ad
Ghế Arthur
MÔ TẢ
Bench là một công cụ để đánh giá LLM cho các trường hợp sử dụng sản xuất. Cho dù bạn đang so sánh các LLM khác nhau, xem xét các lời nhắc khác nhau hay thử nghiệm các siêu thông số tạo ra như nhiệt độ và # mã thông báo, Bench đều cung cấp một điểm tiếp xúc cho tất cả đánh giá hiệu suất LLM của bạn.
Tính năng
- Để chuẩn hóa quy trình đánh giá LLM với giao diện chung giữa các nhiệm vụ và trường hợp sử dụng
- Để kiểm tra xem LLM nguồn mở có thể hoạt động tốt như các nhà cung cấp API LLM nguồn đóng hàng đầu trên dữ liệu cụ thể của bạn hay không
- Để chuyển đổi thứ hạng trên bảng xếp hạng LLM và điểm chuẩn thành điểm số mà bạn quan tâm cho trường hợp sử dụng thực tế của mình
- Bench cung cấp một điểm tiếp xúc cho tất cả các đánh giá hiệu suất LLM của bạn
- Cài đặt Bench vào môi trường python của bạn với các phần phụ thuộc tùy chọn để cung cấp kết quả cục bộ
- Ngoài ra, hãy cài đặt Bench vào môi trường python của bạn với mức phụ thuộc tối thiểu
Ngôn ngữ lập trình
TypeScript
Danh Mục
Đây là một ứng dụng cũng có thể được tải xuống từ https://sourceforge.net/projects/arthur-bench.mirror/. Nó đã được lưu trữ trên OnWorks để có thể chạy trực tuyến một cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.