이것은 최신 릴리스를 0.2.3sourcecode.zip으로 다운로드할 수 있는 Arthur Bench라는 Linux 앱입니다. 워크스테이션용 무료 호스팅 제공업체인 OnWorks에서 온라인으로 실행할 수 있습니다.
OnWorks가 포함된 Arthur Bench라는 앱을 무료로 다운로드하여 온라인으로 실행해 보세요.
이 앱을 실행하려면 다음 지침을 따르세요.
- 1. 이 애플리케이션을 PC에 다운로드했습니다.
- 2. 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX에 원하는 사용자 이름을 입력합니다.
- 3. 이러한 파일 관리자에서 이 응용 프로그램을 업로드합니다.
- 4. 이 웹사이트에서 OnWorks Linux 온라인 또는 Windows 온라인 에뮬레이터 또는 MACOS 온라인 에뮬레이터를 시작합니다.
- 5. 방금 시작한 OnWorks Linux OS에서 원하는 사용자 이름으로 파일 관리자 https://www.onworks.net/myfiles.php?username=XXXXX로 이동합니다.
- 6. 응용 프로그램을 다운로드하여 설치하고 실행합니다.
스크린 샷
Ad
아서 벤치
기술
Bench는 프로덕션 사용 사례에 대해 LLM을 평가하기 위한 도구입니다. 다양한 LLM을 비교하든, 다양한 프롬프트를 고려하든, 온도 및 # 토큰과 같은 생성 하이퍼매개변수를 테스트하든 Bench는 모든 LLM 성과 평가를 위한 원터치 포인트를 제공합니다.
기능
- 작업 및 사용 사례 전반에 걸쳐 공통 인터페이스를 사용하여 LLM 평가 워크플로우를 표준화합니다.
- 특정 데이터에 대해 오픈 소스 LLM이 최고의 폐쇄 소스 LLM API 제공업체만큼 수행할 수 있는지 테스트하려면
- LLM 리더보드 및 벤치마크의 순위를 실제 사용 사례에 대해 관심 있는 점수로 변환하려면
- Bench는 모든 LLM 성과 평가를 위한 원터치 포인트를 제공합니다.
- 결과를 로컬로 제공하기 위한 선택적 종속성을 사용하여 Python 환경에 Bench를 설치합니다.
- 또는 최소한의 종속성을 사용하여 Python 환경에 Bench를 설치하세요.
프로그래밍 언어
유형 스크립트
카테고리
이는 https://sourceforge.net/projects/arthur-bench.mirror/에서도 가져올 수 있는 애플리케이션입니다. 무료 운영 시스템 중 하나에서 가장 쉬운 방법으로 온라인으로 실행하기 위해 OnWorks에서 호스팅되었습니다.