Đây là ứng dụng Linux có tên Imagen - Pytorch có bản phát hành mới nhất có thể được tải xuống dưới dạng 1.25.11sourcecode.zip. Nó có thể được chạy trực tuyến trong nhà cung cấp dịch vụ lưu trữ miễn phí OnWorks dành cho máy trạm.
Tải xuống và chạy trực tuyến ứng dụng này có tên Imagen - Pytorch với OnWorks miễn phí.
Làm theo các hướng dẫn sau để chạy ứng dụng này:
- 1. Đã tải ứng dụng này xuống PC của bạn.
- 2. Nhập vào trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 3. Tải lên ứng dụng này trong trình quản lý tệp như vậy.
- 4. Khởi động trình giả lập trực tuyến OnWorks Linux hoặc trình giả lập trực tuyến Windows hoặc trình mô phỏng trực tuyến MACOS từ trang web này.
- 5. Từ Hệ điều hành OnWorks Linux mà bạn vừa khởi động, hãy truy cập trình quản lý tệp của chúng tôi https://www.onworks.net/myfiles.php?username=XXXXX với tên người dùng mà bạn muốn.
- 6. Tải xuống ứng dụng, cài đặt và chạy nó.
MÀN HÌNH
Ad
Imagen - Pytorch
MÔ TẢ
Triển khai Imagen, Mạng thần kinh chuyển văn bản thành hình ảnh của Google đánh bại DALL-E2, trong Pytorch. Đây là SOTA mới để tổng hợp văn bản thành hình ảnh. Về mặt kiến trúc, nó thực sự đơn giản hơn nhiều so với DALL-E2. Nó bao gồm một DDPM xếp tầng được điều chỉnh dựa trên các nhúng văn bản từ một mô hình T5 lớn được đào tạo trước (mạng chú ý). Nó cũng chứa tính năng cắt động để cải thiện hướng dẫn không cần phân loại, điều chỉnh mức độ tiếng ồn và thiết kế bộ nhớ hiệu quả. Rốt cuộc, có vẻ như CLIP cũng như mạng trước đó đều không cần thiết. Và vì vậy nghiên cứu tiếp tục. Để đào tạo đơn giản hơn, bạn có thể cung cấp trực tiếp các chuỗi văn bản thay vì tính toán trước mã hóa văn bản. (Mặc dù với mục đích mở rộng quy mô, bạn chắc chắn sẽ muốn tính toán trước phần nhúng văn bản + mặt nạ)
Tính năng
- Số lượng chú thích văn bản phải phù hợp với kích thước lô của hình ảnh
- Với lớp trình bao bọc ImagenTrainer, các đường trung bình động hàm mũ cho tất cả các mạng chữ U trong DDPM xếp tầng sẽ tự động được xử lý khi gọi cập nhật
- Bạn cũng có thể đào tạo Imagen mà không cần văn bản (tạo hình ảnh vô điều kiện)
- Bạn cũng có thể dựa vào ImagenTrainer để tự động huấn luyện các phiên bản DataLoader
- Tạo một hình ảnh với bất kỳ dấu nhắc văn bản nào bằng một dòng lệnh
- Imagen sử dụng một thuật toán gọi là Hướng dẫn miễn phí về bộ phân loại
Ngôn ngữ lập trình
Python
Danh Mục
Đây là một ứng dụng cũng có thể được tìm nạp từ https://sourceforge.net/projects/imagen-pytorch.mirror/. Nó đã được lưu trữ trong OnWorks để có thể chạy trực tuyến theo cách dễ dàng nhất từ một trong các Hệ điều hành miễn phí của chúng tôi.