Construye tu propia voz para StyleTTS2
Plataforma de manipulación facial líder en la industria
Programación del sistema Pinokio: crea tu propio Pinokio personalizado
[SOLO NVIDIA] Generar videos con el modelo txt2vid de Allegro https://github.com/rhymes-ai/Allegro
El agente de codificación de autoconstrucción más simple https://github.com/yoheinakajima/ditto
Difusión para modelado mundial https://diamond-wm.github.io/
La plataforma Gen AI para estudios profesionales https://github.com/invoke-ai/InvokeAI
Eliminar objetos de una imagen https://huggingface.co/spaces/OzzyGT/diffusers-image-fill
Una interfaz web para subtítulos sencillos utilizando el modelo de whisper.
[SOLO NVIDIA] Generar videos con menos de 10 GB de VRAM https://github.com/THUDM/CogVideo
¡Dale vida a tus retratos! https://github.com/KwaiVGI/LivePortrait
Interfaz de usuario de difusión estable mínima
Genera lanzadores de Pinokio al instante. https://gepeto.pinokio.computer
Unifique el ajuste fino eficiente de más de 100 LLM https://github.com/hiyouga/LLaMA-Factory
Crea una historia generando imágenes consistentes https://github.com/HVision-NKU/StoryDiffusion
Ingeniero de software de inteligencia artificial de Agentic https://github.com/stitionai/devika
Generar imágenes con precisión espacial https://huggingface.co/spaces/SPRIGHT-T2I/SPRIGHT-T2I
Un modelo básico de rostros humanos https://huggingface.co/spaces/FoivosPar/Arc2Face
Visión geométrica 3D simplificada https://dust3r.europe.naverlabs.com/
Interfaz de chat de código abierto para Ollama https://github.com/ivanfioravanti/chatbot-ollama
Una GUI intuitiva para GLIGEN que utiliza ComfyUI en el backend https://github.com/mut-ex/gligen-gui
Stable Cascade from StabilityAI
Convierte cualquier vídeo en vídeo Openpose https://huggingface.co/spaces/fffiloni/video2openpose2
Convierte cualquier vídeo en vídeo Openpose https://huggingface.co/spaces/fffiloni/video2openpose2
Marco de generación de texto a video (T2V) de Vchitect https://github.com/Vchitect/LaVie
Edición de imágenes sin límites mediante modelos de texto a imagen
Un modelo de generación de texto a imagen en tiempo real
Un motor de creación en tiempo real
Subtítulos de música pseudo basados en LLM
Separa todo lo que describas (https://huggingface.co/spaces/Audio-AGI/AudioSep)
ModelScope Image2Video (Nvidia GPU only)
Una implementación de código abierto del modelo TTS de disparo cero VALL-E X de Microsoft
Generación densa de texto a imagen con modulación de atención
1 Click Control-Lora for ComfyUI
Instale los modelos y flujos de trabajo de Control-Lora en ComfyUI con un solo clic
[SOLO GPU NVIDIA] Instalador con un solo clic para ldm3d de Intel
Una interfaz web para diferentes redes neuronales relacionadas con el audio
[Solo GPU Nvidia] Instalador con un solo clic para AudioLDM 2 Gradio UI
Instale la extensión AnimateDiff Automatic1111 y los modelos con un solo clic
Interfaz de usuario y API web de LLM