Stable Diffusion é um modelo de aprendizado de máquina desenvolvido pela Stability AI para gerar imagens digitais a partir de descrições em linguagem natural. O modelo pode ser usado para diferentes tarefas, como gerar traduções de imagem para imagem guiadas por prompts de texto e imagens de upscaling.
Ao contrário de modelos concorrentes como o DALL-E, o Stable Diffusion é de código aberto e não limita artificialmente as imagens que produz. A difusão estável foi treinada em um subconjunto do conjunto de dados LAION-Aesthetics V2. Ele pode ser executado na maioria dos hardwares de consumo equipados com uma GPU modesta e foi aclamado pela PC World como "o próximo aplicativo matador para o seu PC".
Como o Stable Diffusion é executado localmente e não na nuvem, como mencionado, não há limite para o número de imagens que você pode produzir, mas para usá-lo você terá que se esforçar um pouco na configuração do ambiente do seu PC, pois não é realmente um aplicativo, é um descritor baseado em texto de linha de comando que usará python para gerar suas imagens, portanto, não há instalação nem GUI.
Neste guia, mostraremos como instalar e executar o Stable Diffusion em seu PC local para que você possa começar a produzir algumas imagens legais sozinho.
Requisitos de hardware e software
Não se engane, o Stable Diffusion não será executado em um PC de batata, para colher o poder das imagens geradas por IA, é disso que você precisará:
- Uma GPU com pelo menos 4 GB de VRAM
- 10 GB de espaço em disco rígido
- Python e bibliotecas (o instalador do Miniconda3 instalará tudo o que você precisa)
- Os arquivos de difusão estável
- Git
- Qualquer sistema operacional (Windows, Linux, macOS)
Instalando componentes
Para este tutorial, estamos cobrindo a instalação e execução do Stable Diffusion no Windows PC. As etapas apresentadas aqui são apresentadas de forma que a instalação possa ser realizada em qualquer sistema operacional, mas as instruções precisas serão para o sistema operacional Windows.
GIT
A primeira coisa a fazer é instalar o GIT. É uma ferramenta que permite manter e instalar facilmente repositórios da Internet. para instalar acesse: https://git-scm.com/ e clique em baixar. Siga as instruções para sua versão do sistema operacional. Se você é um desenvolvedor, conhece o GIT e se já o tem instalado, pode pular esta etapa.
Uma coisa importante ao instalar o GIT localmente é selecionar para usá-lo através da linha de comando (a segunda opção que diz "Git da linha de comando e também de software de terceiros").
Miniconda3
Agora, quando temos o GIT instalado, a próxima coisa é usar o Miniconda3 para instalar o python e todas as bibliotecas necessárias. Obtenha o instalador em: https://docs.conda.io/en/latest/miniconda.html
Miniconda3 é basicamente um instalador fácil, então você não precisa instalar toneladas de coisas manualmente de diferentes sites e fontes, ele é bem empacotado no instalador que cuidará de tudo.
Difusão Estável
Após as duas etapas anteriores, estamos prontos agora para instalar o Stable Diffusion. Vamos para https://huggingface.co/CompVis/stable-diffusion#model-access e instale a biblioteca mais recente (no momento da redação deste artigo, atualmente é stable-diffusion-v1-4-original, a última à direita), a biblioteca tem quase 5 GB de tamanho, então esteja preparado para um grande download.
Depois de instalar a biblioteca mais recente da difusão estável, é hora de atualizá-la para a versão mais recente. Você pode baixar o ZIP do GIT HUB https://github.com/CompVis/stable-diffusion
Uma vez baixado, clique no botão iniciar do Windows e digite Miniconda3 e clique em abrir. Crie uma pasta e nomeie-a como quiser em uma unidade de sua escolha. Para este exemplo, instalaremos tudo no disco C na pasta AI_art, siga as instruções abaixo, mas use seus próprios nomes e destino. Não feche o Minicoda3 após digitar os comandos!!!
cd c:/
mkdir AI_art
cd AI_art
Extraia os arquivos do GitHub que você baixou para sua nova pasta e volte para o Minicoda3 e digite os seguintes comandos:
cd C:\AI_art\stable-diffusion-main
conda env create -f environment.yaml
conda activate ldm
mkdir models\ldm\stable-diffusion-v1
Deixe todo o processo terminar, alguns arquivos são grandes e pode demorar um pouco. Depois que todo o processo estiver concluído e concluído, copie o arquivo de ponto de verificação que você baixou em: C:\AI_art\stable-diffusion-main\models\ldm\stable-diffusion-v1
Depois que o arquivo for copiado, renomeie-o para model.ckpt e pronto.
Executando Difusão Estável
O ambiente criado é necessário para realmente usar a difusão estável para criar imagens. Cada vez que você quiser usá-lo você terá que executá-lo, então entre no Miniconda3, e dentro dele digite:
conda activate ldm
cd C:\AI_art\stable-diffusion-main
depois que estivermos dentro da pasta chame o script com os parâmetros:
python scripts/txt2img.py --prompt "TXT DESCRIPTION OF IMAGE THAT YOU WANT TO CREATE" --plms --n_iter 5 --n_samples 1
e pronto, sua imagem é criada e está localizada em C:\AI_art\stable-diffusion-main\outputs\txt2img-samples\samples