Poiché Midjourney è stato ampiamente testato dal pubblico, sono stati identificati alcuni problemi con le immagini generate dall’IA, dal senso di meraviglia al fatto che le immagini generate da Midjourney tendono solitamente ad avere lo stesso stile, che potresti definire “cremoso” e troppo omogeneo, e che Midjourney non offre. Se sei un utente gratuito, le tue immagini saranno visibili al resto della community, e se sei un utente a pagamento, non puoi escludere la possibilità che le tue immagini vengano “rubate” per altri scopi.
Stable Diffusion proviene da un ecosistema open source e, grazie alla combinazione delle capacità dei plug-in e alla creatività degli utenti, si possono esplorare più scenari applicativi. Non ti accontenterai di generare semplicemente un’immagine tramite una descrizione come con Midjourney, ma la tratterai come un designer di stile, ed è qui che inizieranno le cose divertenti e preziose.
Nella community esplorerai molti modelli altamente stilizzati, come ChilloutMix per lo stile manga giapponese, MoXin per lo stile inchiostro cinese, e persino modelli che imitano il volto di una star del cinema. Puoi caricare questi modelli di addestramento per generare immagini con un grado più elevato di personalizzazione. Quando si arriverà davvero alla fase di disponibilità commerciale, penso che l’attenzione del mercato si sposterà da Midjourney a Stable Diffusion.
Di cosa hai bisogno se vuoi auto-ospitare un ambiente Stable Diffusion?
Preparazione hardware
1. Un computer WindowsPreferibilmente un computer Windows, i Mac potrebbero incontrare più difficoltà con i driver della scheda grafica. 2. Una GPU NV superiore a 6GBSe vuoi fare addestramento, almeno 12GB di memoria video.
3. Memoria superiore a 16GB8GB di memoria vanno bene, ma è difficile caricare i modelli eccellenti della community durante il processo di costruzione, e precauzioni.
1. Installa l’ambiente Python Durante l’installazione, assicurati che Aggiungi Python al PATH sia selezionato.
2. Installa l’ambiente git
3. Nel CMD, esegui il seguente comando per scaricare stable-diffusiongit clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
4. Avvia l’interfaccia web di stable-diffusionUsa il file manager per trovare il file webui-user.bat scaricato ed eseguilo senza privilegi di amministratore.
5. Secondo le istruzioni del passaggio precedente, apri l’indirizzo IP e verrà visualizzata l’interfaccia utente– Se ci sono errori nei passaggi precedenti, puoi chiedere a GPT di aiutarti a risolverli.
Progetta un piccolo obiettivo – alcune immagini per addestrare un piccolo modello
Alcuni concetti importanti che devi capire

modello principale
– Il modello principale che influenza lo stile di output, puoi usare il modello originale v1.5 nell’illustrazione
– Puoi scegliere un download che ti soddisfa su civitai e metterlo nella posizione specificata…/stable-diffusion-webui/models/Stable-diffusion
parola prompt – Inserisci la descrizione testuale dell’immagine che vuoi generare, per esempio, Un padre cinese vissuto che tiene una ciotola di riso, Caratteristiche speciali
Passi di campionamento – In generale, più alto è il numero di passi, più raffinata sarà l’immagine, ma più lungo sarà il tempo di attesa. Di solito lo imposto tra 20 e 40.
Lunghezza e larghezza – 512×512 è una dimensione ragionevole, se hai esigenze particolari per il rapporto dell’immagine, puoi modificarlo
Genera – Clicca il pulsante genera per eseguire la generazione, se non sei soddisfatto al primo tentativo, prova più volte
semi – Se pensi che la composizione generata sia buona, puoi continuare a usare questo seed nella generazione successiva salvando l’immagine qui sotto.

Opzioni avanzate
Extra – Seleziona questa casella per aprire le opzioni estese – L’intensità della differenza può aumentare i dettagli dell’immagine, se pensi che l’immagine sia troppo uniforme puoi aumentare questo valore

Collega uno stile al modello – Clicca il pulsante rosso “mostra reti extra” sotto il pulsante Genera per espandere il pannello aggiuntivo – Le miniature possono essere scaricate da civitai, oppure puoi addestrarle tu stesso.

– L’hyper network è più universale, mentre LoRA è più adatto per la generazione di ritratti

– I mini-modelli sono posizionati nella cartella corrispondente sotto models e possono essere visualizzati e selezionati

– Dopo aver selezionato lo “stile”, i parametri dello stile verranno aggiunti al prompt, e i parametri successivi rappresentano la concentrazione

Azioni per raggiungere il mini-obiettivo (addestramento)
1. Prepara il set di addestramento

– Circa 20 immagini sono sufficienti per addestrare un piccolo modello di stile carino – come inizio, 5 immagini con uno stile specifico vanno bene – la dimensione delle immagini nel set di addestramento deve essere identica 2. Crea Hypernetwork – Durante l’addestramento, inserisci un nome per creare una hyper network

3. Preprocessa le immagini – In questo passaggio, l’IA genererà prima una descrizione testuale basata sull’immagine di addestramento. – Nelle immagini preprocessate, inserisci l’indirizzo della cartella delle immagini di addestramento e l’indirizzo della cartella delle immagini preprocessate in output. – Modifica le dimensioni delle immagini di addestramento – Se le dimensioni non sono uguali, puoi usare Birme per modificare le dimensioni delle immagini in batch prima. – Seleziona l’opzione BLIP e clicca il pulsante Preprocessa per eseguire il preprocessing

–attendi il completamento di ogni immagine di addestramento accanto a un file txt, il testo è la descrizione dell’immagine corrispondente –ci saranno imprecisioni nelle descrizioni, puoi modificarle manualmente – La precisione delle descrizioni determina in una certa misura l’efficacia dell’addestramento


4. Addestramento –Durante l’addestramento, seleziona la Hypernetwork che hai appena creato. 2. –inserisci un learning rate di 0.00005 – All’inizio dell’addestramento 4 zeri sono appropriati, in seguito riduci gradualmente il numero di zeri – inserisci la directory con descrizioni testuali e immagini –modifica la dimensione delle immagini –scegli 2000 passi iterativi –In generale, per 2000 passi di addestramento, ci vuole 1 ora con una scheda grafica serie 10 e mezz’ora con una serie 30 –Clicca il pulsante Training Hypernetwork per iniziare l’addestramento

5. Presentazione dell’effetto –Dopo l’inizio dell’addestramento, puoi vedere il processo di addestramento nella finestra di anteprima

–Dopo l’addestramento, puoi vedere il processo in … /stable-diffusion-webui/textual_inversion/date/… Puoi trovare i risultati dell’addestramento nella cartella hyper networks –nella cartella images ci sono i risultati del processo di addestramento –Puoi visualizzare le immagini e decidere quale risultato di addestramento è appropriato

–nella cartella hyper networks, i file con estensione .pt sono i modelli di stile addestrati – Per esempio, se pensi che il risultato al passo 1400 sia appropriato, puoi spostare il file pt del passo 1400 in models/hyper networks come stile

–Usa i risultati dell’addestramento per generare immagini –In “txt to img” e “img to img”, seleziona lo stile appena addestrato e genera. –Se lo stile non è abbastanza forte, puoi aumentare il fattore

–Divertiti!
Ultimi sviluppi appena rilasciati e la mia comprensione
Recentemente Stable Diffusion ha introdotto un nuovo modello chiamato DeepFloyd IF, che migliora notevolmente una serie di problemi criticati nel disegno AI. Per esempio, le immagini generate dall’IA presentano problemi di relazioni spaziali, personaggi con più dita sugli arti e l’incapacità di gestire relazioni logiche complesse. Francamente, credo che per l’IA delle immagini, il futuro sia dalla parte dell’open source e del deployment privato.
La società umana è diversificata e differente a livello visivo, e strumenti con stili e tendenze specifiche non possono coprire un’ampia area. La differenza tra le preferenze estetiche umane è data dai diversi set di addestramento, non c’è differenza tra umani e IA, e il deployment privato dell’addestramento per garantire l’indipendenza estetica, “indipendenza” può ripristinare un grado maggiore di “diversità”.
Centro Campagna Zima
Altro da leggere

Specifiche hardware di ZimaCube spiegate: 6 alloggiamenti per unità, 4 slot NVMe e doppio Thunderbolt 4
Questa analisi hardware di ZimaCube spiega come la sua CPU i3, la memoria DDR5, l'archiviazione a tre livelli, le doppie porte 2.5GbE, Thunderbolt 4,...

7 Dettagli di Design Intelligenti nel ZimaCube
ZimaCube nasconde dettagli intelligenti oltre la sua scheda tecnica: viti in rame, pannello magnetico, lati intercambiabili, Thunderbolt 4, flessibilità PCIe e una misteriosa porta...

Dentro lo ZimaCube: dall'unboxing allo smontaggio
Una completa analisi del ZimaCube rivela un accesso senza attrezzi, una gabbia per 6 unità disco, possibilità di aggiornamento NVMe e DDR5, espansione PCIe,...
