स्टेबल डिफ्यूजन एक मशीन लर्निंग मॉडल है जिसे स्टैबिलिटी एआई ने प्राकृतिक भाषा विवरण से डिजिटल इमेज बनाने के लिए विकसित किया है। मॉडल का उपयोग विभिन्न कार्यों के लिए किया जा सकता है जैसे टेक्स्ट प्रॉम्प्ट और अपस्केलिंग छवियों द्वारा निर्देशित छवि-से-छवि अनुवाद उत्पन्न करना।
DALL-E जैसे प्रतिस्पर्धी मॉडलों के विपरीत, स्टेबल डिफ्यूजन खुला स्रोत है और इसके द्वारा निर्मित छवियों को कृत्रिम रूप से सीमित नहीं करता है। स्थिर प्रसार को LAION-सौंदर्यशास्त्र V2 डेटा सेट के सबसेट पर प्रशिक्षित किया गया था। यह मामूली GPU से लैस अधिकांश उपभोक्ता हार्डवेयर पर चल सकता है और इसकी प्रशंसा की गई पीसी वर्ल्ड "आपके पीसी के लिए अगला हत्यारा ऐप" के रूप में।
चूंकि स्थिर प्रसार स्थानीय रूप से चलाया जाता है और क्लाउड में नहीं, जैसा कि उल्लेख किया गया है कि आपके द्वारा उत्पादित छवियों की संख्या की कोई सीमा नहीं है, लेकिन इसका उपयोग करने के लिए आपको इसके लिए अपने पीसी वातावरण को सेट करने के साथ थोड़ा गंदा होना होगा। यह वास्तव में एक एप्लिकेशन नहीं है, यह एक कमांड लाइन टेक्स्ट आधारित डिस्क्रिप्टर है जो आपकी छवियों को उत्पन्न करने के लिए पायथन का उपयोग करेगा, इसलिए कोई इंस्टॉल नहीं है और न ही जीयूआई है।
इस गाइड में, हम आपको दिखाएंगे कि अपने स्थानीय पीसी पर स्थिर डिफ्यूजन को कैसे स्थापित और चलाएं ताकि आप अपने आप से कुछ अच्छी छवियां बनाना शुरू कर सकें।
हार्डवेयर और सॉफ्टवेयर आवश्यकताएँ
कोई गलती न करें, आलू पीसी पर स्टेबल डिफ्यूजन नहीं चलेगा, एआई-जनरेटेड इमेजरी की शक्ति को काटने के लिए आपको इसकी आवश्यकता होगी:
- कम से कम 4GB VRAM वाला GPU
- 10GB हार्ड डिस्क स्थान
- पायथन और पुस्तकालय (मिनिकोंडा 3 इंस्टॉलर आपकी जरूरत की हर चीज स्थापित करेगा)
- स्थिर प्रसार फ़ाइलें
- जाना
- कोई भी ओएस (विंडोज, लिनक्स, मैकओएस)
घटकों को स्थापित करना
इस ट्यूटोरियल के लिए, हम विंडोज पीसी पर स्टेबल डिफ्यूजन के इंस्टॉलेशन और रनिंग को कवर कर रहे हैं। यहां प्रस्तुत चरणों को इस तरह प्रस्तुत किया गया है कि किसी भी ऑपरेटिंग सिस्टम पर इंस्टॉलेशन किया जा सकता है लेकिन सटीक निर्देश विंडोज ओएस के लिए होंगे।
GIT
करने के लिए पहली बात जीआईटी स्थापित करना है। यह एक ऐसा उपकरण है जो आपको इंटरनेट से रेपो को आसानी से बनाए रखने और स्थापित करने देगा। इसे स्थापित करने के लिए यहां जाएं: https://git-scm.com/ और डाउनलोड पर क्लिक करें। ऑपरेटिंग सिस्टम के अपने संस्करण के लिए निर्देशों का पालन करें। यदि आप एक डेवलपर हैं तो आप जीआईटी से परिचित हैं और यदि आपने इसे पहले ही इंस्टॉल कर लिया है तो आप इस चरण को छोड़ सकते हैं।
एक चीज जो स्थानीय रूप से जीआईटी स्थापित करते समय महत्वपूर्ण है, उसे कमांड लाइन के माध्यम से उपयोग करने के लिए चुनना है (दूसरा विकल्प जो कहता है "कमांड लाइन से गिट और तीसरे पक्ष के सॉफ़्टवेयर से भी")।
मिनिकोंडा3
अब जब हमारे पास जीआईटी स्थापित है, तो अगली बात यह है कि पाइथन और सभी आवश्यक पुस्तकालयों को स्थापित करने के लिए मिनिकोंडा 3 का उपयोग करना है। इंस्टॉलर यहां प्राप्त करें: https://docs.conda.io/en/latest/miniconda.html
Miniconda3 मूल रूप से एक आसान इंस्टॉलर है, इसलिए आपको विभिन्न वेबसाइटों और स्रोतों से मैन्युअल रूप से ढेर सारा सामान इंस्टॉल करने की आवश्यकता नहीं है, यह इंस्टॉलर में अच्छी तरह से पैक किया गया है जो हर चीज का ध्यान रखेगा।
स्थिर प्रसार
पिछले दो चरणों के बाद, हम अब वास्तव में स्थिर प्रसार स्थापित करने के लिए तैयार हैं। के लिए जाओ https://huggingface.co/CompVis/stable-diffusion#model-access और नवीनतम पुस्तकालय स्थापित करें (इस लेख के लेखन के अनुसार वर्तमान में यह स्थिर-प्रसार-v1-4-मूल, दाईं ओर अंतिम है), पुस्तकालय लगभग 5GB आकार का है इसलिए बड़े डाउनलोड के लिए तैयार रहें।
स्थिर प्रसार के नवीनतम पुस्तकालय को स्थापित करने के बाद इसे नवीनतम संस्करण में अपडेट करने का समय आ गया है। आप जीआईटी हब से ज़िप डाउनलोड कर सकते हैं https://github.com/CompVis/stable-diffusion
एक बार डाउनलोड हो जाने पर विंडोज स्टार्ट बटन पर क्लिक करें और मिनिकोंडा 3 टाइप करें और ओपन पर क्लिक करें। एक फोल्डर बनाएं और उसे नाम दें कि आप अपनी पसंद के ड्राइव पर कैसे चाहते हैं। इस उदाहरण के लिए, हम इसे डिस्क सी में फ़ोल्डर AI_art के तहत स्थापित करेंगे, नीचे दिए गए निर्देशों का पालन करें लेकिन इसके बजाय अपने नाम और गंतव्य का उपयोग करें। कमांड टाइप करने के बाद मिनिकोडा3 को बंद न करें !!!
cd c:/
mkdir AI_art
cd AI_art
अपने नए फ़ोल्डर में डाउनलोड की गई गिटहब फ़ाइलें निकालें और मिनिकोडा3 पर वापस जाएं और अगले आदेश टाइप करें:
cd C:\AI_art\stable-diffusion-main
conda env create -f environment.yaml
conda activate ldm
mkdir models\ldm\stable-diffusion-v1
पूरी प्रक्रिया को समाप्त होने दें, कुछ फाइलें बड़ी हैं और इसमें कुछ समय लग सकता है। पूरी प्रक्रिया समाप्त होने और पूर्ण होने के बाद, उस चेकपॉइंट फ़ाइल को कॉपी करें जिसे आपने डाउनलोड किया है: C:\AI_art\stable-diffusion-main\models\ldm\stable-diffusion-v1
फ़ाइल की प्रतिलिपि बनाने के बाद उसका नाम बदलकर model.ckpt कर दें और आप समाप्त कर लें।
स्थिर प्रसार चल रहा है
छवियों को बनाने के लिए वास्तव में स्थिर प्रसार का उपयोग करने के लिए बनाए गए वातावरण की आवश्यकता होती है। हर बार जब आप इसका उपयोग करना चाहते हैं तो आपको इसे चलाना होगा, इसलिए Miniconda3 में जाएं, और इसके अंदर टाइप करें:
conda activate ldm
cd C:\AI_art\stable-diffusion-main
जब हम फ़ोल्डर के अंदर होते हैं तो स्क्रिप्ट को पैरामीटर के साथ कॉल करें:
python scripts/txt2img.py --prompt "TXT DESCRIPTION OF IMAGE THAT YOU WANT TO CREATE" --plms --n_iter 5 --n_samples 1
और बस इतना ही, आपकी छवि बनाई गई है और यह C:\AI_art\stable-diffusion-main\outputs\txt2img-samples\samples में स्थित है