স্টেবল ডিফিউশন হল একটি মেশিন লার্নিং মডেল যা স্টেবিলিটি এআই দ্বারা তৈরি করা হয়েছে প্রাকৃতিক ভাষার বর্ণনা থেকে ডিজিটাল ছবি তৈরি করার জন্য। মডেলটি বিভিন্ন কাজের জন্য ব্যবহার করা যেতে পারে যেমন টেক্সট প্রম্পট দ্বারা নির্দেশিত ইমেজ থেকে ইমেজ অনুবাদ তৈরি করা এবং ইমেজ আপস্কেলিং করা।
DALL-E-এর মতো প্রতিযোগী মডেলের বিপরীতে, স্থিতিশীল ডিফিউশন ওপেন সোর্স এবং এটি তৈরি করা ছবিগুলিকে কৃত্রিমভাবে সীমাবদ্ধ করে না। স্থিতিশীল বিস্তারকে LAION-Aesthetics V2 ডেটা সেটের একটি উপসেটে প্রশিক্ষণ দেওয়া হয়েছিল। এটি একটি পরিমিত জিপিইউ দিয়ে সজ্জিত বেশিরভাগ ভোক্তা হার্ডওয়্যারে চলতে পারে এবং এটিকে স্বাগত জানানো হয়েছিল পিসি ওয়ার্ল্ড "আপনার পিসির জন্য পরবর্তী হত্যাকারী অ্যাপ" হিসাবে।
যেহেতু স্টেবল ডিফিউশন স্থানীয়ভাবে চালিত হয় এবং ক্লাউডে নয়, যেমন উল্লেখ করা হয়েছে আপনি যে চিত্রগুলি তৈরি করতে পারেন তার কোনও সীমা নেই তবে এটি ব্যবহার করার জন্য আপনাকে এটির জন্য আপনার পিসি পরিবেশ সেট করার সাথে কিছুটা নোংরা হতে হবে। এটি আসলে একটি অ্যাপ্লিকেশন নয়, এটি একটি কমান্ড লাইন টেক্সট ভিত্তিক বর্ণনাকারী যা আপনার ছবি তৈরি করতে পাইথন ব্যবহার করবে, তাই কোন ইনস্টল বা GUI নেই।
এই নির্দেশিকায়, আমরা আপনাকে দেখাব কিভাবে আপনার স্থানীয় পিসিতে স্থিতিশীল ডিফিউশন ইনস্টল এবং চালাতে হয় যাতে আপনি নিজেরাই কিছু দুর্দান্ত ছবি তৈরি করা শুরু করতে পারেন।
হার্ডওয়্যার এবং সফ্টওয়্যার প্রয়োজনীয়তা
কোন ভুল করবেন না, স্থিতিশীল ডিফিউশন একটি আলু পিসিতে চলবে না, এআই-উত্পন্ন চিত্রের শক্তি সংগ্রহ করতে আপনার এটির প্রয়োজন হবে:
- কমপক্ষে 4GB VRAM সহ একটি GPU
- 10GB হার্ড ডিস্ক স্পেস
- পাইথন এবং লাইব্রেরি (Miniconda3 ইনস্টলার আপনার প্রয়োজনীয় সবকিছু ইনস্টল করবে)
- স্থিতিশীল বিস্তার ফাইল
- git
- যেকোনো ওএস (উইন্ডোজ, লিনাক্স, ম্যাকওএস)
উপাদান ইনস্টল করা হচ্ছে
এই টিউটোরিয়ালের জন্য, আমরা উইন্ডোজ পিসিতে স্টেবল ডিফিউশনের ইনস্টলেশন এবং রানিং কভার করছি। এখানে উপস্থাপিত পদক্ষেপগুলি এমনভাবে উপস্থাপন করা হয়েছে যে কোনও অপারেটিং সিস্টেমে ইনস্টলেশন করা যেতে পারে তবে সুনির্দিষ্ট নির্দেশাবলী উইন্ডোজ ওএসের জন্য হবে।
এলেবেলে
প্রথমেই জিআইটি ইন্সটল করতে হবে। এটি এমন একটি টুল যা আপনাকে সহজেই ইন্টারনেট থেকে রেপো রক্ষণাবেক্ষণ এবং ইনস্টল করতে দেয়। এটি ইনস্টল করতে যান: https://git-scm.com/ এবং ডাউনলোড এ ক্লিক করুন। আপনার অপারেটিং সিস্টেমের সংস্করণের জন্য নির্দেশাবলী অনুসরণ করুন। আপনি যদি একজন বিকাশকারী হন তবে আপনি GIT এর সাথে পরিচিত এবং আপনি যদি এটি ইতিমধ্যেই ইনস্টল করে থাকেন তবে আপনি এই পদক্ষেপটি এড়িয়ে যেতে পারেন৷
স্থানীয়ভাবে জিআইটি ইনস্টল করার সময় একটি গুরুত্বপূর্ণ বিষয় হল কমান্ড লাইনের মাধ্যমে এটি ব্যবহার করার জন্য নির্বাচন করা (দ্বিতীয় বিকল্প যা বলে "কমান্ড লাইন থেকে গিট এবং তৃতীয় পক্ষের সফ্টওয়্যার থেকে")।
মিনিকোন্ডা3
এখন যখন আমরা জিআইটি ইনস্টল করেছি, তখন পরবর্তী জিনিসটি হল পাইথন এবং প্রয়োজনীয় সমস্ত প্রয়োজনীয় লাইব্রেরি ইনস্টল করতে Miniconda3 ব্যবহার করা। এখানে ইনস্টলার পান: https://docs.conda.io/en/latest/miniconda.html
Miniconda3 মূলত একটি সহজ ইনস্টলার তাই আপনাকে বিভিন্ন ওয়েবসাইট এবং উত্স থেকে ম্যানুয়ালি প্রচুর স্টাফ ইনস্টল করতে হবে না, এটি ইনস্টলারে সুন্দরভাবে প্যাকেজ করা হয়েছে যা সবকিছুর যত্ন নেবে।
স্থিতিশীল বিস্তার
পূর্ববর্তী দুটি ধাপের পর, আমরা এখন প্রকৃতপক্ষে স্টেবল ডিফিউশন ইনস্টল করার জন্য প্রস্তুত। যাও https://huggingface.co/CompVis/stable-diffusion#model-access এবং সর্বশেষ লাইব্রেরি ইনস্টল করুন (বর্তমানে এই নিবন্ধটি লেখার হিসাবে এটি স্থিতিশীল-প্রসারণ-v1-4-অরিজিনাল, ডানদিকে শেষটি), লাইব্রেরির আকার প্রায় 5GB তাই বড় ডাউনলোডের জন্য প্রস্তুত থাকুন।
স্থিতিশীল বিস্তারের সর্বশেষ লাইব্রেরি ইনস্টল করার পরে এটি নতুন সংস্করণে আপডেট করার সময়। আপনি জিআইটি হাব থেকে জিপ ডাউনলোড করতে পারেন https://github.com/CompVis/stable-diffusion
ডাউনলোড হয়ে গেলে উইন্ডোজ স্টার্ট বোতামে ক্লিক করুন এবং Miniconda3 টাইপ করুন এবং open এ ক্লিক করুন। একটি ফোল্ডার তৈরি করুন এবং আপনার পছন্দের ড্রাইভে আপনি যেভাবে চান তার নাম দিন। এই উদাহরণের জন্য, আমরা AI_art ফোল্ডারের অধীনে ডিস্ক সি-তে এটি ইনস্টল করব, নীচের নির্দেশাবলী অনুসরণ করুন কিন্তু পরিবর্তে আপনার নিজের নাম এবং গন্তব্য ব্যবহার করুন। কমান্ড টাইপ করার পরে Minicoda3 বন্ধ করবেন না!!!
cd c:/
mkdir AI_art
cd AI_art
আপনার নতুন ফোল্ডারে ডাউনলোড করা GitHub ফাইলগুলি বের করুন এবং Minicoda3 এ ফিরে যান এবং পরবর্তী কমান্ড টাইপ করুন:
cd C:\AI_art\stable-diffusion-main
conda env create -f environment.yaml
conda activate ldm
mkdir models\ldm\stable-diffusion-v1
পুরো প্রক্রিয়াটি শেষ হতে দিন, কিছু ফাইল বড় এবং এটি কিছুটা সময় নিতে পারে। পুরো প্রক্রিয়াটি শেষ হওয়ার পরে এবং সম্পূর্ণ হওয়ার পরে, আপনি যে চেকপয়েন্ট ফাইলটি ডাউনলোড করেছেন তা অনুলিপি করুন: C:\AI_art\stable-diffusion-main\models\ldm\stable-diffusion-v1
ফাইলটি কপি হওয়ার পরে মডেল.ckpt এ নাম পরিবর্তন করুন এবং আপনার কাজ শেষ।
চলমান স্থিতিশীল বিস্তার
চিত্র তৈরি করতে স্থিতিশীল বিস্তার ব্যবহার করার জন্য তৈরি পরিবেশ প্রয়োজন। প্রতিবার আপনি এটি ব্যবহার করতে চাইলে আপনাকে এটি চালাতে হবে, তাই Miniconda3 এ যান এবং এর ভিতরে টাইপ করুন:
conda activate ldm
cd C:\AI_art\stable-diffusion-main
ফোল্ডারের ভিতরে থাকার পর পরামিতি সহ স্ক্রিপ্ট কল করুন:
python scripts/txt2img.py --prompt "TXT DESCRIPTION OF IMAGE THAT YOU WANT TO CREATE" --plms --n_iter 5 --n_samples 1
এবং এটিই, আপনার চিত্র তৈরি করা হয়েছে এবং এটি C:\AI_art\stable-diffusion-main\outputs\txt2img-samples\samples-এ অবস্থিত