مقدمه:
در دنیای شگفتانگیز هوش مصنوعی، سال ۲۰۲۲ با ظهور پدیدهای به نام Stable Diffusion نقطه عطفی تاریخی را رقم زد. تا پیش از آن، ابزارهای تولید تصویر از متن مانند DALL·E و Midjourney، با وجود قدرت خیرهکننده، در انحصار شرکتهای بزرگ و پشت درهای بسته فعالیت میکردند.
اما Stable Diffusion این معادله را برای همیشه تغییر داد. این مدل هوش مصنوعی مولد (Generative AI) نه تنها از نظر کیفیت با بهترینها رقابت میکند، بلکه به صورت متنباز (Open Source) منتشر شد و به میلیونها کاربر، هنرمند، توسعهدهنده و کسبوکار در سراسر جهان این قدرت را داد که خلاقیت خود را بدون محدودیت و روی کامپیوتر شخصی خودشان به تصویر بکشند.
این مقاله یک راهنمای جامع، کامل و گامبهگام و آموزش و نصب Stable Diffusion برای شماست. فرقی نمیکند یک فرد کاملاً مبتدی باشید که تازه نام استیبل دیفیوشن را شنیده، یک هنرمند دیجیتال که به دنبال ابزاری نوین برای خلق اثر است، یا یک مدیر کسبوکار که میخواهد از پتانسیل AI Image Generation برای رشد برند خود استفاده کند.
ما در این راهنمای +۴۰۰۰ کلمهای، از مبانی نظری و مفاهیم اولیه شروع کرده، به نصب و راهاندازی قدمبهقدم میپردازیم، هنر پرامپت نویسی در استیبل دیفیوشن را رمزگشایی میکنیم و در نهایت، با تکنیکهای پیشرفته و کاربردهای واقعی، شما را به یک کاربر حرفهای تبدیل خواهیم کرد.
هدف ما این است که پس از مطالعه این مقاله آموزش گام به گام و استفاده ازStable Diffusion، شما نه تنها بتوانید تصاویر خیرهکننده خلق کنید، بلکه درک عمیقی از این فناوری، پتانسیلها و آینده آن به دست آورید. بیایید سفر خود را به دنیای Latent Diffusion آغاز کنیم.در ادامه به آموزش گام به گام و استفاده ازStable Diffusion میپردازیم
گام اول: درک مفاهیم بنیادی – Stable Diffusion چیست و چگونه کار میکند؟

آموزش و نصب Stable Diffusionمدل دیفیوژن (Diffusion Model) به زبان ساده
تصور کنید یک عکس بسیار باکیفیت دارید. حالا در طی مراحل متوالی، مقدار بسیار کمی نویز (مشابه برفک تلویزیون) به آن اضافه میکنید. این کار را صدها یا هزاران بار تکرار میکنید تا جایی که از تصویر اولیه چیزی جز یک صفحه پر از نویز باقی نماند. این فرآیند “دیفیوژن رو به جلو” (Forward Diffusion) است.حالا، جادوی هوش مصنوعی اینجا اتفاق میافتد. مدل دیفیوژن آموزش میبیند که فرآیند معکوس را انجام دهد. یعنی یک تصویر کاملاً نویزی را به عنوان ورودی بگیرد و یاد بگیرد که چگونه مرحله به مرحله نویز را از آن حذف کند تا به تصویر اصلی و معنادار برسد. این فرآیند “دیفیوژن معکوس” (Reverse Diffusion) نام دارد.
تفاوت Stable Diffusion: معرفی فضای نهان (Latent Space)
مدلهای دیفیوژن اولیه این فرآیند حذف نویز را مستقیماً روی پیکسلهای تصویر انجام میدادند که به توان پردازشی بسیار عظیمی (و در نتیجه سختافزار بسیار گرانقیمت) نیاز داشت. اینجا بود که نوآوری بزرگ Latent Diffusion (که Stable Diffusion بر پایه آن ساخته شده) معرفی شد.
به جای کار روی تصویر با وضوح بالا (مثلاً ۵۱۲x۵۱۲ پیکسل)، این مدل ابتدا تصویر را به یک نسخه بسیار فشردهتر و کوچکتر در “فضای نهان” (Latent Space) تبدیل میکند. این نسخه فشرده، اطلاعات مفهومی تصویر را در خود نگه میدارد، نه جزئیات پیکسلی آن را. سپس کل فرآیند دیفیوژن (حذف نویز) در همین فضای نهان کمحجم انجام میشود. در انتها، نتیجه نهایی از فضای نهان به فضای پیکسلی برگردانده شده و تصویر باکیفیت ساخته میشود.
این رویکرد هوشمندانه مصرف منابع را به شدت کاهش داد و باعث شد اجرای مدل روی کارتهای گرافیک معمولی (Consumer GPUs) ممکن شود. این همان دلیلی است که شما میتوانید استیبل دیفیوشن روی کامپیوتر شخصی خود اجرا کنید.
چرا Stable Diffusion متن باز است و این چه اهمیتی دارد؟
Stable Diffusion توسط شرکت Stability AI و با همکاری محققان دانشگاه LMU مونیخ و RunwayML توسعه داده شد. برخلاف رقبایش، این مدل به صورت متنباز منتشر شد. این یعنی:
- دسترسی همگانی: هر کسی میتواند کد و مدل را دانلود کرده و به رایگان از آن استفاده کند.
- کنترل کامل: شما روی تمام پارامترها و تنظیمات کنترل دارید و محدود به رابط کاربری یک وبسایت نیستید.
- قابلیت سفارشیسازی: جامعه توسعهدهندگان میتواند مدلهای جدیدی را بر اساس Stable Diffusion آموزش دهد (که به آنها Checkpoint یا Model گفته میشود) و ابزارهای جانبی بینظیری برای آن بسازد.
- حفظ حریم خصوصی: وقتی مدل را روی سیستم خود اجرا میکنید، دادهها و تصاویر شما در سرور هیچ شرکتی ذخیره نمیشود.
این ماهیت متنباز، یک اکوسیستم خلاق و پویا پیرامون Stable Diffusion ایجاد کرده که هر روز در حال رشد و تکامل است.
گام دوم: انتخاب روش و راهاندازی Stable Diffusion

برای استفاده از Stable Diffusion چندین راه پیش روی شماست که هر کدام مزایا و معایب خود را دارند.
روش اول: استفاده از پلتفرمهای آنلاین (سادهترین راه)
اگر نمیخواهید درگیر نصب و تنظیمات فنی شوید یا سیستم قدرتمندی ندارید، پلتفرمهای آنلاین بهترین گزینه هستند. این سرویسها Stable Diffusion را روی سرورهای قدرتمند خود اجرا کرده و یک رابط کاربری ساده در اختیار شما قرار میدهند.
- DreamStudio: وبسایت رسمی Stability AI که تجربهای ساده و بهینه ارائه میدهد.
- Hugging Face: این پلتفرم یک نسخه دمو از Stable Diffusion را برای تست سریع ارائه میکند.
- سایر سرویسها: وبسایتهای زیادی مانند Playground AI یا Mage.space نیز مبتنی بر Stable Diffusion هستند.
مزایا:
- بدون نیاز به نصب.
- بدون نیاز به سختافزار قوی.
- شروع سریع و آسان.
معایب:
- معمولاً رایگان نیستند (بر اساس اعتبار یا Credit کار میکنند).
- کنترل و سفارشیسازی محدود.
- سرعت ممکن است بسته به ترافیک سرور متغیر باشد.
روش دوم: نصب روی کامپیوتر شخصی (قدرتمندترین راه)
این روش به شما کنترل کامل و دسترسی به تمام قابلیتهای پیشرفته را میدهد. برای این کار شما به یک کارت گرافیک (GPU) مناسب، ترجیحاً از برند NVIDIA با حداقل ۶ گیگابایت VRAM نیاز دارید. هرچه VRAM بیشتر باشد، میتوانید تصاویر بزرگتر و با سرعت بیشتری تولید کنید.
محبوبترین و کاملترین رابط کاربری برای اجرای استیبل دیفیوشن روی کامپیوتر، AUTOMATIC1111 Stable Diffusion WebUI است. این یک پروژه متنباز است که تمام ابزارهای مورد نیاز شما را در یک محیط تحت وب (که به صورت محلی روی سیستم شما اجرا میشود) فراهم میکند.
راهنمای نصب AUTOMATIC1111 (برای ویندوز با کارت گرافیک NVIDIA):
- نصب Python: به وبسایت رسمی پایتون رفته و نسخه
3.10.6را دانلود و نصب کنید. نکته بسیار مهم: در حین نصب، حتماً تیک گزینهAdd Python to PATHرا بزنید. - نصب Git: به وبسایت Git رفته و آن را دانلود و با تنظیمات پیشفرض نصب کنید.
- کپی کردن ریپازیتوری: یک پوشه در درایو خود بسازید (مثلاً
D:\StableDiffusion). سپس در فضای خالی این پوشه راستکلیک کرده وGit Bash Hereرا انتخاب کنید. در پنجره باز شده، دستور زیر را وارد و اجرا کنید:git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git - دانلود مدل پایه (Checkpoint): برای تولید تصویر، به یک مدل پایه نیاز دارید. به صفحه Hugging Face برای Stable Diffusion v1.5 بروید و فایل
v1-5-pruned-emaonly.ckptرا دانلود کنید. این فایل را در پوشه زیر قرار دهید:stable-diffusion-webui\models\Stable-diffusion - اجرای اولیه: به پوشه اصلی
stable-diffusion-webuiبرگردید و فایلwebui-user.batرا اجرا کنید. بار اول، برنامه شروع به دانلود و نصب تمام وابستگیها میکند. این فرآیند ممکن است بسته به سرعت اینترنت شما زمانبر باشد. پس از اتمام، یک آدرس محلی (معمولاًhttp://127.0.0.1:7860) در پنجره دستور نمایش داده میشود. این آدرس را در مرورگر خود باز کنید تا رابط کاربری را مشاهده کنید.
گام سوم: هنر پرامپتنویسی (Prompt Engineering) – چگونه با ماشین صحبت کنیم؟

پرامپت (Prompt) دستوری است که شما به مدل میدهید تا تصویر مورد نظرتان را خلق کند. کیفیت خروجی شما مستقیماً به کیفیت پرامپت شما بستگی دارد. این بخش، مهمترین مهارت شما در کار با Stable Diffusion خواهد بود.
ساختار یک پرامپت مؤثر
یک پرامپت خوب، ترکیبی از چندین جزء کلیدی است. به جای نوشتن یک جمله ساده، سعی کنید پرامپت خود را مانند یک نقاش که پالت رنگ خود را میچیند، بسازید.
- موضوع اصلی (Subject): واضحترین و اصلیترین بخش پرامپت. چه چیزی میخواهید بکشید؟
- مثال:
a majestic lion(یک شیر باشکوه)
- مثال:
- جزئیات و توصیفات (Medium & Style): سبک هنری، نوع رسانه (عکس، نقاشی رنگ روغن، دیجیتال آرت)، هنرمند الهامبخش، و حال و هوای تصویر.
- مثال:
oil painting, in the style of Rembrandt, dramatic lighting(نقاشی رنگ روغن، به سبک رامبراند، نورپردازی دراماتیک)
- مثال:
- اطلاعات تکمیلی (Additional Details): جزئیات محیط، لباس، زاویه دوربین، کیفیت و وضوح.
- مثال:
sitting on a throne in a dark castle, wearing a golden crown, cinematic shot, 8k, ultra detailed(نشسته بر تختی در یک قلعه تاریک، با تاجی طلایی، نمای سینمایی، ۸کی، جزئیات بسیار بالا)
- مثال:
ترکیب نهایی پرامپت:a majestic lion, sitting on a throne in a dark castle, wearing a golden crown, oil painting, in the style of Rembrandt, dramatic lighting, cinematic shot, 8k, ultra detailed
پرامپت منفی (Negative Prompt)
به همان اندازه که میگویید چه چیزهایی را در تصویر میخواهید، گفتن چیزهایی که نمیخواهید نیز اهمیت دارد. پرامپت منفی به مدل کمک میکند تا از تولید المانهای ناخواسته، بیکیفیت یا دارای اعوجاج خودداری کند.
پرامپت منفیهای رایج و کاربردی:ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face
استفاده هوشمندانه از پرامپت منفی یکی از بهترین تنظیمات استیبل دیفیوشن برای افزایش کیفیت خروجی است.
تکنیکهای پیشرفته پرامپتنویسی
- وزندهی به کلمات (Word Weighting): اگر میخواهید روی کلمهای تأکید بیشتری کنید، آن را داخل پرانتز قرار دهید. برای تأکید بیشتر، از
(word:1.2)(افزایش ۱.۲ برابری تأکید) و برای کاهش تأکید از[word]یا(word:0.8)استفاده کنید.- مثال:
a man with a (red:1.3) hat(تأکید روی قرمز بودن کلاه)
- مثال:
- ترکیب مفاهیم (Prompt Blending): میتوانید دو مفهوم را با هم ترکیب کنید.
- مثال:
[cat:dog:0.5]این پرامپت در نیمه اول فرآیند روی گربه و در نیمه دوم روی سگ تمرکز میکند و نتیجهای ترکیبی ایجاد میکند.
- مثال:
گام چهارم: آشنایی با پارامترها و تنظیمات کلیدی
در رابط کاربری AUTOMATIC1111، علاوه بر پرامپت، پارامترهای دیگری وجود دارند که تأثیر شگرفی بر نتیجه نهایی دارند.
- Sampling Method (سمپلر): الگوریتمی که برای حذف نویز استفاده میشود. هر کدام نتایج کمی متفاوتی تولید میکنند. سمپلرهای
Euler a,DPM++ 2M KarrasوDDIMبرای شروع گزینههای خوبی هستند و سرعت بالایی دارند. آزمایش کردن سمپلرهای مختلف بخشی از فرآیند یادگیری است. - Sampling Steps (مراحل نمونهبرداری): تعداد مراحلی که مدل برای حذف نویز طی میکند. مقدار بیشتر معمولاً جزئیات بیشتری به تصویر اضافه میکند، اما همیشه بهتر نیست. مقادیر بین ۲۰ تا ۳۰ برای اکثر سمپلرها یک نقطه شروع عالی است. مقادیر بسیار بالا (بیش از ۵۰) اغلب بازده نزولی دارد و فقط زمان تولید را افزایش میدهد.
- CFG Scale (Classifier-Free Guidance Scale): این پارامتر مشخص میکند که مدل چقدر باید به پرامپت شما “پایبند” باشد.
- مقدار پایین (۳-۶): به مدل آزادی خلاقانه بیشتری میدهد. ممکن است نتیجه دقیقاً مطابق پرامپت شما نباشد اما خلاقانهتر است.
- مقدار متوسط (۷-۱۰): بهترین تعادل بین خلاقیت و پایبندی به پرامپت. این محدوده برای اکثر کارها توصیه میشود.
- مقدار بالا (۱۱-۱۵): مدل را مجبور میکند تا به شدت به پرامپت وفادار بماند. ممکن است باعث ایجاد رنگهای اشباع شده و مصنوعات (artifacts) در تصویر شود.
- Seed (دانه): هر تصویر تولید شده یک شماره Seed منحصربهفرد دارد. این عدد نماینده نویز اولیهای است که تصویر از آن ساخته شده. اگر یک Seed را ثابت نگه دارید و پرامپت را کمی تغییر دهید، ساختار کلی تصویر ثابت باقی میماند و فقط جزئیات تغییر میکنند. این برای ایجاد تصاویر مشابه و انجام تنظیمات دقیق بسیار کاربردی است. اگر مقدار Seed را روی
-1قرار دهید، در هر بار اجرا یک Seed تصادفی انتخاب میشود. - Width & Height (عرض و ارتفاع): ابعاد تصویر خروجی. مدلهای پایه Stable Diffusion (مانند v1.5) روی تصاویر ۵۱۲x۵۱۲ پیکسل آموزش دیدهاند. تولید تصاویر با ابعاد نزدیک به این مقدار (مثلاً ۵۱۲x۷۶۸ برای پرتره) بهترین نتیجه را میدهد. برای افزایش کیفیت عکس در استیبل دیفیوشن و تولید تصاویر با رزولوشن بالا، از ابزارهایی مانند
Hires. Fixیا upscalerها استفاده کنید که در ادامه توضیح داده میشوند.
مقایسه جامع – Stable Diffusion در برابر DALL·E و Midjourney
انتخاب ابزار مناسب به نیاز شما بستگی دارد. در جدول زیر، یک مقایسه بین استیبل دیفیوشن و دالی و میدجرنی انجام دادهایم.
| ویژگی | Stable Diffusion | Midjourney | DALL·E 3 (via ChatGPT) |
|---|---|---|---|
| سهولت استفاده | دشوار (نیاز به نصب و یادگیری) | متوسط (کار با دستورات دیسکورد) | بسیار آسان (رابط چت) |
| کیفیت هنری/سبک | بسیار بالا (وابسته به مدل) | بسیار بالا (سبک هنری مشخص و زیبا) | بالا (بسیار خوب در درک زبان) |
| واقعگرایی (Photorealism) | عالی (با مدلهای تخصصی) | خوب تا عالی | خوب |
| کنترل و سفارشیسازی | کنترل مطلق (متنباز، افزونهها) | محدود به پارامترهای دیسکورد | بسیار محدود |
| هزینه | رایگان (به جز هزینه سختافزار) | اشتراک ماهانه | اشتراک ماهانه (ChatGPT Plus) |
| سرعت | وابسته به سختافزار شما | بسیار سریع | سریع |
چه زمانی از کدام استفاده کنیم؟
- Stable Diffusion: اگر به کنترل کامل، سفارشیسازی بینهایت، تولید تصویر بدون محدودیت و رایگان (روی سیستم خود) و استفاده از ابزارهای پیشرفته مانند ControlNet نیاز دارید. این انتخاب حرفهایهاست.
- Midjourney: اگر به دنبال سریعترین راه برای تولید تصاویر هنری بسیار زیبا و با سبکی خاص هستید و کار با دیسکورد برایتان راحت است.
- DALL·E 3: اگر مبتدی هستید و میخواهید با استفاده از زبان طبیعی و بدون یادگیری پرامپتنویسی پیچیده، تصاویری با درک مفهومی بالا از متن تولید کنید.
ورود به دنیای پیشرفته – فراتر از تولید تصویر ساده
مدلهای سفارشی (Checkpoints) و LoRA
جامعه کاربری Stable Diffusion هزاران مدل سفارشی را آموزش داده و به اشتراک گذاشته است. این مدلها که Checkpoint نام دارند، برای سبکهای خاصی بهینهسازی شدهاند:
- مدلهای واقعگرایانه (Photorealistic): مانند
Realistic Vision,Deliberate. - مدلهای انیمه و کارتونی: مانند
Anything V5,MeinaMix. - مدلهای هنری: برای تقلید از سبکهای خاص نقاشی یا هنر دیجیتال.
LoRA (Low-Rank Adaptation): فایلهای کوچکی هستند که میتوانند به صورت پویا به یک مدل پایه اضافه شوند تا یک کاراکتر، سبک یا مفهوم خاص را به آن یاد بدهند، بدون اینکه نیاز به تغییر کل مدل باشد. مثلاً میتوانید یک LoRA برای یک شخصیت خاص یا یک سبک لباس خاص پیدا و استفاده کنید.
Image-to-Image (Img2Img)
در این حالت، علاوه بر پرامپت، یک تصویر اولیه هم به مدل میدهید. Stable Diffusion آن تصویر را به عنوان راهنما گرفته و بر اساس پرامپت شما آن را بازآفرینی میکند. این قابلیت برای تغییر سبک یک عکس، اصلاح بخشی از آن یا افزودن جزئیات جدید فوقالعاده است.
Inpainting و Outpainting
- Inpainting: به شما اجازه میدهد بخشی از یک تصویر را با ماسک مشخص کرده و فقط آن قسمت را بر اساس یک پرامپت جدید بازسازی کنید. این برای حذف یک شیء ناخواسته، تغییر لباس یک شخص یا اصلاح چهره عالی است.
- Outpainting: به شما امکان میدهد بوم تصویر را گسترش داده و از هوش مصنوعی بخواهید که فضاهای خالی اطراف تصویر اصلی را به صورت هماهنگ پر کند.
ControlNet: کنترل مطلق بر خروجی
ControlNet انقلابی در AI Art Generation است. این ابزار به شما اجازه میدهد تا با ارائه یک تصویر راهنما (مانند اسکچ، نقشه عمق، خطوط لبه یا ژست انسان)، ترکیببندی، ژست و ساختار کلی تصویر خروجی را به طور دقیق کنترل کنید. برای مثال، میتوانید ژست دقیق یک فرد را با یک مدل اسکلتی مشخص کرده و از Stable Diffusion بخواهید یک کاراکتر کاملاً متفاوت را دقیقاً در همان ژست خلق کند.
[محل قرارگیری تصویر: مثالی از عملکرد ControlNet. ستون اول یک تصویر ورودی (مثلا یک اسکچ ساده یا یک عکس ژست)، ستون دوم مدل ControlNet (مثلا Canny یا OpenPose) و ستون سوم تصویر خروجی نهایی را نشان میدهد.]
کاربردهای عملی و واقعی Stable Diffusion
این فناوری فقط برای سرگرمی نیست. در اینجا چند نمونه از کاربردهای تجاری و حرفهای آن آورده شده است:
- بازاریابی و تبلیغات: تولید تصاویر یونیک و خلاقانه برای کمپینهای دیجیتال، پستهای شبکههای اجتماعی و بنرهای وبسایت با کسری از هزینه عکاسی یا خرید عکس استوک.
- طراحی محصول و مد: ایدهپردازی سریع برای طراحیهای جدید لباس، بستهبندی محصولات، یا ظاهر گجتها.
- معماری و طراحی داخلی: ایجاد رندرهای مفهومی و سریع از فضاها و ساختمانها برای ارائه اولیه به کارفرما.
- تولید محتوا و بازیسازی: خلق کاراکترها، محیطها، آیتمها و بافتهای (textures) مورد نیاز برای بازیهای ویدیویی و انیمیشن.
- هنر دیجیتال: هنرمندان میتوانند از Stable Diffusion به عنوان یک ابزار قدرتمند برای شروع، تکمیل یا الهام گرفتن در آثار خود استفاده کنند.
جمعبندی
Stable Diffusion فقط یک ابزار تولید تصویر نیست؛ یک پلتفرم خلاقیت متنباز و بینهایت انعطافپذیر است. در این راهنمای استفاده از استیبل دیفیوشن، ما سفری را از مفاهیم تئوریک آغاز کردیم، به نصب و راهاندازی عملی رسیدیم، هنر پرامپتنویسی را آموختیم، تنظیمات کلیدی را بررسی کردیم و با قابلیتهای پیشرفتهای مانند ControlNet و Img2Img آشنا شدیم.
شما اکنون تمام دانش لازم برای شروع خلق آثار شگفتانگیز را در اختیار دارید. به یاد داشته باشید که بهترین پرامپتها برای استیبل دیفیوشن و بهترین نتایج از طریق آزمون و خطا، کنجکاوی و تمرین مداوم به دست میآیند. اکوسیستم Stable Diffusion به سرعت در حال رشد است؛ مدلهای جدید، LoRAها و افزونههای جدید هر روز منتشر میشوند. کنجکاو بمانید و از کاوش در این دنیای جدید لذت ببرید.
این فناوری این قدرت را به شما میدهد که هر آنچه را تصور میکنید، به تصویر بکشید. این یک انقلاب دموکراتیک در دنیای خلاقیت است و شما اکنون بخشی از آن هستید. برای برداشتن گامهای بعدی در دنیای هوش مصنوعی و دیجیتال مارکتینگ و کشف پتانسیلهای نامحدود آن برای کسبوکارتان، میتوانید به منابع تخصصی ما در آژانس دیجیتال مارکتینگ هیجده (hijdah.ir) مراجعه کنید و از مشاوره کارشناسان ما بهرهمند شوید.
بخش پرسشهای متداول (FAQ)
- حداقل سیستم مورد نیاز برای اجرای Stable Diffusion چیست؟
برای یک تجربه قابل قبول، یک کارت گرافیک NVIDIA با حداقل ۶ گیگابایت VRAM (مانند RTX 3060) توصیه میشود. با VRAM کمتر نیز قابل اجراست اما با محدودیت در سرعت و اندازه تصویر. کارتهای AMD نیز با انجام تنظیمات خاصی پشتیبانی میشوند. - آیا استفاده از Stable Diffusion قانونی است؟
بله، خود نرمافزار کاملاً قانونی و متنباز است. با این حال، مسئولیت محتوایی که تولید میکنید (مثلاً تصاویر دارای کپیرایت یا چهره افراد مشهور) بر عهده شماست. همیشه به قوانین کپیرایت و حریم خصوصی احترام بگذارید. - چگونه میتوانم کیفیت تصاویرم را بالاتر ببرم؟
از پرامپتهای دقیق و پرامپت منفی قوی استفاده کنید. از مدلهای (Checkpoints) باکیفیت و تخصصی استفاده کنید. در رابط کاربری، از گزینهHires. Fixبرای افزایش رزولوشن تصویر در حین تولید استفاده کنید یا پس از تولید، تصویر را به تبExtrasفرستاده و با استفاده از الگوریتمهای Upscaler مانندESRGAN_4xیاSwinIRاندازه و کیفیت آن را افزایش دهید. - بهترین وبسایت برای دانلود مدلها و LoRAها کجاست؟
وبسایت Civitai.com اصلیترین و محبوبترین مرجع برای دانلود و به اشتراکگذاری مدلها، LoRAها، و سایر منابع مرتبط با Stable Diffusion است. وبسایت HuggingFace.co نیز میزبان مدلهای رسمی و تحقیقاتی است.
منابع برای مطالعه بیشتر
- Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).
- AUTOMATIC1111/stable-diffusion-webui GitHub Repository: https://github.com/AUTOMATIC1111/stable-diffusion-webui
- Stability AI Official Website: https://stability.ai/