راهنمای جامع آموزش گام به گام و استفاده ازStable Diffusion | ورود به دنیای هوش مصنوعی در 7 گام

متن پرامپت

مقدمه:

در دنیای شگفت‌انگیز هوش مصنوعی، سال ۲۰۲۲ با ظهور پدیده‌ای به نام Stable Diffusion نقطه عطفی تاریخی را رقم زد. تا پیش از آن، ابزارهای تولید تصویر از متن مانند DALL·E و Midjourney، با وجود قدرت خیره‌کننده، در انحصار شرکت‌های بزرگ و پشت درهای بسته فعالیت می‌کردند.

اما Stable Diffusion این معادله را برای همیشه تغییر داد. این مدل هوش مصنوعی مولد (Generative AI) نه تنها از نظر کیفیت با بهترین‌ها رقابت می‌کند، بلکه به صورت متن‌باز (Open Source) منتشر شد و به میلیون‌ها کاربر، هنرمند، توسعه‌دهنده و کسب‌وکار در سراسر جهان این قدرت را داد که خلاقیت خود را بدون محدودیت و روی کامپیوتر شخصی خودشان به تصویر بکشند.

این مقاله یک راهنمای جامع، کامل و گام‌به‌گام و آموزش و نصب Stable Diffusion برای شماست. فرقی نمی‌کند یک فرد کاملاً مبتدی باشید که تازه نام استیبل دیفیوشن را شنیده، یک هنرمند دیجیتال که به دنبال ابزاری نوین برای خلق اثر است، یا یک مدیر کسب‌وکار که می‌خواهد از پتانسیل AI Image Generation برای رشد برند خود استفاده کند.

ما در این راهنمای +۴۰۰۰ کلمه‌ای، از مبانی نظری و مفاهیم اولیه شروع کرده، به نصب و راه‌اندازی قدم‌به‌قدم می‌پردازیم، هنر پرامپت نویسی در استیبل دیفیوشن را رمزگشایی می‌کنیم و در نهایت، با تکنیک‌های پیشرفته و کاربردهای واقعی، شما را به یک کاربر حرفه‌ای تبدیل خواهیم کرد.

هدف ما این است که پس از مطالعه این مقاله آموزش گام به گام و استفاده ازStable Diffusion، شما نه تنها بتوانید تصاویر خیره‌کننده خلق کنید، بلکه درک عمیقی از این فناوری، پتانسیل‌ها و آینده آن به دست آورید. بیایید سفر خود را به دنیای Latent Diffusion آغاز کنیم.در ادامه به آموزش گام به گام و استفاده ازStable Diffusion میپردازیم

گام اول: درک مفاهیم بنیادی – Stable Diffusion چیست و چگونه کار می‌کند؟

آموزش و نصب Stable Diffusionمدل دیفیوژن (Diffusion Model) به زبان ساده

تصور کنید یک عکس بسیار باکیفیت دارید. حالا در طی مراحل متوالی، مقدار بسیار کمی نویز (مشابه برفک تلویزیون) به آن اضافه می‌کنید. این کار را صدها یا هزاران بار تکرار می‌کنید تا جایی که از تصویر اولیه چیزی جز یک صفحه پر از نویز باقی نماند. این فرآیند “دیفیوژن رو به جلو” (Forward Diffusion) است.حالا، جادوی هوش مصنوعی اینجا اتفاق می‌افتد. مدل دیفیوژن آموزش می‌بیند که فرآیند معکوس را انجام دهد. یعنی یک تصویر کاملاً نویزی را به عنوان ورودی بگیرد و یاد بگیرد که چگونه مرحله به مرحله نویز را از آن حذف کند تا به تصویر اصلی و معنادار برسد. این فرآیند “دیفیوژن معکوس” (Reverse Diffusion) نام دارد.

تفاوت Stable Diffusion: معرفی فضای نهان (Latent Space)

مدل‌های دیفیوژن اولیه این فرآیند حذف نویز را مستقیماً روی پیکسل‌های تصویر انجام می‌دادند که به توان پردازشی بسیار عظیمی (و در نتیجه سخت‌افزار بسیار گران‌قیمت) نیاز داشت. اینجا بود که نوآوری بزرگ Latent Diffusion (که Stable Diffusion بر پایه آن ساخته شده) معرفی شد.

به جای کار روی تصویر با وضوح بالا (مثلاً ۵۱۲x۵۱۲ پیکسل)، این مدل ابتدا تصویر را به یک نسخه بسیار فشرده‌تر و کوچک‌تر در “فضای نهان” (Latent Space) تبدیل می‌کند. این نسخه فشرده، اطلاعات مفهومی تصویر را در خود نگه می‌دارد، نه جزئیات پیکسلی آن را. سپس کل فرآیند دیفیوژن (حذف نویز) در همین فضای نهان کم‌حجم انجام می‌شود. در انتها، نتیجه نهایی از فضای نهان به فضای پیکسلی برگردانده شده و تصویر باکیفیت ساخته می‌شود.

این رویکرد هوشمندانه مصرف منابع را به شدت کاهش داد و باعث شد اجرای مدل روی کارت‌های گرافیک معمولی (Consumer GPUs) ممکن شود. این همان دلیلی است که شما می‌توانید استیبل دیفیوشن روی کامپیوتر شخصی خود اجرا کنید.

چرا Stable Diffusion متن باز است و این چه اهمیتی دارد؟

Stable Diffusion توسط شرکت Stability AI و با همکاری محققان دانشگاه LMU مونیخ و RunwayML توسعه داده شد. برخلاف رقبایش، این مدل به صورت متن‌باز منتشر شد. این یعنی:

دسترسی همگانی: هر کسی می‌تواند کد و مدل را دانلود کرده و به رایگان از آن استفاده کند.
کنترل کامل: شما روی تمام پارامترها و تنظیمات کنترل دارید و محدود به رابط کاربری یک وب‌سایت نیستید.
قابلیت سفارشی‌سازی: جامعه توسعه‌دهندگان می‌تواند مدل‌های جدیدی را بر اساس Stable Diffusion آموزش دهد (که به آن‌ها Checkpoint یا Model گفته می‌شود) و ابزارهای جانبی بی‌نظیری برای آن بسازد.
حفظ حریم خصوصی: وقتی مدل را روی سیستم خود اجرا می‌کنید، داده‌ها و تصاویر شما در سرور هیچ شرکتی ذخیره نمی‌شود.

این ماهیت متن‌باز، یک اکوسیستم خلاق و پویا پیرامون Stable Diffusion ایجاد کرده که هر روز در حال رشد و تکامل است.

گام دوم: انتخاب روش و راه‌اندازی Stable Diffusion

برای استفاده از Stable Diffusion چندین راه پیش روی شماست که هر کدام مزایا و معایب خود را دارند.

روش اول: استفاده از پلتفرم‌های آنلاین (ساده‌ترین راه)

اگر نمی‌خواهید درگیر نصب و تنظیمات فنی شوید یا سیستم قدرتمندی ندارید، پلتفرم‌های آنلاین بهترین گزینه هستند. این سرویس‌ها Stable Diffusion را روی سرورهای قدرتمند خود اجرا کرده و یک رابط کاربری ساده در اختیار شما قرار می‌دهند.

DreamStudio: وب‌سایت رسمی Stability AI که تجربه‌ای ساده و بهینه ارائه می‌دهد.
Hugging Face: این پلتفرم یک نسخه دمو از Stable Diffusion را برای تست سریع ارائه می‌کند.
سایر سرویس‌ها: وب‌سایت‌های زیادی مانند Playground AI یا Mage.space نیز مبتنی بر Stable Diffusion هستند.

مزایا:

بدون نیاز به نصب.
بدون نیاز به سخت‌افزار قوی.
شروع سریع و آسان.

معایب:

معمولاً رایگان نیستند (بر اساس اعتبار یا Credit کار می‌کنند).
کنترل و سفارشی‌سازی محدود.
سرعت ممکن است بسته به ترافیک سرور متغیر باشد.

روش دوم: نصب روی کامپیوتر شخصی (قدرتمندترین راه)

این روش به شما کنترل کامل و دسترسی به تمام قابلیت‌های پیشرفته را می‌دهد. برای این کار شما به یک کارت گرافیک (GPU) مناسب، ترجیحاً از برند NVIDIA با حداقل ۶ گیگابایت VRAM نیاز دارید. هرچه VRAM بیشتر باشد، می‌توانید تصاویر بزرگ‌تر و با سرعت بیشتری تولید کنید.

محبوب‌ترین و کامل‌ترین رابط کاربری برای اجرای استیبل دیفیوشن روی کامپیوتر، AUTOMATIC1111 Stable Diffusion WebUI است. این یک پروژه متن‌باز است که تمام ابزارهای مورد نیاز شما را در یک محیط تحت وب (که به صورت محلی روی سیستم شما اجرا می‌شود) فراهم می‌کند.

راهنمای نصب AUTOMATIC1111 (برای ویندوز با کارت گرافیک NVIDIA):

نصب Python: به وب‌سایت رسمی پایتون رفته و نسخه 3.10.6 را دانلود و نصب کنید. نکته بسیار مهم: در حین نصب، حتماً تیک گزینه Add Python to PATH را بزنید.
نصب Git: به وب‌سایت Git رفته و آن را دانلود و با تنظیمات پیش‌فرض نصب کنید.
کپی کردن ریپازیتوری: یک پوشه در درایو خود بسازید (مثلاً D:\StableDiffusion). سپس در فضای خالی این پوشه راست‌کلیک کرده و Git Bash Here را انتخاب کنید. در پنجره باز شده، دستور زیر را وارد و اجرا کنید:
```
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
```
دانلود مدل پایه (Checkpoint): برای تولید تصویر، به یک مدل پایه نیاز دارید. به صفحه Hugging Face برای Stable Diffusion v1.5 بروید و فایل v1-5-pruned-emaonly.ckpt را دانلود کنید. این فایل را در پوشه زیر قرار دهید:
stable-diffusion-webui\models\Stable-diffusion
اجرای اولیه: به پوشه اصلی stable-diffusion-webui برگردید و فایل webui-user.bat را اجرا کنید. بار اول، برنامه شروع به دانلود و نصب تمام وابستگی‌ها می‌کند. این فرآیند ممکن است بسته به سرعت اینترنت شما زمان‌بر باشد. پس از اتمام، یک آدرس محلی (معمولاً http://127.0.0.1:7860) در پنجره دستور نمایش داده می‌شود. این آدرس را در مرورگر خود باز کنید تا رابط کاربری را مشاهده کنید.

گام سوم: هنر پرامپت‌نویسی (Prompt Engineering) – چگونه با ماشین صحبت کنیم؟

پرامپت (Prompt) دستوری است که شما به مدل می‌دهید تا تصویر مورد نظرتان را خلق کند. کیفیت خروجی شما مستقیماً به کیفیت پرامپت شما بستگی دارد. این بخش، مهم‌ترین مهارت شما در کار با Stable Diffusion خواهد بود.

ساختار یک پرامپت مؤثر

یک پرامپت خوب، ترکیبی از چندین جزء کلیدی است. به جای نوشتن یک جمله ساده، سعی کنید پرامپت خود را مانند یک نقاش که پالت رنگ خود را می‌چیند، بسازید.

موضوع اصلی (Subject): واضح‌ترین و اصلی‌ترین بخش پرامپت. چه چیزی می‌خواهید بکشید؟
- مثال: a majestic lion (یک شیر باشکوه)
جزئیات و توصیفات (Medium & Style): سبک هنری، نوع رسانه (عکس، نقاشی رنگ روغن، دیجیتال آرت)، هنرمند الهام‌بخش، و حال و هوای تصویر.
- مثال: oil painting, in the style of Rembrandt, dramatic lighting (نقاشی رنگ روغن، به سبک رامبراند، نورپردازی دراماتیک)
اطلاعات تکمیلی (Additional Details): جزئیات محیط، لباس، زاویه دوربین، کیفیت و وضوح.
- مثال: sitting on a throne in a dark castle, wearing a golden crown, cinematic shot, 8k, ultra detailed (نشسته بر تختی در یک قلعه تاریک، با تاجی طلایی، نمای سینمایی، ۸کی، جزئیات بسیار بالا)

ترکیب نهایی پرامپت:
a majestic lion, sitting on a throne in a dark castle, wearing a golden crown, oil painting, in the style of Rembrandt, dramatic lighting, cinematic shot, 8k, ultra detailed

پرامپت منفی (Negative Prompt)

به همان اندازه که می‌گویید چه چیزهایی را در تصویر می‌خواهید، گفتن چیزهایی که نمی‌خواهید نیز اهمیت دارد. پرامپت منفی به مدل کمک می‌کند تا از تولید المان‌های ناخواسته، بی‌کیفیت یا دارای اعوجاج خودداری کند.

پرامپت منفی‌های رایج و کاربردی:
ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face

استفاده هوشمندانه از پرامپت منفی یکی از بهترین تنظیمات استیبل دیفیوشن برای افزایش کیفیت خروجی است.

تکنیک‌های پیشرفته پرامپت‌نویسی

وزن‌دهی به کلمات (Word Weighting): اگر می‌خواهید روی کلمه‌ای تأکید بیشتری کنید، آن را داخل پرانتز قرار دهید. برای تأکید بیشتر، از (word:1.2) (افزایش ۱.۲ برابری تأکید) و برای کاهش تأکید از [word] یا (word:0.8) استفاده کنید.
- مثال: a man with a (red:1.3) hat (تأکید روی قرمز بودن کلاه)
ترکیب مفاهیم (Prompt Blending): می‌توانید دو مفهوم را با هم ترکیب کنید.
- مثال: [cat:dog:0.5] این پرامپت در نیمه اول فرآیند روی گربه و در نیمه دوم روی سگ تمرکز می‌کند و نتیجه‌ای ترکیبی ایجاد می‌کند.

گام چهارم: آشنایی با پارامترها و تنظیمات کلیدی

در رابط کاربری AUTOMATIC1111، علاوه بر پرامپت، پارامترهای دیگری وجود دارند که تأثیر شگرفی بر نتیجه نهایی دارند.

Sampling Method (سمپلر): الگوریتمی که برای حذف نویز استفاده می‌شود. هر کدام نتایج کمی متفاوتی تولید می‌کنند. سمپلرهای Euler a, DPM++ 2M Karras و DDIM برای شروع گزینه‌های خوبی هستند و سرعت بالایی دارند. آزمایش کردن سمپلرهای مختلف بخشی از فرآیند یادگیری است.
Sampling Steps (مراحل نمونه‌برداری): تعداد مراحلی که مدل برای حذف نویز طی می‌کند. مقدار بیشتر معمولاً جزئیات بیشتری به تصویر اضافه می‌کند، اما همیشه بهتر نیست. مقادیر بین ۲۰ تا ۳۰ برای اکثر سمپلرها یک نقطه شروع عالی است. مقادیر بسیار بالا (بیش از ۵۰) اغلب بازده نزولی دارد و فقط زمان تولید را افزایش می‌دهد.
CFG Scale (Classifier-Free Guidance Scale): این پارامتر مشخص می‌کند که مدل چقدر باید به پرامپت شما “پایبند” باشد.
- مقدار پایین (۳-۶): به مدل آزادی خلاقانه بیشتری می‌دهد. ممکن است نتیجه دقیقاً مطابق پرامپت شما نباشد اما خلاقانه‌تر است.
- مقدار متوسط (۷-۱۰): بهترین تعادل بین خلاقیت و پایبندی به پرامپت. این محدوده برای اکثر کارها توصیه می‌شود.
- مقدار بالا (۱۱-۱۵): مدل را مجبور می‌کند تا به شدت به پرامپت وفادار بماند. ممکن است باعث ایجاد رنگ‌های اشباع شده و مصنوعات (artifacts) در تصویر شود.
Seed (دانه): هر تصویر تولید شده یک شماره Seed منحصربه‌فرد دارد. این عدد نماینده نویز اولیه‌ای است که تصویر از آن ساخته شده. اگر یک Seed را ثابت نگه دارید و پرامپت را کمی تغییر دهید، ساختار کلی تصویر ثابت باقی می‌ماند و فقط جزئیات تغییر می‌کنند. این برای ایجاد تصاویر مشابه و انجام تنظیمات دقیق بسیار کاربردی است. اگر مقدار Seed را روی -1 قرار دهید، در هر بار اجرا یک Seed تصادفی انتخاب می‌شود.
Width & Height (عرض و ارتفاع): ابعاد تصویر خروجی. مدل‌های پایه Stable Diffusion (مانند v1.5) روی تصاویر ۵۱۲x۵۱۲ پیکسل آموزش دیده‌اند. تولید تصاویر با ابعاد نزدیک به این مقدار (مثلاً ۵۱۲x۷۶۸ برای پرتره) بهترین نتیجه را می‌دهد. برای افزایش کیفیت عکس در استیبل دیفیوشن و تولید تصاویر با رزولوشن بالا، از ابزارهایی مانند Hires. Fix یا upscalerها استفاده کنید که در ادامه توضیح داده می‌شوند.

مقایسه جامع – Stable Diffusion در برابر DALL·E و Midjourney

انتخاب ابزار مناسب به نیاز شما بستگی دارد. در جدول زیر، یک مقایسه بین استیبل دیفیوشن و دالی و میدجرنی انجام داده‌ایم.

ویژگی	Stable Diffusion	Midjourney	DALL·E 3 (via ChatGPT)
سهولت استفاده	دشوار (نیاز به نصب و یادگیری)	متوسط (کار با دستورات دیسکورد)	بسیار آسان (رابط چت)
کیفیت هنری/سبک	بسیار بالا (وابسته به مدل)	بسیار بالا (سبک هنری مشخص و زیبا)	بالا (بسیار خوب در درک زبان)
واقع‌گرایی (Photorealism)	عالی (با مدل‌های تخصصی)	خوب تا عالی	خوب
کنترل و سفارشی‌سازی	کنترل مطلق (متن‌باز، افزونه‌ها)	محدود به پارامترهای دیسکورد	بسیار محدود
هزینه	رایگان (به جز هزینه سخت‌افزار)	اشتراک ماهانه	اشتراک ماهانه (ChatGPT Plus)
سرعت	وابسته به سخت‌افزار شما	بسیار سریع	سریع

چه زمانی از کدام استفاده کنیم؟

Stable Diffusion: اگر به کنترل کامل، سفارشی‌سازی بی‌نهایت، تولید تصویر بدون محدودیت و رایگان (روی سیستم خود) و استفاده از ابزارهای پیشرفته مانند ControlNet نیاز دارید. این انتخاب حرفه‌ای‌هاست.
Midjourney: اگر به دنبال سریع‌ترین راه برای تولید تصاویر هنری بسیار زیبا و با سبکی خاص هستید و کار با دیسکورد برایتان راحت است.
DALL·E 3: اگر مبتدی هستید و می‌خواهید با استفاده از زبان طبیعی و بدون یادگیری پرامپت‌نویسی پیچیده، تصاویری با درک مفهومی بالا از متن تولید کنید.

ورود به دنیای پیشرفته – فراتر از تولید تصویر ساده

مدل‌های سفارشی (Checkpoints) و LoRA

جامعه کاربری Stable Diffusion هزاران مدل سفارشی را آموزش داده و به اشتراک گذاشته است. این مدل‌ها که Checkpoint نام دارند، برای سبک‌های خاصی بهینه‌سازی شده‌اند:

مدل‌های واقع‌گرایانه (Photorealistic): مانند Realistic Vision, Deliberate.
مدل‌های انیمه و کارتونی: مانند Anything V5, MeinaMix.
مدل‌های هنری: برای تقلید از سبک‌های خاص نقاشی یا هنر دیجیتال.

LoRA (Low-Rank Adaptation): فایل‌های کوچکی هستند که می‌توانند به صورت پویا به یک مدل پایه اضافه شوند تا یک کاراکتر، سبک یا مفهوم خاص را به آن یاد بدهند، بدون اینکه نیاز به تغییر کل مدل باشد. مثلاً می‌توانید یک LoRA برای یک شخصیت خاص یا یک سبک لباس خاص پیدا و استفاده کنید.

Image-to-Image (Img2Img)

در این حالت، علاوه بر پرامپت، یک تصویر اولیه هم به مدل می‌دهید. Stable Diffusion آن تصویر را به عنوان راهنما گرفته و بر اساس پرامپت شما آن را بازآفرینی می‌کند. این قابلیت برای تغییر سبک یک عکس، اصلاح بخشی از آن یا افزودن جزئیات جدید فوق‌العاده است.

Inpainting و Outpainting

Inpainting: به شما اجازه می‌دهد بخشی از یک تصویر را با ماسک مشخص کرده و فقط آن قسمت را بر اساس یک پرامپت جدید بازسازی کنید. این برای حذف یک شیء ناخواسته، تغییر لباس یک شخص یا اصلاح چهره عالی است.
Outpainting: به شما امکان می‌دهد بوم تصویر را گسترش داده و از هوش مصنوعی بخواهید که فضاهای خالی اطراف تصویر اصلی را به صورت هماهنگ پر کند.

ControlNet: کنترل مطلق بر خروجی

ControlNet انقلابی در AI Art Generation است. این ابزار به شما اجازه می‌دهد تا با ارائه یک تصویر راهنما (مانند اسکچ، نقشه عمق، خطوط لبه یا ژست انسان)، ترکیب‌بندی، ژست و ساختار کلی تصویر خروجی را به طور دقیق کنترل کنید. برای مثال، می‌توانید ژست دقیق یک فرد را با یک مدل اسکلتی مشخص کرده و از Stable Diffusion بخواهید یک کاراکتر کاملاً متفاوت را دقیقاً در همان ژست خلق کند.

[محل قرارگیری تصویر: مثالی از عملکرد ControlNet. ستون اول یک تصویر ورودی (مثلا یک اسکچ ساده یا یک عکس ژست)، ستون دوم مدل ControlNet (مثلا Canny یا OpenPose) و ستون سوم تصویر خروجی نهایی را نشان می‌دهد.]

کاربردهای عملی و واقعی Stable Diffusion

این فناوری فقط برای سرگرمی نیست. در اینجا چند نمونه از کاربردهای تجاری و حرفه‌ای آن آورده شده است:

بازاریابی و تبلیغات: تولید تصاویر یونیک و خلاقانه برای کمپین‌های دیجیتال، پست‌های شبکه‌های اجتماعی و بنرهای وب‌سایت با کسری از هزینه عکاسی یا خرید عکس استوک.
طراحی محصول و مد: ایده‌پردازی سریع برای طراحی‌های جدید لباس، بسته‌بندی محصولات، یا ظاهر گجت‌ها.
معماری و طراحی داخلی: ایجاد رندرهای مفهومی و سریع از فضاها و ساختمان‌ها برای ارائه اولیه به کارفرما.
تولید محتوا و بازی‌سازی: خلق کاراکترها، محیط‌ها، آیتم‌ها و بافت‌های (textures) مورد نیاز برای بازی‌های ویدیویی و انیمیشن.
هنر دیجیتال: هنرمندان می‌توانند از Stable Diffusion به عنوان یک ابزار قدرتمند برای شروع، تکمیل یا الهام گرفتن در آثار خود استفاده کنند.

جمع‌بندی

Stable Diffusion فقط یک ابزار تولید تصویر نیست؛ یک پلتفرم خلاقیت متن‌باز و بی‌نهایت انعطاف‌پذیر است. در این راهنمای استفاده از استیبل دیفیوشن، ما سفری را از مفاهیم تئوریک آغاز کردیم، به نصب و راه‌اندازی عملی رسیدیم، هنر پرامپت‌نویسی را آموختیم، تنظیمات کلیدی را بررسی کردیم و با قابلیت‌های پیشرفته‌ای مانند ControlNet و Img2Img آشنا شدیم.

شما اکنون تمام دانش لازم برای شروع خلق آثار شگفت‌انگیز را در اختیار دارید. به یاد داشته باشید که بهترین پرامپت‌ها برای استیبل دیفیوشن و بهترین نتایج از طریق آزمون و خطا، کنجکاوی و تمرین مداوم به دست می‌آیند. اکوسیستم Stable Diffusion به سرعت در حال رشد است؛ مدل‌های جدید، LoRAها و افزونه‌های جدید هر روز منتشر می‌شوند. کنجکاو بمانید و از کاوش در این دنیای جدید لذت ببرید.

این فناوری این قدرت را به شما می‌دهد که هر آنچه را تصور می‌کنید، به تصویر بکشید. این یک انقلاب دموکراتیک در دنیای خلاقیت است و شما اکنون بخشی از آن هستید. برای برداشتن گام‌های بعدی در دنیای هوش مصنوعی و دیجیتال مارکتینگ و کشف پتانسیل‌های نامحدود آن برای کسب‌وکارتان، می‌توانید به منابع تخصصی ما در آژانس دیجیتال مارکتینگ هیجده (hijdah.ir) مراجعه کنید و از مشاوره کارشناسان ما بهره‌مند شوید.

بخش پرسش‌های متداول (FAQ)

حداقل سیستم مورد نیاز برای اجرای Stable Diffusion چیست؟
برای یک تجربه قابل قبول، یک کارت گرافیک NVIDIA با حداقل ۶ گیگابایت VRAM (مانند RTX 3060) توصیه می‌شود. با VRAM کمتر نیز قابل اجراست اما با محدودیت در سرعت و اندازه تصویر. کارت‌های AMD نیز با انجام تنظیمات خاصی پشتیبانی می‌شوند.
آیا استفاده از Stable Diffusion قانونی است؟
بله، خود نرم‌افزار کاملاً قانونی و متن‌باز است. با این حال، مسئولیت محتوایی که تولید می‌کنید (مثلاً تصاویر دارای کپی‌رایت یا چهره افراد مشهور) بر عهده شماست. همیشه به قوانین کپی‌رایت و حریم خصوصی احترام بگذارید.
چگونه می‌توانم کیفیت تصاویرم را بالاتر ببرم؟
از پرامپت‌های دقیق و پرامپت منفی قوی استفاده کنید. از مدل‌های (Checkpoints) باکیفیت و تخصصی استفاده کنید. در رابط کاربری، از گزینه Hires. Fix برای افزایش رزولوشن تصویر در حین تولید استفاده کنید یا پس از تولید، تصویر را به تب Extras فرستاده و با استفاده از الگوریتم‌های Upscaler مانند ESRGAN_4x یا SwinIR اندازه و کیفیت آن را افزایش دهید.
بهترین وب‌سایت برای دانلود مدل‌ها و LoRAها کجاست؟
وب‌سایت Civitai.com اصلی‌ترین و محبوب‌ترین مرجع برای دانلود و به اشتراک‌گذاری مدل‌ها، LoRAها، و سایر منابع مرتبط با Stable Diffusion است. وب‌سایت HuggingFace.co نیز میزبان مدل‌های رسمی و تحقیقاتی است.

منابع برای مطالعه بیشتر

Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).
AUTOMATIC1111/stable-diffusion-webui GitHub Repository: https://github.com/AUTOMATIC1111/stable-diffusion-webui
Stability AI Official Website: https://stability.ai/

نحوه استفاده از پرامپت

دستور را کپی کنید و مستقیماً در ChatGPT یا هوش مصنوعی مورد علاقه خود از آن استفاده کنید.
اگر قسمتی داخل {براکت} وجود دارد، آن را با اطلاعات خود جایگزین کنید.
مراحل یا نکات داخل پرامپت را دنبال کنید.

می‌خواهید دستورالعمل‌های هوشمندانه‌تری بنویسید؟

برای دریافت اطلاعات بیشتر و پرامپت های تخصصی برای کسب و کارتان همین حالا با ما تماس بگیرید.