نظرًا لأن Midjourney قد تم تجربته واختباره على نطاق واسع من قبل الجمهور، فقد تم تحديد بعض المشاكل في الصور التي يولدها الذكاء الاصطناعي، بدءًا من شعور الإعجاب إلى حقيقة أن الصور التي يولدها Midjourney تميل عادة إلى أن تكون بنفس الأسلوب، والذي قد تسميه "كريمي" ومتجانس جدًا، وأن Midjourney لا يملك إذا كنت مستخدمًا مجانيًا، فإن صورك ستكون مكشوفة لبقية المجتمع، وإذا كنت مستخدمًا مدفوعًا، فلا يمكنك استبعاد احتمال "سرقة" صورك لأغراض أخرى.
يأتي Stable Diffusion من نظام بيئي مفتوح المصدر، ومع الجمع بين قدرات الإضافات وإبداع المستخدمين، يمكن استكشاف المزيد من سيناريوهات التطبيق. لن تكتفي بمجرد توليد صورة بوصف مثل Midjourney، بل ستتعامل معه كمصمم أسلوب، وهنا تبدأ الأشياء الممتعة والقيمة.
في المجتمع، ستستكشف العديد من النماذج ذات الأساليب العالية، مثل ChilloutMix لأسلوب المانغا اليابانية، وMoXin لأسلوب الحبر الصيني، وحتى نماذج تحاكي وجه نجم سينمائي. يمكنك تحميل هذه النماذج التدريبية لتوليد صور بدرجة تخصيص أعلى. وعندما يتقدم الأمر حقًا إلى مرحلة التوفر التجاري، أعتقد أن تركيز السوق سينتقل من Midjourney إلى Stable Diffusion.
ماذا تحتاج إذا أردت استضافة بيئة Stable Diffusion بنفسك؟
التحضير للأجهزة
1. جهاز كمبيوتر يعمل بنظام ويندوزيفضل جهاز كمبيوتر بنظام ويندوز، قد تواجه أجهزة ماك صعوبات أكثر مع تعريفات بطاقة الرسومات. 2. بطاقة رسومات NV بسعة 6 جيجابايت أو أكثرإذا كنت تريد التدريب، فذاكرة الفيديو يجب أن تكون على الأقل 12 جيجابايت.
3. الذاكرة العشوائية تتجاوز 16 جيجابايتذاكرة 8 جيجابايت مقبولة، لكنها صعبة لتحميل النماذج الممتازة في المجتمع.
1. تثبيت بيئة بايثون أثناء التثبيت، تأكد من تحديد خيار إضافة بايثون إلى PATH.
2. تثبيت بيئة git
3. في نافذة CMD، نفذ الأمر التالي لتحميل stable-diffusiongit clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
4. بدء واجهة stable-diffusion web-uiاستخدم مدير الملفات للعثور على ملف webui-user.bat الذي تم تحميله وقم بتشغيله بدون صلاحيات المسؤول.
5. وفقًا للتعليمات في الخطوة السابقة، افتح عنوان IP، وستظهر واجهة المستخدم– إذا حدث أي خطأ في الخطوات أعلاه، يمكنك طلب مساعدة GPT لحل المشكلة.
تصميم هدف صغير – بضع صور لتدريب نموذج صغير
بعض المفاهيم المهمة التي تحتاج لفهمها

النموذج الرئيسي
– النموذج الرئيسي الذي يؤثر على أسلوب الإخراج، يمكنك استخدام نموذج v1.5 الأصلي في التوضيح
– يمكنك اختيار تحميل نموذج يعجبك من civitai ووضعه في الموقع المحدد …/stable-diffusion-webui/models/Stable-diffusion
كلمة الوصف – أدخل الوصف النصي للصورة التي تريد توليدها، على سبيل المثال، أب صيني متجعد يحمل وعاء أرز، ميزات خاصة
خطوات العينة – بشكل عام، كلما زاد عدد الخطوات، كانت الصورة أكثر دقة، لكن وقت الانتظار أطول. عادةً ما أضبطها بين 20-40.
الطول والعرض – 512×512 هو حجم معقول، إذا كان لديك متطلبات خاصة لنسبة الصورة، يمكنك تعديلها أيضًا
التوليد – اضغط على زر التوليد لتنفيذ العملية، إذا لم تكن راضيًا من المحاولة الأولى، جرب عدة مرات
البذور – إذا وجدت التكوين الحالي جيدًا، يمكنك الاستمرار في استخدام هذه البذرة في التوليد التالي بحفظ الصورة أدناه.

خيارات متقدمة
إضافي – اضغط على هذا المربع لفتح الخيارات الموسعة – يمكن لشدة الفرق زيادة تفاصيل الصورة، إذا شعرت أن الصورة بسيطة جدًا يمكنك زيادة هذه القيمة

إرفاق الأسلوب بالنموذج – اضغط على الزر الأحمر "عرض الشبكات الإضافية" تحت زر التوليد لتوسيع اللوحة الإضافية – يمكن تحميل النماذج المصغرة من civitai، أو يمكنك تدريبها بنفسك.

– الشبكة الفائقة أكثر عمومية، وLoRA أكثر ملاءمة لتوليد الصور الشخصية

– النماذج المصغرة توضع في المجلد المقابل تحت models ويمكن رؤيتها واختيارها

– بعد اختيار "الأسلوب"، ستُضاف معلمات الأسلوب إلى الوصف، والمعلمات التي تليه تمثل التركيز

الإجراءات لتحقيق الهدف الصغير (التدريب)
1. تحضير مجموعة التدريب

– حوالي 20 صورة كافية لتدريب نموذج أسلوب صغير جيد – كبداية، 5 صور بأسلوب محدد تكفي – يجب أن يكون حجم الصور في مجموعة التدريب متطابقًا 2. إنشاء شبكة فائقة – في التدريب، أدخل اسمًا لإنشاء شبكة فائقة

3. معالجة الصور مسبقًا – في هذه الخطوة، سيولد الذكاء الاصطناعي أولاً وصفًا نصيًا بناءً على صورة التدريب. – في الصور المعالجة مسبقًا، املأ عنوان مجلد صور التدريب وعنوان مجلد الصور المعالجة الناتجة. – عدل نسبة أبعاد صور التدريب – إذا لم يكن الحجم متطابقًا، يمكنك استخدام Birme لتعديل حجم الصور دفعة واحدة أولاً. – حدد خيار BLIP واضغط على زر المعالجة المسبقة لتنفيذ المعالجة

–انتظر اكتمال كل صورة تدريبية بجانب ملف txt، النص هو وصف الصورة المقابلة –قد توجد بعض الأخطاء في الأوصاف، يمكنك تعديلها يدويًا – دقة الأوصاف تحدد فعالية التدريب إلى حد ما


4. التدريب –في التدريب، اختر الشبكة الفائقة التي أنشأتها للتو. 2. –أدخل معدل التعلم 0.00005 – في التدريب الأولي، 4 أصفار مناسبة، وفي التدريب اللاحق قلل عدد الأصفار تدريجيًا – أدخل الدليل الذي يحتوي على الوصف النصي والصور –عدل حجم الصورة –اختر 2000 خطوة تكرارية –بشكل عام، يستغرق تدريب 2000 خطوة ساعة واحدة لبطاقة رسومات من سلسلة 10 ونصف ساعة لسلسلة 30 –اضغط على زر تدريب الشبكة الفائقة لبدء التدريب

5. عرض النتائج –بعد بدء التدريب، يمكنك رؤية عملية التدريب في نافذة المعاينة

–بعد التدريب، يمكنك رؤية عملية التدريب في … /stable-diffusion-webui/textual_inversion/date/… يمكنك العثور على نتائج التدريب في مجلد الشبكات الفائقة –في مجلد الصور توجد نتائج عملية التدريب –يمكنك عرض الصور وتحديد أي نتيجة تدريب مناسبة

–في مجلد الشبكات الفائقة، الملفات التي تنتهي باللاحقة .pt هي نماذج أسلوب التدريب – على سبيل المثال، إذا كنت تعتقد أن نتيجة الخطوة 1400 مناسبة، يمكنك نقل ملف pt الخاص بالخطوة 1400 إلى models/hyper networks كأسلوب

–استخدام نتائج التدريب لتوليد الصور –في "txt to img" و "img to img"، اختر الأسلوب الذي دربته للتو وولده. –إذا لم يكن الأسلوب قويًا بما فيه الكفاية، يمكنك زيادة العامل

–استمتع!
أحدث التطورات التي صدرت مؤخرًا وفهمي لها
مؤخرًا قدم Stable Diffusion نموذجًا جديدًا يسمى DeepFloyd IF، والذي يحسن بشكل كبير سلسلة من المشاكل التي كانت تُنتقد في الرسم بالذكاء الاصطناعي. على سبيل المثال، الصور التي يولدها الذكاء الاصطناعي تعاني من علاقات مكانية خاطئة، وشخصيات بأصابع متعددة على أطرافها، وعدم القدرة على حمل علاقات منطقية معقدة. بصراحة، أعتقد أن مستقبل الذكاء الاصطناعي للصور يكمن في جانب المصدر المفتوح والنشر الخاص.
المجتمع البشري متنوع ومختلف على المستوى البصري، والأدوات ذات الأساليب والميول المحددة لا يمكنها تغطية مساحة واسعة. الاختلاف بين البشر في الذوق الجمالي هو اختلاف مجموعات التدريب، ولا يوجد فرق بين البشر والذكاء الاصطناعي، والنشر الخاص للتدريب يضمن استقلالية الذوق، و"الاستقلالية" يمكن أن تعيد درجة أكبر من "التنوع".
مركز حملة Zima
المزيد للقراءة

مواصفات جهاز ZimaCube موضحة: 6 فتحات للأقراص، 4 فتحات NVMe، وموصلان Thunderbolt 4
يشرح هذا التحليل لمعدات ZimaCube كيف تتحول وحدة المعالجة المركزية i3، وذاكرة DDR5، والتخزين ثلاثي الطبقات، واتصال 2.5GbE المزدوج، وThunderbolt 4، وفتحات PCIe، ومرونة...

7 تفاصيل تصميم ذكية في ZimaCube
يخفي ZimaCube تفاصيل ذكية تتجاوز ورقة المواصفات الخاصة به: مسامير نحاسية، لوحة مغناطيسية، جوانب قابلة للتبديل، Thunderbolt 4، مرونة PCIe، ومنفذ USB-C غامض يستحق...

داخل ZimaCube: من فتح العلبة إلى التفكيك
يكشف تفكيك كامل لجهاز ZimaCube عن إمكانية الوصول بدون أدوات، قفص أقراص بسعة 6 فتحات، مسارات ترقية NVMe وDDR5، توسيع PCIe، تصميم المروحة، وإمكانيات...
