أفضل 10 مُنشئات صور الذكاء الاصطناعي في عام 2024

جدول المحتويات

كان عام 2022 عامًا اختراقيًا في مجال الشبكات العصبية. ثم ظهر ChatGPT الشهير من Open AI وبالطبع Midjourney، وهو شبكة عصبية لتوليد الصور. بالطبع، كانت هناك مُولِّدات صور من قبل، ولكن لم تظهر شبكة عصبية واحدة مثل هذا المستوى.

أثر هذا الحدث على العديد من الصناعات التي تتطلب الكثير من الأفكار الإبداعية وتدفقًا مستمرًا للصور. الآن، سيكون العالم، بدون مبالغة، لن يكون هو نفسه، وفي الوظائف يمكنك أن تجد متطلبات متزايدة لـ “مهارات الذكاء الاصطناعي” أو “الاستعداد للعمل مع الشبكات العصبية”.

لأنه من أجل الاستمرار في أن تكون متخصصًا مؤهلاً للغاية، تحتاج إلى تعلم أدوات جديدة. اليوم في هذه المقالة سنلقي نظرة على أكثر عشرة مولدات صور شعبية ونتحدث عن مزاياها وعيوبها.

ما هو مُولِّد الصور الذكاء الاصطناعي

مُولِّد الصور الذكاء الاصطناعي، كما هو واضح من الاسم، يقوم بتوليد الصور. من المهم التأكيد على كلمة “يولِّد” لأن بعض الدردشات الذكاء الاصطناعي قد تبحث في الإنترنت عن الصور بدلاً من توليدها، بينما تقوم الشبكات العصبية بتوليد صور جديدة وفريدة.

يمكن ضمان استخدام مثل هذه الصور للأغراض التجارية، ولكن من المهم ملاحظة أن في العديد من البلدان، تُدرَس التشريعات قضايا تنظيم القضايا المتعلقة بالشبكات العصبية. إحدى المسائل الملحة هي ملكية العمل الذي يتم إنشاؤه بواسطة الذكاء الاصطناعي، خاصة عندما تتعلم الشبكة من أعمال الكتاب الموجودة وتولد صورًا استنادًا إليها دون إنشاء أي شيء خاص بها.

العديد من الدردشات النصية للتواصل مع الذكاء الاصطناعي تعمل بالتزامن مع مُولِّدات الصور. على سبيل المثال، يمكن استخدام DALL-E في التواصل مع ChatGPT. في هذه الحالة، سنحدد في المقالة أين يمكن استخدام المُولِّد.

لتوليد الصور، تحتاج الشبكات العصبية إلى محفز. المحفز هو وصف نصي للصورة التي ترغب في الحصول عليها.

نظرًا لأن الذكاء الاصطناعي لا يزال بدائيًا إلى حد ما، يفهم معظم الشبكات العصبية البساطة التقنية بشكل جيد – مجموعات من الرموز الخاصة والكلمات في شكل أوامر، مكتوبة من خلال “؛” مع خصائص العملية. على سبيل المثال، اسم النمط الذي يجب أن تكون عليه الصورة، ونسبها، وإعدادات الكاميرا، والألوان المفضلة، إلخ.

يمكننا التحدث كثيرًا عن المحفزات، ولكن اليوم سنقيم فقط سهولة التواصل مع الشبكة العصبية.

رحلة منتصف الطريق

في عام 2022، بشكل غير متوقع للجميع، تم إصدار رحلة منتصف الطريق، وهي حاليًا أفضل شبكة عصبية لتوليد الصور. في السابق، كانت جميع الشبكات العصبية للعمل مع الفن تقوم فقط بأداء وظائف منفصلة: إضافة كائن إلى صورة أو إزالته، تنسيق الصورة بأنماط مختلفة، شيخوخة الناس في الصور. من ناحية أخرى، رحلة منتصف الطريق هي مستوى جديد؛ مع هذه الشبكة، يمكنك توليد صورة بالكامل من الصفر استنادًا إلى الوصف النصي.

تم إنشاء الصورة أدناه باستخدام الاقتراح “توليد صورة بأسلوب لوحات فان جوخ مع فتاة ترتدي نظارات شمسية”.

القدرات وسهولة الاستخدام

الشبكة العصبية مُحَدَّثة باستمرار، مما يجعل من الصعب تتبع ما يمكن أن تفعله النسخة الحالية من Midjourney. تجري مجتمع نشط من الخبراء من مجالات مختلفة تجارب على قدرات المولد، ويمكنك العثور على العديد من الاقتراحات الجاهزة للعمل أو التوصيات وحتى دورات تدريبية على العمل مع هذه الشبكة عبر الإنترنت.

هذا الوفرة من المعلومات يجعل العمل مع الشبكة العصبية أسهل.

من الجدير بالذكر أنه حتى بدون مجتمع نشط، فإن الشبكة العصبية سهلة جدًا للعمل معها، وموقع المطورين يحتوي على الكثير من المحتوى التعليمي مع أمثلة على الاقتراحات الممكنة، لذا يمكن للمبتدئين أيضًا فهمها.

مناسبة لجميع المهن دون استثناء.

جودة الصورة

يحب Midjourney لجودة الصور المولدة والخيارات الواسعة لضبط الكاميرا ونسب القماش وحتى اللون ونسب الكائن في الفن النهائي.

المشكلة الكامنة في جميع الشبكات العصبية اليوم مع الغرائب والعناصر المتكررة ملائمة أيضًا لـ Midjourney، ولكن مع كل إصدار، يصبح أقل واضحًا.

هناك، بالطبع، أخطاء مثل وجود ثلاثة أرجل على شخص واحد أو عشرة أصابع على يد واحدة.

أدناه، قمنا بتوليد صورة بموجب الاستفسار “توليد شخص بلا مأوى مع كمبيوتر محمول وقطة زنجبيل.” هناك بعض المشاكل مع الأصابع، والقطة ليست زنجبيل لسبب ما. ولكن بشكل عام، الصورة جيدة حتى مع استفسار بسيط وغير دقيق (يفضل Midjourney الوصف الفني-الأوامر ويفهم بشكل سيئ اللغة الطبيعية للإنسان).

الأداء

نظرًا لارتفاع حمل الخادم وتعقيد العمل الذي يتم تنفيذه، يعاني الشبكة العصبية باستمرار من التأخر. هذا شيء يجب قبوله، حيث لا يوجد حاليًا ما يعادل Midjourney من حيث الجودة.

التسعير

في البداية، كان Midjourney يعمل فقط من خلال خادم Discord، وكان لكل مستخدم خمسة وعشرون استفسارًا مجانيًا. ولكن الآن ليس هناك خيار لاستخدام الشبكة العصبية مجانًا على الإطلاق؛ يجب عليك شراء الوصول على الفور.

المزايا والعيوب

الإيجابيات	السلبيات
مجتمع نشط، سهولة التعلم	سمات مميزة في الأسلوب تجعل كتابات Midjourney سهلة التعرف عليها بسهولة
مستوى عالٍ من جودة الصور المولدة	لا يوجد نسخة تجريبية مجانية
إعدادات كاميرا ونسبة واسعة، القدرة على التحكم في كل تفاصيل توليد الشبكة العصبية	تعمل ببطء

ليوناردو الذكاء الاصطناعي

القدرات وسهولة الاستخدام

العمل مع ليوناردو الذكاء الاصطناعي سهل بسبب واجهة الموقع المريحة. إنه يفهم لغة الإنسان ولكن يتصرف بشكل غريب أثناء التوليد. على سبيل المثال، لا يولد أي شيء إضافي: إذا في الأمثلة أعلاه تخمينت الشبكة العصبية، عند توليد شخص بلا مأوى مع قطة ولابتوب، أنه إذا كان الشخص بلا مأوى، فمن المحتمل أن يجلس على الشارع ويبدو وفقًا لذلك، فقد أنشأ ليوناردو الذكاء الاصطناعي شخصًا بلا مأوى مع لابتوب وقطة زنجبيل داخل منزل ردًا على الطلب “توليد شخص بلا مأوى مع لابتوب وقطة زنجبيل.” أدناه بعض النتائج.

لذلك ، للعمل مع هذا الشبكة العصبية ، ستحتاج إلى دراسة الاستفسار بعناية ؛ خلاف ذلك ، سيكون النتيجة غير متوقعة. على سبيل المثال ، تم ذكر قطة زنجبيل في الاستفسار ، ولكن ليوناردو الذكاء الاصطناعي يولد بإصرار كل من قطة زنجبيل وشخص.

جودة الصورة

جودة الصور تترك الكثير للرغب فيه. بالطبع، مع مساعدة تعليمات دقيقة وكلمات مختارة بعناية، يمكنك تحقيق نتيجة طبيعية، ولكن حتى الآن، كل عمل يتبع بوضوح نمطًا واحدًا، وهناك مشاكل في إنشاء الوجوه والملامح.
أدناه صورة تم إنشاؤها باستخدام التعليمة “انشئ لي شخصًا بلا مأوى جالسًا بجوار سلة قمامة في الشارع، مع كمبيوتر محمول في يده. قطة ذات شعر أحمر تجلس بجانبه، على خلفية مدينة كبيرة”.

فقط من خلال تنقية النتيجة إلى الحد الأقصى حصلنا على صورة قابلة للمقارنة مع أمثلة من الشبكات العصبية السابقة. تظهر المشاكل الرئيسية للشبكة العصبية بوضوح هنا: أيدي تشبه النقانق، وجوه مائلة، وسمات، وسخافة الصورة. من المثير للاهتمام أن الشخص ذو الشعر الأحمر مرة أخرى إلى جانب القط.

للمقارنة، دعونا نرى ما سيحدث مع الطلب “توليد صورة بأسلوب لوحات فان جوخ مع فتاة ترتدي نظارات شمسية”.

الأداء

تتم إنشاء الصور في المتوسط خلال عشر ثوانٍ.

التسعير

المزايا والعيوب

المزايا	العيوب
مجاني للاستخدام	جودة صور منخفضة
يولد بالضبط ما تطلبه، دون ابتكار أي شيء “من الرأس”	يولد بالضبط ما تطلبه، دون ابتكار أي شيء “من الرأس”
واجهة مريحة مع إعدادات لحجم الصورة والنسب ومعلمات أخرى	النسخة المجانية لها قيود صارمة على عدد الأجيال في اليوم

الاستنتاج العام

تكافح المولد مع المهام غير المحددة، لكن لديها إمكانات هائلة وقدرات تعلمية. على سبيل المثال، للألعاب، تحتاج إلى لوازم اللعب – صناديق، عملات، نسيج. أظهر صور ليوناردو الذكاء الاصطناعي بالنمط المطلوب، استخدم الحافز بمهارة، وستحصل على نتيجة جيدة جدًا.

الذكاء الاصطناعي العميق

شبكة عصبية بدائية تولد صور بطريقة غريبة. النتيجة تشبه التصاميم التي يقوم بها الأطفال في رياض الأطفال خلال درس الإبداع. يمكنك الضحك على هذا ونسيانه مثل كابوس سيء.

القدرات وسهولة الاستخدام

العمل مع الشبكة العصبية سهل، ولكن تحقيق أي نتيجة جيدة سيتطلب جهودًا هائلة.

جودة الصورة

دعونا نلقي نظرة فقط على الطلب “توليد لي شخص بلا مأوى جالس بجوار سلة قمامة في الشارع، مع حمل جهاز كمبيوتر محمول. القط الأحمر جالس بجواره، على خلفية المدينة الكبيرة.”

المشاكل ليست بسبب طلب غير صحيح. إذا نظرت إلى معرض الصور (غير موصى به في الليل، للنساء الحوامل، والأطفال) على الموقع، يمكنك رؤية أن جميع الصور غير منطقية بنفس القدر.

السرعة

توليد فوري.

التكلفة

النسخة المجانية تسمح بالوصول إلى جميع الميزات الأساسية للشبكة العصبية. الميزات المحددة في النسخة المحترفة مقابل 5 دولارات شهريًا غير معروفة.

المزايا والعيوب

المزايا	العيوب
يمكن أن يكون مضحكًا	جودة صور منخفضة جدًا
	مدفوع جزئيًا

ذكاء اصطناعي Canva

أصدرت كانفا، أداة رائدة لإنشاء الإبداعات في التصميم والعلامات التجارية وغيرها من الصناعات، أداة ذكاء اصطناعي Canva.

الميزات وسهولة الاستخدام

الآن، في النسخة الاحترافية، جنبًا إلى جنب مع أدوات أخرى، ظهر حقل لإدخال نص تلميح في اللوحة اليسرى للموقع عند إنشاء إبداع. يفهم Canva AI اللغة الطبيعية، لذا ليس هناك حاجة لتعلم تلميح للحصول على نتيجة جيدة.

تم تصميم المولد لغرض واحد – لتسريع وتحسين عملية إنشاء محتوى التصميم، مما يجعله مناسبًا حصريًا لهذه الأغراض.

جودة الصورة

قد لا تكون جودة الصورة دائمًا كما هو متوقع، ولكن نظرًا لأن Canva AI تم إصدارها مؤخرًا، فإن هذا أمر يُغتفر. فيما يلي أمثلة على الصور التي تم إنشاؤها بواسطة هذا الذكاء الاصطناعي.

السرعة

الجيل تقريبًا فوري.

التكلفة

يتم تضمين Canva AI في اشتراك PRO في Canva.

المزايا والعيوب

المزايا	العيوب
أداة جيدة للمصممين	مدفوعة
إصدار تجريبي مجاني لمدة شهر متاح

NightCafe

NightCafe هي أداة لها قدرات واسعة جدًا لتوليد الصور. إنها تجمع بين العديد من الشبكات العصبية المتقدمة وتسمح بإنشاء أنماط خاصة بك استنادًا إليها.

القدرات وسهولة الاستخدام

هناك مجتمع كبير حول NightCafe، مما يجعل من السهل طرح أسئلة مثيرة للاهتمام، وطلب المساعدة مع الحوافز، إلخ. يشجع نظام المولد على التماسك من خلال توفير رصيد إضافي عند نشر الصور في المجتمع.

لدى NightCafe واجهة مستخدم سهلة الاستخدام للغاية ونظام توليد، مما يجعله مناسبًا للمبتدئين أيضًا.

جودة الصور

مقارنة جودة الصور مع الشبكات العصبية المتقدمة تعتبر حاليا تحديا. ومع ذلك، يُعتقد أن NightCafe سوف يلحق قريبا بمنافسيه ويوفر منافسة قوية. يحتوي المُولد على كل ما يحتاجه: مجتمع متماسك، عرض فريد من الشبكات العصبية المتعددة ضمن مشروع واحد، نظام لإنشاء الأنماط بشكل مستقل، والقدرة على نشر الاقتراحات على الموقع ليستخدمها الآخرون.

حتى الآن، لا يمكن القول بأن كل شيء سيء. ولكن لتحقيق نتائج جيدة، سيكون من الضروري بالتأكيد دراسة المُولد بعناية والعثور على الطريقة الأكثر فعالية للتفاعل معه.

تم إنشاء الصورة الأولى بمساعدة “إنشاء صورة لي بأسلوب لوحات فان جوخ مع فتاة ترتدي نظارات شمسية”.

إنشاء صورة مع شخص بلا مأوى وكمبيوتر محمول تبين أنه أمر أكثر تحديًا بكثير. على الأرجح ، لا تزال الذكاء الاصطناعي يعاني من فهم اللغة الطبيعية ، على الرغم من ادعاء خلاف ذلك ، وبالتالي الصعوبات. ومع ذلك ، إذا تجاهلنا وجه القط بدلاً من وجه الشخص وأخطاء مماثلة بسبب عدم دقة الاستفسار ، فإن العمل يبدو أكثر من مرضٍ.

الاستفسار الذي تم إدخاله أدناه: “إنشاء شخص بلا مأوى مع كمبيوتر محمول وقط أحمر اللون.”

الجيل الذي يلي: “إنشاء شخص بلا مأوى جالس بجوار سلة قمامة في الشارع، مع كمبيوتر محمول في يده. القط الزنجبيل يجلس بالقرب.”

الأداء

10-15 ثانية.

التسعير

الإصدار المجاني متاح مع قيوده. يتم تقييد عدد الاستخدامات في الإصدار المجاني، ولكن يمكن الحصول على رصيد إضافي (تتم إنشاء الصور بناءً على الرصيد) من خلال نشر الإنشاءات في المجتمع واتخاذ إجراءات أخرى.

المزايا والعيوب

المزايا	العيوب
القدرة على إنشاء ومشاركة أنماطك مع المستخدمين	يتطلب إدخال تعليمة فنية دقيقة، ويفهم اللغة الطبيعية بشكل سيء
إمكانيات واسعة مع عدة نماذج لشبكات عصبية تحت واجهة واحدة	مشاكل في عرض الوجوه والأيدي والتفاصيل الصغيرة
القدرة على الاستخدام مجانًا	يتطلب الإصدار المدفوع للحصول على الوظائف الكاملة

مُنشئ صور Bing

أصدرت مايكروسوفت محرك بحثها مع ChatGPT وبالتالي القدرة على إنشاء صور باستخدام DALL-E.

القدرات وسهولة الاستخدام

كتبنا سابقًا عن DALL-E كأولى في قائمتنا العليا، ونظرًا لأن مُنشئ صور Bing هو نسخة كاملة من هذا المُولّد، فلا حاجة لوصف كل شيء مرة أخرى. يمكن العثور على جميع المعلومات أعلاه.

أدناه صور تم إنشاؤها في مُنشئ صور Bing. لا تختلف عن DALL-E.

فن جاسبر

فن جاسبر هو منتج من نفس الشركة التي أنشأت جاسبر شات. يتم استخدام الأول عند إدخال الطلبات في الدردشة مثل “توليد لي”، أي مثل DALL-E، فهو متكامل تمامًا مع جاسبر شات.

القدرات وسهولة الاستخدام

للأسف، لا يمكننا فحص كيف يعمل جاسبر آرت بشكل مستقل حيث أن النسخة المجانية متاحة فقط بعد إدخال تفاصيل الدفع. في النظرية، يجب أن يتفاعل بشكل جيد بناءً على لغة بشرية بسيطة، ولكن المستخدمون على الإنترنت يشكون من أن الشبكة العصبية لا تفهم بشكل جيد أي صورة يريد الشخص الحصول عليها منه.

جودة الصورة

يشير المستخدمون على الإنترنت إلى أن جودة الصورة حالياً تترك الكثير للرغب. من الظاهر من خلال جاسبر شات، من المحتمل أن مولد الصور سيتحسن قريبًا.

الأداء

الأداء غير معروف.

التسعير

المزايا والعيوب

المزايا	العيوب
بديل لـ ChatGPT مع DALL-E. حاليًا لا يتطابق مع مستوى توليد الصور، ولكن المُولِّد يتطور باستمرار.	الشبكة العصبية لا تفهم ما يُتوقع منها.
فترة تجريبية مجانية لمدة أسبوع.	يتطلب دفعًا.

Starry AI

عند دخول الموقع والتسجيل ، نُقدم أربع خيارات للأجيال: الرسومات والصور والرسوم التوضيحية وإنشاء نمطك الخاص. بشكل عام ، يحتوي الشبكة العصبية على واجهة بسيطة وسهلة الاستخدام للغاية.

القدرات وسهولة الاستخدام

تفضل الشبكة العصبية التعليمات الفنية الدقيقة بدلاً من الكلام الإنساني الطبيعي ، لذا من الصعب التواصل معها بشكل طبيعي. يُلاحظ جميع المشاكل النموذجية مع الشبكات العصبية: عشرة أصابع ، وعناصر متكررة ، وأعين ووجوه غريبة.

عند الطلب “انشاء شخص بلا مأوى يحمل كمبيوتر محمول وقطة زنجبيلية لي” ، حصلنا على هذا:

بشكل مثير للاهتمام، الشخص يحمل كمبيوتر محمول من شركة آبل ويحلق في الهواء. ولكن اللحظة المثيرة للاهتمام: لم تكن هناك مشاكل في تطابق لون الشعر مع القط أو إنشاء وجه قط بدلاً من وجه بشري. ومع ذلك، في بعض الاختلافات، اختفى القط تمامًا.

جودة الصورة

من المرجح أنه إذا غمرت نفسك بعمق في المُولّد، يمكنك تحقيق نتائج جيدة. ومع ذلك، يمكنك إنشاء ما يصل إلى صورتين يوميًا فقط، أو سيتعين عليك شراء حساب PRO.

في طلب أبسط مثل “إنشاء صورة بأسلوب لوحات فان جوخ مع فتاة ترتدي نظارات شمسية”، حصلنا على هذه الصورة:

الأداء

يقوم Starry AI بإنشاء الصور ببطء مقارنة بالمولدات الأخرى – حوالي 30 ثانية. الإصدار الكمبيوتري يعاني بشكل كبير في جميع مراحل العمل: مشاكل في التسجيل، بدء العملية، وتحميل الصور النهائية.

التسعير

تكلفة الحساب الاحترافي هي 9 دولارات شهريًا. تتوفر تطبيقات محمولة لأي أجهزة.

المزايا والعيوب

المزايا	العيوب
تطوير جودة جيدة للأجيال	تشتغل ببطء
واجهة بسيطة مريحة	تتطلب دفع

استوديو الأحلام (انتشار مستقر)

استوديو الأحلام هو واجهة لاستخدام شبكة الدماغ العصبي لتوليد الصور بانتشار مستقر.

القدرات وسهولة الاستخدام

إذا كانت Stable Diffusion عبارة عن شبكة عصبية “ثقيلة” يمكن تثبيتها فقط على جهاز كمبيوتر قوي، فإن Dream Studio تتيح لك استخدام المولد مباشرة على موقعها الإلكتروني البسيط وسهل الاستخدام مع إعدادات النمط وخيارات تنسيق الصور وغيرها.

جودة الصورة

لم نتمكن من التحقق يدويًا من جودة الصورة بسبب صعوبة الوصول إلى هذه الشبكة العصبية. نظرًا لأن هذه واجهة المستخدم وهي في وضع الاختبار، قد تظهر صعوبات مماثلة. ومع ذلك، تبدو معرض الصور المولدة مثيرة للإعجاب.

سرعة العمل

غير معروفة.

التكلفة

في البداية، يحصل المستخدم على مئة رصيد – تقريباً 500 جيل مجاني. هذا المبلغ يكفي لاستكشاف قدرات الموقع بالكامل واتخاذ قرار بشأن شراء الرصيد. 1000 رصيد يكلف فقط 10 دولارات.

المزايا والعيوب

المزايا	العيوب
جودة الصورة الجيدة	مشاكل التسجيل
واجهة سهلة الاستخدام	مدفوع جزئياً

الختام

في العالم، هناك صراع أخلاقي بين مبدعي المحتوى والذكاء الاصطناعي، وتقوم الشركات باستمرار بإدخال قواعد جديدة لاستخدام الذكاء الاصطناعي في عملهم (خاصة فيما يتعلق بمسابقات الدخول، والأعمال الفائزة بالجوائز، إلخ). لا يُعرف كيف سينتهي هذا الصراع الأخلاقي، ولكن القدرة على استخدام المولدات بمهارة وتفكير واعٍ هو مهارة مفيدة ستكون مطلوبة قريبًا لأي وظيفة ذات صلة. المفتاح ليس في إنشاء الصور بشكل ميكانيكي وتمريرها كفن، ولكن في استخدام الذكاء الاصطناعي كأداة لتعزيز كفاءة الشخص الحي.