AI Art

KamurtV · 19 ديسمبر 2022

MaherMatrix قال:
أوك لنعالجها نقطة نقطة:

مرة ثانية استخدام معلومات غير صحيحة للأسف. كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن. البيانات تبع المودلز مثل Stable diffusion كلها متوفرة اوبن سورس وتقدر تبحث فيها. ما فيه اثر لاي شيء منسوخ او مشفر ولو كان موجود فال Lawsuit حتكون موجودة مباشرة.
بغض النظر ال Theory خلف ال Neural Networks موجودة ومدروسة لو تحب تقدر تقرأ عنها وتشوف كيف ال Convolutional neural netwoks ما تحفظ اي شيء من بيانات الصورة بل تصنع منها اثقال فقط. هي أحد مجالات دراستي بالجامعة وتمثيلها من الرسامين عم يصير بشكل جدا خاطئ ويسيء لقضيتهم.

لو تقرأ نتيجة الورقة لح تشوف ان هالدراسة ما توصل للنتيجة اللي تبحث عنها بل تأكد كلامي السابق. هم استخدمو جزء صغير جداً من الداتا تبع Stable diffusion وهذه ما تمثل ال Model النهائي أبدا بل نسخة جداً صغيرة منه:

التدريب بهالورقة تم على 12 مليون صورة فقط. المودل الحقيقي تبع ستيبل ديفيوجن هو 2 مليار صورة. اكثر ب 200 ضعف. الورقة ما اثبتت شيء بالنسبة للموديل نفسه بل نسخة صغيرة جداً منه.
حجم ال Training data جدا مهم لانه كلما كبرته كلما قربت على موديل فيه Bias اقل بكثير. بالتالي ما يعيد صناعة الصور المستخدمة لشرحه الا عن طريق طلب خاص من المستخدم. وطبعاً بهالحالة المستخدم هو اللي يتحمل السرقة الفكرية.
مثل ما شرحت سابقاً بردي عن اخذ قواعد كثيرة من شخص واحد فقط. تحتاج تنوع بشكل كبير حتى توصل لموديل يعمم بشكل صحيح:

ماهكذا تؤكل الكتف.

قولك ان "كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن" ينهي النقاش.

انا اورد لك بحوث cutting edge منشورة منذ ايام فقط، وتقول بالبنط العريض بطريقة لاتقبل التأويل ان برامج الذكاء الاصطناعي تنسخ البيانات التي قامت بدراستها، وبالادلة والميثودولجي الكامل.

لايمكن مع ذلك ان ترفض استخدام نسخ او copy، لأن هذا ماحصل فعلا. مشكلتك الان ليست معي او مع الرسامين، مشكلتك مع مجتمع الباحثين في الذكاء الاصطناعي.

لو كنت مكانك، كنت لأقول:

اوه، لم انتبه لهذه النقطة. يبدو انها صحيحة وvalid criticism، ولكن التقنية مازالت في بداياتها واعتقد انها معضلة ستتخطاها في المستقبل.

لو تقرأ نتيجة الورقة لح تشوف ان هالدراسة ما توصل للنتيجة اللي تبحث عنها بل تأكد كلامي السابق. هم استخدمو جزء صغير جداً من الداتا تبع Stable diffusion وهذه ما تمثل ال Model النهائي أبدا بل نسخة جداً صغيرة منه:

The goal of this study was to evaluate whether diffusion
models are capable of reproducing high-fidelity content
from their training data, and we find that they are.
While typical images from large-scale models do not appear
to contain copied content that was detectable using our feature
extractors, copies do appear to occur often enough that
their presence cannot be safely ignored; Stable Diffusion
images with dataset similarity :5; as depicted in Fig. 7,
account for approximate 1:88% of our random generations.
Note, however, that our search for replication in Stable
Diffusion only covered the 12M images in the LAION
Aesthetics v2 6+ dataset. The model was first trained
on over 2 billion images, before being fine-tuned on the
600M LAION Aesthetics V2 5+ split. The dataset that we
searched in our study is a small subset of this fine-tuning
data, comprising less than 0:6% of the total training data.

أنقر للتوسيع...

حقيقة لا ادري ماهي نقطتك. نتيجة الدراسة توضح بشكل واضح لايحتمل التأويل ان ال diffusion models قادرة على النسخ من البيانات التي تم تدريبها عليه. هم ذكروا بأن المودلز المبنية على بيانات ضخمة لا تبدو بأنها تحتوي على محتويات منسوخة يمكننا اكتشافها بالتقنيات التي نستخدمها ولكن عمليات النسخ تحدث لدرجة لايمكن معها تجاهل وجودها.

مدري مين ينظّر ويخترع فرضيات هنا لاني اعطيت مصادر تثبت وجود موديلز تقدر تصنع موسيقى بس فيه صعوبة اعلى مقارنة بالصور. لو ما تحب تاخذ رايي تقدر تقرا ردود من ريديت:

ومثل ما قلت الموديلز موجودة. تحتاج تنتظر فترة حتى تشوفها تنتشر بشكل اكبر اكيد.

مجددا، dont strawman me بالله عليك.

انا لم اجادلك في وجود موديلز تستطيع صنع موسيقى، هذا ادعاء من جيبك. كل ماقلته هو ان هذه الشركات تقوم باتخاذ جميع اجراءات الحذر في الجانب الموسيقي ببينما يسرقون حقوق الملكية في الجانب البصري. دانس ديفيوشن وهي البرنامج الموسيقي من نفس الشركة صانعة ستابل ديفيوشن يقولون ذلك علانية على موقعهم:

هذا دليل دامغ على ان مايقومون به في الجانب البصري غير اخلاقي وغير قانوني.

المقارنة بمكانها تماماً. الآلات ما تعلّمت تزرع وتحرث بدون ما تبرمجها من تعلّم كيف البشر عملوا هالشيء. حتى لو ما فيه شبكة ذكاء اصطناعي الخوارزميات تمشي على طرق تعاملنا كبشر.

كلامك عن الحقوق الفكرية ما يمس كلامي بل انا أييدها بشكل كبير. الحقوق الفكرية ما تحمي أساليب الرسم وهذه النقطة ان المودلز تتعلم هالشيء بشكل خاص. هذه مقالة عن الموضوع:

A Guide To Copyright Infringement - The Illustrators Guide

What counts as a copyright infringement? What should you do if your work is used without your consent, and how do you deal with artists copying your style?

theillustratorsguide.com

وكووت:

ومثل ما قالوا ما لازم تنسخ او تستلهم من رسام معيّن فقط. لهيك تستخدم AI لتستلهم من اكبر عدد ممكن

لم يتحدث احد عن اساليب الرسم، انت تعود مجددا للstrawman argument.

هذه الشركات استولت على بلايين الصور واللوحات بدون اذن من اصحابها. هذه سرقة يا زميل. لو قامت الشركات بانتاج نفس برامج الرسم بالذكاء الاصطناعي معتمدة بشكل كامل على ملفات بدون حماية فكرية (تماما كما فعلوا في الجانب الموسيقي) لم تكن لترى هذا الرفض الشديد له.

اعتقد ان النقطة بسيطة للغاية، من غير الممكن انك لاتستطيع رؤيتها.

MaherMatrix · 19 ديسمبر 2022

KamurtV قال:
ماهكذا تؤكل الكتف.

قولك ان "كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن" ينهي النقاش.

انا اورد لك بحوث cutting edge منشورة منذ ايام فقط، وتقول بالبنط العريض بطريقة لاتقبل التأويل ان برامج الذكاء الاصطناعي تنسخ البيانات التي قامت بدراستها، وبالادلة والميثودولجي الكامل.

لايمكن مع ذلك ان ترفض استخدام نسخ او copy، لأن هذا ماحصل فعلا. مشكلتك الان ليست معي او مع الرسامين، مشكلتك مع مجتمع الباحثين في الذكاء الاصطناعي.

لو كنت مكانك، كنت لأقول:

اوه، لم انتبه لهذه النقطة. يبدو انها صحيحة وvalid criticism، ولكن التقنية مازالت في بداياتها واعتقد انها معضلة ستتخطاها في المستقبل.

تدري اني اقدر اجيب شخص مع خلفية علمية يثبت ان عقارات كورونا ما لها قيمة والارض مسطحة وما شابه؟ ال Titel ما تثبت شيء بل لازم ندخل بالتفاصيل.
مأخذي مع كلامه انه يستخدم كلمة Copy واللي تعطي تصوّر عند قارئ عادي بان الموديل يحفظ الصورة وينسخها وهذا خاطئ. لفظ اصح واقرب هو reconstruction. حتى الورقة اللي وضعتها تعرّف كلمة تقليد/نسخ قبل ما تستخدمها لان المعنى مهم جداً.

KamurtV قال:
حقيقة لا ادري ماهي نقطتك. نتيجة الدراسة توضح بشكل واضح لايحتمل التأويل ان ال diffusion models قادرة على النسخ من البيانات التي تم تدريبها عليه. هم ذكروا بأن المودلز المبنية على بيانات ضخمة لا تبدو بأنها تحتوي على محتويات منسوخة يمكننا اكتشافها بالتقنيات التي نستخدمها ولكن عمليات النسخ تحدث لدرجة لايمكن معها تجاهل وجودها.

مرة ثانية النقطة هي كمية البيانات وتنوّعها يقلل ال Bias هذا. الدراسة تثبت هالشيء اصلا وهو نقطتي الاصلية. نعم المودلز تقدر تعيد صناعة صور اذا تدرّبها على مجموعة محددة بس نتكلم عن مودلز عامّة جداً. الشيء قلته بكلامي الاول.

KamurtV قال:
مجددا، dont strawman me بالله عليك.

انا لم اجادلك في وجود موديلز تستطيع صنع موسيقى، هذا ادعاء من جيبك. كل ماقلته هو ان هذه الشركات تقوم باتخاذ جميع اجراءات الحذر في الجانب الموسيقي ببينما يسرقون حقوق الملكية في الجانب البصري. دانس ديفيوشن وهي البرنامج الموسيقي من نفس الشركة صانعة ستابل ديفيوشن يقولون ذلك علانية على موقعهم:

هذا دليل دامغ على ان مايقومون به في الجانب البصري غير اخلاقي وغير قانوني.

وين الدليل الدامغ يا رجل. تجيب تويتة لموديل مدرب بشكل خاص ليتفادى الموسيقى الكوبي رايتد وهذا دليل ان كل لموديلز ما تستخدمه ولسبب معين وهو خوفها من الشركات؟
هذه قفزة كبيرة جداً وافتراض هائل من طرفك وطرف صاحب التويتة. هذا موديل واحد فقط والشيء ما يتعمم بهالسهولة.

تعرف ان Stable diffusion يعمل نفس الشيء ويخلي الرسامين ما يشاركوا بالموديل صح؟ هل هذا يجعل كل مودلز الرسم بدون مشاكل؟

KamurtV قال:
لم يتحدث احد عن اساليب الرسم، انت تعود مجددا للstrawman argument.

هذه الشركات استولت على بلايين الصور واللوحات بدون اذن من اصحابها. هذه سرقة يا زميل. لو قامت الشركات بانتاج نفس برامج الرسم بالذكاء الاصطناعي معتمدة بشكل كامل على ملفات بدون حماية فكرية (تماما كما فعلوا في الجانب الموسيقي) لم تكن لترى هذا الرفض الشديد له.

اعتقد ان النقطة بسيطة للغاية، من غير الممكن انك لاتستطيع رؤيتها.

ما في "استيلاء على بلايين الصور بدون اذن". الصور موجودة على الانترنت. الحماية الفكرية ما تمنعك من تحميل صور والنظر لها (الا لو كانت pay-walled). هذا اللي يعمله ال AI. المنع يكون بإعادة صناعتها او نشرها. وهذا ما يحصل (الا بالمودلز السيئة).

KamurtV · 19 ديسمبر 2022

MaherMatrix قال:
تدري اني اقدر اجيب شخص مع خلفية علمية يثبت ان عقارات كورونا ما لها قيمة والارض مسطحة وما شابه؟ ال Titel ما تثبت شيء بل لازم ندخل بالتفاصيل.
مأخذي مع كلامه انه يستخدم كلمة Copy واللي تعطي تصوّر عند قارئ عادي بان الموديل يحفظ الصورة وينسخها وهذا خاطئ. لفظ اصح واقرب هو reconstruction. حتى الورقة اللي وضعتها تعرّف كلمة تقليد/نسخ قبل ما تستخدمها لان المعنى مهم جداً.

لا اعتقد انك تستطيع وضع ابحاث منشورة منذ فترة وجيزة للغاية من قبل باحثين مرموقين ومن جامعات محترمة تعتبر الافضل في العالم تقول ان الارض مسطحة. احترم عقولنا يا صاح.

مأخذك على كلماته يستند على semmantics، ومن غير الممكن تجاهل بحوث منشورة لأن كلمة استعملها باحثون لهم باع في المجال لم تعجبك. هذا ضد الطريقة العلمية جملة وتفصيلا.

نحن ندور الان في دائرة مفرغة، لب النقاش منتهي منذ ردين على الاقل.

انت مؤمن بأن برمجيات الذكاء الاصطناعي لاتقوم بنسخ المصادر التي تدربت عليها. انت مخطئ تماما في ذلك، وقد بينت لك ان احدث البحوث في هذا المجال من قبل مختصين في هذا المجال اثبتت بشكل تجريبي emperical ان النسخ موجود:

بل وقد افاد الباحثان ان دراستهما هذه تكون underestimation لكم النسخ نظرا لوجود احتماليات كبرى لوجود عمليات نسخ لم تستطع تقنياتهم الحالية تحديدها.

أخلاقيا وقانونيا، يبدو من كلامك انك لاترى مشكلا اخلاقيا او قانونيا في كيفية تدريب البرمجيات، وانت مجددا مخطئ هنا لأن عدول شركات الذكاء الاصطناعي عن استخدام نفس طريقة الindiscremenant scraping التي اتبعوها في مجال الرسوم واستخدامهم (على الاقل ستابيليتي وهي كبيرتهم التي علمتهم السحر) فقط للأغاني الغير مقيدة بقوانين حماية فكرية يشي بخوفهم من دور النشر الموسيقية واعترافهم ضمنيا ان مايفعلونه منافٍ للقانون.

شوف، انت متحمس لـour new AI overlords، انا مقدر لذلك ومتفهم له تماما. ولكن من المجحف من قبلك ان تقوم بتصوير مجتمع المبدعين (سواء رسامين، كتاب، موسيقيين الخ) على انهم عاطفيون تقودهم تخوفاتهم من ان يصبحوا عاطلين عن العمل تماما كعاملي مكدونالدز (هذا مثالك)، والحقيقة انه لم يكن احد ليأبه لما تقوم به هذه الشركات لو قامت باحترام خصوصية وحقوق المبدعين بصريا كم احترمت المبدعين سمعيا. اعتقد ان النقطة واضحة وغير قابلة للتأويل. هذا ليس منطقا عاطفيا ابله، او مضادا كارها للتطور والتقنية، بل هو غضب وجيه من عملية سرقة علنية.

I rest my case ياصديقي.

MaherMatrix · 19 ديسمبر 2022

KamurtV قال:
لا اعتقد انك تستطيع وضع ابحاث منشورة منذ فترة وجيزة للغاية من قبل باحثين مرموقين ومن جامعات محترمة تعتبر الافضل في العالم تقول ان الارض مسطحة. احترم عقولنا يا صاح.

لا تخلط بين كلام "باحث" عشوائي والدراسة. الباحث ما عرف كلمة "copy" بينما الدراسة عرفتها. هذا مو اختلاف semantics بل حقائق. مثل ما قلت تستطيع البحث بالسورس كود كاملا ولن تجد اي مثال قريب او بعيد لصور:

stabilityai (Stability AI)

Our vibrant communities consist of experts, leaders and partners across the globe. They are developing cutting-edge open AI models for Image, Language, Audio, Video, 3D and Biology.

huggingface.co

KamurtV قال:
انت مؤمن بأن برمجيات الذكاء الاصطناعي لاتقوم بنسخ المصادر التي تدربت عليها. انت مخطئ تماما في ذلك، وقد بينت لك ان احدث البحوث في هذا المجال من قبل مختصين في هذا المجال اثبتت بشكل تجريبي emperical ان النسخ موجود:

بل وقد افاد الباحثان ان دراستهما هذه تكون underestimation لكم النسخ نظرا لوجود احتماليات كبرى لوجود عمليات نسخ لم تستطع تقنياتهم الحالية تحديدها.

مثل ما ذكرت الدراسة ما تبثت اي شيء متعلق بال Stable diffusion بل جزئية صغيرة جداً. الـ Quotes التالية تثبت حتى ان المسالة مسالة كمية بيانات ومخصوصة بالمودل نفسه مو اكثر:

We observe that the diffusion models trained
on smaller datasets tend to generate images that are copied
from the training data. The amount of replication reduces
as we increase the size of the training set.

أنقر للتوسيع...

Data replication in generative models is not inevitable;
previous studies of GANs have not found it, and our study
of ImageNet LDM did not find any evidence of significant
data replication.

أنقر للتوسيع...

أما احتمالية وجود هالشيء بالموديل الضخم فهو طبعاً وارد لكن حتى يتم اثباته لا يمكن صناعة اي قرار اتجاهه. كل الدراسات تُبقي باب مفتوح لدراسة تالية لها. هالشيء معروف بالمجال

KamurtV قال:
أخلاقيا وقانونيا، يبدو من كلامك انك لاترى مشكلا اخلاقيا او قانونيا في كيفية تدريب البرمجيات، وانت مجددا مخطئ هنا لأن عدول شركات الذكاء الاصطناعي عن استخدام نفس طريقة الindiscremenant scraping التي اتبعوها في مجال الرسوم واستخدامهم (على الاقل ستابيليتي وهي كبيرتهم التي علمتهم السحر) فقط للأغاني الغير مقيدة بقوانين حماية فكرية يشي بخوفهم من دور النشر الموسيقية واعترافهم ضمنيا ان مايفعلونه منافٍ للقانون.

هذا Straw man قوي. اكيد فيه مشاكل قانونية واخلاقية بتدريب البرمجيات بس هذه مو مسألة ابيض واسود ابداً وتقبّلي لهالنقطة مو يعني تقبّلي لكل شيء. موضوع الموسيقى تم الرد عليه.

KamurtV قال:
شوف، انت متحمس لـour new AI overlords، انا مقدر لذلك ومتفهم له تماما. ولكن من المجحف من قبلك ان تقوم بتصوير مجتمع المبدعين (سواء رسامين، كتاب، موسيقيين الخ) على انهم عاطفيون تقودهم تخوفاتهم من ان يصبحوا عاطلين عن العمل تماما كعاملي مكدونالدز (هذا مثالك)، والحقيقة انه لم يكن احد ليأبه لما تقوم به هذه الشركات لو قامت باحترام خصوصية وحقوق المبدعين بصريا كم احترمت المبدعين سمعيا. اعتقد ان النقطة واضحة وغير قابلة للتأويل. هذا ليس منطقا عاطفيا ابله، او مضادا كارها للتطور والتقنية، بل هو غضب وجيه من عملية سرقة علنية.

لا ابدا انا فقط ضد الجهل واسلوب النظر لهالمسألة على السوشال ميديا وصل قمة الجهل حاليا. مع الوقت الشيء بيوصل لمرحلة تكيّف معينة وتقبل مع منع بعض ال Edge cases بكل تأكيد.
التعاطف مع الرسامين ما بيكون بدفشهم من فوق الحافة بل بتشجعيهم على التكيّف. اللي شجع المزارعين ضد الثورة الصناعية كان أسوأ شخص لهم

.......

معظم نقاشات الـ AI Art تنتهي مثل كذا باختلاف تقني للاسف وما تتطور لشيء مثير للاهتمام. الحقيقة فيه كثير اسئلة ضد ال AI Art مثل حصر مصادر الالهام والاختلاف بين الشركات والمشاريع ال open source واثره عالصناعات وما شابه لكن ما نوصلها ابدا ...
بكل الاحوال قلت اللي عندي ونترك الشيء للقراء.

AzureFlame · 20 ديسمبر 2022

شغل AI اللي ما أطيقه لكن بصراحة أريد هذا الشيء. ليش مافي مسلسلات جديدة بهالAesthetics الثمانيني الجميل

.

Netero · 22 ديسمبر 2022

حضارة المايا والاتصال الأول.

صرخة في الفضاء من cosmic entity ضخم.

حاجة مثيرة للاهتمام أشوف كيف الAI يفسر كلامي أو حاجة أتخيلها، متحمس أشوف ال5 سنين الجاية أيش ممكن يصير!

MaherMatrix · 26 ديسمبر 2022

بكتب رد عن تجاربي مع Stable Diffusion

الفترة الماضية كان مصدر تسليتي الأساسي مع كثير تجارب عملتها لاختبار أدواته.

طبعاً بالبداية يلي يتساءل ما هو ال Stable Diffusion (اختصار SD) فهو اسم ل Model مبني على تدريب عملاق على مليارات الصور المُعنونة. اللي يميزه انه Open source بشكل كامل وتقدر تحصل عليه وتستخدمه او تدرّب عليه عكس Midjourney وغيره اللي هم خدمة مغلقة مملوكة لشركات مع Dataset سريّة. مثل أغلب مشاريع ال Open-source فيه وراه مجتمع شغوف كثير وطوّروا كثير أدوات لاستخدامه بشكل مميز.

هذا فيديو سريع لطرق تحميله وتشغيله:

فيه عدة اصدارات ل SD. آخر واحد (من وقت كتابة هالرد) هو 2.1 بس كثير ناس لسه تستخدم 1.4 لان الفرق الاساسي هنا هو ال Tuning. الفريق خلف الموديل الأساسي حاول يقلل إنتاج الموديل غير المقصود للصور الإباحيّة بالنسبة 2.0 بس هالشيء أثر بشكل سلبي على صناعة صور لبشر بشكل عام لهيك حاولوا يصلحوها بالنسبة 2.1 بس البعض لسه يشوف 1.4 الأفضل.

لتشغيل الموديل وصناعة صور تحتاج كرت شاشة قادر بس مو بالضرورة قوي جداً (حد أدنى VRAM هو 4 غيغا). بس لتدريب موديل تحتاج كرت مع VRAM على الاقل 12 غيغا. يُفضّل استخدام كروت انفيديا دعمها أفضل بكثير بسبب CUDA.
لحسن الحظ عندي كرت 3080 12 غيغا فالتدريب كان ممكن عندي.

آخر شغلة بذكرها هي الـ Custom Models. مثل ما ذكرت تقدر تدرّب الموديل الأساسي على مجموعة صور ثانية وتعطيه كلمات خاصة ليعرف يطبّقها. هنا كان دور المجتمع حوله بصناعة كثير موديلات مثيرة للاهتمام. بذكر أكثرها مثير للاهتمام بنظري كانوا Analog Diffusion (للصور القديمة)، Anything 3 (للأنمي)، Inkpunk 3 (لآرت وورك يشبه سايبربانك).

المهم بعد الكلام العام بتكلم عن الاداة نفسها. من أكثر الجوانب اللي فاجأتني مع SD هو كمية المرونة الكبيرة نسبياً اللي تحصلها باستخدامه. تقدر تحدد كثير اشياء وتنقلها بسلاسة بين أدواته.
طبعاً أبسط شيء معروف هو Text to Image. توصف شيء والموديل يصنعه لك. هذه بعض التجارب مع Analog Diffusion:

وهذه تجارب مع موديلات ثانية:

ما حفظت ال Prompts للأسف بس بعضهم دقيق لاوصل لشيء مشابه للي بمخيّلتي وبعضها متروك عام لتجربة الموديل.

بالمجمل أداة Text to Image ممتعة وتقدر توصل لحاجات مثيرة للاهتمام فيها بس هي أقل شيء أثار اهتمامي. الأدوات الثانية شدّتني أكثر هي Image to Image و Inpainting.

اداة Image to Image تستخدم صورة مع ال Prompts لل Input وتقدر تستخدمها جُزئيّاً لتحدد كيف النتيجة حتكون. أداة Inpainting تسمحلك ترسم فوق صورة معيّنة بمكان معيّن. جربت هالشيء على صورتين من اللي انعرضوا فوق:

(إضافة رجل وسمكة مع تغيير جزء من الصورة)

(إضافة سماعات وسيغار)

هالاداة ممتازة وتعطي تحكم هائل للمستخدم. على سبيل المثال كان عندي صورة ببالي لـ (ميكا مخبأة في الكهف نصفها غارق تحت الماء مع فتاة تنظر لها من الجانب) بس صعب توصل شيء معقد مثل هذا لل AI مع تحديد مكان وما شابه. الحل الأفضل كان صناعة البيئة لوحدها عن طريق Text to Image وبعدها استخدام اداة Inpainting لإضافة الميكا والفتاة بعدين:

بعدها فلتر ابسكيلينغ وتنظيف:

نات باد

بالنسبة ل Image to Image فاستخدمتها بطريقتين اساسيتين. أول شيء حاولت حوّل رسمات سابقة لي عملتها من عدة سنوات لتصاميم ثانية او حوّل 3d ل 2d. هذه من الأساليب اللي يقدروا الرسامين يستفيدوا من هالاداة كثير.
مثلا هذا خنجر صممته ثري دي من زمان:

بس تصميمه مبسّط بزيادة. فجربت امرره على Image to image مع موديل سايبربانك وشوف شو بيطلع:

مو افضل التصاميم بالحياة بس مثيرة للاهتمام وممكن استخدامها كمصدر الهام.

الشيء الثاني هو تحويل 3دي ل 2دي. هذا تصميم وجه عملته من زمان:

جربت امرره على موديل الأنمي:

استديوهات الأنمي لازم تبلش تستخدمه xD.

مثال ثاني يتضمن اضافة textures هو هالبيت البسيط المصنوع بالبلندر:

بعد:

هذه الأدوات الأساسية بس بتكلم عن طرق متقدمة أكثر لاستخدامها بالرد اللي بعده.

MaherMatrix · 26 ديسمبر 2022

شيء ذكرته عالسريع هو تدريب الموديل. طبعاً هالشيء يحتاج هاردوير قوي مثل ما ذكرت.
أول تجربة عملتها هو تدريب موديل سايبربانك على صوري. جمعت 12 صورة وجربتهم (طبعاً عدد قليل كثير). النتيجة يقدر يصنع حاجات رهيبة

وتقدر تدمج هالشي مع Inpainting تطلع بحاجات رهيبة xD

بس اللي لاحظته انه كثير ملتزم بالصور التدريبية بسبب قلّتها وان خطوة التدريب عالية عليه. زيادة العدد يعطي الموديل فهم اكثر.

المهم بعد هذا جربت تدريبه على أسلوب رسم معيّن. أخترت يوشيوكي ساداموتو (مصمم شخصيّات ايفانجليون وغيره) بسبب توفّر رسماته بمكان سهل جمعه وهالمرة جرّبت 25 صورة. الصور اللي يصنعها كثير قريب عالأصل بس الشيء اللي أعجبني أكثر كان استخدامه على Image to Image لتحويل رسمات أنمي لشيء يشبه تصاميمه. مثال:

تتحول ل:

تجربة ثانية من موب:

المهم بعد هالشيء جربت اجمع 200 صورة هالمرة من كوفرات ميورا (مؤلف بيرسيرك) وخصوصا الملونة. أظن غلطت هنا باني تركت خطوة التدريب عالية مع هالعدد بس بالمجمل قدر يصنع حاجات متنوعة من text to image:

وطبعاً جربت استخدمه مع Image to image لخليه يرسم غوجو xD

توقفت هنا مع موضوع تدريب الموديل بسبب كمية الوقت المطلوبة لصناعته (حق ميورا اخذ 3 ساعات).

السؤال اللي كان ببالي هنا هو هل اقدر اصنع حاجات محددة اكثر ك Composition. هل اقدر احدد اكثر زوايا وشخصيات وما شابه باستخدام الادوات الحالية.
الجواب هو انه صعب بس ممكن. فيه شي ما ذكرته للآن بس تم اصدار موديل مخصص من SD 2.1 مخصص للعمق. ياخذ عمق الصورة ويبني عليها صورة ثانية ضمن Image to image. ما كثير جربت فيه للآن صراحة بس فيه تجارب رهيبة من الريديت مع الثري دي:

بس الشيء اللي كان ببالي هل اقدر استخدم Image to image العادي لاصنع شيء مثل ستوريبورد قبيح وحوله لصورة نهائية؟ الجواب هو نعم بس تحتاج كثير شغل وذكاء باستخدام الاداة لتوصل لنتيجة جيدة.

هذه أمثلة. طبعاً هذه ما كانت ابداً عملية واحد بل عدّة تحويلات ومئات ال samples لاوصل للنتيجة:

هذه تجربتي الاولى. كنت احاول اصنع رسمة لفامباير مع قمر خلفه واشجار على الاطراف. النتيجة احتاجت تعديلات لان ما قدر يولّد أشجار جيدة فاستخدمت Inpainting لها:

تجربة ثانية كانت بصناعة هاللقطة:

الكومبوزيشن كان معقد عليه فتخلصت من الراس، صنعت البيئة وبعدها أضفته:

اخيرا كنت بدي اجرب حاجة تجريدية وحاجة سريالية اكثر. الصورة التجريدية كانت غريبة لرأس منفصل:

هذه كان فهمها صعب الصراحة يبدو انها معقدة كثير عليه واخذت مئات المحاولات لحصلت شيء أعجبني:

اللوحة السريالية كنت متحير كيف اعملها لان اعطاء كثير تحديد حيكون معاكس لهدفها فتركت حرية كبيرة لل AI مثل تصميم الوحش فيها:

واخيراً اكثر وحدة اعجبتني شخصياً كانت هاللوحة:

استخدمت شوية Inpainting والاضاءة تحتاج بعض التصحيحات بس قدرت تنقل اللي ببالي بشكل رهيب وبدون عشوائية كثيرة

شيء ثاني ذكرته عالسريع هو كيف الكوميونيتي حول SD ناشطة كثير وفيه كثير ادوات تتطور كل يوم. وحدة منها جربته هو Deform. هذا يستخدم SD ليصنع فيديوهات معيّنة. المشكلة العامة مع SD هي العشوائية لهيك تحويل الرسمات لفيديوهات جدا صعب بس تقدر تستخدم هالعشوائية كاسلوب كمان.
تجربتي معه لسه كثير سطحية بس قدرت استخدم الموديل اللي دربته على مصمم ايفانجليون لاصنع فيديو تجريبي غريب لراي ببيئة ثلجية:

الصورة تضل تتغير مع كل فريم بس الشيء يصنع اثر مثير للاهتمام. اقدر اتخيله من الآن مستخدم ل Music videos.

..

هذه كانت التجارب المثيرة للاهتمام بنظري. طبعاً الموديل يتحسن كل يوم وفيه كثير اضافات ما اتكلمت عنها بس اظن الشيء يعطي فكرة كيف مو كله عشوائية بل تقدر تحصل درجات تحكم مختلفة حسب استخدامك له وهذا اكثر شيء متحمسله مع هالتقنية الصراحة (اضافة للفيديوهات بس هذه بعيدة لسا).

Arashi · 27 ديسمبر 2022

بحط لكم اياها كمعلومه او خبر فقط:

الفكره ان الفنانين بدوا يسوون حمله ضد الـAi art، يبون تكون فيه ضوابط انه ما يسرق\يستلهم\يقتبس من اعمال رسامين ومصورين.
يبونه ينتج بطرق أخلاقيه ويشتغل بنفسه.
البعض يقول "طيب انتوا يالرسامين ايضا تستلهمون"، نعم لكن الفرق ان الرسام يرسم من الصفر، الـ Ai ياخذ ويركب ومادري ايش يسوي << هذا كله مب كلامي، هذا شرح الناس.

الحمله مب كبيره وايد بس حبيت اعطي فكره ^^

retha · 27 ديسمبر 2022

تطبيق تعطيه ٨-١٢ صورة لك ويرسمك بمئات الوضعيات والأشكال.

Naif92 · 2 يناير 2023

ترند جديد في AI Art :

Arashi قال:
البعض يقول "طيب انتوا يالرسامين ايضا تستلهمون"، نعم لكن الفرق ان الرسام يرسم من الصفر، الـ Ai ياخذ ويركب ومادري ايش يسوي << هذا كله مب كلامي، هذا شرح الناس.

أتفق مع هذا النقطة ، لو تلاحظون في الفيديو بعض الصور كأنها مشاهد محذوفه من فيلم ماد ماكس (جودتها مبهره بشكل مخيف).

MH MD · 6 يناير 2023

سيفروس سنيب · 6 يناير 2023

MH MD قال:

تدري .. حتى الثورة الزراعية ماجابوا الفلاحين وقالوا لهم معليش امسحوها فوجهنا وتعالوا علموا المكاين كيف تبذر الحب وتروي الزرع

كمية بجاحة ووقاحة مالها حد. إنت الي اخترعتم الـAI ؟ انتم علموه! اما تجوا تقحموا الفنانين إقحام ياخذون دور في هالعملية يعني جد والله مدري وش الي أوقح

السرقة ولا محاولة تلطيفها ؟

MaherMatrix · 6 يناير 2023

MH MD قال:

يعجبني كيف صاحب التويتة افترض انهم عم يعلموا ال AI على ستايل الرسام بدون اي شيء حتى بالرسالة يفترضه (طبعاً ما في اثبات حتى لان الشيء حصل بدون اسم الشركة).
للتوضيح ما استغرب انه شيء ممكن يصير بس حاليا هالموضوع كثير دارج بالسوشال ميديا صار Virtue signal سهل كثير فالحذر أفضل.

أخر شهر تم فتح عدة حملات Gofundme من شركات تستغل قوانين ال Copyright لتحصد مال بهدف توسيع القوانين وبناء على حالة الهلع الحالية كثير رسامين وقعوا فيها مع انها ما حتجيب اي نتائج مع كمية المال المستهدف:

فانصح بالانتباه من ال Grifts لحد ما تهدأ الأجواء.

MH MD · 6 يناير 2023

MaherMatrix قال:
يعجبني كيف صاحب التويتة افترض انهم عم يعلموا ال AI على ستايل الرسام بدون اي شيء حتى بالرسالة يفترضه (طبعاً ما في اثبات حتى لان الشيء حصل بدون اسم الشركة).

على اساس انه مجرد استبدال رسام بالAI حتى لو بستايل رسمات مختلفة عن رسماته هو شي افضل واخلاقي اكثر لول

الشيء ماله تبرير بأي شكل بغض النظر عن موقفك من رسم الAI نفسه بشكل عام.

MaherMatrix · 6 يناير 2023

MH MD قال:
على اساس انه مجرد استبدال رسام بالAI حتى لو بستايل رسمات مختلفة عن رسماته هو شي افضل واخلاقي اكثر لول

الشيء ماله تبرير بأي شكل بغض النظر عن موقفك من رسم الAI نفسه بشكل عام.

طبعاً ما اختلف من هالناحية بس ال Argument هنا مالها علاقة بال AI بل العقود السيئة اللي تستغل الرسامين. عم يتم استخدام هالشيء لل Fear mongering اتجاه شيء ثاني ولهيك عم قول Virtue signal واستغلال ليجيب تفاعل اتجاه قضية ثانية.

Primal · 18 يوليو 2023

MOSU · 18 يوليو 2023

Primal قال:

@Cloud_no_sora

Othmane · 18 يوليو 2023

صناعة Arts عبر الذكاء الاصطناعي صارت اسهل من اي وقت مضى.

Mr.Assassin19 · 25 يوليو 2023

MaherMatrix قال:
شيء ذكرته عالسريع هو تدريب الموديل. طبعاً هالشيء يحتاج هاردوير قوي مثل ما ذكرت.
أول تجربة عملتها هو تدريب موديل سايبربانك على صوري. جمعت 12 صورة وجربتهم (طبعاً عدد قليل كثير). النتيجة يقدر يصنع حاجات رهيبة

وتقدر تدمج هالشي مع Inpainting تطلع بحاجات رهيبة xD

بس اللي لاحظته انه كثير ملتزم بالصور التدريبية بسبب قلّتها وان خطوة التدريب عالية عليه. زيادة العدد يعطي الموديل فهم اكثر.

المهم بعد هذا جربت تدريبه على أسلوب رسم معيّن. أخترت يوشيوكي ساداموتو (مصمم شخصيّات ايفانجليون وغيره) بسبب توفّر رسماته بمكان سهل جمعه وهالمرة جرّبت 25 صورة. الصور اللي يصنعها كثير قريب عالأصل بس الشيء اللي أعجبني أكثر كان استخدامه على Image to Image لتحويل رسمات أنمي لشيء يشبه تصاميمه. مثال:

تتحول ل:

تجربة ثانية من موب:

المهم بعد هالشيء جربت اجمع 200 صورة هالمرة من كوفرات ميورا (مؤلف بيرسيرك) وخصوصا الملونة. أظن غلطت هنا باني تركت خطوة التدريب عالية مع هالعدد بس بالمجمل قدر يصنع حاجات متنوعة من text to image:

وطبعاً جربت استخدمه مع Image to image لخليه يرسم غوجو xD

توقفت هنا مع موضوع تدريب الموديل بسبب كمية الوقت المطلوبة لصناعته (حق ميورا اخذ 3 ساعات).

السؤال اللي كان ببالي هنا هو هل اقدر اصنع حاجات محددة اكثر ك Composition. هل اقدر احدد اكثر زوايا وشخصيات وما شابه باستخدام الادوات الحالية.
الجواب هو انه صعب بس ممكن. فيه شي ما ذكرته للآن بس تم اصدار موديل مخصص من SD 2.1 مخصص للعمق. ياخذ عمق الصورة ويبني عليها صورة ثانية ضمن Image to image. ما كثير جربت فيه للآن صراحة بس فيه تجارب رهيبة من الريديت مع الثري دي:

بس الشيء اللي كان ببالي هل اقدر استخدم Image to image العادي لاصنع شيء مثل ستوريبورد قبيح وحوله لصورة نهائية؟ الجواب هو نعم بس تحتاج كثير شغل وذكاء باستخدام الاداة لتوصل لنتيجة جيدة.

هذه أمثلة. طبعاً هذه ما كانت ابداً عملية واحد بل عدّة تحويلات ومئات ال samples لاوصل للنتيجة:

هذه تجربتي الاولى. كنت احاول اصنع رسمة لفامباير مع قمر خلفه واشجار على الاطراف. النتيجة احتاجت تعديلات لان ما قدر يولّد أشجار جيدة فاستخدمت Inpainting لها:

تجربة ثانية كانت بصناعة هاللقطة:

الكومبوزيشن كان معقد عليه فتخلصت من الراس، صنعت البيئة وبعدها أضفته:

اخيرا كنت بدي اجرب حاجة تجريدية وحاجة سريالية اكثر. الصورة التجريدية كانت غريبة لرأس منفصل:

هذه كان فهمها صعب الصراحة يبدو انها معقدة كثير عليه واخذت مئات المحاولات لحصلت شيء أعجبني:

اللوحة السريالية كنت متحير كيف اعملها لان اعطاء كثير تحديد حيكون معاكس لهدفها فتركت حرية كبيرة لل AI مثل تصميم الوحش فيها:

واخيراً اكثر وحدة اعجبتني شخصياً كانت هاللوحة:

استخدمت شوية Inpainting والاضاءة تحتاج بعض التصحيحات بس قدرت تنقل اللي ببالي بشكل رهيب وبدون عشوائية كثيرة

شيء ثاني ذكرته عالسريع هو كيف الكوميونيتي حول SD ناشطة كثير وفيه كثير ادوات تتطور كل يوم. وحدة منها جربته هو Deform. هذا يستخدم SD ليصنع فيديوهات معيّنة. المشكلة العامة مع SD هي العشوائية لهيك تحويل الرسمات لفيديوهات جدا صعب بس تقدر تستخدم هالعشوائية كاسلوب كمان.
تجربتي معه لسه كثير سطحية بس قدرت استخدم الموديل اللي دربته على مصمم ايفانجليون لاصنع فيديو تجريبي غريب لراي ببيئة ثلجية:

الصورة تضل تتغير مع كل فريم بس الشيء يصنع اثر مثير للاهتمام. اقدر اتخيله من الآن مستخدم ل Music videos.

..

هذه كانت التجارب المثيرة للاهتمام بنظري. طبعاً الموديل يتحسن كل يوم وفيه كثير اضافات ما اتكلمت عنها بس اظن الشيء يعطي فكرة كيف مو كله عشوائية بل تقدر تحصل درجات تحكم مختلفة حسب استخدامك له وهذا اكثر شيء متحمسله مع هالتقنية الصراحة (اضافة للفيديوهات بس هذه بعيدة لسا).

+

MaherMatrix قال:
بكتب رد عن تجاربي مع Stable Diffusion

الفترة الماضية كان مصدر تسليتي الأساسي مع كثير تجارب عملتها لاختبار أدواته.

طبعاً بالبداية يلي يتساءل ما هو ال Stable Diffusion (اختصار SD) فهو اسم ل Model مبني على تدريب عملاق على مليارات الصور المُعنونة. اللي يميزه انه Open source بشكل كامل وتقدر تحصل عليه وتستخدمه او تدرّب عليه عكس Midjourney وغيره اللي هم خدمة مغلقة مملوكة لشركات مع Dataset سريّة. مثل أغلب مشاريع ال Open-source فيه وراه مجتمع شغوف كثير وطوّروا كثير أدوات لاستخدامه بشكل مميز.

هذا فيديو سريع لطرق تحميله وتشغيله:

فيه عدة اصدارات ل SD. آخر واحد (من وقت كتابة هالرد) هو 2.1 بس كثير ناس لسه تستخدم 1.4 لان الفرق الاساسي هنا هو ال Tuning. الفريق خلف الموديل الأساسي حاول يقلل إنتاج الموديل غير المقصود للصور الإباحيّة بالنسبة 2.0 بس هالشيء أثر بشكل سلبي على صناعة صور لبشر بشكل عام لهيك حاولوا يصلحوها بالنسبة 2.1 بس البعض لسه يشوف 1.4 الأفضل.

لتشغيل الموديل وصناعة صور تحتاج كرت شاشة قادر بس مو بالضرورة قوي جداً (حد أدنى VRAM هو 4 غيغا). بس لتدريب موديل تحتاج كرت مع VRAM على الاقل 12 غيغا. يُفضّل استخدام كروت انفيديا دعمها أفضل بكثير بسبب CUDA.
لحسن الحظ عندي كرت 3080 12 غيغا فالتدريب كان ممكن عندي.

آخر شغلة بذكرها هي الـ Custom Models. مثل ما ذكرت تقدر تدرّب الموديل الأساسي على مجموعة صور ثانية وتعطيه كلمات خاصة ليعرف يطبّقها. هنا كان دور المجتمع حوله بصناعة كثير موديلات مثيرة للاهتمام. بذكر أكثرها مثير للاهتمام بنظري كانوا Analog Diffusion (للصور القديمة)، Anything 3 (للأنمي)، Inkpunk 3 (لآرت وورك يشبه سايبربانك).

المهم بعد الكلام العام بتكلم عن الاداة نفسها. من أكثر الجوانب اللي فاجأتني مع SD هو كمية المرونة الكبيرة نسبياً اللي تحصلها باستخدامه. تقدر تحدد كثير اشياء وتنقلها بسلاسة بين أدواته.
طبعاً أبسط شيء معروف هو Text to Image. توصف شيء والموديل يصنعه لك. هذه بعض التجارب مع Analog Diffusion:

وهذه تجارب مع موديلات ثانية:

ما حفظت ال Prompts للأسف بس بعضهم دقيق لاوصل لشيء مشابه للي بمخيّلتي وبعضها متروك عام لتجربة الموديل.

بالمجمل أداة Text to Image ممتعة وتقدر توصل لحاجات مثيرة للاهتمام فيها بس هي أقل شيء أثار اهتمامي. الأدوات الثانية شدّتني أكثر هي Image to Image و Inpainting.

اداة Image to Image تستخدم صورة مع ال Prompts لل Input وتقدر تستخدمها جُزئيّاً لتحدد كيف النتيجة حتكون. أداة Inpainting تسمحلك ترسم فوق صورة معيّنة بمكان معيّن. جربت هالشيء على صورتين من اللي انعرضوا فوق:

(إضافة رجل وسمكة مع تغيير جزء من الصورة)

(إضافة سماعات وسيغار)

هالاداة ممتازة وتعطي تحكم هائل للمستخدم. على سبيل المثال كان عندي صورة ببالي لـ (ميكا مخبأة في الكهف نصفها غارق تحت الماء مع فتاة تنظر لها من الجانب) بس صعب توصل شيء معقد مثل هذا لل AI مع تحديد مكان وما شابه. الحل الأفضل كان صناعة البيئة لوحدها عن طريق Text to Image وبعدها استخدام اداة Inpainting لإضافة الميكا والفتاة بعدين:

بعدها فلتر ابسكيلينغ وتنظيف:

نات باد

بالنسبة ل Image to Image فاستخدمتها بطريقتين اساسيتين. أول شيء حاولت حوّل رسمات سابقة لي عملتها من عدة سنوات لتصاميم ثانية او حوّل 3d ل 2d. هذه من الأساليب اللي يقدروا الرسامين يستفيدوا من هالاداة كثير.
مثلا هذا خنجر صممته ثري دي من زمان:

بس تصميمه مبسّط بزيادة. فجربت امرره على Image to image مع موديل سايبربانك وشوف شو بيطلع:

مو افضل التصاميم بالحياة بس مثيرة للاهتمام وممكن استخدامها كمصدر الهام.

الشيء الثاني هو تحويل 3دي ل 2دي. هذا تصميم وجه عملته من زمان:

جربت امرره على موديل الأنمي:

استديوهات الأنمي لازم تبلش تستخدمه xD.

مثال ثاني يتضمن اضافة textures هو هالبيت البسيط المصنوع بالبلندر:

بعد:

هذه الأدوات الأساسية بس بتكلم عن طرق متقدمة أكثر لاستخدامها بالرد اللي بعده.

فيه طريقة لحفظ الرد في مفضلة أو ما شابه؟
لي فترة أنوي الغوص بشكل فعلي وتجربة المودلز خصوصًا في مجال صناعة صور شخصيات الأنمي

Invader Zim · 26 يوليو 2023

Mr.Assassin19 قال:
+

فيه طريقة لحفظ الرد في مفضلة أو ما شابه؟
لي فترة أنوي الغوص بشكل فعلي وتجربة المودلز خصوصًا في مجال صناعة صور شخصيات الأنمي

Mr.Assassin19 · 26 يوليو 2023

Invader Zim قال:

يا ساتر
المصيبة الأيقونة أمامي في كل رد ولا شفتها
قبيلة رجال الكهف ترحب بي على ما يبدو
شكرًا لك

Invader Zim · 26 يوليو 2023

Mr.Assassin19 قال:
يا ساتر
المصيبة الأيقونة أمامي في كل رد ولا شفتها
قبيلة رجال الكهف ترحب بي على ما يبدو
شكرًا لك

العفو صاحبي

Arashi · 26 يوليو 2023

AI Art

Gamer

True Gamer

Gamer

True Gamer

Moderator

True Gamer

True Gamer

True Gamer

Dragon of Heaven

from a parallel universe

True Gamer

Moderator

بروفيسور فنون الظلام

True Gamer

Moderator

True Gamer

(￣ー￣)

Another Side Another Story

Deference for Darkness

True Gamer

TG’s Discord owner

True Gamer

TG’s Discord owner

Dragon of Heaven