hits counter

AI Art

KamurtV

Gamer
أوك لنعالجها نقطة نقطة:



مرة ثانية استخدام معلومات غير صحيحة للأسف. كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن. البيانات تبع المودلز مثل Stable diffusion كلها متوفرة اوبن سورس وتقدر تبحث فيها. ما فيه اثر لاي شيء منسوخ او مشفر ولو كان موجود فال Lawsuit حتكون موجودة مباشرة.
بغض النظر ال Theory خلف ال Neural Networks موجودة ومدروسة لو تحب تقدر تقرأ عنها وتشوف كيف ال Convolutional neural netwoks ما تحفظ اي شيء من بيانات الصورة بل تصنع منها اثقال فقط. هي أحد مجالات دراستي بالجامعة وتمثيلها من الرسامين عم يصير بشكل جدا خاطئ ويسيء لقضيتهم.



لو تقرأ نتيجة الورقة لح تشوف ان هالدراسة ما توصل للنتيجة اللي تبحث عنها بل تأكد كلامي السابق. هم استخدمو جزء صغير جداً من الداتا تبع Stable diffusion وهذه ما تمثل ال Model النهائي أبدا بل نسخة جداً صغيرة منه:


التدريب بهالورقة تم على 12 مليون صورة فقط. المودل الحقيقي تبع ستيبل ديفيوجن هو 2 مليار صورة. اكثر ب 200 ضعف. الورقة ما اثبتت شيء بالنسبة للموديل نفسه بل نسخة صغيرة جداً منه.
حجم ال Training data جدا مهم لانه كلما كبرته كلما قربت على موديل فيه Bias اقل بكثير. بالتالي ما يعيد صناعة الصور المستخدمة لشرحه الا عن طريق طلب خاص من المستخدم. وطبعاً بهالحالة المستخدم هو اللي يتحمل السرقة الفكرية.
مثل ما شرحت سابقاً بردي عن اخذ قواعد كثيرة من شخص واحد فقط. تحتاج تنوع بشكل كبير حتى توصل لموديل يعمم بشكل صحيح:

ماهكذا تؤكل الكتف.

قولك ان "كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن" ينهي النقاش.

انا اورد لك بحوث cutting edge منشورة منذ ايام فقط، وتقول بالبنط العريض بطريقة لاتقبل التأويل ان برامج الذكاء الاصطناعي تنسخ البيانات التي قامت بدراستها، وبالادلة والميثودولجي الكامل.

لايمكن مع ذلك ان ترفض استخدام نسخ او copy، لأن هذا ماحصل فعلا. مشكلتك الان ليست معي او مع الرسامين، مشكلتك مع مجتمع الباحثين في الذكاء الاصطناعي.

لو كنت مكانك، كنت لأقول:

اوه، لم انتبه لهذه النقطة. يبدو انها صحيحة وvalid criticism، ولكن التقنية مازالت في بداياتها واعتقد انها معضلة ستتخطاها في المستقبل.

لو تقرأ نتيجة الورقة لح تشوف ان هالدراسة ما توصل للنتيجة اللي تبحث عنها بل تأكد كلامي السابق. هم استخدمو جزء صغير جداً من الداتا تبع Stable diffusion وهذه ما تمثل ال Model النهائي أبدا بل نسخة جداً صغيرة منه:
The goal of this study was to evaluate whether diffusion
models are capable of reproducing high-fidelity content
from their training data, and we find that they are.
While typical images from large-scale models do not appear
to contain copied content that was detectable using our feature
extractors
, copies do appear to occur often enough that
their presence cannot be safely ignored; Stable Diffusion
images with dataset similarity :5; as depicted in Fig. 7,
account for approximate 1:88% of our random generations.
Note, however, that our search for replication in Stable
Diffusion only covered the 12M images in the LAION
Aesthetics v2 6+ dataset. The model was first trained
on over 2 billion images
, before being fine-tuned on the
600M LAION Aesthetics V2 5+ split. The dataset that we
searched in our study is a small subset of this fine-tuning
data
, comprising less than 0:6% of the total training data.

حقيقة لا ادري ماهي نقطتك. نتيجة الدراسة توضح بشكل واضح لايحتمل التأويل ان ال diffusion models قادرة على النسخ من البيانات التي تم تدريبها عليه. هم ذكروا بأن المودلز المبنية على بيانات ضخمة لا تبدو بأنها تحتوي على محتويات منسوخة يمكننا اكتشافها بالتقنيات التي نستخدمها ولكن عمليات النسخ تحدث لدرجة لايمكن معها تجاهل وجودها.

مدري مين ينظّر ويخترع فرضيات هنا لاني اعطيت مصادر تثبت وجود موديلز تقدر تصنع موسيقى بس فيه صعوبة اعلى مقارنة بالصور. لو ما تحب تاخذ رايي تقدر تقرا ردود من ريديت:


ومثل ما قلت الموديلز موجودة. تحتاج تنتظر فترة حتى تشوفها تنتشر بشكل اكبر اكيد.

مجددا، dont strawman me بالله عليك.

انا لم اجادلك في وجود موديلز تستطيع صنع موسيقى، هذا ادعاء من جيبك. كل ماقلته هو ان هذه الشركات تقوم باتخاذ جميع اجراءات الحذر في الجانب الموسيقي ببينما يسرقون حقوق الملكية في الجانب البصري. دانس ديفيوشن وهي البرنامج الموسيقي من نفس الشركة صانعة ستابل ديفيوشن يقولون ذلك علانية على موقعهم:


هذا دليل دامغ على ان مايقومون به في الجانب البصري غير اخلاقي وغير قانوني.

المقارنة بمكانها تماماً. الآلات ما تعلّمت تزرع وتحرث بدون ما تبرمجها من تعلّم كيف البشر عملوا هالشيء. حتى لو ما فيه شبكة ذكاء اصطناعي الخوارزميات تمشي على طرق تعاملنا كبشر.

كلامك عن الحقوق الفكرية ما يمس كلامي بل انا أييدها بشكل كبير. الحقوق الفكرية ما تحمي أساليب الرسم وهذه النقطة ان المودلز تتعلم هالشيء بشكل خاص. هذه مقالة عن الموضوع:


وكووت:



ومثل ما قالوا ما لازم تنسخ او تستلهم من رسام معيّن فقط. لهيك تستخدم AI لتستلهم من اكبر عدد ممكن ::raz::

لم يتحدث احد عن اساليب الرسم، انت تعود مجددا للstrawman argument.

هذه الشركات استولت على بلايين الصور واللوحات بدون اذن من اصحابها. هذه سرقة يا زميل. لو قامت الشركات بانتاج نفس برامج الرسم بالذكاء الاصطناعي معتمدة بشكل كامل على ملفات بدون حماية فكرية (تماما كما فعلوا في الجانب الموسيقي) لم تكن لترى هذا الرفض الشديد له.

اعتقد ان النقطة بسيطة للغاية، من غير الممكن انك لاتستطيع رؤيتها.
 

MaherMatrix

True Gamer
ماهكذا تؤكل الكتف.

قولك ان "كلام "الباحث" هذا خاطئ بكل تأكيد أو انه يسيء استخدام كلمة "Copy" بأسوأ شكل ممكن" ينهي النقاش.

انا اورد لك بحوث cutting edge منشورة منذ ايام فقط، وتقول بالبنط العريض بطريقة لاتقبل التأويل ان برامج الذكاء الاصطناعي تنسخ البيانات التي قامت بدراستها، وبالادلة والميثودولجي الكامل.

لايمكن مع ذلك ان ترفض استخدام نسخ او copy، لأن هذا ماحصل فعلا. مشكلتك الان ليست معي او مع الرسامين، مشكلتك مع مجتمع الباحثين في الذكاء الاصطناعي.

لو كنت مكانك، كنت لأقول:

اوه، لم انتبه لهذه النقطة. يبدو انها صحيحة وvalid criticism، ولكن التقنية مازالت في بداياتها واعتقد انها معضلة ستتخطاها في المستقبل.

تدري اني اقدر اجيب شخص مع خلفية علمية يثبت ان عقارات كورونا ما لها قيمة والارض مسطحة وما شابه؟ ال Titel ما تثبت شيء بل لازم ندخل بالتفاصيل.
مأخذي مع كلامه انه يستخدم كلمة Copy واللي تعطي تصوّر عند قارئ عادي بان الموديل يحفظ الصورة وينسخها وهذا خاطئ. لفظ اصح واقرب هو reconstruction. حتى الورقة اللي وضعتها تعرّف كلمة تقليد/نسخ قبل ما تستخدمها لان المعنى مهم جداً.

حقيقة لا ادري ماهي نقطتك. نتيجة الدراسة توضح بشكل واضح لايحتمل التأويل ان ال diffusion models قادرة على النسخ من البيانات التي تم تدريبها عليه. هم ذكروا بأن المودلز المبنية على بيانات ضخمة لا تبدو بأنها تحتوي على محتويات منسوخة يمكننا اكتشافها بالتقنيات التي نستخدمها ولكن عمليات النسخ تحدث لدرجة لايمكن معها تجاهل وجودها.

مرة ثانية النقطة هي كمية البيانات وتنوّعها يقلل ال Bias هذا. الدراسة تثبت هالشيء اصلا وهو نقطتي الاصلية. نعم المودلز تقدر تعيد صناعة صور اذا تدرّبها على مجموعة محددة بس نتكلم عن مودلز عامّة جداً. الشيء قلته بكلامي الاول.

مجددا، dont strawman me بالله عليك.

انا لم اجادلك في وجود موديلز تستطيع صنع موسيقى، هذا ادعاء من جيبك. كل ماقلته هو ان هذه الشركات تقوم باتخاذ جميع اجراءات الحذر في الجانب الموسيقي ببينما يسرقون حقوق الملكية في الجانب البصري. دانس ديفيوشن وهي البرنامج الموسيقي من نفس الشركة صانعة ستابل ديفيوشن يقولون ذلك علانية على موقعهم:


هذا دليل دامغ على ان مايقومون به في الجانب البصري غير اخلاقي وغير قانوني.
وين الدليل الدامغ يا رجل. تجيب تويتة لموديل مدرب بشكل خاص ليتفادى الموسيقى الكوبي رايتد وهذا دليل ان كل لموديلز ما تستخدمه ولسبب معين وهو خوفها من الشركات؟
هذه قفزة كبيرة جداً وافتراض هائل من طرفك وطرف صاحب التويتة. هذا موديل واحد فقط والشيء ما يتعمم بهالسهولة.

تعرف ان Stable diffusion يعمل نفس الشيء ويخلي الرسامين ما يشاركوا بالموديل صح؟ هل هذا يجعل كل مودلز الرسم بدون مشاكل؟



لم يتحدث احد عن اساليب الرسم، انت تعود مجددا للstrawman argument.

هذه الشركات استولت على بلايين الصور واللوحات بدون اذن من اصحابها. هذه سرقة يا زميل. لو قامت الشركات بانتاج نفس برامج الرسم بالذكاء الاصطناعي معتمدة بشكل كامل على ملفات بدون حماية فكرية (تماما كما فعلوا في الجانب الموسيقي) لم تكن لترى هذا الرفض الشديد له.

اعتقد ان النقطة بسيطة للغاية، من غير الممكن انك لاتستطيع رؤيتها.

ما في "استيلاء على بلايين الصور بدون اذن". الصور موجودة على الانترنت. الحماية الفكرية ما تمنعك من تحميل صور والنظر لها (الا لو كانت pay-walled). هذا اللي يعمله ال AI. المنع يكون بإعادة صناعتها او نشرها. وهذا ما يحصل (الا بالمودلز السيئة).
 

KamurtV

Gamer
تدري اني اقدر اجيب شخص مع خلفية علمية يثبت ان عقارات كورونا ما لها قيمة والارض مسطحة وما شابه؟ ال Titel ما تثبت شيء بل لازم ندخل بالتفاصيل.
مأخذي مع كلامه انه يستخدم كلمة Copy واللي تعطي تصوّر عند قارئ عادي بان الموديل يحفظ الصورة وينسخها وهذا خاطئ. لفظ اصح واقرب هو reconstruction. حتى الورقة اللي وضعتها تعرّف كلمة تقليد/نسخ قبل ما تستخدمها لان المعنى مهم جداً.

لا اعتقد انك تستطيع وضع ابحاث منشورة منذ فترة وجيزة للغاية من قبل باحثين مرموقين ومن جامعات محترمة تعتبر الافضل في العالم تقول ان الارض مسطحة. احترم عقولنا يا صاح.

مأخذك على كلماته يستند على semmantics، ومن غير الممكن تجاهل بحوث منشورة لأن كلمة استعملها باحثون لهم باع في المجال لم تعجبك. هذا ضد الطريقة العلمية جملة وتفصيلا.

نحن ندور الان في دائرة مفرغة، لب النقاش منتهي منذ ردين على الاقل.

انت مؤمن بأن برمجيات الذكاء الاصطناعي لاتقوم بنسخ المصادر التي تدربت عليها. انت مخطئ تماما في ذلك، وقد بينت لك ان احدث البحوث في هذا المجال من قبل مختصين في هذا المجال اثبتت بشكل تجريبي emperical ان النسخ موجود:


fvtZ8AI.png


بل وقد افاد الباحثان ان دراستهما هذه تكون underestimation لكم النسخ نظرا لوجود احتماليات كبرى لوجود عمليات نسخ لم تستطع تقنياتهم الحالية تحديدها.

أخلاقيا وقانونيا، يبدو من كلامك انك لاترى مشكلا اخلاقيا او قانونيا في كيفية تدريب البرمجيات، وانت مجددا مخطئ هنا لأن عدول شركات الذكاء الاصطناعي عن استخدام نفس طريقة الindiscremenant scraping التي اتبعوها في مجال الرسوم واستخدامهم (على الاقل ستابيليتي وهي كبيرتهم التي علمتهم السحر) فقط للأغاني الغير مقيدة بقوانين حماية فكرية يشي بخوفهم من دور النشر الموسيقية واعترافهم ضمنيا ان مايفعلونه منافٍ للقانون.

شوف، انت متحمس لـour new AI overlords، انا مقدر لذلك ومتفهم له تماما. ولكن من المجحف من قبلك ان تقوم بتصوير مجتمع المبدعين (سواء رسامين، كتاب، موسيقيين الخ) على انهم عاطفيون تقودهم تخوفاتهم من ان يصبحوا عاطلين عن العمل تماما كعاملي مكدونالدز (هذا مثالك)، والحقيقة انه لم يكن احد ليأبه لما تقوم به هذه الشركات لو قامت باحترام خصوصية وحقوق المبدعين بصريا كم احترمت المبدعين سمعيا. اعتقد ان النقطة واضحة وغير قابلة للتأويل. هذا ليس منطقا عاطفيا ابله، او مضادا كارها للتطور والتقنية، بل هو غضب وجيه من عملية سرقة علنية.

I rest my case ياصديقي.
 

MaherMatrix

True Gamer
لا اعتقد انك تستطيع وضع ابحاث منشورة منذ فترة وجيزة للغاية من قبل باحثين مرموقين ومن جامعات محترمة تعتبر الافضل في العالم تقول ان الارض مسطحة. احترم عقولنا يا صاح.

لا تخلط بين كلام "باحث" عشوائي والدراسة. الباحث ما عرف كلمة "copy" بينما الدراسة عرفتها. هذا مو اختلاف semantics بل حقائق. مثل ما قلت تستطيع البحث بالسورس كود كاملا ولن تجد اي مثال قريب او بعيد لصور:


انت مؤمن بأن برمجيات الذكاء الاصطناعي لاتقوم بنسخ المصادر التي تدربت عليها. انت مخطئ تماما في ذلك، وقد بينت لك ان احدث البحوث في هذا المجال من قبل مختصين في هذا المجال اثبتت بشكل تجريبي emperical ان النسخ موجود:


fvtZ8AI.png


بل وقد افاد الباحثان ان دراستهما هذه تكون underestimation لكم النسخ نظرا لوجود احتماليات كبرى لوجود عمليات نسخ لم تستطع تقنياتهم الحالية تحديدها.

مثل ما ذكرت الدراسة ما تبثت اي شيء متعلق بال Stable diffusion بل جزئية صغيرة جداً. الـ Quotes التالية تثبت حتى ان المسالة مسالة كمية بيانات ومخصوصة بالمودل نفسه مو اكثر:

We observe that the diffusion models trained
on smaller datasets tend to generate images that are copied
from the training data. The amount of replication reduces
as we increase the size of the training set.

Data replication in generative models is not inevitable;
previous studies of GANs have not found it, and our study
of ImageNet LDM did not find any evidence of significant
data replication.

أما احتمالية وجود هالشيء بالموديل الضخم فهو طبعاً وارد لكن حتى يتم اثباته لا يمكن صناعة اي قرار اتجاهه. كل الدراسات تُبقي باب مفتوح لدراسة تالية لها. هالشيء معروف بالمجال

أخلاقيا وقانونيا، يبدو من كلامك انك لاترى مشكلا اخلاقيا او قانونيا في كيفية تدريب البرمجيات، وانت مجددا مخطئ هنا لأن عدول شركات الذكاء الاصطناعي عن استخدام نفس طريقة الindiscremenant scraping التي اتبعوها في مجال الرسوم واستخدامهم (على الاقل ستابيليتي وهي كبيرتهم التي علمتهم السحر) فقط للأغاني الغير مقيدة بقوانين حماية فكرية يشي بخوفهم من دور النشر الموسيقية واعترافهم ضمنيا ان مايفعلونه منافٍ للقانون.

هذا Straw man قوي. اكيد فيه مشاكل قانونية واخلاقية بتدريب البرمجيات بس هذه مو مسألة ابيض واسود ابداً وتقبّلي لهالنقطة مو يعني تقبّلي لكل شيء. موضوع الموسيقى تم الرد عليه.


شوف، انت متحمس لـour new AI overlords، انا مقدر لذلك ومتفهم له تماما. ولكن من المجحف من قبلك ان تقوم بتصوير مجتمع المبدعين (سواء رسامين، كتاب، موسيقيين الخ) على انهم عاطفيون تقودهم تخوفاتهم من ان يصبحوا عاطلين عن العمل تماما كعاملي مكدونالدز (هذا مثالك)، والحقيقة انه لم يكن احد ليأبه لما تقوم به هذه الشركات لو قامت باحترام خصوصية وحقوق المبدعين بصريا كم احترمت المبدعين سمعيا. اعتقد ان النقطة واضحة وغير قابلة للتأويل. هذا ليس منطقا عاطفيا ابله، او مضادا كارها للتطور والتقنية، بل هو غضب وجيه من عملية سرقة علنية.

لا ابدا انا فقط ضد الجهل واسلوب النظر لهالمسألة على السوشال ميديا وصل قمة الجهل حاليا. مع الوقت الشيء بيوصل لمرحلة تكيّف معينة وتقبل مع منع بعض ال Edge cases بكل تأكيد.
التعاطف مع الرسامين ما بيكون بدفشهم من فوق الحافة بل بتشجعيهم على التكيّف. اللي شجع المزارعين ضد الثورة الصناعية كان أسوأ شخص لهم :)

.......

معظم نقاشات الـ AI Art تنتهي مثل كذا باختلاف تقني للاسف وما تتطور لشيء مثير للاهتمام. الحقيقة فيه كثير اسئلة ضد ال AI Art مثل حصر مصادر الالهام والاختلاف بين الشركات والمشاريع ال open source واثره عالصناعات وما شابه لكن ما نوصلها ابدا ...
بكل الاحوال قلت اللي عندي ونترك الشيء للقراء.
 

AzureFlame

Moderator
مشرف


شغل AI اللي ما أطيقه لكن بصراحة أريد هذا الشيء. ليش مافي مسلسلات جديدة بهالAesthetics الثمانيني الجميل :triumph: .
 

Netero

True Gamer
ger.png


حضارة المايا والاتصال الأول.


reg.png



صرخة في الفضاء من cosmic entity ضخم.


حاجة مثيرة للاهتمام أشوف كيف الAI يفسر كلامي أو حاجة أتخيلها، متحمس أشوف ال5 سنين الجاية أيش ممكن يصير!
 

MaherMatrix

True Gamer
بكتب رد عن تجاربي مع Stable Diffusion

الفترة الماضية كان مصدر تسليتي الأساسي مع كثير تجارب عملتها لاختبار أدواته.

طبعاً بالبداية يلي يتساءل ما هو ال Stable Diffusion (اختصار SD) فهو اسم ل Model مبني على تدريب عملاق على مليارات الصور المُعنونة. اللي يميزه انه Open source بشكل كامل وتقدر تحصل عليه وتستخدمه او تدرّب عليه عكس Midjourney وغيره اللي هم خدمة مغلقة مملوكة لشركات مع Dataset سريّة. مثل أغلب مشاريع ال Open-source فيه وراه مجتمع شغوف كثير وطوّروا كثير أدوات لاستخدامه بشكل مميز.

هذا فيديو سريع لطرق تحميله وتشغيله:


فيه عدة اصدارات ل SD. آخر واحد (من وقت كتابة هالرد) هو 2.1 بس كثير ناس لسه تستخدم 1.4 لان الفرق الاساسي هنا هو ال Tuning. الفريق خلف الموديل الأساسي حاول يقلل إنتاج الموديل غير المقصود للصور الإباحيّة بالنسبة 2.0 بس هالشيء أثر بشكل سلبي على صناعة صور لبشر بشكل عام لهيك حاولوا يصلحوها بالنسبة 2.1 بس البعض لسه يشوف 1.4 الأفضل.

لتشغيل الموديل وصناعة صور تحتاج كرت شاشة قادر بس مو بالضرورة قوي جداً (حد أدنى VRAM هو 4 غيغا). بس لتدريب موديل تحتاج كرت مع VRAM على الاقل 12 غيغا. يُفضّل استخدام كروت انفيديا دعمها أفضل بكثير بسبب CUDA.
لحسن الحظ عندي كرت 3080 12 غيغا فالتدريب كان ممكن عندي.

آخر شغلة بذكرها هي الـ Custom Models. مثل ما ذكرت تقدر تدرّب الموديل الأساسي على مجموعة صور ثانية وتعطيه كلمات خاصة ليعرف يطبّقها. هنا كان دور المجتمع حوله بصناعة كثير موديلات مثيرة للاهتمام. بذكر أكثرها مثير للاهتمام بنظري كانوا Analog Diffusion (للصور القديمة)، Anything 3 (للأنمي)، Inkpunk 3 (لآرت وورك يشبه سايبربانك).

المهم بعد الكلام العام بتكلم عن الاداة نفسها. من أكثر الجوانب اللي فاجأتني مع SD هو كمية المرونة الكبيرة نسبياً اللي تحصلها باستخدامه. تقدر تحدد كثير اشياء وتنقلها بسلاسة بين أدواته.
طبعاً أبسط شيء معروف هو Text to Image. توصف شيء والموديل يصنعه لك. هذه بعض التجارب مع Analog Diffusion:

6AE2P2a.png


oG7Mi1F.png


oqOZrEq.png


وهذه تجارب مع موديلات ثانية:

ZMaE1pV.png



5HETyiF.png


I4ps6bd.png



ما حفظت ال Prompts للأسف بس بعضهم دقيق لاوصل لشيء مشابه للي بمخيّلتي وبعضها متروك عام لتجربة الموديل.

بالمجمل أداة Text to Image ممتعة وتقدر توصل لحاجات مثيرة للاهتمام فيها بس هي أقل شيء أثار اهتمامي. الأدوات الثانية شدّتني أكثر هي Image to Image و Inpainting.

اداة Image to Image تستخدم صورة مع ال Prompts لل Input وتقدر تستخدمها جُزئيّاً لتحدد كيف النتيجة حتكون. أداة Inpainting تسمحلك ترسم فوق صورة معيّنة بمكان معيّن. جربت هالشيء على صورتين من اللي انعرضوا فوق:

b5AQGjU.png


(إضافة رجل وسمكة مع تغيير جزء من الصورة)

y5oq0xS.png


(إضافة سماعات وسيغار)


هالاداة ممتازة وتعطي تحكم هائل للمستخدم. على سبيل المثال كان عندي صورة ببالي لـ (ميكا مخبأة في الكهف نصفها غارق تحت الماء مع فتاة تنظر لها من الجانب) بس صعب توصل شيء معقد مثل هذا لل AI مع تحديد مكان وما شابه. الحل الأفضل كان صناعة البيئة لوحدها عن طريق Text to Image وبعدها استخدام اداة Inpainting لإضافة الميكا والفتاة بعدين:
ePjzjR4.png


0pSNV1B.png


jfE5a6Z.png


qJ3Hy9B.png

بعدها فلتر ابسكيلينغ وتنظيف:

7xxxrmy.png


نات باد

بالنسبة ل Image to Image فاستخدمتها بطريقتين اساسيتين. أول شيء حاولت حوّل رسمات سابقة لي عملتها من عدة سنوات لتصاميم ثانية او حوّل 3d ل 2d. هذه من الأساليب اللي يقدروا الرسامين يستفيدوا من هالاداة كثير.
مثلا هذا خنجر صممته ثري دي من زمان:

0mjk2oQ.png


بس تصميمه مبسّط بزيادة. فجربت امرره على Image to image مع موديل سايبربانك وشوف شو بيطلع:

h44zagt.png


73JKiNX.png
d8YZr1B.png


مو افضل التصاميم بالحياة بس مثيرة للاهتمام وممكن استخدامها كمصدر الهام.

الشيء الثاني هو تحويل 3دي ل 2دي. هذا تصميم وجه عملته من زمان:

qTqxe34.png


جربت امرره على موديل الأنمي:

F3ORdbt.png


ZujsqXB.png


استديوهات الأنمي لازم تبلش تستخدمه xD.

مثال ثاني يتضمن اضافة textures هو هالبيت البسيط المصنوع بالبلندر:

GG79zCY.png


بعد:

zqPuU0V.png


هذه الأدوات الأساسية بس بتكلم عن طرق متقدمة أكثر لاستخدامها بالرد اللي بعده.
 
التعديل الأخير:

MaherMatrix

True Gamer
شيء ذكرته عالسريع هو تدريب الموديل. طبعاً هالشيء يحتاج هاردوير قوي مثل ما ذكرت.
أول تجربة عملتها هو تدريب موديل سايبربانك على صوري. جمعت 12 صورة وجربتهم (طبعاً عدد قليل كثير). النتيجة يقدر يصنع حاجات رهيبة

ph2SyeB.png


Y718mMg.png


FZREY4Y.png


nQBP7wL.png

وتقدر تدمج هالشي مع Inpainting تطلع بحاجات رهيبة xD

T4mK7D4.png


بس اللي لاحظته انه كثير ملتزم بالصور التدريبية بسبب قلّتها وان خطوة التدريب عالية عليه. زيادة العدد يعطي الموديل فهم اكثر.

المهم بعد هذا جربت تدريبه على أسلوب رسم معيّن. أخترت يوشيوكي ساداموتو (مصمم شخصيّات ايفانجليون وغيره) بسبب توفّر رسماته بمكان سهل جمعه وهالمرة جرّبت 25 صورة. الصور اللي يصنعها كثير قريب عالأصل بس الشيء اللي أعجبني أكثر كان استخدامه على Image to Image لتحويل رسمات أنمي لشيء يشبه تصاميمه. مثال:

LZH18ik.png


تتحول ل:

OrXBuMs.png


تجربة ثانية من موب:


Sr97obD.jpg



المهم بعد هالشيء جربت اجمع 200 صورة هالمرة من كوفرات ميورا (مؤلف بيرسيرك) وخصوصا الملونة. أظن غلطت هنا باني تركت خطوة التدريب عالية مع هالعدد بس بالمجمل قدر يصنع حاجات متنوعة من text to image:

3j90gsV.png


mgWVjkT.png


JORhvz1.png


hMSRAdb.png


وطبعاً جربت استخدمه مع Image to image لخليه يرسم غوجو xD

OokLGLQ.png


rmdIrve.png


توقفت هنا مع موضوع تدريب الموديل بسبب كمية الوقت المطلوبة لصناعته (حق ميورا اخذ 3 ساعات).

السؤال اللي كان ببالي هنا هو هل اقدر اصنع حاجات محددة اكثر ك Composition. هل اقدر احدد اكثر زوايا وشخصيات وما شابه باستخدام الادوات الحالية.
الجواب هو انه صعب بس ممكن. فيه شي ما ذكرته للآن بس تم اصدار موديل مخصص من SD 2.1 مخصص للعمق. ياخذ عمق الصورة ويبني عليها صورة ثانية ضمن Image to image. ما كثير جربت فيه للآن صراحة بس فيه تجارب رهيبة من الريديت مع الثري دي:


بس الشيء اللي كان ببالي هل اقدر استخدم Image to image العادي لاصنع شيء مثل ستوريبورد قبيح وحوله لصورة نهائية؟ الجواب هو نعم بس تحتاج كثير شغل وذكاء باستخدام الاداة لتوصل لنتيجة جيدة.

هذه أمثلة. طبعاً هذه ما كانت ابداً عملية واحد بل عدّة تحويلات ومئات ال samples لاوصل للنتيجة:
6aqxEj1.png


هذه تجربتي الاولى. كنت احاول اصنع رسمة لفامباير مع قمر خلفه واشجار على الاطراف. النتيجة احتاجت تعديلات لان ما قدر يولّد أشجار جيدة فاستخدمت Inpainting لها:

b5EdysL.png


تجربة ثانية كانت بصناعة هاللقطة:

z5eR4iw.png


الكومبوزيشن كان معقد عليه فتخلصت من الراس، صنعت البيئة وبعدها أضفته:

iMdAGIr.png


اخيرا كنت بدي اجرب حاجة تجريدية وحاجة سريالية اكثر. الصورة التجريدية كانت غريبة لرأس منفصل:

Y1RyZTG.png


هذه كان فهمها صعب الصراحة يبدو انها معقدة كثير عليه واخذت مئات المحاولات لحصلت شيء أعجبني:

OA3befn.png
Mn8lKVT.png
erkEzQI.png


اللوحة السريالية كنت متحير كيف اعملها لان اعطاء كثير تحديد حيكون معاكس لهدفها فتركت حرية كبيرة لل AI مثل تصميم الوحش فيها:

gcL1h3a.png


PRYeCjw.png


واخيراً اكثر وحدة اعجبتني شخصياً كانت هاللوحة:

mDvXj2p.png


uYC5eJq.png


استخدمت شوية Inpainting والاضاءة تحتاج بعض التصحيحات بس قدرت تنقل اللي ببالي بشكل رهيب وبدون عشوائية كثيرة

شيء ثاني ذكرته عالسريع هو كيف الكوميونيتي حول SD ناشطة كثير وفيه كثير ادوات تتطور كل يوم. وحدة منها جربته هو Deform. هذا يستخدم SD ليصنع فيديوهات معيّنة. المشكلة العامة مع SD هي العشوائية لهيك تحويل الرسمات لفيديوهات جدا صعب بس تقدر تستخدم هالعشوائية كاسلوب كمان.
تجربتي معه لسه كثير سطحية بس قدرت استخدم الموديل اللي دربته على مصمم ايفانجليون لاصنع فيديو تجريبي غريب لراي ببيئة ثلجية:

ezgif-4-74a7cecb4b.gif


الصورة تضل تتغير مع كل فريم بس الشيء يصنع اثر مثير للاهتمام. اقدر اتخيله من الآن مستخدم ل Music videos.

..

هذه كانت التجارب المثيرة للاهتمام بنظري. طبعاً الموديل يتحسن كل يوم وفيه كثير اضافات ما اتكلمت عنها بس اظن الشيء يعطي فكرة كيف مو كله عشوائية بل تقدر تحصل درجات تحكم مختلفة حسب استخدامك له وهذا اكثر شيء متحمسله مع هالتقنية الصراحة (اضافة للفيديوهات بس هذه بعيدة لسا).
 
التعديل الأخير:

Arashi

Dragon of Heaven
بحط لكم اياها كمعلومه او خبر فقط:


الفكره ان الفنانين بدوا يسوون حمله ضد الـAi art، يبون تكون فيه ضوابط انه ما يسرق\يستلهم\يقتبس من اعمال رسامين ومصورين.
يبونه ينتج بطرق أخلاقيه ويشتغل بنفسه.
البعض يقول "طيب انتوا يالرسامين ايضا تستلهمون"، نعم لكن الفرق ان الرسام يرسم من الصفر، الـ Ai ياخذ ويركب ومادري ايش يسوي << هذا كله مب كلامي، هذا شرح الناس.

الحمله مب كبيره وايد بس حبيت اعطي فكره ^^
 

retha

from a parallel universe

تطبيق تعطيه ٨-١٢ صورة لك ويرسمك بمئات الوضعيات والأشكال.
 

Naif92

True Gamer
ترند جديد في AI Art :


البعض يقول "طيب انتوا يالرسامين ايضا تستلهمون"، نعم لكن الفرق ان الرسام يرسم من الصفر، الـ Ai ياخذ ويركب ومادري ايش يسوي << هذا كله مب كلامي، هذا شرح الناس.

أتفق مع هذا النقطة ، لو تلاحظون في الفيديو بعض الصور كأنها مشاهد محذوفه من فيلم ماد ماكس (جودتها مبهره بشكل مخيف).
 

سيفروس سنيب

بروفيسور فنون الظلام

تدري .. حتى الثورة الزراعية ماجابوا الفلاحين وقالوا لهم معليش امسحوها فوجهنا وتعالوا علموا المكاين كيف تبذر الحب وتروي الزرع

كمية بجاحة ووقاحة مالها حد. إنت الي اخترعتم الـAI ؟ انتم علموه! اما تجوا تقحموا الفنانين إقحام ياخذون دور في هالعملية يعني جد والله مدري وش الي أوقح

السرقة ولا محاولة تلطيفها ؟
 

MaherMatrix

True Gamer

يعجبني كيف صاحب التويتة افترض انهم عم يعلموا ال AI على ستايل الرسام بدون اي شيء حتى بالرسالة يفترضه (طبعاً ما في اثبات حتى لان الشيء حصل بدون اسم الشركة).
للتوضيح ما استغرب انه شيء ممكن يصير بس حاليا هالموضوع كثير دارج بالسوشال ميديا صار Virtue signal سهل كثير فالحذر أفضل.

أخر شهر تم فتح عدة حملات Gofundme من شركات تستغل قوانين ال Copyright لتحصد مال بهدف توسيع القوانين وبناء على حالة الهلع الحالية كثير رسامين وقعوا فيها مع انها ما حتجيب اي نتائج مع كمية المال المستهدف:


فانصح بالانتباه من ال Grifts لحد ما تهدأ الأجواء.
 

MH MD

Moderator
مشرف
يعجبني كيف صاحب التويتة افترض انهم عم يعلموا ال AI على ستايل الرسام بدون اي شيء حتى بالرسالة يفترضه (طبعاً ما في اثبات حتى لان الشيء حصل بدون اسم الشركة).
على اساس انه مجرد استبدال رسام بالAI حتى لو بستايل رسمات مختلفة عن رسماته هو شي افضل واخلاقي اكثر لول


الشيء ماله تبرير بأي شكل بغض النظر عن موقفك من رسم الAI نفسه بشكل عام.
 

MaherMatrix

True Gamer
على اساس انه مجرد استبدال رسام بالAI حتى لو بستايل رسمات مختلفة عن رسماته هو شي افضل واخلاقي اكثر لول


الشيء ماله تبرير بأي شكل بغض النظر عن موقفك من رسم الAI نفسه بشكل عام.

طبعاً ما اختلف من هالناحية بس ال Argument هنا مالها علاقة بال AI بل العقود السيئة اللي تستغل الرسامين. عم يتم استخدام هالشيء لل Fear mongering اتجاه شيء ثاني ولهيك عم قول Virtue signal واستغلال ليجيب تفاعل اتجاه قضية ثانية.
 

Othmane

Deference for Darkness
qE5MJCo.png


صناعة Arts عبر الذكاء الاصطناعي صارت اسهل من اي وقت مضى.
 

Mr.Assassin19

True Gamer
شيء ذكرته عالسريع هو تدريب الموديل. طبعاً هالشيء يحتاج هاردوير قوي مثل ما ذكرت.
أول تجربة عملتها هو تدريب موديل سايبربانك على صوري. جمعت 12 صورة وجربتهم (طبعاً عدد قليل كثير). النتيجة يقدر يصنع حاجات رهيبة

ph2SyeB.png


Y718mMg.png


FZREY4Y.png


nQBP7wL.png

وتقدر تدمج هالشي مع Inpainting تطلع بحاجات رهيبة xD

T4mK7D4.png


بس اللي لاحظته انه كثير ملتزم بالصور التدريبية بسبب قلّتها وان خطوة التدريب عالية عليه. زيادة العدد يعطي الموديل فهم اكثر.

المهم بعد هذا جربت تدريبه على أسلوب رسم معيّن. أخترت يوشيوكي ساداموتو (مصمم شخصيّات ايفانجليون وغيره) بسبب توفّر رسماته بمكان سهل جمعه وهالمرة جرّبت 25 صورة. الصور اللي يصنعها كثير قريب عالأصل بس الشيء اللي أعجبني أكثر كان استخدامه على Image to Image لتحويل رسمات أنمي لشيء يشبه تصاميمه. مثال:

LZH18ik.png


تتحول ل:

OrXBuMs.png


تجربة ثانية من موب:


Sr97obD.jpg



المهم بعد هالشيء جربت اجمع 200 صورة هالمرة من كوفرات ميورا (مؤلف بيرسيرك) وخصوصا الملونة. أظن غلطت هنا باني تركت خطوة التدريب عالية مع هالعدد بس بالمجمل قدر يصنع حاجات متنوعة من text to image:

3j90gsV.png


mgWVjkT.png


JORhvz1.png


hMSRAdb.png


وطبعاً جربت استخدمه مع Image to image لخليه يرسم غوجو xD

OokLGLQ.png


rmdIrve.png


توقفت هنا مع موضوع تدريب الموديل بسبب كمية الوقت المطلوبة لصناعته (حق ميورا اخذ 3 ساعات).

السؤال اللي كان ببالي هنا هو هل اقدر اصنع حاجات محددة اكثر ك Composition. هل اقدر احدد اكثر زوايا وشخصيات وما شابه باستخدام الادوات الحالية.
الجواب هو انه صعب بس ممكن. فيه شي ما ذكرته للآن بس تم اصدار موديل مخصص من SD 2.1 مخصص للعمق. ياخذ عمق الصورة ويبني عليها صورة ثانية ضمن Image to image. ما كثير جربت فيه للآن صراحة بس فيه تجارب رهيبة من الريديت مع الثري دي:


بس الشيء اللي كان ببالي هل اقدر استخدم Image to image العادي لاصنع شيء مثل ستوريبورد قبيح وحوله لصورة نهائية؟ الجواب هو نعم بس تحتاج كثير شغل وذكاء باستخدام الاداة لتوصل لنتيجة جيدة.

هذه أمثلة. طبعاً هذه ما كانت ابداً عملية واحد بل عدّة تحويلات ومئات ال samples لاوصل للنتيجة:
6aqxEj1.png


هذه تجربتي الاولى. كنت احاول اصنع رسمة لفامباير مع قمر خلفه واشجار على الاطراف. النتيجة احتاجت تعديلات لان ما قدر يولّد أشجار جيدة فاستخدمت Inpainting لها:

b5EdysL.png


تجربة ثانية كانت بصناعة هاللقطة:

z5eR4iw.png


الكومبوزيشن كان معقد عليه فتخلصت من الراس، صنعت البيئة وبعدها أضفته:

iMdAGIr.png


اخيرا كنت بدي اجرب حاجة تجريدية وحاجة سريالية اكثر. الصورة التجريدية كانت غريبة لرأس منفصل:

Y1RyZTG.png


هذه كان فهمها صعب الصراحة يبدو انها معقدة كثير عليه واخذت مئات المحاولات لحصلت شيء أعجبني:

OA3befn.png
Mn8lKVT.png
erkEzQI.png


اللوحة السريالية كنت متحير كيف اعملها لان اعطاء كثير تحديد حيكون معاكس لهدفها فتركت حرية كبيرة لل AI مثل تصميم الوحش فيها:

gcL1h3a.png


PRYeCjw.png


واخيراً اكثر وحدة اعجبتني شخصياً كانت هاللوحة:

mDvXj2p.png


uYC5eJq.png


استخدمت شوية Inpainting والاضاءة تحتاج بعض التصحيحات بس قدرت تنقل اللي ببالي بشكل رهيب وبدون عشوائية كثيرة

شيء ثاني ذكرته عالسريع هو كيف الكوميونيتي حول SD ناشطة كثير وفيه كثير ادوات تتطور كل يوم. وحدة منها جربته هو Deform. هذا يستخدم SD ليصنع فيديوهات معيّنة. المشكلة العامة مع SD هي العشوائية لهيك تحويل الرسمات لفيديوهات جدا صعب بس تقدر تستخدم هالعشوائية كاسلوب كمان.
تجربتي معه لسه كثير سطحية بس قدرت استخدم الموديل اللي دربته على مصمم ايفانجليون لاصنع فيديو تجريبي غريب لراي ببيئة ثلجية:

ezgif-4-74a7cecb4b.gif


الصورة تضل تتغير مع كل فريم بس الشيء يصنع اثر مثير للاهتمام. اقدر اتخيله من الآن مستخدم ل Music videos.

..

هذه كانت التجارب المثيرة للاهتمام بنظري. طبعاً الموديل يتحسن كل يوم وفيه كثير اضافات ما اتكلمت عنها بس اظن الشيء يعطي فكرة كيف مو كله عشوائية بل تقدر تحصل درجات تحكم مختلفة حسب استخدامك له وهذا اكثر شيء متحمسله مع هالتقنية الصراحة (اضافة للفيديوهات بس هذه بعيدة لسا).

+

بكتب رد عن تجاربي مع Stable Diffusion

الفترة الماضية كان مصدر تسليتي الأساسي مع كثير تجارب عملتها لاختبار أدواته.

طبعاً بالبداية يلي يتساءل ما هو ال Stable Diffusion (اختصار SD) فهو اسم ل Model مبني على تدريب عملاق على مليارات الصور المُعنونة. اللي يميزه انه Open source بشكل كامل وتقدر تحصل عليه وتستخدمه او تدرّب عليه عكس Midjourney وغيره اللي هم خدمة مغلقة مملوكة لشركات مع Dataset سريّة. مثل أغلب مشاريع ال Open-source فيه وراه مجتمع شغوف كثير وطوّروا كثير أدوات لاستخدامه بشكل مميز.

هذا فيديو سريع لطرق تحميله وتشغيله:


فيه عدة اصدارات ل SD. آخر واحد (من وقت كتابة هالرد) هو 2.1 بس كثير ناس لسه تستخدم 1.4 لان الفرق الاساسي هنا هو ال Tuning. الفريق خلف الموديل الأساسي حاول يقلل إنتاج الموديل غير المقصود للصور الإباحيّة بالنسبة 2.0 بس هالشيء أثر بشكل سلبي على صناعة صور لبشر بشكل عام لهيك حاولوا يصلحوها بالنسبة 2.1 بس البعض لسه يشوف 1.4 الأفضل.

لتشغيل الموديل وصناعة صور تحتاج كرت شاشة قادر بس مو بالضرورة قوي جداً (حد أدنى VRAM هو 4 غيغا). بس لتدريب موديل تحتاج كرت مع VRAM على الاقل 12 غيغا. يُفضّل استخدام كروت انفيديا دعمها أفضل بكثير بسبب CUDA.
لحسن الحظ عندي كرت 3080 12 غيغا فالتدريب كان ممكن عندي.

آخر شغلة بذكرها هي الـ Custom Models. مثل ما ذكرت تقدر تدرّب الموديل الأساسي على مجموعة صور ثانية وتعطيه كلمات خاصة ليعرف يطبّقها. هنا كان دور المجتمع حوله بصناعة كثير موديلات مثيرة للاهتمام. بذكر أكثرها مثير للاهتمام بنظري كانوا Analog Diffusion (للصور القديمة)، Anything 3 (للأنمي)، Inkpunk 3 (لآرت وورك يشبه سايبربانك).

المهم بعد الكلام العام بتكلم عن الاداة نفسها. من أكثر الجوانب اللي فاجأتني مع SD هو كمية المرونة الكبيرة نسبياً اللي تحصلها باستخدامه. تقدر تحدد كثير اشياء وتنقلها بسلاسة بين أدواته.
طبعاً أبسط شيء معروف هو Text to Image. توصف شيء والموديل يصنعه لك. هذه بعض التجارب مع Analog Diffusion:

6AE2P2a.png


oG7Mi1F.png


oqOZrEq.png


وهذه تجارب مع موديلات ثانية:

ZMaE1pV.png



5HETyiF.png


I4ps6bd.png



ما حفظت ال Prompts للأسف بس بعضهم دقيق لاوصل لشيء مشابه للي بمخيّلتي وبعضها متروك عام لتجربة الموديل.

بالمجمل أداة Text to Image ممتعة وتقدر توصل لحاجات مثيرة للاهتمام فيها بس هي أقل شيء أثار اهتمامي. الأدوات الثانية شدّتني أكثر هي Image to Image و Inpainting.

اداة Image to Image تستخدم صورة مع ال Prompts لل Input وتقدر تستخدمها جُزئيّاً لتحدد كيف النتيجة حتكون. أداة Inpainting تسمحلك ترسم فوق صورة معيّنة بمكان معيّن. جربت هالشيء على صورتين من اللي انعرضوا فوق:

b5AQGjU.png


(إضافة رجل وسمكة مع تغيير جزء من الصورة)

y5oq0xS.png


(إضافة سماعات وسيغار)


هالاداة ممتازة وتعطي تحكم هائل للمستخدم. على سبيل المثال كان عندي صورة ببالي لـ (ميكا مخبأة في الكهف نصفها غارق تحت الماء مع فتاة تنظر لها من الجانب) بس صعب توصل شيء معقد مثل هذا لل AI مع تحديد مكان وما شابه. الحل الأفضل كان صناعة البيئة لوحدها عن طريق Text to Image وبعدها استخدام اداة Inpainting لإضافة الميكا والفتاة بعدين:
ePjzjR4.png


0pSNV1B.png


jfE5a6Z.png


qJ3Hy9B.png

بعدها فلتر ابسكيلينغ وتنظيف:

7xxxrmy.png


نات باد

بالنسبة ل Image to Image فاستخدمتها بطريقتين اساسيتين. أول شيء حاولت حوّل رسمات سابقة لي عملتها من عدة سنوات لتصاميم ثانية او حوّل 3d ل 2d. هذه من الأساليب اللي يقدروا الرسامين يستفيدوا من هالاداة كثير.
مثلا هذا خنجر صممته ثري دي من زمان:

0mjk2oQ.png


بس تصميمه مبسّط بزيادة. فجربت امرره على Image to image مع موديل سايبربانك وشوف شو بيطلع:

h44zagt.png


73JKiNX.png
d8YZr1B.png


مو افضل التصاميم بالحياة بس مثيرة للاهتمام وممكن استخدامها كمصدر الهام.

الشيء الثاني هو تحويل 3دي ل 2دي. هذا تصميم وجه عملته من زمان:

qTqxe34.png


جربت امرره على موديل الأنمي:

F3ORdbt.png


ZujsqXB.png


استديوهات الأنمي لازم تبلش تستخدمه xD.

مثال ثاني يتضمن اضافة textures هو هالبيت البسيط المصنوع بالبلندر:

GG79zCY.png


بعد:

zqPuU0V.png


هذه الأدوات الأساسية بس بتكلم عن طرق متقدمة أكثر لاستخدامها بالرد اللي بعده.

فيه طريقة لحفظ الرد في مفضلة أو ما شابه؟
لي فترة أنوي الغوص بشكل فعلي وتجربة المودلز خصوصًا في مجال صناعة صور شخصيات الأنمي
 
أعلى