المعمارية و DLSS 3.0

المعمارية

تستخدم هذه البطاقة الرسومية معمارية Ada Lovelace، وقد أشارت التقارير التقنية في بادىء الأمر أن معمارية Ada ستكون شبيهة جدًا بمعمارية Ampere، وأن التحسينات على الأداء ستأتي في المقام الأول من الانتقال إلى دقة تصنيع أعلى كثافة، إلا أن نفيديا قررت لاحقًا تدشين تقنيات مستقبلية في البطاقة من أجل المنافسة مع AMD، هل كانت هذه التقارير صادقة؟ لا أحد يعلم سوى نفيديا، إلا أن Ada Lovelace تقدم بالتأكيد تحسينات ملحوظة على Ampere في جوانب عديدة أبرزها تلك التي تتعلق بمعالجة تقنيات تتبع الشعاع Ray Tracing وسنأتي على ذكرها بالتفصيل.

رقاقة AD104
رقاقة AD104

تضم الرقاقة مسارع Optical Flow Accelerator الذي سنتحدث عنه في الأسفل، و وحدتي NVENC و وحدة NVDEC لتشفير وفك تشفير الفيديو (البطاقات الاقتصادية في المستقبل لن تحتوي سوى على وحدة NVENC واحدة مثل الأجيال السابقة)، البنية الأساسية هنا ما زالت مشابهة لبطاقات Ampere، هذه البطاقة تستعمل جميع وحدات تظليل رقاقة AD104 وبكامل قدراتها.

إليكم أبرز التحسينات التي طرأت على هذه المعمارية وستلاحظون أن معظمها يرتبط بمعالجة تقنية تتبع الأشعة و لا غرابة في هذا إذ إن نفيديا ترى بأن تقنيات الرسم بالتنقيط هي شيء من الماضي وأن المستقبل هو لاستعمال الموارد الرسومية بشكل أفضل وأكثر كفاءة وليس بالقوة المُجردة:

تقنية Shader Execution Reordering الجديدة

تواجه أنوية تتبع الشعاع تحديات عديدة في التظليل ولا تضمن تقديم معدل إطارات مرتفع، إن عمليات مثل تظليل عدة ترددات للشعاع أو التعامل مع خامات معقدة، هي عملية متحدية للغاية تتسبب بإهدار موارد البطاقة الرسومية. تأتي هذه التقنية، والتي هي نظام جدولة جديد يقوم بإعادة تنسيق مهام التظليل التي تتعامل مع خيوط أو Threads متعددة في ذات الوقت بشكل فوري، والتي يقوم كل منها بتنفيذ برمجية مختلفة لتتبع الأشعة. وحتى يتحقق ذلك، قامت نفيديا بإجراء تعديلات على وحدات التظليل وعلى نظام الذاكرة. إن تقنية SER تزيد الأداء في Cyberpunk 2077 بحسب معلومات نفيديا، بنسبة 44% في طور RT: Overdrive Mode.
الجيل الرابع من أنوية Tensor

وحدات تينسور الحاسوبية متخصصة في تسريع حسابات ضرب المصفوفات المستعملة في تطبيقات الذكاء الاصطناعي، الجيل الرابع منها يُقدم ضعف الأداء الذي قدمه الجيل الثالث في معمارية Ampere.
الجيل الثالث من أنوية تتبع الشعاع RT

قام مهندسو نفيديا بالعمل على ثلاث جوانب رئيسية لتحسين الأداء في الجيل الثالث من أنوية تتبع الشعاع:

– ضعف سرعة فحص التداخل بين الشعاع و المثلث (Ray-Triangle Intersection) مقارنة مع الجيل السابق، وهو فحص أساسي في عملية تتبع الأشعة، إذا كان هناك تداخل فإن هذا يعني أن شعاع الضوء يرتطم بالمضلع في طريقه ويجب أن تُحسب قيمة الضوء والظل بناء على هذا الأساس.
– مُحرك Opacity Micromap Engine الجديد لمضاعفة سرعة عبور الألفا. المُحرك يقوم بإجراء اختبارات الألفا على البنية التضليعية (الجيومتري) مباشرة، مما يسمح للمطورين بتوصيف أجسام معقدة مثل الحواجز المعدنية الشائكة وتتبعها بالأشعة بدون خسارة في فعالية الأداء. الألفا تمثل قيمًا تقديرية لتبسيط الأصول الرسومية المعقدة (مثل ورقة شجر أو لهيب نار) وتجسيد قيم شفافيتها أو صلابتها.

صورة توضيحية
من الأوراق البيضاء لمعمارية Ada Lovelace

هذه الصورة التوضيحية تقوم بإظهار فائدة قيم Alpha على اليمين، وكيف يحصل الشعاع الساقط على المعلومات المطلوبة عن ورقة الشجر بسهولة كبيرة، مقارنة بما كان عليه الحال في السابق كما يظهر على اليسار.

– مُحرك Displaced Micro-Mesh Engine لتسريع بناء هيكلية BVH بعشرة أضعاف وتقليل حجمها بعشرين ضعف. micro-mesh هي قيمة جديدة من قيم بناء الهيكلية الرسومية.

صورة توضيحية
من الأوراق البيضاء لمعمارية Ada Lovelace

المنطقة الحمراء على اليمين توضح استعمال قيم Micro-Mesh الجديدة للتعامل مع فحص التداخل بين الشعاع و المثلثات، مما يزيد من سرعة بناء هيكلية البيانات BVH التي تحتفظ بمعلومات التداخل الناجمة من الأشعة حتى تقوم وحدات التظليل بعملها بناء على هذه المعلومات.

تقنية DLSS 3 و Optical Flow Acceleration

انهمك باحثو نفيديا في العمل على تقنية توليد الإطارات لفترة زمنية تزيد على 4 سنوات، التقنية تمزج بين أداء DLSS و بين تقريب optical flow لتدشين إطارات مولدة حاسوبيًا بين الإطارات الحقيقية عن طريق توقع كيف سيكون الإطار التالي بتشكيل ما يُسمى optical flow-field، لزيادة معدل الإطارات وتقديم تجربة لعب أكثر سلاسة. إن مُحرك optical flow engine الجديد يستعمل خوارزميات معقدة للغاية لأداء يتفوق على نظيره في معمارية Ampere بمقدار الضعف، وهو يغذي شبكة المعلومات الخاصة بتقنية DLSS 3 بتفاصيل جوهرية لعمل التقنية. ولأن هذه الإطارات المولدة تزيد زمن الاستجابة (latency)، فإن DLSS 3 لا تعمل إلا مع تفعيل تقنية Nvidia Reflex التي تقوم بتقليل زمن الاستجابة. بشكلٍ عام، مع DLSS 3 و قوة المعالجة الإضافية للـRTX 4080، يُمكن تحقيق مقدار من الأداء يصل إلى 4 أضعاف الجيل السابق Ampere في بعض الحالات.
وحدتا تشفير AVI

أضافت نفيديا دعم تشفير الفيديو AV1 للمرة الأولى في بطاقة رسومية مع Ada من خلال الإنكودر (NVENC). تؤكد نفيديا أنه أكثر كفاءة بنسبة 40% من تشفير H.264. هذا يسمح للمستخدمين الذين يقومون بالبث (streaming) بدقة 1080p بالبث بدقة 1440p بنفس التردد (bitrate) والجودة، أو يسمح بزيادة الجودة في الصورة للبث لمن يحافظ على دقة عرض 1080p.

نفيديا تعاونت مع صانعي البرمجيات مثل برمجية OBS المجانية للبث، والتي تقوم بإضافة دعم AVI هذا العام لتحسين كفاءة التشفير على بطاقات نفيديا الرسومية بنسبة 35%. نفيديا تعاونت أيضًا مع Discord لتوفير بثوث AVI من مستخدم إلى مستخدم آخر. البطاقات الراقية من نفيديا ومن ضمنها بطاقتنا هذه RTX 4070 Ti، تحتوي على وحدتي تشفير NVENC من أجل المساعدة على تحرير الفيديو بدقة 8k/60fps أو التحرير الاحترافي بدقة 4k/60fps.

شارك هذا المقال