U3F1ZWV6ZTQ1OTM5OTE4NDM1OTY0X0ZyZWUyODk4Mjg3MzAxMzc3OA==

بطاقات RTX 3000 من NVIDIA تجعل عد التيرافلوب بلا فائدة


بطاقات RTX 3000 من NVIDIA تجعل عد التيرافلوب بلا فائدة

كانت Teraflops طريقة شائعة لقياس "القوة الرسومية" لسنوات. يشير المصطلح إلى عدد العمليات الحسابية التي يمكن أن تقوم بها وحدة معالجة الرسومات ، ولكن أثناء وجودها في أوراق المواصفات إلى الأبد ، أصبح التيرافلوب مؤخرًا سائدًا ، حيث ظهرت في الرسائل التسويقية الموجودة في إطلاق وحدات التحكم مثل Xbox Series X. مع التهم الأساسية GPU بالوصول إلى خمسة أرقام ، من الجيد الحصول على نقطة مقارنة بسيطة. لسوء الحظ ، لم يكن تيرافلوب أقل فائدة.

يأتي مصطلح teraflop من FLOPs ، أو "عمليات النقطة العائمة في الثانية" ، والتي تعني ببساطة "العمليات الحسابية التي تتضمن نقاط عشرية في الثانية". تيرا تعني تريليون ، لذا فإن مجموع تيرافلوب يعني "تريليون عملية فاصلة عائمة في الثانية".

GPU الأكثر شهرة بين مستخدمي Steam اليوم ، GTX 1060 من NVIDIA ، قادر على أداء 4.4 تيرافلوب ، 2080 Ti الذي سيتم اغتصابه قريبًا يمكنه التعامل مع حوالي 13.5 ويمكن لـ Xbox Series X القادمة إدارة 12. هذه الأرقام محسوبة بواسطة أخذ عدد النوى المظللة في شريحة ، وضرب ذلك في ذروة سرعة ساعة البطاقة ثم ضرب ذلك في عدد التعليمات لكل ساعة. على عكس العديد من الأرقام التي نراها في مساحة الكمبيوتر الشخصي ، إنها عملية حسابية عادلة وشفافة ، لكن هذا لا يجعلها مقياسًا جيدًا لأداء الألعاب.

تصل كل عائلة GPU تقريبًا بهذه المكاسب عبر الأجيال
AMD's RX 580 ، 6.17 تيرافلوب GPU من 2017 ، على سبيل المثال ، يعمل بشكل مشابه لـ RX 5500 ، بطاقة 5.2 تيرافلوب الميزانية التي أطلقتها الشركة العام الماضي. يمكن أن يُعزى هذا النوع من التحسين "المخفي" إلى العديد من العوامل ، بدءًا من التغييرات الهيكلية إلى مطوري الألعاب الذين يستخدمون الميزات الجديدة ، ولكن كل عائلة GPU تصل تقريبًا بهذه المكاسب عبر الأجيال. لهذا السبب ، من المتوقع أن يتفوق Xbox Series X ، على سبيل المثال ، على Xbox One X بأكثر مما تشير إليه أرقام "12 مقابل 6 تيرافلوب". (كما سبق لـ PS5 و PS4 Pro.)

النقطة المهمة هي أنه حتى داخل نفس شركة وحدة معالجة الرسومات ، مع كل عام ، فإن التغييرات في طرق تصميم الرقائق والألعاب تجعل من الصعب تمييز ما تعنيه عبارة "تيرافلوب" بالضبط لأداء الألعاب. خذ بطاقة AMD وبطاقة NVIDIA من أي جيل والمقارنة لها قيمة أقل.

كل هذا يقودنا إلى سلسلة RTX 3000. وصلت هذه ببعض المواصفات المذهلة حقًا. تم إدراج بطاقة RTX 3070 ، بطاقة 500 دولار ، على أنها تحتوي على 5888 نواة (اسم NVIDIA للتظليل) قادرة على 20 تيرافلوب. والبطاقة الرئيسية الجديدة التي تبلغ قيمتها 1500 دولار ، RTX 3090؟ 10496 نواة ، لـ 36 تيرافلوب. بالنسبة للسياق ، فإن RTX 2080 Ti ، حتى الآن أفضل بطاقة رسومات "مستهلك" متوفرة ، بها 4352 "نواة cuda." إذن ، زادت NVIDIA من عدد النوى في مركزها الرئيسي بأكثر من 140 بالمائة ، وقدرتها التيرافلوبس بأكثر من 160 بالمائة.

حسنًا ، لقد فعلت ، ولم تفعل.

تتكون بطاقات NVIDIA من العديد من "المعالجات المتعددة المتدفقة" أو SMs. تحتوي كل واحدة من 2080 Ti 68 "Turing" SMs ، من بين العديد من الأشياء الأخرى ، 64 "FP32" نواة cuda مخصصة لرياضيات الفاصلة العائمة و 64 نواة "INT32" مخصصة للرياضيات الصحيحة (حسابات بأرقام صحيحة).

كان الابتكار الكبير في Turing SM ، بصرف النظر عن تسارع الذكاء الاصطناعي وتتبع الأشعة ، هو القدرة على تنفيذ حسابات الأعداد الصحيحة والعائمة في نفس الوقت. كان هذا تغييرًا كبيرًا عن الجيل السابق ، باسكال ، حيث كانت بنوك النوى تتقلب بين عدد صحيح ونقطة عائمة على أساس إما أو.

NVIDIA AMPERE SM

إن بطاقات RTX 3000 مبنية على معمارية تسميها NVIDIA "Ampere" ، و SM الخاص بها ، من بعض النواحي ، يأخذ نهج Pascal و Turing. يحتفظ Ampere بـ 64 نواة FP32 كما كان من قبل ، ولكن تم تعيين 64 نواة أخرى الآن كـ "FP32 و INT32." لذا ، فإن نصف نوى الأمبير مخصصة للفاصلة العائمة ، لكن النصف الآخر يمكن أن يؤدي إما الفاصلة العائمة أو الرياضيات الصحيحة ، تمامًا كما هو الحال في باسكال.

باستخدام هذا المفتاح ، تعد NVIDIA الآن كل SM على أنه يحتوي على 128 نواة FP32 ، بدلاً من 64 نواة تورينج. ربما يكون أفضل وصف لـ "5888 نواة cuda" في 3070 هو "2944 نواة cuda و 2944 نواة يمكن أن تكون كودا".

نظرًا لأن الألعاب أصبحت أكثر تعقيدًا ، فقد بدأ المطورون في الاعتماد بشكل أكبر على الأعداد الصحيحة. اقترحت شريحة NVIDIA من الإصدار الأصلي 2018 RTX أن الرياضيات الصحيحة ، في المتوسط ​​، تشكل حوالي ربع عمليات GPU داخل اللعبة.

الجانب السلبي لـ Turing SM هو احتمال قلة الاستخدام. إذا كان عبء العمل ، على سبيل المثال ، عبارة عن 25 في المائة من الرياضيات الصحيحة ، فإن حوالي ربع نوى وحدة معالجة الرسومات يمكن أن تجلس دون أن تفعل شيئًا. هذا هو التفكير الكامن وراء هذا الهيكل الأساسي شبه الموحد الجديد ، وعلى الورق ، يكون له معنى كبير: لا يزال بإمكانك تشغيل عمليات عدد صحيح ونقطة عائمة في وقت واحد ، ولكن عندما تكون هذه النوى الصحيحة نائمة ، يمكنها تشغيل الفاصلة العائمة في حين أن.

عند إطلاق RTX 3000 من NVIDIA ، قال الرئيس التنفيذي Jensen Huang إن RTX 3070 كان "أقوى من RTX 2080 Ti." باستخدام ما نعرفه الآن عن تصميم Ampere ، وعدد صحيح ، ونقطة عائمة ، وسرعات الساعة ، و teraflops ، يمكننا أن نرى كيف يمكن أن تسير الأمور. في عبء العمل هذا "25 بالمائة" ، يمكن تشغيل 4،416 من هذه النوى الرياضيات FP32 ، مع معالجة 1،472 INT32 الضروري.

إلى جانب جميع التغييرات الأخرى التي يجلبها Ampere ، يمكن أن يتفوق 3070 على 2080 Ti ربما بنسبة 10 بالمائة ، على افتراض أن اللعبة لا تمانع في امتلاك ذاكرة 8 جيجابايت بدلاً من 11 جيجابايت للعمل معها. في سيناريو الحالة الأسوأ المطلق (والمستبعد للغاية) ، حيث يعتمد عبء العمل على عدد صحيح للغاية ، يمكن أن يتصرف مثل 2080. من ناحية أخرى ، إذا كانت اللعبة تتطلب القليل جدًا من الرياضيات الصحيحة ، فإن التعزيز على 2080 Ti يمكن أن تكون هائلة.

بغض النظر عن التخمين ، لدينا نقطة واحدة للمقارنة حتى الآن: فيديو Digital Foundry يقارن RTX 3080 بـ RTX 2080. شهد DF ارتفاعًا بنسبة 70 إلى 90 بالمائة عبر الأجيال في العديد من الألعاب التي قدمتها NVIDIA للاختبار ، مع فجوة أداء أعلى في العناوين التي تستخدم ميزات RTX مثل تتبع الأشعة. يعطي هذا النطاق لمحة عن نوع مكاسب الأداء المتغيرة التي نتوقعها في ضوء النوى المشتركة الجديدة. سيكون من المثير للاهتمام أن نرى كيف تتصرف مجموعة أكبر من الألعاب ، حيث من المحتمل أن تكون NVIDIA قد وضعت أفضل ما لديها في اختيار اللعبة التي تمت الموافقة عليها. ما لن تراه هو ما يقرب من 3 أضعاف التحسن الذي قد تشير إليه القفزة من رقم تيرافلوب 2080 إلى رقم تيرافلوب 3080.

مع وصول بطاقات RTX 3000 الأولى في غضون أسابيع ، يمكنك توقع أن تعطيك المراجعات فكرة ثابتة عن أداء Ampere قريبًا. على الرغم من أنه حتى الآن من الآمن القول إن Ampere يمثل قفزة هائلة إلى الأمام لألعاب الكمبيوتر. من المحتمل أن يتداول الطراز 3070 البالغ 499 دولارًا في الضربات التجارية مع الرائد الحالي ، ويجب أن يقدم 799 دولارًا 3080 أداءً أكثر من كافٍ لأولئك الذين ربما اختاروا سابقًا "Ti". ومع ذلك ، فإن هذه البطاقات تصطف ، فمن الواضح أنه لم يعد من الممكن تمثيل قيمتها بشخصية فريدة مثل التيرافلوب.


تعليقات
ليست هناك تعليقات
إرسال تعليق

إرسال تعليق

الاسمبريد إلكترونيرسالة