
انویدیا از تراشههای هوش مصنوعی "روبین اولترا" و "فاینمن" برای سالهای ۲۰۲۷ و ۲۰۲۸ رونمایی کرد
تاریخ انتشار:
معرفی تراشههای جدید انویدیا
مدیر عامل انویدیا، جنسن هوانگ، در کنفرانس GTC 2025 این شرکت که در سن خوزه، کالیفرنیا برگزار شد، از چندین GPU جدید برای تسریع هوش مصنوعی رونمایی کرد که این شرکت قصد دارد در ماهها و سالهای آینده عرضه کند. او همچنین جزئیات بیشتری درباره تراشههای قبلاً اعلام شده ارائه داد.
تراشه Vera Rubin
اعلامیه اصلی، تراشه Vera Rubin بود که برای اولین بار در Computex 2024 معرفی شد و اکنون برای نیمه دوم سال 2026 برنامهریزی شده است. این GPU که به نام یک ستارهشناس مشهور نامگذاری شده، دارای ۲۸۸ گیگابایت حافظه است و با یک CPU سفارشی طراحی شده توسط انویدیا به نام Vera همراه است.
به گفته انویدیا، Vera Rubin بهبودهای قابل توجهی در عملکرد نسبت به نسل قبلی خود، Grace Blackwell، به ویژه در زمینه آموزش و استنتاج هوش مصنوعی ارائه خواهد داد.
عملکرد و مشخصات Vera Rubin
Vera Rubin دارای دو GPU در یک تراشه است که ۵۰ پتافلاپس عملکرد استنتاج FP4 را در هر تراشه ارائه میدهد. هنگامی که در یک رک کامل NVL144 پیکربندی شود، این سیستم ۳.۶ اگزافلاپس محاسبات استنتاج FP4 ارائه میدهد که ۳.۳ برابر بیشتر از ۱.۱ اگزافلاپس Blackwell Ultra در یک پیکربندی مشابه است.
CPU Vera دارای ۸۸ هسته ARM سفارشی با ۱۷۶ رشته است که به GPU های Rubin از طریق یک رابط NVLink با سرعت ۱.۸ ترابایت در ثانیه متصل شدهاند.
تراشه Rubin Ultra
هوانگ همچنین از Rubin Ultra رونمایی کرد که در نیمه دوم سال ۲۰۲۷ عرضه خواهد شد. Rubin Ultra از پیکربندی رک NVL576 استفاده خواهد کرد و شامل GPU های جداگانه با چهار تراشه به اندازه رتیكل است که ۱۰۰ پتافلاپس دقت FP4 (یک فرمت اعشاری ۴ بیتی که برای نمایش و پردازش اعداد در مدلهای هوش مصنوعی استفاده میشود) را در هر تراشه ارائه میدهد.
در سطح رک، Rubin Ultra ۱۵ اگزافلاپس محاسبات استنتاج FP4 و ۵ اگزافلاپس عملکرد آموزش FP8 ارائه خواهد داد که تقریباً چهار برابر قدرتمندتر از پیکربندی Rubin NVL144 است. هر GPU Rubin Ultra شامل ۱ ترابایت حافظه HBM4e است و رک کامل شامل ۳۶۵ ترابایت حافظه سریع خواهد بود.
تراشه Blackwell Ultra B300
برای آینده نزدیک، انویدیا در نیمه دوم سال ۲۰۲۵ تراشه Blackwell Ultra B300 را عرضه خواهد کرد. این تراشه شامل دو GPU است که ۱۵ پتافلاپس عملکرد محاسبات FP4 متراکم را در هر تراشه ارائه میدهد. هنگامی که در یک رک کامل NVL72 پیکربندی شود، Blackwell Ultra ۱.۱ اگزافلاپس محاسبات استنتاج FP4 متراکم را ارائه میدهد که ۱.۵ برابر بیشتر از پیکربندی فعلی Blackwell B200 است. هر GPU B300 دارای ۲۸۸ گیگابایت حافظه HBM3e در مقایسه با ۱۹۲ گیگابایت Blackwell است.
معماری GPU نسل بعدی "فاینمن"
هوانگ به طور مختصر به یک معماری GPU نسل بعدی به نام "فاینمن" اشاره کرد که به نام فیزیکدان نظری آمریکایی، ریچارد فاینمن، نامگذاری شده است. او جزئیات بیشتری درباره طراحی یا قابلیتهای فاینمن ارائه نداد، فقط اشاره کرد که این تراشه به جای CPU "ریچارد" که بر اساس الگوی نامگذاری انتظار میرفت، از CPU "ورا" استفاده خواهد کرد و در سال ۲۰۲۸ عرضه خواهد شد.
چشمانداز آینده هوش مصنوعی
در طول سخنرانی اصلی، هوانگ همچنین نقشه راهی خوشبینانه برای آینده هوش مصنوعی ارائه داد که موفقیت آن به طور حیاتی با موفقیتهای ادامهدار شرکتش مرتبط است. او مراکز داده را "کارخانههای هوش مصنوعی" نامید که به جای اشیاء فیزیکی، توکنها (واحدهای داده که مدلهای هوش مصنوعی در حال حاضر پردازش میکنند) تولید میکنند. او دیدگاه خود را برای آینده "هوش مصنوعی فیزیکی" که روزی رباتهای انساننما را قادر میسازد تا کارهای انسانی را انجام دهند، به اشتراک گذاشت. انویدیا در حال حاضر پلتفرمهای نرمافزاری را ارائه میدهد که به مدلهای هوش مصنوعی کنترلکننده رباتها کمک میکند تا در دنیای مجازی آموزش ببینند.
در این میان، هوانگ حدس زد که تراشههای انویدیا به زودی "۱۰ میلیارد عامل دیجیتال" را که کارهای مفیدی برای انسانها انجام میدهند، تغذیه خواهند کرد و اشاره کرد که تا پایان سال جاری، ۱۰۰ درصد مهندسان انویدیا با مدلهای هوش مصنوعی کمک خواهند شد.
این مقاله در تاریخ ۱۹ مارس ۲۰۲۵ بهروزرسانی شد تا نادرستی در مشخصات تراشه Vera Rubin را اصلاح کند. "دهها ترابایت" که قبلاً ذکر شده بود مربوط به کل خوشه بود، اما خود تراشه دارای ۲۸۸ گیگابایت RAM onboard است.





