انویدیا از تراشه‌های هوش مصنوعی "روبین اولترا" و "فاینمن" برای سال‌های ۲۰۲۷ و ۲۰۲۸ رونمایی کرد

انویدیا از تراشه‌های هوش مصنوعی "روبین اولترا" و "فاینمن" برای سال‌های ۲۰۲۷ و ۲۰۲۸ رونمایی کرد

تاریخ انتشار:

انویدیا از تراشه‌های هوش مصنوعی "روبین اولترا" و "فاینمن" برای سال‌های ۲۰۲۷ و ۲۰۲۸ رونمایی کرد

معرفی تراشه‌های جدید انویدیا

مدیر عامل انویدیا، جنسن هوانگ، در کنفرانس GTC 2025 این شرکت که در سن خوزه، کالیفرنیا برگزار شد، از چندین GPU جدید برای تسریع هوش مصنوعی رونمایی کرد که این شرکت قصد دارد در ماه‌ها و سال‌های آینده عرضه کند. او همچنین جزئیات بیشتری درباره تراشه‌های قبلاً اعلام شده ارائه داد.

تراشه Vera Rubin

اعلامیه اصلی، تراشه Vera Rubin بود که برای اولین بار در Computex 2024 معرفی شد و اکنون برای نیمه دوم سال 2026 برنامه‌ریزی شده است. این GPU که به نام یک ستاره‌شناس مشهور نامگذاری شده، دارای ۲۸۸ گیگابایت حافظه است و با یک CPU سفارشی طراحی شده توسط انویدیا به نام Vera همراه است.

به گفته انویدیا، Vera Rubin بهبودهای قابل توجهی در عملکرد نسبت به نسل قبلی خود، Grace Blackwell، به ویژه در زمینه آموزش و استنتاج هوش مصنوعی ارائه خواهد داد.

عملکرد و مشخصات Vera Rubin

Vera Rubin دارای دو GPU در یک تراشه است که ۵۰ پتافلاپس عملکرد استنتاج FP4 را در هر تراشه ارائه می‌دهد. هنگامی که در یک رک کامل NVL144 پیکربندی شود، این سیستم ۳.۶ اگزافلاپس محاسبات استنتاج FP4 ارائه می‌دهد که ۳.۳ برابر بیشتر از ۱.۱ اگزافلاپس Blackwell Ultra در یک پیکربندی مشابه است.

CPU Vera دارای ۸۸ هسته ARM سفارشی با ۱۷۶ رشته است که به GPU های Rubin از طریق یک رابط NVLink با سرعت ۱.۸ ترابایت در ثانیه متصل شده‌اند.

تراشه Rubin Ultra

هوانگ همچنین از Rubin Ultra رونمایی کرد که در نیمه دوم سال ۲۰۲۷ عرضه خواهد شد. Rubin Ultra از پیکربندی رک NVL576 استفاده خواهد کرد و شامل GPU های جداگانه با چهار تراشه به اندازه رتیكل است که ۱۰۰ پتافلاپس دقت FP4 (یک فرمت اعشاری ۴ بیتی که برای نمایش و پردازش اعداد در مدل‌های هوش مصنوعی استفاده می‌شود) را در هر تراشه ارائه می‌دهد.

در سطح رک، Rubin Ultra ۱۵ اگزافلاپس محاسبات استنتاج FP4 و ۵ اگزافلاپس عملکرد آموزش FP8 ارائه خواهد داد که تقریباً چهار برابر قدرتمندتر از پیکربندی Rubin NVL144 است. هر GPU Rubin Ultra شامل ۱ ترابایت حافظه HBM4e است و رک کامل شامل ۳۶۵ ترابایت حافظه سریع خواهد بود.

تراشه Blackwell Ultra B300

برای آینده نزدیک، انویدیا در نیمه دوم سال ۲۰۲۵ تراشه Blackwell Ultra B300 را عرضه خواهد کرد. این تراشه شامل دو GPU است که ۱۵ پتافلاپس عملکرد محاسبات FP4 متراکم را در هر تراشه ارائه می‌دهد. هنگامی که در یک رک کامل NVL72 پیکربندی شود، Blackwell Ultra ۱.۱ اگزافلاپس محاسبات استنتاج FP4 متراکم را ارائه می‌دهد که ۱.۵ برابر بیشتر از پیکربندی فعلی Blackwell B200 است. هر GPU B300 دارای ۲۸۸ گیگابایت حافظه HBM3e در مقایسه با ۱۹۲ گیگابایت Blackwell است.

معماری GPU نسل بعدی "فاینمن"

هوانگ به طور مختصر به یک معماری GPU نسل بعدی به نام "فاینمن" اشاره کرد که به نام فیزیکدان نظری آمریکایی، ریچارد فاینمن، نامگذاری شده است. او جزئیات بیشتری درباره طراحی یا قابلیت‌های فاینمن ارائه نداد، فقط اشاره کرد که این تراشه به جای CPU "ریچارد" که بر اساس الگوی نامگذاری انتظار می‌رفت، از CPU "ورا" استفاده خواهد کرد و در سال ۲۰۲۸ عرضه خواهد شد.

چشم‌انداز آینده هوش مصنوعی

در طول سخنرانی اصلی، هوانگ همچنین نقشه راهی خوشبینانه برای آینده هوش مصنوعی ارائه داد که موفقیت آن به طور حیاتی با موفقیت‌های ادامه‌دار شرکتش مرتبط است. او مراکز داده را "کارخانه‌های هوش مصنوعی" نامید که به جای اشیاء فیزیکی، توکن‌ها (واحدهای داده که مدل‌های هوش مصنوعی در حال حاضر پردازش می‌کنند) تولید می‌کنند. او دیدگاه خود را برای آینده "هوش مصنوعی فیزیکی" که روزی ربات‌های انسان‌نما را قادر می‌سازد تا کارهای انسانی را انجام دهند، به اشتراک گذاشت. انویدیا در حال حاضر پلتفرم‌های نرم‌افزاری را ارائه می‌دهد که به مدل‌های هوش مصنوعی کنترل‌کننده ربات‌ها کمک می‌کند تا در دنیای مجازی آموزش ببینند.

در این میان، هوانگ حدس زد که تراشه‌های انویدیا به زودی "۱۰ میلیارد عامل دیجیتال" را که کارهای مفیدی برای انسان‌ها انجام می‌دهند، تغذیه خواهند کرد و اشاره کرد که تا پایان سال جاری، ۱۰۰ درصد مهندسان انویدیا با مدل‌های هوش مصنوعی کمک خواهند شد.

این مقاله در تاریخ ۱۹ مارس ۲۰۲۵ به‌روزرسانی شد تا نادرستی در مشخصات تراشه Vera Rubin را اصلاح کند. "ده‌ها ترابایت" که قبلاً ذکر شده بود مربوط به کل خوشه بود، اما خود تراشه دارای ۲۸۸ گیگابایت RAM onboard است.

An image of a hypothetical Rubin system silicon chip die that Nvidia CEO Jensen Huang presented at GTC 2025.
An image of a hypothetical Rubin system silicon chip die that Nvidia CEO Jensen Huang presented at GTC 2025.
Specifications for Vera Rubin, presented by Jensen Huang during his GTC 2025 keynote.
Specifications for Rubin Ultra, presented by Jensen Huang during his GTC 2025 keynote.
Specifications for Blackwell Ultra, presented by Jensen Huang during his GTC 2025 keynote.
A roadmap of future Nvidia AI chips presented by Jensen Huang during his GTC 2025 keynote.
منبع:Ars Technica
در حال بارگذاری نظرات...
نظر شما:
0/800