- پردازنده گرافیکی جدید بلک ول B200 انویدیا با بیش از 200 میلیارد ترانزیستور، انقلاب صنعتی جدید را تامین خواهد کرد.
- قدرت بخشیدن به انقلاب صنعتی جدید
- 1) قوی ترین تراشه در جهان
- 2) موتور ترانسفورماتور نسل دوم
- 3) نسل پنجم NVLink
- 4) موتور RAS
- 5) هوش مصنوعی ایمن
- 6) موتور رفع فشار
- مقیاس بندی معماری بلک ول و معرفی یک واحد محاسباتی جدید در مقیاس رک
- Blackwell همچنین به زودی از طریق Cloud Computing Partners در دسترس است
پردازنده گرافیکی جدید بلک ول B200 انویدیا با بیش از 200 میلیارد ترانزیستور، انقلاب صنعتی جدید را تامین خواهد کرد.
توجه داشته باشید: این ویژگی برای اولین بار در 19 مارس 2024 منتشر شد.
قدرت بخشیدن به انقلاب صنعتی جدید
ماههاست که اینترنت مملو از شایعات مربوط به انتشار GPU بلکول بوده است، اما اکثر آنها معتقدند که جانشین GeForce RTX 4090 چه چیزی میتواند ارائه دهد. اگرچه تمرکز راه اندازی امروز نیست، اما معماری GPU Blackwell سرانجام در اولین کنفرانس هوش مصنوعی NVIDIA، GTC 2024 معرفی شد. با عنوانی مانند brandish قدرت هدایت انقلاب صنعتی جدیدGPU بلک ول وعده داده است که ابزاری کلیدی برای محاسبات سریع، پردازش انقلابی داده، شبیهسازی مهندسی، طراحی دارو، محاسبات کوانتومی و هوش مصنوعی مولد در مقیاس بزرگ باشد.
به هر حال، انویدیا قول داد مشکلات مرکز داده را حل کند، و این همان کاری است که با سوپرچیپ A100 مبتنی بر معماری Ampere در سال 2019 انجام داد. تا سال 2022، هدف NVIDIA مشخص بود: پیشرفت چشمگیر هوش مصنوعی برای هدایت زیرساخت های هوش مصنوعی جهانی، و آنچه آنها با سوپرتراشه معماری H100 Hopper انجام دادند. چه نمونه ای بهتر از پردازش هوش مصنوعی مولد و مدل زبان بزرگ (LLM) که هر دو از طریق آموزش و استفاده از سخت افزار NVIDIA به وجود آمده اند؟ امروز، همانطور که توسط جنسن هوانگ، بنیانگذار و مدیر عامل NVIDIA اعلام شده است، امروز نمی توانید یک روز را بدون شنیدن، استفاده یا دیدن ثمرات هوش مصنوعی مولد و بدون اینکه “فناوری تعیین کننده زمان ما” باشید، سپری کنید. جای تعجب نیست که این میلیاردر شاخص ثروت شخصی در زمان های اخیر به طور قابل توجهی افزایش یافته است قیمت سهام این شرکت در بالاترین حد خود قرار دارد در تاریخ خود
معماری بلکول GPU مبتنی بر افتخارات معماری قبلی هاپر است. او آمار دیوانه وار درجه یک مانند تا عملکرد استنتاج 30 برابر، 4 برابر در عملکرد تمرینیو چشمگیر کاهش 25 برابری در مصرف انرژی و هزینه های عملیاتی برای استنتاج LLM همراه با یک کامپایلر جدید. به رخ کشیدن بیش از 200 میلیارد ترانزیستورTHE Nvidia B200 پردازنده Blackwell از پیشرفت های زیادی برای دستیابی به این اعداد دیوانه کننده سود می برد.
این معماری جدید که به افتخار دیوید هارولد بلکول، ریاضیدان متخصص در تئوری بازی ها و آمار و اولین محقق سیاه پوست که به آکادمی ملی علوم معرفی شد، نامگذاری شده است، معماری جدید جانشین معماری هاپر می شود که فقط دو سال پیش راه اندازی شد.
با یک وعده بزرگ برای حفظ، اینها هستند شش “معجزه” یا پیشرفت هایی که پردازنده NVIDIA B200 Blackwell را به واقعیت تبدیل کرد: –
1) قوی ترین تراشه در جهان
بهره مندی از یک بزرگ 208 میلیارد ترانزیستور، پردازنده گرافیکی Blackwell در واقع از دو تا از بزرگترین قالب های ممکن TSMC تشکیل شده است و در یک GPU واحد متحد شده اند. اگر متوجه اندازههای قبلی تراشههای سوپرتراشههای NVIDIA شدهاید، به لطف TSMC ایده بزرگترین اندازه تراشه ممکن را خواهید داشت. ساخته شده برای اندازه گیری فرآیند TSMC 4NP این دو تراشه که برای نیازهای محاسباتی تسریع شده طراحی شده اند، توسط یک پیوند تراشه به تراشه 10 ترابایت در ثانیه به یکدیگر متصل می شوند تا به عنوان یک واحد پردازش گرافیکی واحد و یکپارچه عمل کنند. این اتصال بافت به تنهایی می تواند یک معجزه متمایز در نظر گرفته شود.
اثبات 192 گیگابایت HBM3 (جهشی بزرگ از 80 گیگابایت H100)، و ترکیبی پهنای باند حافظه 8 ترابایت بر ثانیه (به جای 3 ترابایت بر ثانیه)، افزایش گسترده در پهنای باند حافظه مطمئناً برای مطابقت با قابلیت های توان عملیاتی کلی تراشه مفید است.
2) موتور ترانسفورماتور نسل دوم
برای یادآوری، NVIDA برای اولین بار یک موتور Transformer را در معماری Hopper معرفی کرد تا به طور خاص مدلهای یادگیری عمیق را هدف قرار دهد که یادگیری خود نظارتی را ممکن میسازد و تا حد زیادی پردازش زبان طبیعی، خلاصههای متن و بینایی رایانه را فعال میکند. همانطور که اکنون می توانید درک کنید، امروزه اینها زمینه های اصلی استفاده از هوش مصنوعی مولد هستند. ما در اینجا با جزئیات بیشتری به این موضوع پرداخته ایم. در پردازنده گرافیکی بلک ول، NVIDIA با افزودن فرمت های پردازشی بیشتر، قابلیت های موتور Transformer را گسترش داده است. استنتاج FP4 و FP6 AIکه به مقیاسبندی پیچیدگی مدل و در نتیجه بهبود کارایی پردازش یا مقابله با اندازههای مدل بزرگتر کمک میکند.
3) نسل پنجم NVLink
معماری گرافیکی مقیاسپذیر NVIDIA به اندازه یک واحد پردازش گرافیکی بلکول B200 از طریق اتصال GPU به GPU با پهنای باند بالا، کم مصرف، تأخیر کم و بدون تلفات NVLink، یک توانمندساز حیاتی برای عملکرد چند محاسباتی است. -گرههای عظیم، و این رشد زیادی با هر نسل، هم از نظر توان عملیاتی و هم از نظر ظرفیت پخش داشته است.
آخرین نسل پنجم NVLink لاف می زند پهنای باند دو طرفه 1.8 ترابایت بر ثانیه در هر پیوند و بیشتر گسترش می یابد تا 576 پردازنده گرافیکیs (این دو برابر حد H100 است) در هر دامنه NVLink. برای پشتیبانی از بسیاری از GPUهای متصل به هم، نیاز به یک نسل بعدی NVSwitchکه از سرعت NVLink 1.8 ترابایت بر ثانیه نیز پشتیبانی می کند. آنقدر پیچیده است که به تنهایی 3.6 TFLOPS محاسبات شبکه ای برای کمک به تخلیه برخی از عملیات از شبکه عصبی دارد.
4) موتور RAS
GPU B200 Blackwell دارای یک موتور RAS داخلی است تا مراکز داده ساخته شده، حتی در مقیاس بزرگتر، بتوانند به طور مداوم سلامت آن را 24/7 نظارت کنند. یک مخفف رایج در دنیای تجارت، RAS به قابلیت اطمینان، در دسترس بودن و قابلیت خدمات اشاره دارد. با یک موتور خودآزمایی داخلی، این قابلیت دسترسی سیستم را به حداکثر میرساند و انعطافپذیری را بهبود میبخشد زیرا اندازه استقرار مقیاسپذیر به طور قابل توجهی از نسلی به نسل دیگر افزایش مییابد.
5) هوش مصنوعی ایمن
در حالی که معماری هاپر پیشگام پشتیبانی از محاسبات محرمانه بود، معماری بلکول با پشتیبانی از پروتکلهای رمزگذاری بومی جدید فراتر رفت. صنایع حساس به حریم خصوصی، مانند خدمات بهداشتی و مالی که از پردازنده های Blackwell استفاده می کنند، از آن استقبال خواهند کرد.
6) موتور رفع فشار
از آنجایی که پردازش داده ها به طور فزاینده ای توسط GPU تسریع می شود، مشاغل می خواهند بهترین عملکرد را از پردازش داده های تحلیلی داشته باشند. با موتور فشردهسازی 800 گیگابایت بر ثانیه اختصاصی داخلی که از جدیدترین فرمتهای دادههای فشرده پشتیبانی میکند، GPU بلکول میتواند بر روی فرمتهای دادههای فشرده کار کند بدون اینکه منتظر بماند تا CPU ابتدا کار رفع فشردهسازی را انجام دهد.
مقیاس بندی معماری بلک ول و معرفی یک واحد محاسباتی جدید در مقیاس رک
ابرکک گریس هاپر را به خاطر دارید؟ اکنون می توانید a سوپرچیپ گریس بلکول GB200 چه کسی پیوند می دهد دو پردازنده گرافیکی B200 و پردازنده NVIDIA Grace arm از طریق اتصال 900 گیگابایتی بر ثانیه NVLink چیپ به تراشه (C2C). اگرچه بلک ول می تواند از سرعت انتقال NVLink سریع تری استفاده کند، اما پردازنده گریس هنوز از این سرعت پشتیبانی نمی کند و از آخرین نسل استاندارد انتقال استفاده خواهد کرد.
اما به اینجا ختم نمیشود. GB200 یکی از اجزای اصلی سیستم NVLink چند نود جدید NVIDIA، خنککننده مایع و در مقیاس رک برای بارهای کاری فشرده است. 72 پردازنده گرافیکی بلک ول و 36 پردازنده گریس به طور کامل روی یک ستون فقرات NVLink Switch Rack به هم متصل هستند. ملقب به NVIDIA GB200 NVL72همچنین دارای پردازندههای گرافیکی NVDIA Bluefield 3 برای ارائه شتاب شبکه ابری، امنیت غیرقابل اعتماد و کشش محاسباتی GPU در یک سیستم ابری هوش مصنوعی انعطافپذیر و مقیاسپذیر است.
GB200 NVL72 دارای یک 30 برابر افزایش عملکرد نسبت به همان تعداد پردازنده گرافیکی H100 در بارهای کاری استنتاج LLM، در حالی که با بهبود عملکرد بلک ول، هزینه های عملیاتی و مصرف برق را نیز کاهش می دهد. این پلتفرم همچنین به عنوان یک واحد پردازش گرافیکی با 1.4 اگزافلاپس از عملکرد هوش مصنوعی و 30 ترابایت حافظه ترکیبی برای بلوک سازنده نسل بعدی DGX SuperPOD عمل می کند.
در انتهای دیگر مقیاس نیز الف وجود دارد برد سرور HGX B200 که می تواند تا هشت پردازنده گرافیکی B200 را به یک پلتفرم هوش مصنوعی مبتنی بر x86 متصل کند. یک نوع ابرکامپیوتر جمع و جورتر خواهد بود DGX B200 ارائه یک طراحی مقیاس پذیر با هوا خنک. برای مرجع، تجسمات گذشته آن DGX H100 و DGX A100 ابررایانه شخصی هستند.
Blackwell همچنین به زودی از طریق Cloud Computing Partners در دسترس است
گره سوپرتراشه GB200 به DGX Cloud NVIDIA و همچنین شرکای زیرساخت ابری مانند AWS، Google Cloud، Microsoft Azure و Oracle Infrastructure هدایت میشود تا نمونههای محاسباتی مبتنی بر Blackwell را ارائه دهد.
در ادامه بخوانید
1) قدرت پردازنده گرافیکی Blackwell که در NVIDIA Drive Thor ادغام شده است، تجربیات Gen AI را در ماشین بعدی شما آزاد می کند.
2) NVIDIA پروژه ای را برای حمایت از توسعه ربات های انسان نما آغاز می کند
منبع: https://www.hardwarezone.com.sg/feature-nvidia-blackwell-b200-gpu-will-tackle-xl-sized-generative-ai-models-secure-accelerated-computing