پردازنده گرافیکی جدید بلک‌ول B200 انویدیا با 200 میلیارد ترانزیستور، مدل‌های هوش مصنوعی در اندازه XXXL را کنترل می‌کند.


پردازنده گرافیکی جدید بلک ول B200 انویدیا با بیش از 200 میلیارد ترانزیستور، انقلاب صنعتی جدید را تامین خواهد کرد.

توجه داشته باشید: این ویژگی برای اولین بار در 19 مارس 2024 منتشر شد.

تصویر معماری بلک ول NVIDIA;  برای بزرگنمایی کلیک کنید  (منبع تصویر: NVIDIA)

قدرت بخشیدن به انقلاب صنعتی جدید

ماه‌هاست که اینترنت مملو از شایعات مربوط به انتشار GPU بلک‌ول بوده است، اما اکثر آنها معتقدند که جانشین GeForce RTX 4090 چه چیزی می‌تواند ارائه دهد. اگرچه تمرکز راه اندازی امروز نیست، اما معماری GPU Blackwell سرانجام در اولین کنفرانس هوش مصنوعی NVIDIA، GTC 2024 معرفی شد. با عنوانی مانند brandish قدرت هدایت انقلاب صنعتی جدیدGPU بلک ول وعده داده است که ابزاری کلیدی برای محاسبات سریع، پردازش انقلابی داده، شبیه‌سازی مهندسی، طراحی دارو، محاسبات کوانتومی و هوش مصنوعی مولد در مقیاس بزرگ باشد.

به هر حال، انویدیا قول داد مشکلات مرکز داده را حل کند، و این همان کاری است که با سوپرچیپ A100 مبتنی بر معماری Ampere در سال 2019 انجام داد. تا سال 2022، هدف NVIDIA مشخص بود: پیشرفت چشمگیر هوش مصنوعی برای هدایت زیرساخت های هوش مصنوعی جهانی، و آنچه آنها با سوپرتراشه معماری H100 Hopper انجام دادند. چه نمونه ای بهتر از پردازش هوش مصنوعی مولد و مدل زبان بزرگ (LLM) که هر دو از طریق آموزش و استفاده از سخت افزار NVIDIA به وجود آمده اند؟ امروز، همانطور که توسط جنسن هوانگ، بنیانگذار و مدیر عامل NVIDIA اعلام شده است، امروز نمی توانید یک روز را بدون شنیدن، استفاده یا دیدن ثمرات هوش مصنوعی مولد و بدون اینکه “فناوری تعیین کننده زمان ما” باشید، سپری کنید. جای تعجب نیست که این میلیاردر شاخص ثروت شخصی در زمان های اخیر به طور قابل توجهی افزایش یافته است قیمت سهام این شرکت در بالاترین حد خود قرار دارد در تاریخ خود

مروری کوتاه بر ظهور NVIDIA فراتر از دنیای بازی و سفر آن به انقلاب صنعتی جدید.

معماری بلک‌ول GPU مبتنی بر افتخارات معماری قبلی هاپر است. او آمار دیوانه وار درجه یک مانند تا عملکرد استنتاج 30 برابر، 4 برابر در عملکرد تمرینیو چشمگیر کاهش 25 برابری در مصرف انرژی و هزینه های عملیاتی برای استنتاج LLM همراه با یک کامپایلر جدید. به رخ کشیدن بیش از 200 میلیارد ترانزیستورTHE Nvidia B200 پردازنده Blackwell از پیشرفت های زیادی برای دستیابی به این اعداد دیوانه کننده سود می برد.

  امکان نسخه Lenovo ThinkCentre M70a AIO با سیستم عامل اندروید

این معماری جدید که به افتخار دیوید هارولد بلکول، ریاضیدان متخصص در تئوری بازی ها و آمار و اولین محقق سیاه پوست که به آکادمی ملی علوم معرفی شد، نامگذاری شده است، معماری جدید جانشین معماری هاپر می شود که فقط دو سال پیش راه اندازی شد.

با یک وعده بزرگ برای حفظ، اینها هستند شش “معجزه” یا پیشرفت هایی که پردازنده NVIDIA B200 Blackwell را به واقعیت تبدیل کرد: –

1) قوی ترین تراشه در جهان

برای مشاهده تصویر بزرگتر کلیک کنید.  (منبع: Nvidia)

بهره مندی از یک بزرگ 208 میلیارد ترانزیستور، پردازنده گرافیکی Blackwell در واقع از دو تا از بزرگترین قالب های ممکن TSMC تشکیل شده است و در یک GPU واحد متحد شده اند. اگر متوجه اندازه‌های قبلی تراشه‌های سوپرتراشه‌های NVIDIA شده‌اید، به لطف TSMC ایده بزرگ‌ترین اندازه تراشه ممکن را خواهید داشت. ساخته شده برای اندازه گیری فرآیند TSMC 4NP این دو تراشه که برای نیازهای محاسباتی تسریع شده طراحی شده اند، توسط یک پیوند تراشه به تراشه 10 ترابایت در ثانیه به یکدیگر متصل می شوند تا به عنوان یک واحد پردازش گرافیکی واحد و یکپارچه عمل کنند. این اتصال بافت به تنهایی می تواند یک معجزه متمایز در نظر گرفته شود.

اثبات 192 گیگابایت HBM3 (جهشی بزرگ از 80 گیگابایت H100)، و ترکیبی پهنای باند حافظه 8 ترابایت بر ثانیه (به جای 3 ترابایت بر ثانیه)، افزایش گسترده در پهنای باند حافظه مطمئناً برای مطابقت با قابلیت های توان عملیاتی کلی تراشه مفید است.

2) موتور ترانسفورماتور نسل دوم

برای یادآوری، NVIDA برای اولین بار یک موتور Transformer را در معماری Hopper معرفی کرد تا به طور خاص مدل‌های یادگیری عمیق را هدف قرار دهد که یادگیری خود نظارتی را ممکن می‌سازد و تا حد زیادی پردازش زبان طبیعی، خلاصه‌های متن و بینایی رایانه را فعال می‌کند. همانطور که اکنون می توانید درک کنید، امروزه اینها زمینه های اصلی استفاده از هوش مصنوعی مولد هستند. ما در اینجا با جزئیات بیشتری به این موضوع پرداخته ایم. در پردازنده گرافیکی بلک ول، NVIDIA با افزودن فرمت های پردازشی بیشتر، قابلیت های موتور Transformer را گسترش داده است. استنتاج FP4 و FP6 AIکه به مقیاس‌بندی پیچیدگی مدل و در نتیجه بهبود کارایی پردازش یا مقابله با اندازه‌های مدل بزرگتر کمک می‌کند.

  بهترین معاملات خانه هوشمند Keen و SOHO از Comex 2024

3) نسل پنجم NVLink

(منبع تصویر: Nvidia)

معماری گرافیکی مقیاس‌پذیر NVIDIA به اندازه یک واحد پردازش گرافیکی بلک‌ول B200 از طریق اتصال GPU به GPU با پهنای باند بالا، کم مصرف، تأخیر کم و بدون تلفات NVLink، یک توانمندساز حیاتی برای عملکرد چند محاسباتی است. -گره‌های عظیم، و این رشد زیادی با هر نسل، هم از نظر توان عملیاتی و هم از نظر ظرفیت پخش داشته است.

آخرین نسل پنجم NVLink لاف می زند پهنای باند دو طرفه 1.8 ترابایت بر ثانیه در هر پیوند و بیشتر گسترش می یابد تا 576 پردازنده گرافیکیs (این دو برابر حد H100 است) در هر دامنه NVLink. برای پشتیبانی از بسیاری از GPUهای متصل به هم، نیاز به یک نسل بعدی NVSwitchکه از سرعت NVLink 1.8 ترابایت بر ثانیه نیز پشتیبانی می کند. آنقدر پیچیده است که به تنهایی 3.6 TFLOPS محاسبات شبکه ای برای کمک به تخلیه برخی از عملیات از شبکه عصبی دارد.

4) موتور RAS

GPU B200 Blackwell دارای یک موتور RAS داخلی است تا مراکز داده ساخته شده، حتی در مقیاس بزرگتر، بتوانند به طور مداوم سلامت آن را 24/7 نظارت کنند. یک مخفف رایج در دنیای تجارت، RAS به قابلیت اطمینان، در دسترس بودن و قابلیت خدمات اشاره دارد. با یک موتور خودآزمایی داخلی، این قابلیت دسترسی سیستم را به حداکثر می‌رساند و انعطاف‌پذیری را بهبود می‌بخشد زیرا اندازه استقرار مقیاس‌پذیر به طور قابل توجهی از نسلی به نسل دیگر افزایش می‌یابد.

5) هوش مصنوعی ایمن

در حالی که معماری هاپر پیشگام پشتیبانی از محاسبات محرمانه بود، معماری بلک‌ول با پشتیبانی از پروتکل‌های رمزگذاری بومی جدید فراتر رفت. صنایع حساس به حریم خصوصی، مانند خدمات بهداشتی و مالی که از پردازنده های Blackwell استفاده می کنند، از آن استقبال خواهند کرد.

6) موتور رفع فشار

از آنجایی که پردازش داده ها به طور فزاینده ای توسط GPU تسریع می شود، مشاغل می خواهند بهترین عملکرد را از پردازش داده های تحلیلی داشته باشند. با موتور فشرده‌سازی 800 گیگابایت بر ثانیه اختصاصی داخلی که از جدیدترین فرمت‌های داده‌های فشرده پشتیبانی می‌کند، GPU بلک‌ول می‌تواند بر روی فرمت‌های داده‌های فشرده کار کند بدون اینکه منتظر بماند تا CPU ابتدا کار رفع فشرده‌سازی را انجام دهد.

مقیاس بندی معماری بلک ول و معرفی یک واحد محاسباتی جدید در مقیاس رک

ابرکک گریس هاپر را به خاطر دارید؟ اکنون می توانید a سوپرچیپ گریس بلکول GB200 چه کسی پیوند می دهد دو پردازنده گرافیکی B200 و پردازنده NVIDIA Grace arm از طریق اتصال 900 گیگابایتی بر ثانیه NVLink چیپ به تراشه (C2C). اگرچه بلک ول می تواند از سرعت انتقال NVLink سریع تری استفاده کند، اما پردازنده گریس هنوز از این سرعت پشتیبانی نمی کند و از آخرین نسل استاندارد انتقال استفاده خواهد کرد.

  چگونه با آیفون 15 پرو و ​​15 پرو مکس خود عکس های بهتری بگیرید

(منبع تصویر: Nvidia)

اما به اینجا ختم نمیشود. GB200 یکی از اجزای اصلی سیستم NVLink چند نود جدید NVIDIA، خنک‌کننده مایع و در مقیاس رک برای بارهای کاری فشرده است. 72 پردازنده گرافیکی بلک ول و 36 پردازنده گریس به طور کامل روی یک ستون فقرات NVLink Switch Rack به هم متصل هستند. ملقب به NVIDIA GB200 NVL72همچنین دارای پردازنده‌های گرافیکی NVDIA Bluefield 3 برای ارائه شتاب شبکه ابری، امنیت غیرقابل اعتماد و کشش محاسباتی GPU در یک سیستم ابری هوش مصنوعی انعطاف‌پذیر و مقیاس‌پذیر است.

(منبع تصویر: Nvidia)

GB200 NVL72 دارای یک 30 برابر افزایش عملکرد نسبت به همان تعداد پردازنده گرافیکی H100 در بارهای کاری استنتاج LLM، در حالی که با بهبود عملکرد بلک ول، هزینه های عملیاتی و مصرف برق را نیز کاهش می دهد. این پلتفرم همچنین به عنوان یک واحد پردازش گرافیکی با 1.4 اگزافلاپس از عملکرد هوش مصنوعی و 30 ترابایت حافظه ترکیبی برای بلوک سازنده نسل بعدی DGX SuperPOD عمل می کند.

(منبع تصویر: Nvidia)

در انتهای دیگر مقیاس نیز الف وجود دارد برد سرور HGX B200 که می تواند تا هشت پردازنده گرافیکی B200 را به یک پلتفرم هوش مصنوعی مبتنی بر x86 متصل کند. یک نوع ابرکامپیوتر جمع و جورتر خواهد بود DGX B200 ارائه یک طراحی مقیاس پذیر با هوا خنک. برای مرجع، تجسمات گذشته آن DGX H100 و DGX A100 ابررایانه شخصی هستند.

Blackwell همچنین به زودی از طریق Cloud Computing Partners در دسترس است

(منبع تصویر: Nvidia)

گره سوپرتراشه GB200 به DGX Cloud NVIDIA و همچنین شرکای زیرساخت ابری مانند AWS، Google Cloud، Microsoft Azure و Oracle Infrastructure هدایت می‌شود تا نمونه‌های محاسباتی مبتنی بر Blackwell را ارائه دهد.

در ادامه بخوانید

1) قدرت پردازنده گرافیکی Blackwell که در NVIDIA Drive Thor ادغام شده است، تجربیات Gen AI را در ماشین بعدی شما آزاد می کند.

2) NVIDIA پروژه ای را برای حمایت از توسعه ربات های انسان نما آغاز می کند

منبع: https://www.hardwarezone.com.sg/feature-nvidia-blackwell-b200-gpu-will-tackle-xl-sized-generative-ai-models-secure-accelerated-computing