اوراکل با ابرکامپیوتر Zettascale10 به سطح ۱۶ زتافلاپس دست پیدا میکند

شرکت اوراکل بهتازگی اعلام کرده است که بزرگترین ابرکامپیوتر برای هوش مصنوعی در فضای ابری، تحت نام OCI Zettascale10 را معرفی نموده است. این شرکت مدعی است که این سیستم قادر است به اوج عملکردی معادل ۱۶ زتافلاپس دست یابد و برای این منظور از حدود ۸۰۰ هزار پردازنده گرافیکی انویدیا در مراکز داده مختلف استفاده میکند. اگر این توان را تقسیمبندی کنیم، هر پردازنده گرافیکی تقریباً به ۲۰ پتافلاپس میرسد که با تراشه Grace Blackwell GB300 Ultra همخوانی دارد.
به نقل از نشریه تخصصی تکنولوژی تکنا در بخش صنایع زیرساخت، این پلتفرم بهعنوان زیرساخت اصلی خوشه Stargate متعلق به شرکت OpenAI مستقر در ابیلین تگزاس عمل میکند. این مجموعه برای مدیریت برخی از سنگینترین بارهای کاری مربوط به هوش مصنوعی نوظهور طراحی شده است که در تحقیقات و کاربردهای تجاری به کار میرود. پیتر هوشله از OpenAI تأکید دارد که طراحی خاص و مقیاسپذیر RoCE به حداکثر رساندن عملکرد اجزای شبکه (fabric) در مقیاس گیگاواتی کمک کرده و بیشتر تمرکز را بر روی پردازشهای محاسباتی حفظ میکند.
در مرکز سیستم Zettascale10، شبکه Oracle Acceleron RoCE قرار دارد که برای افزایش مقیاسپذیری و اطمینان در عملیات سنگین هوش مصنوعی طراحی شده است. این معماری از کارتهای رابط شبکه بهعنوان سوئیچهای کوچک بهره میبرد. این کارتها پردازندههای گرافیکی را در چندین صفحه شبکه ایزوله به یکدیگر متصل میکنند. هدف این طراحی کاهش تأخیر میان پردازندههای گرافیکی است.
این ساختار همچنین اجازه میدهد در صورت بروز نقص در یک مسیر شبکه، فرآیندها بدون وقفه به کار خود ادامه دهند. ایان باک از انویدیا اشاره کرد که OCI Zettascale10 با تکیه بر زیرساخت جامع هوش مصنوعی انویدیا، بستر محاسباتی لازم برای ارتقاء تحقیقات پیشرفته در حوزه هوش مصنوعی را فراهم میآورد. این سیستم به سازمانهای جهانی کمک میکند تا از مرحله آزمایش به روند صنعتیشدن هوش مصنوعی منتقل شوند.
اوراکل اعلام کرده است که این معماری میتواند با کاهش لایهها در شبکه، هزینهها را به حداقل برساند و همزمان عملکرد ثابتی را در تمام گرهها حفظ کند. این سیستم همچنین از فناوریهای نوری خطی قابل اتصال و گیرنده بهره میبرد تا مصرف انرژی و نیاز به خنککننده را کاهش دهد، بدون اینکه بر پهنای باند تأثیر بگذارد.
با این حال، علیرغم ارقام قابل توجه اوراکل، این شرکت هیچ تأییدیه مستقل برای ادعای ۱۶ زتافلاپس خود ارائه نکرده است. معیارهای اندازهگیری عملکرد ابری میتواند بسته به نحوه محاسبه توان عملیاتی، متنوع باشد. ممکن است مقایسههای اوراکل به جای استفاده از نرخهای پایدار، به اوجهای نظری تکیه کند.
با توجه به اینکه مجموع نیروهایی که به صورت تبلیغاتی اعلام شده، معادل با ۸۰۰ هزار پردازنده گرافیکی پیشرفته است، عملکرد واقعی میتواند به شدت تحت تأثیر طراحی شبکه و بهینهسازی نرمافزار قرار گیرد. تحلیلگران احتمالاً در انتظار نتیجهگیری خواهند بود که آیا این پیکربندی امکان ارائه بهترین عملکرد را در برابر خوشههای هوش مصنوعی پیشرو که پیشتر توسط سایر ارائهدهندگان بزرگ ابری راهاندازی شدهاند، دارد یا خیر.
سیستم Zettascale10 اوراکل را در کنار دیگر بازیگران برجسته قرار میدهد که در تلاشند زیرساختهای لازم برای پشتیبانی از بهترین پردازندههای گرافیکی و ابزارهای هوش مصنوعی را ارائه کنند. این شرکت اعلام کرده است که مشتریان قادر خواهند بود مدلهای بزرگ را در محیط ابری توزیعشده اوراکل آموزش داده و مستقر سازند. این فرآیند تحت پشتیبانی تدابیر حاکمیت داده قرار دارد.
اوراکل همچنین ادعا میکند که Zettascale10 انعطافپذیری عملیاتی را با نگهداری مستقل در سطح صفحه فراهم میآورد که بهروزرسانیها را با حداقل زمان downtime میسر میسازد. ماهش تیاگاراجان از اوراکل توضیح داده است که این شرکت شبکه Oracle Acceleron RoCE را با زیرساخت هوش مصنوعی نسل آینده انویدیا ترکیب کرده است تا ظرفیتهای هوش مصنوعی چند گیگاواتی را در مقیاس بینظیری ارائه کند.
به گفته او، مشتریان قادر خواهند بود بزرگترین مدلهای هوش مصنوعی خود را با مصرف انرژی کمتر طراحی، آموزش و به تولید برسانند. آنها همچنین در سراسر ابر توزیعشده اوراکل آزادی عمل خواهند داشت که از حاکمیت قوی داده و هوش مصنوعی بهرهمند است. با این حال، ناظران هشدار میدهند که دیگر ارائهدهندگان نیز در حال ایجاد خوشههای پردازنده گرافیکی بزرگ و سیستمهای ذخیرهسازی ابری پیشرفتهای هستند که میتواند به کاهش برتری اوراکل منجر شود.
این سیستم در سال آینده به بازار عرضه خواهد شد و تنها زمان مشخص خواهد کرد که آیا این معماری میتواند نیاز به محاسبات هوش مصنوعی مقیاسپذیر، کارآمد و قابل اعتماد را برآورده سازد یا خیر.


