انویدیا و اینتل میتوانند با این روش مخفی در نبرد رایانههای شخصی هوش مصنوعی پیروز شوند.
گرافیک مجتمع را فراموش کنید. قدرت واقعی این اتحاد در معماری حافظه نهفته است.

انویدیا و اینتل میتوانند با این روش مخفی در نبرد رایانههای شخصی هوش مصنوعی پیروز شوند.
اگر در جریان نبودهاید، انویدیا در حال سرمایهگذاری ۵ میلیارد دلاری در اینتل است. به گفته جنسن هوانگ، مدیرعامل انویدیا، این اتحاد هیجانانگیز انویدیا-اینتل، منجر به خلق «تراشههای سیستم-روی-چیپ (SoCs) اینتل x86 با ادغام چیپلتهای پردازندهی گرافیکی (GPU) انویدیا میشود که بهترین CPU و GPU جهان را در هم میآمیزند.» این میتواند همان تزریقی باشد که اینتل برای رهایی از وضعیت نامطلوب و اصلاح مسیر نزولی خود به آن نیاز دارد.
به گزارش اپست به نقل از pcworld ، اما این ادغام فقط در مورد، مثلاً، بهبود گرافیک یکپارچه Arc اینتل نیست. در واقع این یک گام به سوی سلطهی رایانههای شخصی مبتنی بر هوش مصنوعی (AI PC) است. مدتهاست که پردازندههای گرافیکی انویدیا بهترین سختافزار برای بارهای کاری هوش مصنوعی محلی بودهاند، اما محدودیت VRAM (حافظهی دسترسی تصادفی ویدئویی) دارند. انویدیا با کمک اینتل، میتواند سرانجام این گلوگاه را حل کند—با توسعهی همان قدرتی که اپل از آن بهره میبرد.
منظورم حافظهی یکپارچه است.
یک رایانهی شخصی دسکتاپ مدرن را تصور کنید که مجهز به CPU اینتل و GPU انویدیا است. CPU اینتل به RAM روی مادربرد متکی است، در حالی که GPU انویدیا به VRAM داخلی خود متکی است. برای برقراری ارتباط، آنها باید دادهها را بین RAM و VRAM جابجا کنند—و این کند است.
برای بازیهای رایانهای، این یک مشکل اساسی نیست. به عنوان مثال، یک Nvidia GeForce RTX 5080 دارای ۱۶ گیگابایت VRAM است و این برای بازیها کافی است. اما برای وظایف محاسباتی GPU، VRAM اساساً فضای کاری دادهها است، بنابراین VRAM بیشتر بهتر است. این امر برای مدلهای زبان بزرگ (LLMs) محلی و سایر وظایف هوش مصنوعی محلی، و همچنین برای هرگونه بار کاری CUDA روی پردازندههای گرافیکی انویدیا، بسیار حیاتی است.
به عبارت دیگر: اگر میخواهید یک LLM محلی را روی دسکتاپ خود اجرا کنید، باید در حافظهی پردازندهی گرافیکی شما جا بگیرد. یک رایانهی دسکتاپ با ۱۲۸ گیگابایت RAM زیاد دارید؟ فرقی نمیکند. اگر پردازندهی گرافیکی شما فقط ۱۶ گیگابایت VRAM داشته باشد، این حد شماست—و این برای نسل بعدی هوش مصنوعی کافی نیست.

بله، انویدیا دارای بالغترین سیستم محاسباتی مبتنی بر پردازنده گرافیکی (GPU) و سریعترین و قدرتمندترین پردازندههای گرافیکی در جهان است. اما برای بهرهبرداری از آنها در کارهای نیازمند به حافظه زیاد، به مقدار زیادی VRAM (حافظه دسترسی تصادفی ویدئویی) نیاز دارید. در نقطهای مشخص، دیگر مسئله سرعت پردازنده گرافیکی نیست – مسئله این است که چند گیگابایت داده را میتوانید برای دسترسی مستقیم و سریع در حافظه پردازنده گرافیکی جا دهید.
اینجا حافظه یکپارچه (unified memory) وارد میشود. میتوانید حافظه یکپارچه را به عنوان یک استخر واحد از RAM (حافظه دسترسی تصادفی) در نظر بگیرید که بین CPU (واحد پردازش مرکزی) و GPU مشترک است. با حافظه یکپارچه، ارتباط بین CPU و GPU سریعتر است زیرا دادهها نیازی ندارند دائماً از RAM به VRAM و بالعکس منتقل شوند. همچنین، میزان RAM که پردازنده گرافیکی به آن دسترسی دارد را گسترش میدهد.
حال، اجازه دهید واضح بگویم: اینتل و انویدیا هنوز حافظه یکپارچه را اعلام نکردهاند. حداقل نه هنوز. اما آنها چیزی نزدیک به آن را اعلام کردهاند: ادغام یک چیپلت پردازنده گرافیکی انویدیا در همان بسته SoC (سیستم روی تراشه) با یک CPU اینتل، که با NVLink به هم متصل شدهاند. و در محصولات مرکز داده آنها، NVLink-C2C به CPU و GPU اجازه میدهد حافظه را به اشتراک بگذارند. آشنا به نظر میرسد؟
AMD، اپل و کوالکام همگی از قبل دارای حافظه مشترک هستند.
در بخش مک، تراشههای سیلیکون اپل (Apple Silicon) نماد حافظه یکپارچه (unified memory) هستند. میتوانید یک مکبوک با ۱۲۸ گیگابایت حافظه یکپارچه خریداری کنید، و آن حافظه میتواند هم توسط CPU و هم GPU مکبوک استفاده شود.
در همین حال، یک Nvidia GeForce RTX 5090 دارای ۳۲ گیگابایت VRAM است. برای بارهای کاری هوش مصنوعی (AI workloads) که در آنها ظرفیت حافظه عامل محدودکننده است، یک مکبوک میتواند عملکرد بهتری نسبت به یک کامپیوتر دسکتاپ قوی با یک CPU رده بالای اینتل و یک RTX 5090 داشته باشد، حتی با وجود اینکه GPU انویدیا RTX بسیار سریعتر از GPU اپل است.
همچنین معماری APU شرکت AMD (که حافظه سیستمی مشترک بین CPU و GPU ارائه میدهد)، Snapdragon X کوالکام (که مانند اپل حافظه یکپارچه دارد)، و پلتفرم Lunar Lake اینتل (که حافظه روی پکیج مشترک بین CPU و GPU دارد) نیز وجود دارند.

AMD’s Ryzen AI Max+ تا حداکثر ۱۲۸ گیگابایت حافظه را پشتیبانی میکند، اما بسیاری از ابزارهای هوش مصنوعی و بارهای کاری محاسباتی GPU برای CUDA، پلتفرم نرمافزاری انویدیا، طراحی شدهاند. بدون CUDA، ممکن است سیستم AMD با ابزارهایی که میخواهید اجرا کنید سازگار نباشد. (و آن GPUهای یکپارچه کوالکام و اینتل به سادگی به آن سرعت نیستند. در حال حاضر، تنها AMD و اپل واقعاً در این رقابت حضور دارند.)
اگرچه اپل، AMD، کوالکام و اینتل حافظه یکپارچه دارند، اما GPUهای قدرتمند انویدیا یا پلتفرم بالغ CUDA را که انویدیا را به استاندارد وظایف محاسباتی GPU تبدیل میکند، ندارند. با این حال، در حالی که CUDA یک استاندارد بالفعل است، صنعت در حال تلاش برای تغییر این وضعیت با فناوریهایی مانند Windows ML است. رقبا در حال کاهش دادن برتری انویدیا در این زمینه هستند.
برای اینکه انویدیا دوباره پیشی بگیرد، باید راهی پیدا کند که GPUهایش بتوانند به مجموعه اصلی حافظه یک سیستم دسترسی پیدا کنند— درست همانطور که اپل، AMD و کوالکام در حال حاضر در SoCهای خود این اجازه را میدهند. اگر مدلهای هوش مصنوعی و دادهها نتوانند در VRAM راهکار محاسباتی GPU انویدیا جا بگیرند، واقعاً مهم نیست که انویدیا قویترین راهکار محاسباتی GPU را داشته باشد.
غیر رسمی است، اما سرنخها وجود دارند
در اطلاعیه رسمی انویدیا، این شرکت میگوید: «اینتل قرار است تراشههای سیستم-روی-تراشه (SOC) x86 را بسازد و به بازار عرضه کند که شامل چیپلتهای پردازنده گرافیکی (GPU) انویدیا RTX هستند. این SOCهای جدید x86 RTX، طیف وسیعی از رایانههای شخصی را که نیازمند ادغام پردازندههای مرکزی و گرافیکی در سطح جهانی هستند، پشتیبانی خواهند کرد.» و در اطلاعیه رسمی اینتل، این دو شرکت «بر اتصال یکپارچه معماریهای انویدیا و اینتل با استفاده از NVLink انویدیا تمرکز خواهند کرد.»
بنابراین، بله، جزئیات زیادی در اینجا وجود ندارد و نه انویدیا و نه اینتل در مورد حافظه صحبت نمیکنند. آیا حافظه روی خود پردازنده گرافیکی خواهد بود؟ خب، انویدیا این را به عنوان «کلاس جدیدی از گرافیکهای یکپارچه» توصیف میکند. در حال حاضر، تمام SOCهای اصلی با گرافیک یکپارچه – از اپل، AMD، کوالکام و حتی خود اینتل – از حافظه یکپارچه (unified) یا مشترک (pooled) استفاده میکنند. (برخی پلتفرمها حافظه را در سطح سختافزاری یکپارچه دارند، در حالی که برخی دیگر فقط دسترسی پردازنده گرافیکی به رم سیستم را سریع میکنند. نکته کلیدی این است که پردازنده گرافیکی فقط به مقدار کمی VRAM خودش محدود نمیشود.)

انویدیا و اینتل هنوز زمان عرضه سختافزار با این معماری را اعلام نکردهاند، اما تحلیلگران متعددی انتظار سال ۲۰۲۷ را دارند. با این حال، این یک مشارکت یکباره نیست و ادامه خواهد یافت. اولین پکیج SoC آخرین نخواهد بود، و معماری احتمالاً تکامل خواهد یافت… و من معتقدم که به سمت ادغام نزدیکتر بین پردازندههای مرکزی (CPU) اینتل و پردازندههای گرافیکی (GPU) انویدیا حرکت خواهد کرد.
بنابراین، در حالی که انویدیا و اینتل به طور رسمی حافظه یکپارچه (unified memory) را اعلام نکردهاند – در واقع، آنها هیچ چیز در مورد حافظه نگفتهاند – به نظر میرسد که این یک مسیر هوشمندانه است. تمام صحبتها در مورد یک “SoC غولپیکر مجازی” که در آن CPU و GPU “به طور یکپارچه به هم متصل هستند”، یک اشاره قوی به سمت و سوی این همکاری است، و NVLink نیز یک سرنخ بزرگ دیگر است. انویدیا در محصولات مرکز داده خود شکلی از NVLink (به نام NVLink-C2C) دارد که به CPUها و GPUها اجازه میدهد از یک مجموعه حافظه مشترک استفاده کنند. (البته تضمینی نیست که این همان چیزی باشد که در این همکاری رخ خواهد داد – به ویژه در نسل اول.)
اجازه دهید برای یک لحظه کلاه حدس و گمان آگاهانه خود را بگذارم: انویدیا و اینتل هر دو دوست دارند یک معماری حافظه یکپارچه ارائه دهند، اما رسیدن به آن چندین نسل سختافزاری زمان خواهد برد، و شرط میبندم که مهندسان انویدیا و اینتل در حال حاضر که ما صحبت میکنیم، در حال بحث در مورد این موضوع هستند. محصول نسل اول احتمالاً حافظه یکپارچه واقعی نخواهد بود – اگر چنین بود، اینتل و انویدیا در بیانیههای مطبوعاتی خود آن را با هیجان تبلیغ میکردند – اما تقریباً مطمئناً در حال حرکت به آن سمت هستند.
ما باید منتظر جزئیات بیشتری باشیم، اما انویدیا بالاخره یک مسیر قابل قبول برای در هم شکستن رقبای خود در نبردهای رایانه شخصی هوش مصنوعی دارد. انویدیا در حال حاضر بهترین سیستم GPU را دارد؛ تنها قطعه گم شده حافظه است. با همراهی اینتل، انویدیا اکنون یک نقشه راه برای رسیدن به جایی که باید باشد، در اختیار دارد. اما انویدیا و اینتل برای ارائه محصول مناسب به زمان نیاز خواهند داشت، و من انتظار دارم که به همین دلیل است که هنوز در مورد حافظه صحبت نمیکنند. منتظر بمانید.






