logo
ISSN 2734-9020

NVIDIA chuẩn bị công bố hợp tác với Groq và kiến trúc Feynman tại GTC 2026, hé lộ hướng đi mới cho AI

Thứ hai, 16/03/2026 - 07:10

GTC 2026 sẽ chứng kiến NVIDIA hiện thực hóa thỏa thuận với Groq, giới thiệu dòng chip Feynman thế hệ mới cùng nhiều thay đổi lớn về kiến trúc và giải pháp AI.

Hội nghị GTC 2026, một trong những sự kiện quan trọng nhất trong lĩnh vực trí tuệ nhân tạo, đang đến gần và được kỳ vọng sẽ mang lại những thay đổi lớn về cách nhìn nhận về điện toán. Trong vài năm qua, cuộc đua về hạ tầng AI đã phát triển mạnh mẽ, buộc các công ty như NVIDIA và AMD phải liên tục đổi mới để đáp ứng các yêu cầu tính toán ngày càng cao. Từ năm 2022, các tác vụ huấn luyện AI đã trở nên phổ biến, giúp các kiến trúc Hopper và Blackwell của NVIDIA phát huy thế mạnh. Tuy nhiên, sang năm 2026, các tác vụ agentic (tác vụ đại diện) sẽ là trọng tâm mới, và các thông báo tại GTC sắp tới của NVIDIA sẽ xoay quanh chủ đề này, với khái niệm 'agentic performance' được nhấn mạnh.

Một điểm nhấn lớn tại GTC 2026 là việc NVIDIA sẽ hiện thực hóa thỏa thuận hợp tác với Groq, đánh dấu bước chuyển đầu tiên khỏi mô hình tính toán chỉ dựa trên GPU. Theo các nguồn tin, NVIDIA sẽ tích hợp các đơn vị xử lý LPU của Groq vào hệ thống Vera Rubin, tạo ra cấu hình tính toán lai (hybrid compute tray) với các LPU, cho phép tận dụng khả năng suy luận rời rạc (disaggregated inference). Có nhiều giả thuyết về cách tích hợp LPU vào Rubin, trong đó khả năng các khay tính toán sẽ có 64, 128 hoặc 256 đơn vị LPU, kết nối với GPU Rubin qua NVLink Fusion. Giám đốc điều hành Jensen Huang từng so sánh vai trò của Groq với Mellanox trước đây, cho thấy LPU sẽ bổ trợ cho các giai đoạn tác vụ như giải mã. Rubin CPX đã giúp NVIDIA xử lý các tác vụ prefill, đồng nghĩa với việc hãng đã kiểm soát hai giai đoạn chính trong quy trình suy luận truyền thống.

NVIDIA chuẩn bị công bố hợp tác với Groq và kiến trúc Feynman tại GTC 2026, hé lộ hướng đi mới cho AI - Ảnh 1.

Về mặt kiến trúc, NVIDIA đang hướng tới một sự thay đổi lớn, chuyển từ mô hình chỉ dựa vào GPU sang các cấu hình đa dạng, nhắm tới từng loại tác vụ cụ thể. Điều này cho thấy cách tiếp cận "chỉ GPU" đã trở nên lỗi thời khi các tác vụ AI ngày càng phức tạp.

NVIDIA chuẩn bị công bố hợp tác với Groq và kiến trúc Feynman tại GTC 2026, hé lộ hướng đi mới cho AI - Ảnh 2.

Bên cạnh đó, NVIDIA cũng sẽ giới thiệu dòng chip AI thế hệ mới mang tên Feynman. Sau khi Vera Rubin đã đi vào sản xuất hàng loạt, Feynman sẽ là tâm điểm tiếp theo. Theo thông tin hiện có, Feynman sẽ sử dụng tiến trình A16 của TSMC và NVIDIA sẽ là khách hàng độc quyền của tiến trình này do tính chất đặc thù. Dòng chip mới cũng sẽ ứng dụng công nghệ hybrid bonding của TSMC, có thể là SoIC hoặc EMIB, và nhiều khả năng sẽ tích hợp trực tiếp các LPU của Groq lên đế tính toán Feynman nhờ không gian kết nối phía trước mà tiến trình A16 cung cấp. Ngoài ra, cũng có tin đồn NVIDIA đang cân nhắc sử dụng tiến trình 14A của Intel cho Feynman, nhưng chưa có xác nhận chính thức.

Về dòng sản phẩm Vera Rubin, NVIDIA vẫn tiếp tục mở rộng với các hệ thống như DGX NVL8, NVL72, Rubin CPX và đặc biệt là kiến trúc rack-scale NVL576. Tại CES 2026, NVIDIA đã trình diễn NVL72 với 72 chip, nhưng đây mới chỉ là cấu hình cơ bản. Hãng còn hướng tới các hệ thống NVL144 và NVL576, dù có thể NVL144 sẽ không xuất hiện do nhu cầu thực tế từ khách hàng. Rubin CPX cũng đã được giới thiệu như một giải pháp rack-scale tập trung vào tác vụ prefill, tuy nhiên vẫn chưa có nhiều thông tin về các triển khai thực tế.

NVIDIA chuẩn bị công bố hợp tác với Groq và kiến trúc Feynman tại GTC 2026, hé lộ hướng đi mới cho AI - Ảnh 3.

Đáng chú ý nhất là NVL576, khi NVIDIA sẽ chuyển sang thế hệ "Kyber" mới với cấu trúc khay tính toán xếp dọc (vertical blades) và mô hình cấp nguồn 800 VDC từ cơ sở đến rack. NVL576 sẽ thuộc dòng Rubin Ultra GPU, với sự thay đổi lớn về cấu hình chiplet. Ngoài ra, NVIDIA cũng sẽ chuyển từ kết nối đồng sang quang học với các switch CPO (Co-Packaged Optics), nhằm giải quyết các hạn chế về nhiệt và tăng băng thông, giảm độ trễ trong cấu hình 576 GPU.

NVIDIA chuẩn bị công bố hợp tác với Groq và kiến trúc Feynman tại GTC 2026, hé lộ hướng đi mới cho AI - Ảnh 4.

NVIDIA cũng có thể trình diễn hệ thống NVL1,152 tại GTC 2026, nhưng điều này còn phụ thuộc vào sự phát triển của các hệ thống rack. Ngoài các sản phẩm GPU, NVIDIA dự kiến sẽ công bố các hợp tác mới về CPU, trong đó có sự tham gia của Intel.

GTC 2026 sẽ khai mạc vào ngày 16/3 với bài phát biểu của Jensen Huang lúc 11:00 sáng theo giờ Thái Bình Dương.

Max