Nvidia sắp ra chip AI mới, tái định hình cuộc đua điện toán

Thanh Minh

02/03/2026

Nvidia đang thiết kế một hệ thống xử lý mới chuyên biệt cho inference, dự kiến công bố tại hội nghị nhà phát triển GTC ở San Jose trong tháng này...

Trước sức ép ngày càng lớn từ các đối thủ và làn sóng AI tác nhân (agentic AI), Nvidia được cho là sắp ra mắt một nền tảng xử lý mới chuyên cho tác vụ “inference” – giai đoạn giúp mô hình AI trả lời truy vấn người dùng.

Động thái này không chỉ đánh dấu bước chuyển chiến lược quan trọng của hãng chip đồ họa số một thế giới, mà còn có thể làm thay đổi cục diện cạnh tranh trong ngành hạ tầng AI toàn cầu.

THAM VỌNG THỐNG LĨNH SUY LUẬN AI

Theo Wall Street Journal, trong nhiều năm qua, Nvidia gần như đồng nghĩa với sức mạnh tính toán cho AI. Các dòng GPU như Hopper, Blackwell hay Rubin của hãng được xem là tiêu chuẩn vàng cho việc huấn luyện các mô hình AI khổng lồ. Theo ước tính của nhiều nhà phân tích, Nvidia đang nắm giữ hơn 90% thị phần GPU phục vụ trung tâm dữ liệu AI.

Nếu như giai đoạn 2022–2024 là thời kỳ bùng nổ huấn luyện các mô hình nền tảng, thì từ năm 2025 trở đi, trọng tâm dần chuyển sang “inference” – quá trình vận hành mô hình để trả lời câu hỏi, sinh nội dung và thực thi tác vụ thực tế cho người dùng.

Tuy nhiên, thị trường AI đang bước vào một giai đoạn mới. Nếu như giai đoạn 2022–2024 là thời kỳ bùng nổ huấn luyện các mô hình nền tảng, thì từ năm 2025 trở đi, trọng tâm dần chuyển sang “inference” – quá trình vận hành mô hình để trả lời câu hỏi, sinh nội dung và thực thi tác vụ thực tế cho người dùng.

Theo các nguồn tin thân cận, Nvidia đang thiết kế một hệ thống xử lý mới chuyên biệt cho inference, dự kiến công bố tại hội nghị nhà phát triển GTC ở San Jose trong tháng này. Điểm đáng chú ý là nền tảng này sẽ tích hợp một con chip do startup Groq thiết kế – công ty mà Nvidia đã đạt thỏa thuận trị giá khoảng 20 tỷ USD vào cuối năm ngoái để cấp phép công nghệ và chiêu mộ đội ngũ lãnh đạo, bao gồm nhà sáng lập Jonathan Ross.

Groq phát triển kiến trúc “language processing unit” (LPU), khác biệt so với GPU truyền thống của Nvidia. Kiến trúc này được tối ưu hóa cho các tác vụ suy luận, đặc biệt là trong quá trình “decode” – khi mô hình AI tạo phản hồi từng từ một, vốn là phần chậm và tiêu tốn tài nguyên nhất.

Động thái này cho thấy Nvidia đang sẵn sàng điều chỉnh chiến lược cốt lõi. Trong nhiều năm, CEO Jensen Huang luôn khẳng định GPU của hãng đủ linh hoạt để vừa huấn luyện vừa suy luận. Nhưng trước sự dịch chuyển nhu cầu thị trường, Nvidia buộc phải phát triển các giải pháp chuyên biệt hơn, hiệu quả hơn về chi phí và điện năng.

SỨC ÉP TỪ OPENAI, GOOGLE, AMAZON VÀ LÀN SÓNG AI TÁC NHÂN

Sự thay đổi chiến lược của Nvidia không “vô tình diễn ra”. Trong năm qua, các đối thủ lớn như Google và Amazon đã đẩy mạnh phát triển chip riêng cho AI. Amazon tung ra dòng Trainium và Inferentia, còn Google tiếp tục mở rộng hệ sinh thái TPU phục vụ Google Cloud.

Ngay cả những khách hàng lớn nhất của Nvidia cũng bắt đầu tìm kiếm phương án thay thế. OpenAI – một trong những khách hàng tiêu thụ GPU lớn nhất thế giới – được cho là đã đồng ý trở thành một trong những khách hàng lớn nhất của bộ xử lý inference mới từ Nvidia. Trước đó, OpenAI công bố sẽ mua “năng lực suy luận chuyên dụng” từ Nvidia song song với khoản đầu tư 30 tỷ USD từ hãng chip này.

Tuy nhiên, OpenAI cũng không đặt toàn bộ trứng vào một giỏ. Họ đã ký thỏa thuận lớn sử dụng chip Trainium của Amazon, đồng thời thiết lập quan hệ hợp tác điện toán trị giá hàng tỷ USD với Cerebras – startup chuyên về chip tối ưu cho inference. CEO Cerebras, Andrew Feldman, tuyên bố sản phẩm của họ nhanh hơn GPU của Nvidia trong nhiều tác vụ suy luận.

Lý do của sự dịch chuyển này nằm ở làn sóng AI tác nhân – các hệ thống có khả năng tự động thực hiện chuỗi hành động thay mặt người dùng, từ viết mã, phân tích dữ liệu đến điều phối quy trình kinh doanh. Những ứng dụng này đòi hỏi khả năng suy luận liên tục, phản hồi nhanh, chi phí thấp và tiết kiệm năng lượng.

Trong thực tế, nhiều công ty vận hành AI tác nhân nhận thấy GPU truyền thống quá đắt đỏ và tiêu tốn điện năng khi triển khai ở quy mô lớn. Khi doanh thu AI ngày càng dựa vào mô hình thuê bao và khối lượng truy vấn khổng lồ, bài toán kinh tế của inference trở nên sống còn.

NVIDIA MỞ RỘNG KHỎI GPU, TÁI ĐỊNH NGHĨA VỊ THẾ TRONG HẠ TẦNG AI

Một ví dụ điển hình là mảng lập trình tự động – hiện được xem là một trong những ứng dụng AI doanh nghiệp sinh lời nhất. Công cụ Claude Code của Anthropic đang dẫn đầu thị trường, nhưng lại chủ yếu dựa vào hạ tầng chip của Amazon Web Services và Google Cloud, thay vì Nvidia. Trong khi đó, OpenAI kỳ vọng sử dụng nền tảng mới của Nvidia để nâng cấp Codex – đối thủ cạnh tranh trực tiếp của Claude Code.

Cuộc đua AI đang bước sang một chương mới – nơi hiệu quả, chi phí và tốc độ phản hồi quan trọng không kém quy mô mô hình. Nvidia, thay vì chỉ là “vua GPU”, đang cố gắng tái định nghĩa mình như nhà cung cấp hạ tầng toàn diện cho kỷ nguyên AI suy luận.

Một điểm đáng chú ý khác là Nvidia không còn chỉ đặt cược vào GPU. Truyền thống, hãng thường kết hợp CPU Vera với GPU Rubin trong các máy chủ trung tâm dữ liệu hiệu năng cao. Nhưng thực tế triển khai cho thấy một số khối lượng công việc AI tác nhân có thể chạy hiệu quả hơn chỉ với CPU.

Tháng này, Nvidia công bố mở rộng hợp tác với Meta, bao gồm lần triển khai CPU-only quy mô lớn đầu tiên để hỗ trợ các tác nhân AI phục vụ quảng cáo. Thỏa thuận này được xem là tín hiệu sớm cho chiến lược mới: Nvidia tìm cách “khóa chặt” các phân khúc AI bằng giải pháp linh hoạt hơn, thay vì chỉ bán GPU cao cấp.

Wall Street Journal cho rằng bối cảnh cạnh tranh hiện nay cho thấy thị trường AI đang phân mảnh nhanh chóng. Nếu như trước đây cuộc đua chủ yếu xoay quanh ai huấn luyện được mô hình lớn hơn, thì giờ đây câu hỏi chuyển sang: ai có thể vận hành mô hình hiệu quả nhất, rẻ nhất và ở quy mô lớn nhất?

Inference được chia thành hai bước chính: “pre-fill” – khi mô hình tiếp nhận và xử lý truy vấn ban đầu; và “decode” – khi mô hình tạo câu trả lời từng từ một. Decode thường chậm hơn và tiêu tốn tài nguyên hơn, đặc biệt với các mô hình lớn. Chính ở điểm nghẽn này, các kiến trúc mới như LPU của Groq hay wafer-scale engine của Cerebras tìm cách tạo lợi thế.

Với việc tích hợp công nghệ từ Groq và thuyết phục OpenAI trở thành khách hàng lớn, Nvidia đang gửi đi thông điệp rõ ràng: họ không chỉ muốn thống trị kỷ nguyên huấn luyện AI, mà còn quyết tâm dẫn đầu giai đoạn khai thác thương mại AI ở quy mô toàn cầu.

Từ khóa:

Dòng sự kiện:

Trí tuệ nhân tạo -AI

SK Hynix dự kiến chi tới 720 tỷ USD để mở rộng năng lực sản xuất chip AI. Ảnh: CNBC

SK Hynix bước vào câu lạc bộ nghìn tỷ USD, đặt cược tương lai vào "cơn sốt bộ nhớ AI"

Kết quả kinh doanh của hãng chip Hàn Quốc SK Hynix phản ánh rõ cơn sốt AI. Giới phân tích dự báo doanh thu năm 2026 của SK Hynix có thể tiếp tục tăng hơn ba lần, lên khoảng 235 tỷ USD...

07:46 11/07/2026

Thị trường chứng khoán Mỹ đã khép lại phiên giao dịch trong sắc đỏ khi nhóm cổ phiếu AI đồng loạt giảm sâu. Ảnh: AP

Cổ phiếu AI mất đà, từ Samsung đến Intel đều chịu áp lực bán mạnh

Đà tăng mạnh của nhóm cổ phiếu trí tuệ nhân tạo (AI) đã bất ngờ đảo chiều trong phiên giao dịch ngày 8/7, kéo theo sự suy giảm của các thị trường chứng khoán lớn trên thế giới...

10:38 10/07/2026

(Từ trái sang phải) Ông Ralf Reichert, Tổng Giám đốc của Esports Foundation; Hoàng tử Faisal bin Bandar bin Sultan, thành viên Hội đồng Quản trị của Esports Foundation; và Bà Marina Ferrari, Bộ trưởng Bộ Thể thao, Thanh niên và Đời sống Cộng đồng Pháp phát biểu tại buổi họp báo khai mạc Esports World Cup 2026 tại Paris.

Khai mạc Esports World Cup 2026 tại Paris

Esports World Cup 2026 chính thức khai mạc tại Paris, đánh dấu cột mốc lịch sử đưa giải đấu thể thao điện tử lớn nhất hành tinh vươn tầm thế giới với quỹ giải thưởng kỷ lục 75 triệu USD…

10:35 10/07/2026

DeepSeek là doanh nghiệp AI Trung Quốc từng gây tiếng vang lớn đầu năm 2025 và tiếp tục giới thiệu mô hình mới vào tháng 4. Ảnh: CNBC

Doanh nghiệp Mỹ chuyển hướng sang mô hình AI Trung Quốc nhờ lợi thế chi phí

Nhờ chi phí vận hành tối ưu cùng tính năng ngày càng tiệm cận các mô hình hàng đầu tại Mỹ, các giải pháp AI từ Trung Quốc đang dần trở thành lựa chọn ưu tiên của nhiều doanh nghiệp Mỹ...

15:18 09/07/2026

Những doanh nghiệp được hưởng lợi lớn nhất từ xu hướng này là các "ông lớn" đang xây dựng hạ tầng AI tại Trung Quốc như Tencent, Alibaba và Huawei. Ảnh: Bloomberg

Doanh nghiệp Trung Quốc tăng tốc thay thế Nvidia bằng chip AI nội địa

Các doanh nghiệp Trung Quốc dự kiến sẽ dành 46% ngân sách mua chip, bộ tăng tốc AI trong 12 tháng tới cho các sản phẩm nội địa. Con số này tăng mạnh so với mức 30% hiện nay...

15:17 09/07/2026

Thị trường tiền mã hóa toàn cầu hiện có quy mô khoảng 2.000 tỷ USD, vận hành trên nền tảng blockchain với các cơ chế mã hóa được phát triển từ nhiều thập kỷ trước. Ảnh minh họa

Nguy cơ máy tính lượng tử áp sát, ngành tiền số gấp rút gia cố “lá chắn” bảo mật

Sự phát triển nhanh chóng của máy tính lượng tử đang buộc ngành công nghiệp tiền mã hóa phải chuẩn bị cho một kịch bản từng được xem là còn rất xa mới xảy ra: các thuật toán mã hóa hiện nay bị bẻ khóa, kéo theo nguy cơ hàng nghìn tỷ USD tài sản số bị đe dọa...

11:47 09/07/2026

Tổng thống Hàn Quốc Lee Jae Myung phát biểu trong cuộc họp báo về tầm nhìn phát triển ngành công nghiệp bán dẫn. Ảnh: Reuters

Hàn Quốc lập quỹ tương lai từ nguồn thu tăng thêm nhờ bùng nổ bán dẫn

Quỹ sẽ trở thành công cụ tài chính quan trọng để triển khai các dự án đầu tư quy mô lớn của quốc gia, đồng thời nâng cao sức cạnh tranh dài hạn của Hàn Quốc...

16:33 07/07/2026

Ấn Độ đang lựa chọn cách huy động dòng vốn và công nghệ quốc tế nhằm rút ngắn khoảng cách với các quốc gia dẫn đầu AI. Ảnh: CNBC

Các chính phủ đang trải thảm đỏ chào đón các “gã khổng lồ AI”

Các nhà lãnh đạo quốc gia ngày càng dành nhiều thời gian gặp gỡ CEO các tập đoàn công nghệ lớn, coi họ là những đối tác chiến lược trong quá trình xây dựng năng lực AI quốc gia...

16:27 06/07/2026

Công nghệ lượng tử được xác định là một trong những lĩnh vực then chốt cần được đầu tư mạnh nhằm đảm bảo năng lực cạnh tranh dài hạn của Trung Quốc. Ảnh: SCMP

Các địa phương Trung Quốc tăng tốc cạnh tranh trong ngành lượng tử

Nhiều địa phương trên khắp Trung Quốc đang đẩy nhanh việc xây dựng các cụm công nghiệp lượng tử nhằm thu hút doanh nghiệp, nhân tài và nguồn vốn đầu tư…

19:43 03/07/2026

Ứớc tính Việt Nam hiện có khoảng 33 triệu lao động phi chính thức và con số này được dự báo sẽ tiếp tục gia tăng trong thời gian tới. Ảnh minh họa

Khi thuật toán chi phối thu nhập: Thách thức mới của thị trường lao động Việt Nam

Cùng với sự phát triển của các nền tảng số, thuật toán ngày càng đảm nhận vai trò phân bổ công việc, đánh giá hiệu suất, xác định thu nhập và thậm chí quyết định việc một người có tiếp tục được làm việc trên nền tảng hay không...

19:43 03/07/2026

Tin liên quan

Giám đốc Điều hành Groq Jonathan Ross phát biểu tại Hội nghị thượng đỉnh GenAI ở San Francisco, California, Hoa Kỳ, vào ngày 30/5/2024.

Nvidia mua lại tài sản của startup chip AI Groq với giá khoảng 20 tỷ USD, thương vụ lớn nhất từ trước đến nay

Dassault Systèmes và NVIDIA bắt tay xây dựng kiến trúc AI công nghiệp dựa trên bản sao số

CEO Nvidia: Robot hình người sẽ phát triển với tốc độ và quy mô chưa từng có trong thập kỷ tới