DeepSeek ra mắt V3.2, cạnh tranh GPT-5 và Gemini 3

Sơn Trần

09/12/2025

Trong cuộc đua tạo ra các mô hình AI thế hệ mới, khả năng mở rộng sức mạnh tính toán đang trở thành yếu tố quyết định…

DeepSeek khẳng định năng lực mô hình mới tương đương GPT-5 của OpenAI và Gemini-3.0-Pro của Google

Startup trí tuệ nhân tạo Trung Quốc - DeepSeek vừa công bố hai mô hình mới nhất của hãng: DeepSeek-V3.2 và DeepSeek-V3.2-Speciale. Công ty khẳng định đây là những mô hình mạnh nhất mà họ từng phát triển, với năng lực tương đương GPT-5 của OpenAI và Gemini-3.0-Pro của Google.

Đáng chú ý, DeepSeek cho biết phiên bản V3.2-Speciale đã đạt “thành tích huy chương vàng” trong bài kiểm tra nội bộ mô phỏng kỳ thi Olympic Toán học quốc tế (IMO), theo Kr Asia.

DeepSeek công bố tiếp tục mở rộng chiến lược bằng cách tạo ra hiệu suất cạnh tranh nhưng giảm đáng kể mức tiêu thụ tính toán nhờ tối ưu kiến trúc. Mô hình V3.2 tích hợp cơ chế DeepSeek Sparse Attention (DSA) – một cơ chế chú ý độc quyền nhằm giảm tải xử lý khi làm việc với tài liệu dài và nhiệm vụ phức tạp. DSA phát triển từ kiến trúc V3.1-Terminus và đã được thử nghiệm thông qua phiên bản thử nghiệm DeepSeek-V3.2-Exp ra mắt hồi tháng 9.

TỐI ƯU SỨC MẠNH TÍNH TOÁN

Theo cơ chế truyền thống, attention của AI, công nghệ cho phép mô hình hiểu ngữ cảnh, sẽ tăng chi phí tính toán theo cấp số nhân khi độ dài đầu vào tăng. Xử lý một văn bản dài gấp đôi thường cần lượng tính toán gấp bốn lần. DeepSeek cho biết cơ chế DSA giải quyết triệt để điểm nghẽn này nhờ “bộ lập chỉ mục lightning indexer”, cho phép xác định vùng ngữ cảnh liên quan nhất và bỏ qua phần còn lại.

Theo báo cáo kỹ thuật, DSA giúp giảm khoảng một nửa chi phí suy luận với tác vụ chuỗi dài. Kiến trúc này “giảm đáng kể độ phức tạp tính toán nhưng vẫn giữ chất lượng mô hình”, DeepSeek cho biết, đồng thời ước tính mức giảm chi phí suy luận tổng thể đạt khoảng 70%.

Tính toán hiệu quả đã trở thành dấu ấn trong các sản phẩm DeepSeek gần đây. Mô hình V3 ra mắt tháng 1 sử dụng kiến trúc mixture-of-experts, chỉ kích hoạt một phần tham số cho mỗi token. Thay vì định vị V3 là bước đệm cho mô hình lớn hơn, công ty nhấn mạnh rằng việc định tuyến thông minh có thể duy trì sức mạnh mà vẫn giảm áp lực vận hành.

Ngay sau đó là R1 – mô hình dùng huấn luyện tăng cường để nâng cao khả năng suy luận và lập trình. Các công bố cho thấy R1 chạy trên GPU Nvidia H800 cũ hơn và được huấn luyện với chi phí thấp hơn đáng kể so với nhiều mô hình cùng thời. Khả năng suy luận rẻ và giấy phép mở linh hoạt giúp R1 được nhiều doanh nghiệp lựa chọn, đồng thời góp phần đẩy mạnh làn sóng AI mã nguồn mở, cùng với mô hình Qwen của Alibaba và Hunyuan của Tencent.

DeepSeek-V3.2 và V3.2-Speciale tiếp tục tập trung và nhiệm vụ suy luận và workflow agent trong khi duy trì mức vận hành nhẹ, ít tốn tài nguyên.

ÁP LỰC CHI PHÍ VÀ NĂNG LƯỢNG

DeepSeek thu hút nhiều sự chú ý một phần vì kinh tế triển khai AI vẫn còn là thách thức. Dù doanh nghiệp đổ hàng tỷ USD vào trung tâm dữ liệu và phần cứng, chi phí suy luận vẫn chưa giảm đủ nhanh để cải thiện biên lợi nhuận. Ngay cả OpenAI, công ty tạo ra bước ngoặt với ChatGPT, sau ba năm vẫn chưa có lãi. Trong khi đó, kích thước mô hình ngày càng lớn, khiến chi phí vận hành vẫn rất cao.

Những áp lực này từng thúc đẩy doanh nghiệp sớm đón nhận mô hình R1. Các công ty tích hợp R1 thường nhấn mạnh chi phí suy luận thấp là yếu tố then chốt, đặc biệt trong ngành mà độ trễ và chi phí tác động trực tiếp đến trải nghiệm người dùng và biên lợi nhuận sản phẩm.

Tiêu thụ năng lượng cũng là một rào cản. Ở nhiều khu vực, sự mở rộng của trung tâm dữ liệu làm dấy lên lo ngại về nguồn điện và tác động môi trường. Vì suy luận chiếm tỷ trọng lớn trong tổng năng lượng AI, một số mô hình hiệu quả có thể giảm đáng kể chi phí và gánh nặng hạ tầng. Cách tiếp cận kỹ thuật của DeepSeek hướng trực tiếp vào bài toán này, nỗ lực mở rộng khả năng suy luận mà không cần đầu tư hạ tầng quy mô khổng lồ.

Tuy nhiên, chiến lược “tập trung hiệu suất” của DeepSeek cũng đi kèm giới hạn khi doanh nghiệp so sánh với mô hình của OpenAI hay Google. Một trong những hạn chế đó là DeepSeek đạt điểm mạnh ở suy luận và tác vụ có cấu trúc, nhưng lại không có sự đa nhiệm đa phương thức hoặc khả năng vận hành end-to-end của hệ thống lớn.

Ở tình huống cần xử lý audio, hình ảnh, video hoặc tool use, nhiều lựa chọn khác vẫn nổi trội hơn. Ví dụ, Kling AI của Kuaishou đang gây chú ý lớn trong mảng tạo video. Trong khi đó, Janus, dòng mô hình đa phương thức của DeepSeek ra mắt năm ngoái, không tạo được sức ảnh hưởng quốc tế tương tự. Mô hình DeepSeek-OCR công bố hồi tháng 10 chủ yếu tập trung tối ưu ngữ cảnh dài bằng kỹ thuật ánh xạ quang học 2D.

GIỚI HẠN TRUY CẬP

DeepSeek-V3.2 hiện có mặt trên ứng dụng web, app di động và API. Trong khi đó, V3.2-Speciale, phiên bản được khẳng định là mạnh nhất, mới chỉ có qua API và công ty chưa thông báo liệu có mở trên kênh khác hay không.

Tính đến tháng 10, ứng dụng di động DeepSeek có khoảng 72 triệu người dùng hoạt động trên toàn cầu, theo dữ liệu từ Aicpb.

Hai mô hình mới cho thấy DeepSeek đang tiếp tục đóng vai “kẻ thách thức” bằng cách theo đuổi con đường tối ưu hóa năng lực – chi phí, thay vì chạy đua kích thước mô hình. Trong bối cảnh ngành AI chịu sức ép về chi phí, năng lượng và hạ tầng, chiến lược này có thể giúp DeepSeek giữ lợi thế khác biệt so với các ông lớn.

Từ khóa:

Lãnh đạo UBND Thành phố Hà Nội và Tập đoàn Công nghệ CMC ký kết Bản ghi nhớ hợp tác giai đoạn 2026-2030, thúc đẩy chuyển đổi số, chuyển đổi AI và đổi mới sáng tạo.

Hà Nội hợp tác với các doanh nghiệp công nghệ, phát triển chính quyền số, thành phố AI

Trong khuôn khổ hội nghị công bố quy hoạch tổng thể Thủ đô Hà Nội tầm nhìn 100 năm và xúc tiến đầu tư năm 2026, UBND Thành phố Hà Nội đã ký kết thỏa thuận hợp tác với các doanh nghiệp công nghệ hàng đầu Việt Nam về phát triển khoa học, công nghệ và đổi mới sáng tạo, chuyển đổi số.

11:04 27/06/2026

World Cup hiện đại không chỉ còn là cuộc tranh tài giữa những ngôi sao bóng đá hàng đầu thế giới mà còn trở thành sân khấu lớn nhất của trí tuệ nhân tạo và dữ liệu.

World Cup thời AI: Hàng nghìn lao động dữ liệu phía sau sân cỏ

Không chỉ phục vụ các đội bóng, nguồn dữ liệu còn cung cấp cho các đài truyền hình, ngành công nghiệp trò chơi điện tử và đặc biệt là thị trường cá cược thể thao toàn cầu...

10:28 25/06/2026

Tổng thống Mỹ Donald Trump vừa ký hai sắc lệnh hành pháp nhằm thúc đẩy phát triển công nghệ lượng tử. Ảnh: Reuters

Tổng thống Trump đặt mục tiêu Mỹ sở hữu máy tính lượng tử mạnh vào năm 2028

Hoa Kỳ cũng nhấn mạnh nhu cầu tăng cường hợp tác quốc tế về bảo vệ quyền sở hữu trí tuệ và an ninh chuỗi cung ứng trong lĩnh vực lượng tử...

16:29 24/06/2026

Các học viên của Văn phòng Chính phủ thực hành ứng dụng AI vào các tình huống nghiệp vụ thực tế theo phương châm “Học để ứng dụng ngay”

Văn phòng Chính phủ bồi dưỡng chuyển đổi AI trong công tác hành chính và tham mưu tổng hợp

Thông qua chương trình, học viên được trang bị kiến thức, kỹ năng và phương pháp ứng dụng chuyển đổi AI vào thực tiễn công tác hành chính, tham mưu tổng hợp.

15:53 20/06/2026

Ngày 1/6, Spacesail phóng thành công hai vệ tinh bằng tên lửa tái sử dụng của Trung Quốc, chỉ hơn một tuần trước khi SpaceX IPO

SpaceX IPO, Trung Quốc tăng tốc xây dựng “chòm sao Internet” trên quỹ đạo

SpaceX của Elon Musk vừa chính thức niêm yết với mức định giá kỷ lục 1.800 tỷ USD, đánh dấu cột mốc mới của ngành công nghiệp vũ trụ thương mại toàn cầu. Tuy nhiên, khi giới đầu tư tập trung vào thành công của Starlink, một đối thủ mới từ Trung Quốc đang âm thầm mở rộng hiện diện trên thị trường quốc tế...

18:11 16/06/2026

Việc thành lập phòng thí nghiệm mới cũng phản ánh chiến lược tự chủ công nghệ ngày càng quyết liệt của Bắc Kinh

Trung Quốc ra mắt phòng thí nghiệm quang học, cung cấp năng lượng cho AI bằng ánh sáng

Phòng thí nghiệm trọng điểm về chip và hệ thống điện toán quang tử tích hợp của Trung Quốc đã được thành lập, đánh dấu bước đi mới nhất trong nỗ lực duy trì tham vọng AI của nền kinh tế lớn thứ hai thế giới.

18:10 16/06/2026

Hiện nay, ChatGPT vẫn giữ vị trí dẫn đầu trong lĩnh vực chatbot AI. Tuy nhiên, khoảng cách với các đối thủ đang dần thu hẹp.

ChatGPT đạt 1 tỷ người dùng hàng tháng, vượt kỷ lục Google Maps

ChatGPT của OpenAI đã cán mốc 1 tỷ người dùng hàng tháng chỉ sau 3,5 năm ra mắt, trở thành ứng dụng tăng trưởng nhanh nhất trong lịch sử Internet...

18:10 16/06/2026

Công nghệ lượng tử dựa trên silicon có thể tận dụng nhiều quy trình sản xuất vốn đã được phát triển trong ngành bán dẫn truyền thống

Trung Quốc tuyên bố tự chủ vật liệu lõi cho máy tính lượng tử, lần đầu sản xuất hàng loạt silicon-28

Một viện nghiên cứu đã sản xuất thành công silicon-28 có độ tinh khiết đồng vị vượt 99,99%, đánh dấu lần đầu tiên Trung Quốc sở hữu năng lực sản xuất độc lập và quy mô lớn loại vật liệu chiến lược này...

15:58 16/06/2026

Nhận thức người dùng là “lá chắn” trong cuộc chiến chống gian lận tài chính thời AI

Dù lừa đảo trực tuyến tại Việt Nam có dấu hiệu giảm nhiệt, các hình thức gian lận ngày càng tinh vi như “gian lận ủy quyền thanh toán” vẫn đặt ra thách thức lớn cho ngành tài chính. Các chuyên gia cho rằng bên cạnh công nghệ bảo mật, nâng cao nhận thức người dùng là yếu tố then chốt trong phòng chống lừa đảo…

10:50 12/06/2026

SpaceX vừa lần đầu công bố thiết kế vệ tinh trung tâm dữ liệu AI trên quỹ đạo mang tên AI1

SpaceX hé lộ trung tâm dữ liệu AI đầu tiên trên quỹ đạo

Dự án điện toán ngoài không gian hiện đóng vai trò trung tâm trong câu chuyện tăng trưởng mà SpaceX đang trình bày với giới đầu tư...

16:28 11/06/2026