Gemini 3 Flash đưa trí tuệ thế hệ mới đến gần hơn với người dùng toàn cầu

19.12.2025, 10:22 am 13

Gemini 3 Flash đưa trí tuệ thế hệ mới đến gần hơn với người dùng toàn cầu
Google ra mắt Gemini 3 Flash, cải tiến hiệu suất và chi phí, cung cấp tốc độ xử lý nhanh gấp ba lần, thúc đẩy ứng dụng AI trong công việc hàng ngày.

Google mở rộng dòng mô hình Gemini 3 với sự xuất hiện của Gemini 3 Flash, phiên bản được phát triển nhằm mang trí tuệ thế hệ mới đến gần hơn với người dùng thông qua tốc độ xử lý nhanh và chi phí tối ưu hơn. Lần ra mắt này đánh dấu bước tiến quan trọng trong việc phổ cập năng lực AI tiên tiến của Gemini 3 trên nhiều sản phẩm và nền tảng của Google.

Trước đó, Gemini 3 đã được giới thiệu cùng Gemini 3 Pro và chế độ Gemini 3 Deep Think, nhận về nhiều phản hồi tích cực từ cộng đồng. Kể từ thời điểm ra mắt, hệ thống API của Gemini đã xử lý hơn 1 nghìn tỷ token mỗi ngày. Người dùng tận dụng Gemini 3 cho nhiều mục đích khác nhau như lập trình theo cảm hứng, khám phá các chủ đề phức tạp, xây dựng trò chơi tương tác và xử lý đa dạng nội dung đa phương thức.

Gemini 3 đặt ra một chuẩn mực mới cho các tác vụ yêu cầu suy luận nâng cao, khả năng hiểu đa phương thức và thị giác, cũng như năng lực lập trình tự động theo từng ngữ cảnh sử dụng. Gemini 3 Flash kế thừa nền tảng này, kết hợp sức mạnh lập luận ở cấp độ Pro với tốc độ phản hồi cao, hiệu quả vận hành và chi phí thấp đặc trưng của dòng Flash, giúp mô hình phù hợp cho cả nhu cầu hằng ngày lẫn các quy trình làm việc dựa trên tác nhân.

Gemini 3 Flash đang bắt đầu được triển khai đến hàng triệu người dùng trên toàn cầu thông qua nhiều kênh khác nhau. Đối với nhà phát triển, mô hình có thể được truy cập thông qua Gemini API trong Google AI Studio, Gemini CLI và nền tảng phát triển tự động hóa mới Google Antigravity. Với người dùng phổ thông, Gemini 3 Flash xuất hiện trong ứng dụng Gemini và AI Mode của Google Tìm kiếm. Ngoài ra, các doanh nghiệp có thể sử dụng mô hình này thông qua Vertex AI và Gemini Enterprise.

Gemini 3 Flash và bước tiến về hiệu năng, chi phí, quy mô
Gemini 3 Flash cho thấy việc mở rộng quy mô và tối ưu tốc độ không đồng nghĩa với việc đánh đổi năng lực thông minh của mô hình. Trên các bài kiểm tra đánh giá suy luận và kiến thức chuyên sâu cấp độ Tiến sĩ, Gemini 3 Flash đạt kết quả ấn tượng như 90.4% trên GPQA Diamond và 33.7% trên Humanity’s Last Exam khi không sử dụng công cụ, cho thấy hiệu suất tương đương với những mô hình lớn và mạnh nhất hiện nay.

So với các phiên bản trước, Gemini 3 Flash vượt trội hơn Gemini 2.5 Pro trên nhiều thang đo, trong đó có điểm số 81.2% trên MMMU Pro, ngang bằng với Gemini 3 Pro. Những kết quả này phản ánh khả năng duy trì chất lượng suy luận cao trong khi vẫn đảm bảo tốc độ xử lý và khả năng mở rộng ở quy mô lớn.

Bên cạnh năng lực suy luận và đa phương thức, Gemini 3 Flash được thiết kế để đạt hiệu quả vận hành tối ưu. Mô hình có khả năng điều chỉnh mức độ suy nghĩ linh hoạt tùy theo độ phức tạp của tác vụ. Đối với các bài toán khó, mô hình có thể dành nhiều tài nguyên suy luận hơn, trong khi với những tác vụ hằng ngày, Gemini 3 Flash sử dụng trung bình ít hơn 30% token so với Gemini 2.5 Pro dựa trên dữ liệu sử dụng thực tế, giúp hoàn thành công việc một cách chính xác và hiệu quả.

Gemini 3 Flash mở rộng giới hạn giữa hiệu năng so với tốc độ và chi phí

Thế mạnh nổi bật của Gemini 3 Flash nằm ở tốc độ xử lý trong môi trường thực tế. So với Gemini 2.5 Pro, mô hình cho kết quả nhanh hơn gấp 3 lần theo đánh giá của Artificial Analysis, đồng thời duy trì mức chi phí rất cạnh tranh. Cụ thể, Gemini 3 Flash có giá 0,50 USD cho mỗi 1 triệu token đầu vào và 3 USD cho mỗi 1 triệu token đầu ra, trong khi token đầu vào âm thanh được giữ ở mức 1 USD cho mỗi 1 triệu token.

Công cụ AI tốc độ cao cho nhà phát triển và doanh nghiệp
Gemini 3 Flash được xây dựng nhằm hỗ trợ tối đa cho các quy trình phát triển lặp đi lặp lại, nơi tốc độ phản hồi và khả năng lập trình đóng vai trò then chốt. Mô hình mang đến hiệu suất lập trình mạnh mẽ tương đương cấp độ Pro của Gemini 3, nhưng với thời gian phản hồi nhanh hơn đáng kể.

Trên thang đo SWE-bench Verified, vốn được sử dụng để đánh giá năng lực của các tác nhân lập trình, Gemini 3 Flash đạt điểm số 78%, vượt qua cả Gemini 2.5 và Gemini 3 Pro. Kết quả này cho thấy sự cân bằng hiệu quả giữa lập trình theo tác nhân, triển khai trong hệ thống vận hành thực tế và xây dựng các ứng dụng tương tác yêu cầu phản hồi tức thì.

Khả năng suy luận, sử dụng công cụ và xử lý đa phương thức của Gemini 3 Flash mở ra nhiều cơ hội cho các nhà phát triển khi thực hiện những tác vụ phức tạp như phân tích video, trích xuất dữ liệu và hỏi đáp bằng hình ảnh. Nhờ đó, mô hình có thể hỗ trợ xây dựng các ứng dụng thông minh hơn, bao gồm trợ lý trong trò chơi hoặc các thử nghiệm A/B đòi hỏi phản hồi nhanh và lập luận sâu.

Gemini 3 Flash vượt trội hơn so với Gemini 2.5 Pro về tốc độ và chất lượng

Gemini 3 Flash hỗ trợ lập luận đa phương thức trong một trò chơi giải đố “phóng bóng” theo dõi chuyển động tay, đồng thời cung cấp hỗ trợ AI theo thời gian thực

Gemini 3 Flash còn giúp xây dựng và thử nghiệm A/B các thiết kế chỉ báo tải (loading spinner) mới theo thời gian thực, giúp tối ưu hóa quy trình từ thiết kế đến mã hóa

           Gemini 3 Flash phân tích và chú thích hình ảnh theo thời gian thực, kết hợp các lớp UI theo ngữ cảnh để tạo trải nghiệm tương tác

Nhiều doanh nghiệp đã ghi nhận giá trị thực tiễn khi triển khai Gemini 3 Flash trong hoạt động kinh doanh. Các công ty như JetBrains, Bridgewater Associates và Figma bắt đầu ứng dụng mô hình này để thúc đẩy chuyển đổi vận hành, nhờ vào tốc độ xử lý, hiệu quả chi phí và năng lực suy luận đạt mức tương đương với những mô hình có quy mô lớn hơn. Hiện tại, Gemini 3 Flash đã sẵn sàng cho khách hàng doanh nghiệp thông qua Vertex AI và Gemini Enterprise.

Gemini 3 Flash mở rộng trải nghiệm AI cho người dùng toàn cầu
Đối với người dùng phổ thông, Gemini 3 Flash đã trở thành mô hình mặc định trong ứng dụng Gemini, thay thế cho phiên bản 2.5 Flash. Điều này cho phép người dùng trên toàn thế giới tiếp cận phiên bản Gemini mới mà không phải trả thêm chi phí, đồng thời nâng cao hiệu quả xử lý các tác vụ hằng ngày.

Nhờ khả năng lập luận đa phương thức mạnh mẽ, Gemini 3 Flash có thể tiếp nhận, phân tích và xử lý nhiều dạng thông tin khác nhau với tốc độ cao. Người dùng có thể yêu cầu mô hình phân tích video hoặc hình ảnh và nhanh chóng chuyển đổi nội dung đó thành một kế hoạch chi tiết, có thể áp dụng ngay trong thực tế.

Gemini 3 Flash trong ứng dụng Gemini có thể phân tích nội dung video và đưa ra một kế hoạch như cách cải thiện cú đánh golf

Ngay cả khi không có nhiều kinh nghiệm lập trình, người dùng vẫn có thể tạo ra các ứng dụng hữu ích hoặc mang tính giải trí chỉ bằng giọng nói. Thông qua việc trò chuyện với Gemini, những ý tưởng còn rời rạc có thể được chuyển hóa thành một ứng dụng hoàn chỉnh trong thời gian ngắn, kể cả khi người dùng đang di chuyển.

Gemini 3 Flash trong ứng dụng Gemini biến những ý tưởng ngẫu hứng của bạn thành một bản mẫu có thể thử nghiệm

Gemini 3 Flash cũng đang dần được triển khai làm mô hình mặc định cho AI Mode trong Google Tìm kiếm trên phạm vi toàn cầu. Dựa trên nền tảng lập luận của Gemini 3 Pro, AI Mode với Gemini 3 Flash có khả năng hiểu rõ hơn các sắc thái trong truy vấn của người dùng, phân tích toàn diện từng khía cạnh của câu hỏi và trình bày kết quả theo bố cục trực quan, dễ theo dõi.

Hệ thống liên tục cập nhật thông tin địa phương theo thời gian thực và cung cấp các liên kết hữu ích từ nhiều nguồn trên internet. Sự kết hợp này giúp người dùng vừa có được phần nghiên cứu chuyên sâu, vừa nhận được các đề xuất hành động cụ thể với tốc độ tương đương công cụ Tìm kiếm truyền thống.

Năng lực này đặc biệt phát huy hiệu quả khi người dùng đối mặt với những mục tiêu phức tạp, đòi hỏi cân nhắc nhiều yếu tố, chẳng hạn như lập kế hoạch cho một chuyến đi gấp hoặc nhanh chóng tiếp cận các khái niệm học thuật khó. Gemini 3 Flash đưa sức mạnh lập luận của Gemini 3 vào Tìm kiếm mà vẫn đảm bảo tốc độ xử lý cao, giúp giải quyết cả những câu hỏi phức tạp nhất.

Gemini 3 Flash mang đến khả năng lập luận tuyệt vời của Gemini 3 cho chức năng Tìm kiếm, mà không làm giảm tốc độ, giúp bạn giải quyết những câu hỏi phức tạp nhất

Trải nghiệm ngay Gemini 3 Flash
Hiện tại, Gemini 3 Flash đang được cung cấp dưới dạng bản xem trước thông qua Google Antigravity, Vertex AI và Gemini Enterprise. Mô hình cũng có thể được truy cập thông qua các công cụ dành cho nhà phát triển như Gemini CLI và Android Studio, đồng thời bắt đầu được triển khai rộng rãi cho người dùng ứng dụng Gemini và AI Mode trong Google Tìm kiếm, mang đến khả năng tiếp cận nhanh chóng với trí tuệ thế hệ mới hoàn toàn miễn phí.

Google kỳ vọng hệ sinh thái Gemini tiếp tục được mở rộng với sự kết hợp của Gemini 3 Pro, Gemini 3 Deep Think và Gemini 3 Flash, tạo điều kiện để cộng đồng người dùng và nhà phát triển hiện thực hóa nhiều ý tưởng mới dựa trên nền tảng AI ngày càng hoàn thiện.

Bài viết liên quan

Bài viết mới nhất

Sản phẩm khuyến mãi

So sánh (0)

SO SÁNH SẢN PHẨM

Thêm sản phẩm vào giỏ hàng thành công!

huyễn mãi
huyễn mãi