OpenAI ra mắt mô hình GPT-4.5 mới cho ChatGPT
01.03.2025, 2:49 pm 44
OpenAI ra mắt mô hình GPT-4.5 mới cho ChatGPT
OpenAI công bố GPT-4.5 với khả năng hội thoại nổi bật, hiểu ngữ cảnh tốt hơn, và cải thiện trí thông minh sáng tạo, sẵn có cho người dùng Pro hôm nay.
OpenAI vừa công bố GPT-4.5, phiên bản AI tiên tiến nhất của hãng dành cho ChatGPT. Theo OpenAI, GPT-4.5 là mô hình tốt nhất từ trước đến nay cho trò chuyện, với khả năng học không giám sát (unsupervised learning) được mở rộng, giúp AI nhận diện mẫu, liên kết dữ liệu và tạo ra những insight sáng tạo tốt hơn.
Cải thiện khả năng hội thoại và xử lý thông tin
GPT-4.5 mang lại trải nghiệm hội thoại tự nhiên hơn, với tính cách được cải thiện và khả năng hướng dẫn người dùng qua các ý tưởng một cách rõ ràng hơn. OpenAI cho biết, GPT-4.5 vượt trội so với GPT-4o trong hầu hết các lĩnh vực, bao gồm:
- Truy vấn hằng ngày: Trả lời chính xác hơn, phản hồi nhanh và thân thiện hơn.
- Truy vấn chuyên môn: Hiểu rõ hơn về ngữ cảnh chuyên nghiệp, hữu ích trong nhiều lĩnh vực.
- Trí thông minh sáng tạo: Viết lách, lập trình và giải quyết vấn đề hiệu quả hơn.
So với GPT-4o, GPT-4.5 sở hữu kho kiến thức rộng hơn, khả năng bám sát ý định của người dùng tốt hơn và chỉ số EQ cao hơn. Điều này giúp mô hình có thể tương tác gần gũi và tự nhiên hơn, đồng thời giảm thiểu hiện tượng “ảo giác AI”.
Bảng đánh giá hiệu suất mô hình AI
Chỉ số đánh giá mô hình | GPT-4.5 | GPT-4o | OpenAI o3-mini-high |
GPQA (hiểu biết khoa học) | 71.4% | 53.6% | 79.7% |
AIME ‘24 (toán học) | 36.7% | 9.3% | 87.3% |
MMMLU (hiểu biết đa ngôn ngữ) | 85.1% | 81.5% | 81.1% |
MMMU (đa phương thức) | 74.4% | 69.1% | - |
SWE-Lancer Diamond (lập trình) | 32.6% | 23.3% | 10.8% |
SWE-Lancer Diamond (thu nhập) | $186,125 | $138,750 | $89,625 |
SWE-Bench Verified (lập trình) | 38.0% | 30.7% | 61.0% |
Giải thích thuật ngữ:
- GPQA (General Physics and Quantum AI) → Hiểu biết khoa học, do chỉ số này liên quan đến đánh giá khả năng hiểu các vấn đề khoa học và vật lý lượng tử.
- AIME (American Invitational Mathematics Examination) → Toán học, vì đây là bài kiểm tra đánh giá tư duy toán học.
- MMMLU (Massive Multitask Multilingual Understanding) → Hiểu biết đa ngôn ngữ, đánh giá khả năng xử lý nhiều ngôn ngữ khác nhau.
- MMMU (Massive Multimodal Model Understanding) → Đa phương thức, vì mô hình này đánh giá khả năng xử lý cả văn bản, hình ảnh và nhiều loại dữ liệu đầu vào khác.
- SWE (Software Engineering) Lancer Diamond → Lập trình, đánh giá năng lực lập trình thông qua thử thách mã hóa.
- SWE Lancer Diamond → Thu nhập đây là chỉ số về mức lương giả lập mà mô hình có thể kiếm được từ việc giải quyết bài toán lập trình.
- SWE-Bench Verified → Lập trình, một bài kiểm tra khác về lập trình nhưng có độ chính xác cao hơn.
Không phải mô hình chuyên về suy luận như o1 và o3-mini
Dù mạnh mẽ hơn GPT-4o, OpenAI nhấn mạnh rằng GPT-4.5 không phải là mô hình chuyên về suy luận như o1 hay o3-mini. Điều này có nghĩa là các mô hình chuyên biệt như o1 và o3-mini vẫn vượt trội hơn GPT-4.5 trong các tác vụ đòi hỏi tư duy logic như lập trình và toán học.
GPT-4.5 được huấn luyện theo hai giai đoạn: pre-training và post-training, giúp nó trở thành mô hình đa dụng, thích hợp cho các nhiệm vụ tổng quát thay vì chỉ tập trung vào một lĩnh vực cụ thể.
Khả dụng cho người dùng ChatGPT Pro từ hôm nay
OpenAI triển khai GPT-4.5 cho người dùng Pro ngay từ hôm nay. Người dùng thuộc các gói Team và Plus sẽ có quyền truy cập vào tuần tới, tiếp theo là các tổ chức giáo dục và doanh nghiệp.
Ngoài ra, các nhà phát triển thuộc tất cả các gói trả phí cũng có thể bắt đầu sử dụng GPT-4.5 ngay từ hôm nay.
GPT-4.5 hỗ trợ tải lên tệp và hình ảnh, có thể xử lý nội dung viết và lập trình, nhưng không hỗ trợ Voice Mode, video hoặc chia sẻ màn hình.
Bài viết liên quan
22.03.2025, 3:35 pm 22
ASUS Zenbook S16 ra mắt tại Việt Nam: Laptop AI 16-inch mỏng nhẹ dùng chip AMD Ryzen AI 2025
Laptop ASUS Zenbook S16 (UM5606) tích hợp vi xử lý AMD Ryzen AI, màn hình OLED 16 inch, thiết kế mỏng nhẹ, và hiệu năng pin ấn tượng lên đến 18 giờ.
08.03.2025, 10:46 am 39
NVIDIA công bố sự kiện GTC 2025, nhấn mạnh AI vật lý, robot học và lượng tử
GTC 2025 tại San Jose sẽ giới thiệu đột phá AI mới nhất, với hơn 1,000 phiên thảo luận, đại diện từ các ngành công nghiệp và chứng nhận kỹ năng miễn phí.
15.02.2025, 9:55 am 9
Lựa chọn laptop theo nhu cầu: Đơn giản hơn bạn nghĩ
Các mẫu laptop MSI mới đều được trang bị công nghệ tiên tiến với hiệu suất tối ưu, các chương trình khuyến mãi hấp dẫn giúp tiết kiệm tối đa chi phí.
04.02.2025, 2:41 pm 23
COLORFUL trình làng dòng bo mạch chủ B860 Series
COLORFUL ra mắt dòng bo mạch chủ B860 Series, hỗ trợ vi xử lý Intel Core Ultra 200 Series, với nhiều tính năng nổi bật như DDR5 và Wi-Fi 7.
13.01.2025, 2:56 pm 25
ASUS công bố dòng card đồ họa NVIDIA GeForce RTX 50 Series
ASUS ra mắt dòng card đồ họa NVIDIA GeForce RTX 50 Series, với hiệu suất vượt trội, thiết kế bốn quạt tiên tiến và tùy chọn làm mát đa dạng.
13.01.2025, 2:28 pm 18
COLORFUL và iGame ra mắt dòng NVIDIA GeForce RTX 50 Series
COLORFUL ra mắt dòng card đồ họa NVIDIA GeForce RTX 50 Series với thiết kế cải tiến, hiệu suất tối ưu và công nghệ làm mát tiên tiến, phục vụ game thủ và nhà sáng tạo.
20.12.2024, 9:54 am 121
Các cấu hình giả lập chỉ từ 8 triệu đồng
Có lẽ đa phần anh em khi tìm đọc về bài viết này đều không còn gì xa lạ về khái niệm Giả lập. Hiện nay giả lập Android như NoxPlayer, LD Player trên Windows PC không còn là gì quá xa lạ nữa rồi. Nhu cầu thiết thực dành cho MMO ngày càng tăng khi đã có quá nhiều những cách thức MMO khác nhau ngày càng được sinh ra. Để giúp anh em có thể làm việc một cách trơn tru hơn, Duy Hưng Computer xin hướng dẫn bạn trong bài viết sau.