Học viện Công nghệ Bưu chính Viễn thông công bố Bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt

Thứ hai, 06/04/2026 - 16:36

Tại sự kiện “AI Day 2026: Thúc đẩy năng lực AI cho Việt Nam trong kỷ nguyên kinh tế trí tuệ nhân tạo” ngày 5/4 do STEAM for Vietnam Foundation, Đại học Bách Khoa Hà Nội, Đại sứ quán Hoa kỳ tại Việt Nam, AI for Vietnam Foundation, và Trung tâm Đổi mới sáng tạo quốc gia (NIC) đồng tổ chức, Học viện Công nghệ Bưu chính Viễn thông cùng các đối tác triển khai dự án DeepEdu là Công ty Sotatek, DopikAI, và AI for Việt Nam đã công bố công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt.

DeepEdu là dự án về ngôn ngữ lớn được khởi xướng bởi Học viện Công nghệ Bưu chính Viễn thông và các đối tác theo mô hình hợp tác 3 nhà: Công ty Sotatek và Công ty DopikAI với mục tiêu xây dựng bộ dữ liệu mở Tiếng Việt cho giáo dục Việt Nam, phục vụ nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo. Dự án này đồng hành và kết hợp cùng tổ chức AI for Vietnam nhằm tạo ra bộ dữ liệu Tiếng Việt mã nguồn mở chất lượng cao, giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI.

Học viện Công nghệ Bưu chính Viễn thông công bố Bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt - Ảnh 1.

Giới thiệu Bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt tại sự kiện AI Day 2026

Tại sự kiện AI Day 2026, DeepEduBench – bộ tiêu chuẩn đánh giá năng lực AI trong giáo dục do PTIT, Sotatek và DopikAI chủ trì phát triển dùng để đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt. DeepEduBench có khả năng giảng giải rõ ràng theo từng bước, điều chỉnh độ khó theo người học, đưa ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm. Để đạt điểm cao, các mô hình AI cần giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, và khuyến khích tư duy sâu thay vì chỉ đưa đáp án. Bộ tiêu chuẩn DeepEduBench bao gồm 13.700 mẫu dữ liệu đã được sử dụng đánh giá 52 mô hình AI hàng đầu với nhiều thông tin chi tiết tại https://rank.aiforvietnam.org.

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, phần lớn các mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, trong đó tiếng Anh chiếm ưu thế, dẫn đến những hạn chế khi áp dụng trong bối cảnh giáo dục Việt Nam. Vì vậy, Học viện định hướng phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt, đặc biệt trong lĩnh vực giáo dục nhằm nâng cao khả năng hiểu ngữ cảnh và phù hợp với hệ thống tri thức trong nước. Trong thời gian tới, Học viện cùng 03 đối tác là Công ty Sotatek, DopikAI, và AI for Việt Nam dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150B token.

Học viện Công nghệ Bưu chính Viễn thông công bố Bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt - Ảnh 2.

Theo các chuyên gia, việc xây dựng bộ tiêu chuẩn riêng cho AI trong giáo dục là cần thiết để tăng tính minh bạch trong đánh giá và hỗ trợ các cơ sở giáo dục lựa chọn giải pháp phù hợp với nhu cầu thực tiễn.

AI Day 2026 cho thấy xu hướng AI đang dần trở thành công cụ hỗ trợ quan trọng trong giáo dục. Trong bối cảnh đó, định hướng phát triển AI tiếng Việt và xây dựng tiêu chuẩn đánh giá được xem là những bước đi nhằm nâng cao khả năng ứng dụng AI phù hợp với điều kiện trong nước.

Học viện Công nghệ Bưu chính Viễn thông lựa chọn hướng tiếp cận tập trung vào ngôn ngữ bản địa và xây dựng các tiêu chuẩn chung cho AI trong giáo dục. Cách tiếp cận này được kỳ vọng góp phần nâng cao chất lượng nguồn nhân lực, đồng thời tăng khả năng chủ động trong phát triển và ứng dụng công nghệ AI tại Việt Nam.

P.V