ISO/IEC TS 42119-2:2025 : Kiểm tra trí tuệ nhân tạo
ISO/IEC TS 42119-2:2025 : Kiểm tra trí tuệ nhân tạo
Khi trí tuệ nhân tạo (AI) ngày càng được ứng dụng rộng rãi trong tài chính, y tế, sản xuất, giao thông và dịch vụ công, câu hỏi không còn là “AI có hoạt động hay không” mà là “AI có đáng tin cậy hay không”.
Để giải quyết thách thức này, ISO và IEC đã ban hành ISO/IEC TS 42119-2:2025 – Artificial Intelligence — Testing of AI — Part 2: Overview of Testing AI Systems, cung cấp hướng dẫn tổng quan về việc kiểm tra và đánh giá các hệ thống AI. Tiêu chuẩn được xây dựng nhằm hỗ trợ tổ chức áp dụng các nguyên tắc kiểm thử phần mềm hiện có vào môi trường AI, đồng thời giải quyết những đặc thù riêng của các hệ thống học máy và AI hiện đại.

Khác với phần mềm truyền thống hoạt động theo các quy tắc được lập trình sẵn, AI thường dựa trên dữ liệu, mô hình học máy và các thuật toán có khả năng đưa ra kết quả mang tính xác suất.
Điều này tạo ra nhiều rủi ro mới như:
Một hệ thống AI có độ chính xác cao vẫn có thể gây ra hậu quả nghiêm trọng nếu không được đánh giá đầy đủ về tính công bằng, độ tin cậy, tính minh bạch và khả năng kiểm soát rủi ro. Chính vì vậy, kiểm tra AI đang trở thành một thành phần quan trọng trong quản trị AI hiện đại.
ISO/IEC TS 42119-2:2025 được xây dựng nhằm:
Tiêu chuẩn áp dụng phương pháp kiểm thử dựa trên rủi ro nhằm xác định các khu vực cần ưu tiên đánh giá.
Các yếu tố rủi ro có thể bao gồm:
Cách tiếp cận này giúp tổ chức tập trung nguồn lực vào những rủi ro có ảnh hưởng lớn nhất.
ISO/IEC TS 42119-2 không chỉ tập trung vào giai đoạn triển khai mà còn bao phủ toàn bộ vòng đời AI:
Điều này giúp kiểm soát rủi ro liên tục thay vì chỉ đánh giá tại một thời điểm cố định.
Tiêu chuẩn nhấn mạnh việc kiểm tra:
Đây là các yếu tố cốt lõi quyết định độ tin cậy của hệ thống AI.
ISO/IEC TS 42119-2 yêu cầu hoạt động kiểm tra phải có khả năng truy xuất và chứng minh.
Doanh nghiệp cần xây dựng:
Những tài liệu này đóng vai trò quan trọng trong hoạt động đánh giá sự phù hợp và kiểm toán AI.

ISO/IEC TS 42119-2 đề cập đến nhiều loại kiểm thử khác nhau phù hợp với đặc thù của AI:
Đánh giá khả năng đưa ra dự đoán đúng của hệ thống.
Đánh giá khả năng hoạt động ổn định trong các điều kiện khác nhau.
Xác định khả năng xuất hiện thiên vị hoặc phân biệt đối xử trong kết quả AI.
Đánh giá mức độ giải thích được của các quyết định do AI tạo ra.
Đánh giá khả năng chống chịu trước dữ liệu bất thường hoặc thay đổi môi trường vận hành.
Xác định các nguy cơ ảnh hưởng đến an toàn thông tin và vận hành hệ thống.
ISO/IEC TS 42119-2 được xem là tiêu chuẩn kỹ thuật hỗ trợ cho hệ thống quản lý AI theo ISO/IEC 42001.
Trong khi:
Sự kết hợp giữa hai tiêu chuẩn giúp doanh nghiệp vừa thiết lập hệ thống quản lý AI vừa chứng minh được tính hiệu quả và độ tin cậy của các giải pháp AI đang vận hành.
Giúp chứng minh rằng AI hoạt động đúng mục tiêu thiết kế.
Liên kết trực tiếp giữa rủi ro và hoạt động kiểm thử.
Cung cấp bằng chứng rõ ràng về quá trình đánh giá AI.
Giúp doanh nghiệp chuẩn bị tốt hơn trước các yêu cầu quản lý AI đang ngày càng được siết chặt trên toàn cầu.
Thúc đẩy việc phát triển các hệ thống AI minh bạch, an toàn và có trách nhiệm.
Bình luận