ISO/IEC TS 6254:2025 : Mục tiêu và cách tiếp cận giải thích và diễn giải mô hình học máy và hệ thống AI
ISO/IEC TS 6254:2025 : Mục tiêu và cách tiếp cận giải thích và diễn giải mô hình học máy và hệ thống AI
Khi trí tuệ nhân tạo (AI) ngày càng tham gia vào các quyết định quan trọng trong tài chính, y tế, sản xuất, tuyển dụng và dịch vụ công, một trong những thách thức lớn nhất là khả năng giải thích cách hệ thống AI đưa ra kết quả.
Nhiều mô hình học máy hiện đại, đặc biệt là Deep Learning và các mô hình nền tảng (Foundation Models), thường hoạt động như những "hộp đen" (Black Box). Mặc dù có thể đạt độ chính xác rất cao, việc hiểu được vì sao hệ thống đưa ra một quyết định cụ thể lại trở nên khó khăn.
Để giải quyết vấn đề này, ISO và IEC đã ban hành ISO/IEC TS 6254:2025 – Information Technology — Artificial Intelligence — Objectives and Approaches for Explainability and Interpretability of Machine Learning Models and Artificial Intelligence Systems. Tiêu chuẩn cung cấp các mục tiêu, nguyên tắc và phương pháp nhằm nâng cao khả năng giải thích (Explainability) và diễn giải (Interpretability) của các mô hình học máy và hệ thống AI.

Trong nhiều trường hợp, việc AI đưa ra kết quả chính xác là chưa đủ.
Người sử dụng, nhà quản lý, chuyên gia đánh giá và cơ quan quản lý nhà nước cần hiểu:
Khả năng giải thích giúp nâng cao tính minh bạch, khả năng giải trình và mức độ tin cậy của hệ thống AI. Đây cũng là một trong những yếu tố quan trọng của AI đáng tin cậy (Trustworthy AI).
Tiêu chuẩn được xây dựng nhằm:
Một trong những điểm quan trọng của ISO/IEC TS 6254 là phân biệt rõ hai khái niệm thường bị nhầm lẫn.
Là mức độ con người có thể hiểu được cách thức hoạt động bên trong của mô hình AI.
Ví dụ:
Các mô hình này thường có mức độ diễn giải cao vì người dùng có thể theo dõi trực tiếp cách hệ thống đưa ra quyết định.
Là khả năng giải thích vì sao hệ thống AI đưa ra một kết quả hoặc hành vi cụ thể.
Điều này đặc biệt quan trọng với các mô hình phức tạp như:
Ngay cả khi không thể hiểu hoàn toàn cấu trúc bên trong, người dùng vẫn có thể nhận được lời giải thích về kết quả đầu ra.
ISO/IEC TS 6254 nhấn mạnh rằng mỗi nhóm đối tượng có nhu cầu giải thích khác nhau.
Cần hiểu:
Cần biết:
Cần:
Cần:
Tiêu chuẩn mô tả nhiều phương pháp khác nhau nhằm nâng cao khả năng giải thích và diễn giải của hệ thống AI.
Đây là cách tiếp cận xây dựng các mô hình vốn đã dễ hiểu đối với con người.
Ví dụ:
Ưu điểm:
Áp dụng với các mô hình phức tạp như Deep Learning.
Các công cụ giải thích được sử dụng sau khi mô hình đã được huấn luyện nhằm giải thích nguyên nhân tạo ra kết quả.
Ví dụ:
Cách tiếp cận này giúp giải thích các mô hình "hộp đen" mà không cần thay đổi cấu trúc của mô hình.
Tiêu chuẩn đề cập đến việc sử dụng các thử nghiệm và đánh giá thực tế để quan sát phản ứng của hệ thống trước những thay đổi về dữ liệu đầu vào.
Mục tiêu là:
Một số hệ thống AI được thiết kế với các cơ chế hỗ trợ giải thích ngay trong kiến trúc.
Ví dụ:
Các phương pháp này giúp cải thiện khả năng hiểu được quá trình suy luận của AI.
ISO/IEC TS 6254 không chỉ quan tâm đến việc tạo ra lời giải thích mà còn xem xét chất lượng của lời giải thích đó.
Một lời giải thích hiệu quả cần đáp ứng:
Lời giải thích phải phản ánh đúng hành vi thực tế của mô hình.
Các kết quả tương tự phải nhận được các giải thích tương tự.
Người dùng mục tiêu có thể hiểu được nội dung giải thích.
Lời giải thích phải hỗ trợ việc ra quyết định hoặc đánh giá hệ thống.
Mức độ chi tiết cần phù hợp với từng nhóm người sử dụng khác nhau.
Doanh nghiệp áp dụng tiêu chuẩn có thể:
Người dùng hiểu rõ hơn về cách AI đưa ra quyết định.
Tăng khả năng giám sát và kiểm soát hệ thống.
Phát hiện sớm các nguồn gây sai lệch trong mô hình.
Đáp ứng các yêu cầu ngày càng tăng về AI minh bạch và có trách nhiệm.
Cung cấp cơ sở kỹ thuật cho các hoạt động đánh giá và đảm bảo AI.

Bình luận