ISO/IEC 25059:2023 : Mô hình chất lượng cho hệ thống AI
ISO/IEC 25059:2023 : Mô hình chất lượng cho hệ thống AI
Khi trí tuệ nhân tạo (AI) được ứng dụng ngày càng rộng rãi trong các lĩnh vực như tài chính, y tế, sản xuất, logistics và dịch vụ công, câu hỏi quan trọng đặt ra không còn là AI có hoạt động hay không, mà là:
AI có đạt chất lượng hay không?
Khác với các phần mềm truyền thống, hệ thống AI có những đặc điểm riêng như học từ dữ liệu, tự thích nghi, phụ thuộc vào chất lượng dữ liệu huấn luyện và có thể thay đổi hiệu suất theo thời gian. Điều này khiến việc đánh giá chất lượng AI trở nên phức tạp hơn nhiều so với đánh giá phần mềm thông thường.
Để giải quyết vấn đề này, ISO và IEC đã ban hành ISO/IEC 25059:2023 – Software Engineering — Systems and Software Quality Requirements and Evaluation (SQuaRE) — Quality Model for AI Systems.
Tiêu chuẩn cung cấp một mô hình chất lượng dành riêng cho hệ thống AI, giúp các tổ chức đánh giá, quản lý và cải tiến chất lượng AI một cách có hệ thống.

Các mô hình chất lượng phần mềm truyền thống thường tập trung vào:
Hiệu năng.
Độ tin cậy.
Khả năng bảo trì.
Khả năng sử dụng.
Bảo mật.
Tuy nhiên, AI còn phải đối mặt với nhiều vấn đề đặc thù như:
Thiên vị dữ liệu (Bias).
Khả năng giải thích kết quả.
Tính minh bạch.
Độ bền vững của mô hình.
Độ chính xác trong các điều kiện khác nhau.
Khả năng thích nghi khi dữ liệu thay đổi.
Do đó, cần có một mô hình chất lượng được thiết kế riêng cho AI.
ISO/IEC 25059 được xây dựng nhằm đáp ứng nhu cầu này.
Tiêu chuẩn hướng đến:
Thiết lập khung đánh giá chất lượng cho hệ thống AI.
Bổ sung các đặc tính chất lượng riêng của AI.
Hỗ trợ phát triển AI đáng tin cậy.
Tăng khả năng kiểm soát rủi ro AI.
Hỗ trợ kiểm thử và đánh giá AI.
Làm cơ sở cho hoạt động quản trị AI.
Theo cách tiếp cận của ISO/IEC 25059, hệ thống AI là các hệ thống có khả năng:
Học từ dữ liệu.
Phân tích thông tin.
Đưa ra dự đoán hoặc khuyến nghị.
Hỗ trợ hoặc tự động thực hiện quyết định.
Các hệ thống này có thể bao gồm:
Machine Learning.
Deep Learning.
Computer Vision.
Natural Language Processing (NLP).
Generative AI.
Hybrid AI Systems.
ISO/IEC 25059 mở rộng mô hình chất lượng truyền thống bằng cách bổ sung các yếu tố đặc thù của AI.
Đánh giá khả năng AI thực hiện đúng mục đích đã thiết kế.
Bao gồm:
Độ chính xác dự đoán.
Khả năng hoàn thành nhiệm vụ.
Tính phù hợp với yêu cầu nghiệp vụ.
Ví dụ:
Một hệ thống AI chẩn đoán bệnh cần đạt độ chính xác phù hợp với yêu cầu chuyên môn.
Đánh giá khả năng hoạt động ổn định của hệ thống AI.
Bao gồm:
Tính nhất quán.
Khả năng duy trì hiệu suất.
Khả năng phục hồi khi xảy ra lỗi.
AI đáng tin cậy phải duy trì chất lượng trong nhiều điều kiện vận hành khác nhau.
Đánh giá mức độ sử dụng tài nguyên.
Bao gồm:
Tốc độ xử lý.
Thời gian phản hồi.
Mức tiêu thụ tài nguyên tính toán.
Đây là yếu tố đặc biệt quan trọng đối với các mô hình AI quy mô lớn.
Đánh giá trải nghiệm của người dùng khi tương tác với AI.
Bao gồm:
Mức độ dễ hiểu.
Dễ sử dụng.
Khả năng tương tác.
AI càng dễ sử dụng thì khả năng được chấp nhận càng cao.
Đây là một trong những yếu tố nổi bật của ISO/IEC 25059.
Khả năng giải thích giúp:
Hiểu lý do AI đưa ra kết quả.
Tăng niềm tin của người dùng.
Hỗ trợ kiểm toán và quản trị AI.
Đặc tính này đặc biệt quan trọng trong các lĩnh vực có rủi ro cao.
Liên quan đến khả năng cung cấp thông tin về:
Dữ liệu.
Mô hình.
Hiệu suất.
Giới hạn hệ thống.
Minh bạch là nền tảng của AI đáng tin cậy.
Đánh giá mức độ AI tránh tạo ra sự thiên vị hoặc phân biệt đối xử.
Bao gồm:
Thiên vị dữ liệu.
Thiên vị thuật toán.
Thiên vị trong kết quả.
Đây là một yêu cầu ngày càng được nhấn mạnh trong các quy định AI toàn cầu.
Đánh giá khả năng AI tiếp tục hoạt động hiệu quả khi gặp:
Dữ liệu bất thường.
Dữ liệu nhiễu.
Điều kiện vận hành thay đổi.
Các tình huống không mong muốn.
Đánh giá khả năng hạn chế các tác động tiêu cực đến:
Con người.
Tài sản.
Môi trường.
Hoạt động kinh doanh.
Đặc tính này đặc biệt quan trọng đối với AI trong y tế, giao thông và sản xuất.
Đánh giá khả năng bảo vệ hệ thống AI khỏi:
Tấn công mạng.
Rò rỉ dữ liệu.
Tấn công thao túng mô hình.
Truy cập trái phép.

Nhiều đặc tính trong ISO/IEC 25059 chính là các thành phần cốt lõi của Trustworthy AI:
Minh bạch.
Công bằng.
Giải thích được.
An toàn.
Bảo mật.
Độ tin cậy.
Vì vậy, tiêu chuẩn được xem là một nền tảng quan trọng để xây dựng và đánh giá AI đáng tin cậy.
Cung cấp khung đánh giá thống nhất cho toàn bộ vòng đời AI.
Giúp chứng minh chất lượng của hệ thống AI.
Là cơ sở quan trọng cho hệ thống quản lý AI.
Hỗ trợ phát hiện các điểm yếu về hiệu suất, bảo mật và độ tin cậy.
Đáp ứng các yêu cầu ngày càng cao về quản trị và kiểm soát AI.
Tiêu chuẩn phù hợp với:
Doanh nghiệp phát triển AI.
Nhà cung cấp giải pháp AI.
Tổ chức triển khai AI quy mô lớn.
Ngân hàng và tổ chức tài chính.
Doanh nghiệp y tế.
Công ty công nghệ.
Đơn vị triển khai ISO/IEC 42001.
Tổ chức kiểm thử và đánh giá AI.
Đặc biệt, các hệ thống AI có ảnh hưởng trực tiếp đến con người cần được đánh giá chất lượng theo cách tiếp cận toàn diện của ISO/IEC 25059.

Bình luận