Mô hình AI nguồn mở của Meta và Google bị gỡ cơ chế an toàn chỉ trong vài phút, dấy lo ngại về trách nhiệm an toàn AI

Wed, 27 May 2026, 09:26 am UTC

Mô hình AI nguồn mở của Meta và Google bị gỡ cơ chế an toàn chỉ trong vài phút, dấy lo ngại về trách nhiệm an toàn AI / Tokenpost

Theo Financial Times(FT) đưa tin ngày 24 (giờ địa phương), các *mô hình AI nguồn mở* do những tập đoàn công nghệ lớn như Meta(META) và Google(GOOGL) phát triển có thể bị vô hiệu hóa *cơ chế an toàn* chỉ trong vài phút, sử dụng hoàn toàn các công cụ công khai. Kết quả này làm dấy lên tranh luận gay gắt về việc trách nhiệm *an toàn AI* thuộc về ai, khi một khi mô hình đã được phát hành thì gần như không còn khả năng kiểm soát triệt để.

Trong thử nghiệm phối hợp giữa FT và nhóm *AI an toàn* “앨리스 (Alice)”, các nhà nghiên cứu chỉ dùng những công cụ, mã nguồn có sẵn trên các kho code công khai để loại bỏ *hàng rào bảo vệ* (guardrail) của mô hình trong chưa đầy 10 phút. Phiên bản đã bị chỉnh sửa này bắt đầu trả lời cả những yêu cầu vốn bị chặn trước đó, bao gồm câu hỏi về *vũ khí sinh học*, *mã độc*, hay *hóa chất nguy hiểm*.

*bình luận* Kết quả cho thấy, chỉ cần hiểu biết kỹ thuật ở mức trung bình–khá, bất kỳ ai cũng có thể tái sử dụng *mô hình AI nguồn mở* theo hướng nguy hiểm nếu họ có chủ đích xấu.

Diễn biến này làm nổi bật một nghịch lý lớn: càng nhiều *AI nguồn mở* mạnh mẽ được tung ra, hiệu lực của các quy định hiện tại càng suy giảm. Khác với *mô hình đóng*, *hệ thống nguồn mở* có thể được tải về, chỉnh sửa và phân phối lại tự do, khiến bên phát triển khó có thể áp đặt tiêu chuẩn *an toàn* sau khi phát hành. Nhiều ý kiến cho rằng khung pháp lý như *Đạo luật AI* của Liên minh châu Âu(EU), hay các thảo luận về quản lý *mô hình tuyến đầu* (frontier models) ở Mỹ và Anh, hiện vẫn tập trung quá nhiều vào khâu phát triển, trong khi khâu sử dụng thực tế lại là nơi rủi ro bùng phát.

Đồng sáng lập XYO, ông Markus Levin (Marcus Levin), nhận định “khoảnh khắc *mô hình nguồn mở* được công bố là lúc quyền kiểm soát rời khỏi tay nhà phát triển với tốc độ rất nhanh”. Cùng quan điểm, ông David Minarsch (David Minarsch) của Olas và Valory cho rằng “người có ý đồ xấu luôn có thể tiếp cận các bản sao trọng số mô hình đã được nhân bản”. Theo ông, các biện pháp quản lý tập trung vào khâu *phân phối, lưu thông* và *giai đoạn bị lạm dụng thực tế* có thể hiệu quả hơn so với việc chỉ siết ở khâu phát triển.

Tổng giám đốc điều hành của công ty an ninh mạng CertiK, ông Ronghui Gu (Ronghui Gu), cũng đánh giá cơ chế *quản trị ở cấp nhà phát triển* là hoàn toàn chưa đủ. Ông cho rằng kiểm soát *hạ tầng lưu trữ thương mại*, *quy trình doanh nghiệp tích hợp AI* và *chuỗi cung ứng mô hình* là hướng tiếp cận thực tế hơn, bởi đây là những “nút cổ chai” có thể áp dụng tiêu chuẩn *an toàn* và quy định pháp lý.

*bình luận* Trường hợp này một lần nữa cho thấy mặt trái của làn sóng *AI nguồn mở*: nó dân chủ hóa quyền tiếp cận công nghệ, thúc đẩy đổi mới và cạnh tranh, nhưng nếu *cơ chế an toàn* và *khung quản trị* không kịp thích ứng, xã hội sẽ phải đối mặt với lớp rủi ro mới, từ tấn công mạng tinh vi đến đe dọa an ninh sinh học.

Khi *AI nguồn mở* ngày càng mạnh và phổ biến, câu hỏi cốt lõi không chỉ là “ai được phép phát triển”, mà còn là “ai chịu trách nhiệm khi *cơ chế an toàn* bị vô hiệu hóa, và chúng ta quản lý việc phân phối, lưu trữ, triển khai như thế nào”. Nếu thiếu một mô hình *quản trị AI* bao trùm cả vòng đời – từ nghiên cứu, phát hành, thương mại hóa đến sử dụng cuối cùng – mọi cam kết về *an toàn AI* nhiều khả năng chỉ dừng ở mức hình thức.

#AI nguồn mở #an toàn AI #Meta #Google #quản trị AI #mô hình nguồn mở #quy định AI #bảo mật #rủi ro AI