OpenAI vừa công bố bộ *EVMbench* – một thước đo mới để kiểm tra khả năng của AI trong việc phát hiện, vá lỗi và thậm chí khai thác lỗ hổng *hợp đồng thông minh tiền mã hóa*. Trong bối cảnh khối tài sản bị “khóa” trong các *hợp đồng thông minh* lên tới hàng chục tỉ đô la Mỹ, thử nghiệm này được xem là cách để hình dung vai trò của AI cả ở phía *tấn công* lẫn *phòng thủ* trong hệ sinh thái tiền mã hóa.
Theo báo cáo nghiên cứu “EVMbench: Đánh giá tác nhân AI trong bảo mật hợp đồng thông minh” do OpenAI công bố ngày 18 (giờ địa phương), phối hợp cùng quỹ đầu tư tiền mã hóa Paradigm và công ty bảo mật OtterSec, bộ *benchmark* này tổng hợp 120 lỗ hổng từ 40 cuộc kiểm toán hợp đồng thông minh. Mỗi mô hình AI được chấm điểm theo tiêu chí “*hiệu suất kinh tế*”: về lý thuyết, mô hình đó có thể *ngăn chặn* (hoặc chiếm đoạt) bao nhiêu giá trị tài sản nếu phát hiện và xử lý được lỗ hổng.
Kết quả cho thấy mô hình *Claude Opus 4.6* của Anthropic đứng đầu với *phần thưởng phát hiện (detect award)* trung bình 37.824 đô la Mỹ (khoảng 5,47 tỉ đồng). Theo sau là mô hình *OC-GPT-5.2* của OpenAI với 31.623 đô la Mỹ (khoảng 4,57 tỉ đồng) và *Gemini 3 Pro* của Google với 25.112 đô la Mỹ (khoảng 3,63 tỉ đồng). “Phần thưởng phát hiện” được định nghĩa là giá trị tài sản (ước tính bằng đô la Mỹ) *có thể được bảo vệ* nếu lỗ hổng được phát hiện và chặn khai thác kịp thời.
*bình luận* Cách chấm điểm theo “giá trị tài sản cứu được” thay vì chỉ tính số lượng bug hay độ khó kỹ thuật, khiến *EVMbench* trở nên gần với bối cảnh kinh tế thực hơn, phù hợp với môi trường *DeFi* và on-chain nơi *mỗi lỗ hổng đều có giá*.
OpenAI nhấn mạnh, trọng tâm của *EVMbench* là xem *AI như một “tác nhân kinh tế”* chứ không chỉ là trợ lý đọc code. Công ty viết rằng khi *tác nhân AI (AI agent)* ngày càng đảm nhận các nhiệm vụ phức tạp, việc đánh giá chúng trong một “*môi trường có ý nghĩa kinh tế*” là điều cần thiết.
Trong hệ sinh thái *tài chính phi tập trung (DeFi)*, game on-chain và các sản phẩm phái sinh, *hợp đồng thông minh* đang đóng vai trò hạ tầng quản lý *khối tài sản lên tới hàng chục tỉ đô la Mỹ*. OpenAI nhận định: các *hợp đồng thông minh* hiện đang bảo vệ lượng tài sản quy mô lớn, và *tác nhân AI* có thể trở thành “điểm bẻ cong” cho cả phe tấn công lẫn phòng thủ.
Công ty cũng dự báo bối cảnh *“thanh toán stablecoin do tác nhân AI điều phối” (agentic stablecoin payments)* sẽ bùng nổ trong tương lai. Khi đó, *tác nhân AI* có thể tự chủ thực hiện thanh toán bằng *stablecoin*, tham gia trực tiếp vào các hoạt động kinh tế, còn *bảo mật hợp đồng thông minh* sẽ trở thành nền móng không thể thiếu cho cả hệ thống này.
Trước đó, Giám đốc điều hành Circle – Jeremy Allaire – từng nhận định vào tháng 1 rằng trong vòng 5 năm tới, có thể sẽ xuất hiện *hàng tỉ tác nhân AI* đứng ra xử lý thanh toán hàng ngày thay cho người dùng, với *stablecoin* là công cụ thanh toán chủ lực. Nhà sáng lập Binance, Triệu Trường Bằng (Changpeng Zhao), cũng từng dự báo tiền mã hóa sẽ trở thành “*đồng tiền bản địa*” của các *tác nhân AI* khi chúng giao dịch, trao đổi giá trị với nhau.
*bình luận* Những nhận định này gợi ý một tương lai nơi *tiền mã hóa* và *AI agent* gắn chặt với nhau trên tầng hạ tầng: AI kiểm soát ví, ký giao dịch, tối ưu chi phí và *bảo vệ* tài sản, trong khi bản thân chúng cũng có thể trở thành *người chơi* chủ động trong nền kinh tế on-chain.
Theo dữ liệu on-chain và các báo cáo bảo mật, riêng trong năm 2025, tổng giá trị *tài sản tiền mã hóa* bị tin tặc chiếm đoạt đã lên tới khoảng 3,4 tỉ đô la Mỹ (tương đương khoảng 49,2 nghìn tỉ đồng). Con số này chỉ tăng nhẹ so với năm trước, nhưng vẫn cho thấy *quy mô thiệt hại cực lớn* và xu hướng tấn công chưa hề thuyên giảm.
Trong bối cảnh đó, *EVMbench* cố gắng đo lường việc *tác nhân AI* có thể phát hiện lỗ hổng nhanh tới mức nào, ở mức độ tinh vi ra sao, và liệu chúng có thể đưa ra đề xuất vá lỗi, hoặc thậm chí xây dựng kịch bản khai thác hoàn chỉnh hay không. 120 lỗ hổng được lựa chọn phần lớn đến từ các cuộc thi audit mã nguồn mở và chương trình săn lỗi nhận thưởng (bug bounty), tức đều là các trường hợp đã từng gây rủi ro thực tế hoặc có độ khó tương đương.
OpenAI kỳ vọng *EVMbench* sẽ trở thành “điểm chuẩn” để theo dõi *tiến bộ dài hạn của AI trong phát hiện và giảm thiểu lỗ hổng hợp đồng thông minh*, từ đó góp phần nâng cao *bảo mật cho các hệ thống on-chain quy mô lớn*.
Tuy vậy, nghiên cứu này cũng làm nóng lại tranh luận về việc *AI và tiền mã hóa* gặp nhau ở đâu trong trải nghiệm người dùng. Haseeb Qureshi – đối tác điều hành tại quỹ đầu tư mạo hiểm Dragonfly – cùng ngày đã chia sẻ trên X (trước đây là Twitter) rằng *hợp đồng thông minh* hiện tại chưa thực sự thay thế được *quyền sở hữu và hợp đồng pháp lý* truyền thống.
Ông cho rằng lý do không phải vì công nghệ thất bại, mà vì toàn bộ hệ thống chưa được thiết kế phù hợp với *trực giác con người*. Mỗi lần phải ký một giao dịch on-chain trị giá hàng triệu đô la Mỹ, người dùng vẫn luôn bị ám ảnh bởi rủi ro *tấn công drainer* và hàng loạt mối đe dọa khác, trong khi cùng số tiền đó nếu chuyển qua ngân hàng, cảm giác bất an thấp hơn nhiều.
Theo Haseeb Qureshi, trải nghiệm sử dụng tiền mã hóa trong tương lai nhiều khả năng sẽ không còn là cảnh người dùng tự tay ký từng giao dịch trên ví, mà sẽ chuyển sang mô hình *“ví tự lái” (self-driving wallet) do AI trung gian quản lý*. Những chiếc ví này sẽ thay mặt người dùng *tự động nhận diện và xử lý* các lỗ hổng như phishing, *hợp đồng thông minh ác ý*, phí gas bất thường, chiến lược DeFi phức tạp, thậm chí gộp nhiều giao dịch lại với nhau và thực thi như một “quản lý tài chính on-chain”.
Một ví dụ ông đưa ra là nền tảng thử nghiệm tác nhân on-chain Moltbook. Dù mới ở giai đoạn rất sơ khai, nhưng theo ông, có thể thấy các *tác nhân AI* đã bắt đầu tìm kiếm cách *thanh toán lẫn nhau* để hoàn thành nhiệm vụ, từ đó hình thành những “*chuỗi công việc*” nơi AI đặt hàng AI, còn tiền mã hóa là đơn vị thanh toán.
*bình luận* Nếu xu hướng này tiếp diễn, con người có thể dần lùi vào “hàng ghế sau” trong tương tác on-chain, chỉ đặt ra mục tiêu, giới hạn rủi ro và quy tắc, còn toàn bộ phần thực thi – từ duyệt *hợp đồng thông minh*, quản lý *tiền mã hóa*, tối ưu lợi suất, đến đàm phán phí – sẽ do *AI agent* tự động đảm nhiệm.
Ông Haseeb Qureshi nhận định nhiều công nghệ chỉ thực sự “vào form” sau khi *sản phẩm bổ trợ* (complementary product) xuất hiện. GPS cần đến *smartphone*, giao thức TCP/IP cần đến *trình duyệt web*, và với *tiền mã hóa*, rất có thể “sản phẩm bổ trợ” đó sẽ là *tác nhân AI*. Nếu giao diện *hợp đồng thông minh* hiện tại còn xa lạ, khó hiểu và đáng sợ với người dùng, thì với *AI agent*, đây lại là “*môi trường tự nhiên*” – nơi chúng có thể dễ dàng phân tích, suy luận và thực thi.
Từ góc độ bảo mật, *EVMbench* phơi bày rõ tính hai mặt của việc đưa AI vào *hệ sinh thái hợp đồng thông minh*: một mặt, các *tác nhân AI* hiệu quả cao có thể bị lạm dụng để xây dựng những công cụ tấn công tinh vi hơn, quy mô lớn hơn; mặt khác, chính công nghệ này lại có thể trở thành “*tường lửa tự động*” bảo vệ các hệ thống on-chain, theo dõi liên tục và phản ứng nhanh hơn con người rất nhiều.
Nghiên cứu không phải là tín hiệu trực tiếp cho quyết định đầu tư ngay lập tức, nhưng là chỉ dấu cho thấy khi hạ tầng *tiền mã hóa* và công nghệ *AI* ngày càng gắn kết, cuộc chơi sẽ dần chuyển thành *“trò chơi quy mô”*. Càng nhiều tài sản được *hợp đồng thông minh* quản lý, động lực dành cho cả kẻ tấn công lẫn đội ngũ phòng thủ dựa trên *tác nhân AI* sẽ càng lớn.
*bình luận* Điểm mà thị trường cần theo sát không chỉ là “*mô hình nào phát hiện bug tốt hơn*”, mà là *những bộ benchmark như EVMbench sẽ được tích hợp vào quy trình thiết kế – kiểm toán – vận hành hợp đồng thông minh như thế nào* để thực sự giảm rủi ro trên diện rộng. Nếu *AI agent* và *tiền mã hóa* thực sự trở thành “sản phẩm bổ trợ” của nhau, rất có thể *mô hình bảo mật* của toàn bộ hệ sinh thái hợp đồng thông minh sẽ phải được thiết kế lại từ gốc.
Bình luận 0