Back to top
  • 공유 Chia sẻ
  • 인쇄 In
  • 글자크기 Cỡ chữ
URL đã được sao chép

Pantera Capital và Franklin Templeton tham gia Sentient Arena để kiểm thử AI agent trong tài chính và tiền mã hóa

Pantera Capital và Franklin Templeton tham gia Sentient Arena để kiểm thử AI agent trong tài chính và tiền mã hóa / Tokenpost

**Từ khóa**: *“Sentient”*, *“Arena”*, *“AI agent”*, *“tiền mã hóa”*, *“Pantera Capital”*, *“Franklin Templeton”*

Pantera Capital và bộ phận tài sản số của Franklin Templeton vừa tham gia *“Arena”* – môi trường kiểm thử mới do phòng thí nghiệm AI nguồn mở *“Sentient”* công bố. Theo Cointelegraph đưa tin ngày 27 (giờ địa phương), chương trình *“Arena”* được kỳ vọng trở thành bệ thử cho các *“AI agent”* trong bối cảnh doanh nghiệp tài chính – *tiền mã hóa* ngày càng muốn đưa hệ thống AI vào quy trình vận hành thực tế, thay vì chỉ dừng ở các bài test trong phòng lab.

Theo Sentient, *“Arena”* không phải là nơi chấm điểm mô hình theo kiểu truyền thống, mà được thiết kế như một nền tảng “*benchmarking vận hành*” (production-style benchmarking). Thay vì dùng bộ dữ liệu tĩnh và cho điểm, *Arena* chuẩn hóa các kịch bản thường xuất hiện trong môi trường doanh nghiệp: tài liệu dài, thông tin thiếu hoặc mâu thuẫn, nhiều nguồn tham chiếu xung đột… rồi giao thành bộ nhiệm vụ để đánh giá *AI agent*. Mục tiêu là kiểm tra xem hệ thống có thể xử lý các quy trình nghiệp vụ thực sự *như thế nào*, chứ không chỉ đạt điểm cao trên tập dữ liệu mẫu.

Sản phẩm trưởng của Sentient Labs, Oleg Golev, cho biết giai đoạn hiện tại, “tham gia” *Arena* nghĩa là hỗ trợ chương trình và cộng đồng nhà phát triển trong cohort đầu tiên, cùng xây dựng chuẩn cho “*reasoning sẵn sàng vận hành (production-ready reasoning)*” trong các công việc dựa trên tài liệu như phân tích, tuân thủ (compliance) và vận hành. Ông nhấn mạnh các đối tác như Pantera Capital và Franklin Templeton sẽ cùng Sentient xác định thế nào là mức độ suy luận đủ an toàn và ổn định để đưa vào quy trình thật. *Bình luận*: Việc chưa công bố bất kỳ cam kết góp vốn nào cho thấy Sentient đang ưu tiên xây hệ sinh thái và chuẩn đánh giá trước, rồi mới tính đến khía cạnh đầu tư.

Trong *Arena*, nhà phát triển nộp *AI agent* của mình và để hệ thống xử lý các nhiệm vụ chuẩn dưới cùng điều kiện. Sentient chia nhỏ và gắn nhãn các dạng lỗi: “*hallucination*” (bịa thông tin), thiếu dẫn chứng, trích dẫn sai nguồn, khoảng trống trong lập luận... Toàn bộ được theo dõi để nhà phát triển nắm rõ mô hình của mình thất bại *ở đâu* và *vì sao*. Các chỉ số so sánh hiệu năng sẽ được công bố dạng bảng xếp hạng công khai (public leaderboard), kèm theo bản “*postmortem*” tổng hợp mẫu thất bại và hướng khắc phục. Ở tầng hạ tầng, OpenRouter và Fireworks cung cấp tài nguyên tính toán cho suy luận (inference), còn các đối tác khác hỗ trợ về công cụ và workshop kỹ thuật.

Động thái này xuất hiện trong bối cảnh doanh nghiệp ào ạt thử nghiệm đưa *AI agent* vào quy trình nghiên cứu và vận hành, nhưng khung quản trị – kiểm soát vẫn tụt lại phía sau. Báo cáo “2026 Process Optimization Report” do Celonis công bố ngày 4 tháng 2 (giờ địa phương) cho thấy 85% lãnh đạo doanh nghiệp được khảo sát kỳ vọng trở thành “*agentic enterprise*” trong vòng 3 năm tới, song chỉ 19% hiện thực sự sử dụng hệ thống *multi-agent* trong vận hành. *Bình luận*: Khoảng cách này tạo ra nhu cầu cấp bách cho các nền tảng kiểm thử giống đời thực như *Arena*, nơi doanh nghiệp có thể đo lường rủi ro trước khi “trao quyền” cho AI.

Bên dưới sự ra mắt của *Arena* là xu hướng ngày càng nhiều tổ chức tài chính và công ty *tiền mã hóa* muốn trao cho AI quyền tự chủ kinh tế lớn hơn. Gần đây, MoonPay thông báo đã xây dựng hạ tầng để *AI agent* có thể tự tạo ví, thực hiện giao dịch stablecoin và xử lý một phần quy trình thanh toán. Lãnh đạo Stripe cũng cảnh báo, nếu thương mại do AI dẫn dắt tăng tốc, hạ tầng blockchain sẽ phải mở rộng quy mô mạnh để đáp ứng lưu lượng giao dịch tự động.

Trong ngành tài chính số, nhiều chuyên gia nhận định khi *AI agent* bám sâu vào quy trình doanh nghiệp – từ phân tích dữ liệu, tuân thủ, cho đến quản lý ví và thanh toán – thì “tỷ lệ trả lời đúng” sẽ không còn là thước đo duy nhất. Thay vào đó, “*lập luận có căn cứ và khả năng kiểm soát*” mới trở thành lợi thế cạnh tranh trọng yếu. Việc *Sentient* xây *“Arena”* theo hướng “benchmarking vận hành” và công khai phân tích nguyên nhân thất bại phản ánh rõ nhu cầu thị trường: song song với việc nâng cấp hiệu suất, ngành *tiền mã hóa* cần một bộ chuẩn tin cậy để kiểm chứng, giám sát và chuẩn hóa hành vi của *AI agent* trong môi trường thực.

Trong bức tranh đó, *“Sentient”*, nền tảng *“Arena”* và sự tham gia của các tên tuổi như Pantera Capital, Franklin Templeton đang cho thấy bước dịch chuyển từ “AI demo” sang “AI vận hành” của lĩnh vực tài chính và *tiền mã hóa*: ít phô diễn điểm số, nhiều hơn về kiểm chứng, giám sát và khả năng chịu trách nhiệm trước dòng tiền thật.

<Bản quyền ⓒ TokenPost, nghiêm cấm sao chép và phân phối trái phép>

Phổ biến nhất

Các bài viết liên quan khác

Bình luận 0

Mẹo bình luận

Bài viết tuyệt vời. Mong có bài tiếp theo. Phân tích xuất sắc.

0/1000

Mẹo bình luận

Bài viết tuyệt vời. Mong có bài tiếp theo. Phân tích xuất sắc.
1