Khi ví bắt đầu nhúng AI Agent: mô hình tương tác mới của ERC-8211, tại sao nó lại đáng chú ý?
Bản thân nó không phải là một tiêu chuẩn AI, nhưng nó có khả năng trở thành một lớp cơ sở hạ tầng thực thi quan trọng trong kỷ nguyên "ví AI+".

Bắt đầu từ năm 2025, nhiều người có thể dần quen với cách tương tác mới: nói với GPT hoặc Gemini: "Hãy giúp tôi lên kế hoạch cho chuyến đi đến Hồng Kông vào tuần tới và giới thiệu vé máy bay và khách sạn phù hợp". Nó sẽ âm thầm hoàn thành một loạt các bước như tìm kiếm thông tin, lọc điều kiện, chọn tuyến đường, so sánh giá, v.v. ở chế độ nền và cuối cùng chỉ cung cấp cho bạn kết quả để xác nhận.
Tuy nhiên, khi những kỳ vọng tương tự được đưa vào chuỗi, câu chuyện đã hoàn toàn thay đổi.
Ví dụ: bạn đưa ra hướng dẫn cho Đại lý DeFi: "Chuyển đổi ETH trong ví sang USDC, chuyển sang chuỗi Base và sau đó gửi toàn bộ số tiền vào Aave." Khách quan mà nói, xét từ góc độ “hiểu nhu cầu” và “lập đường đi”, Đại lý ngày nay không hẳn là không thể. Lỗi thực sự xảy ra trong liên kết thực thi:
Bạn vẫn có khả năng hoàn thành từng bước các hoạt động như chữ ký, ủy quyền, trao đổi, chuỗi chéo và gửi tiền và mỗi bước đều có nguy cơ thay đổi trượt giá, biến động khí, trì hoãn bắc cầu và thay đổi trạng thái trên chuỗi. Điều này cũng có nghĩa là chỉ cần một liên kết ở giữa đi chệch khỏi mong đợi thì các hành động trước đó có thể không thể hoàn tác được và các hành động tiếp theo có thể không được kết nối. Những gì còn lại trên dây chuyền cuối cùng thường chỉ là một quá trình bán thành phẩm chưa hoàn thành.
Vấn đề không phải là AI không đủ thông minh mà là lớp thực thi trên chuỗi vẫn thiếu phương thức biểu thức thực sự thích ứng với Tác nhân.
Do đó, vào đầu tháng 4 năm 2026, Biconomy và Ethereum Foundation đã cùng nhau phát hành ERC-8211, nhằm giải quyết vấn đề "giới hạn tĩnh" trong việc thực thi hợp đồng thông minh hiện tại, cung cấp lớp thực thi mang tính biểu cảm hơn cho các tác nhân AI và quy trình làm việc DeFi phức tạp, đồng thời cố gắng lấp đầy phần còn thiếu này của câu đố.

1. Tác nhân AI "Lỗi cuối cùng" trên chuỗi truy cập
Trong một đến hai năm qua, trọng tâm của ngành mã hóa đã chuyển từ mở rộng L2 và thanh khoản RWA sang chủ đề khá đột phá về cách Tác nhân AI có thể thực sự tiếp quản các hoạt động trên chuỗi.
Nói một cách khách quan, từ "sử dụng ngôn ngữ tự nhiên để đưa ra chiến lược DeFi nhiều bước" đến "cho phép các đại lý tự chủ lưu trữ toàn bộ danh mục đầu tư xuyên chuỗi", chúng tôi đã thấy nhiều thực tiễn gần đây và hầu hết các ý tưởng đều đã trưởng thành ở cấp độ demo, cho dù đó là tạo ngôn ngữ tự nhiên của chiến lược DeFi nhiều bước, tự động thực hiện tái cân bằng, di chuyển thu nhập tự động, điều chỉnh vị trí chuỗi chéo hay thậm chí là quản lý danh mục đầu tư phức tạp hơn.
Từ góc độ lý luận và điều phối, khả năng AI vốn đã chạy khá nhanh, nhưng khi nó thực sự được đưa vào môi trường sản xuất, những thiếu sót của lớp thực thi ngày càng lộ rõ.
Nếu thực sự nói đến môi trường sản xuất, khuyết điểm này có thể tóm gọn trong một câu: DeFi rất năng động, nhưng hầu hết các lô ngày nay vẫn ở trạng thái tĩnh.
Trang web chính thức của ERC-8211 và các chủ đề thảo luận đã làm rõ vấn đề này, tức là ERC-4337 và EIP-5792 hiện tại thực sự đã nâng cao mô hình cũ "một chữ ký tương ứng với một cuộc gọi" lên một giai đoạn mới là "một chữ ký có thể đóng gói nhiều cuộc gọi". Tuy nhiên, hầu hết các tham số trong các cuộc gọi này về cơ bản vẫn bị đóng băng tại thời điểm ký.
Nói cách khác, số tiền, giá trị mục tiêu và đầu ra dự kiến mà người dùng điền khi ký sẽ không được điều chỉnh tự động do những thay đổi về trạng thái của chuỗi khi nó được thực thi thực sự.

Nhưng bản thân DeFi chứa đầy sự không chắc chắn. Đầu ra thực tế của Hoán đổi phụ thuộc vào độ trượt giá và tính thanh khoản trong khối thực thi; thời gian đến và số tiền cuối cùng của Cầu phụ thuộc vào cơ chế và phí của chính cây cầu đó; tỷ lệ chia sẻ trên tài sản của hợp đồng cho vay hoặc Vault cũng sẽ tiếp tục thay đổi.
Xét cho cùng, giá trị mà người dùng hoặc Tác nhân nhìn thấy khi ký thường chỉ là ước tính hiện tại chứ không phải kết quả thực tế trong quá trình thực thi.
Để hiểu những gì ERC-8211 giải quyết, trước tiên chúng ta hãy xem ví dụ điển hình nhất, giả sử rằng Tác nhân muốn làm một việc có vẻ rất bình thường—chuyển đổi ETH trong tài khoản sang USDC, sau đó gửi toàn bộ số tiền vào Spark để kiếm lãi.
Theo mô hình xử lý hàng loạt tĩnh hiện có, Đại lý phải ước tính số USDC sẽ nhận được sau Hoán đổi trước khi ký, điều này thường buộc bạn phải ghi trước số tiền đầu vào ở bước thứ hai khi ký. Nếu ước tính quá cao, số lượng đến thực tế sẽ không đủ, toàn bộ lô hàng sẽ trực tiếp bị thu hồi; nếu ước tính quá thấp, một số tiền sẽ không hoạt động trong ví và không thể làm gì được.
Nói cách khác, về cơ bản chúng ta đang mắc kẹt trong cái gọi là tình thế tiến thoái lưỡng nan, hoặc phải chịu rủi ro thất bại hoặc phải chịu chi phí cơ hội. Đây là lý do tại sao nhiều quy trình trên chuỗi dường như không phức tạp sẽ nhanh chóng trở nên dễ hỏng khi các bước được mở rộng thành 5 bước, 8 bước hoặc thậm chí trên hai chuỗi. Điều này không phải vì bản thân chiến lược quá phức tạp để mô tả, mà bởi vì mô hình thực thi hiện tại phụ thuộc quá nhiều vào các tham số được viết sẵn.
Tóm lại, giới hạn trên của khả năng xử lý hàng loạt tĩnh thực sự xác định giới hạn trên của chính sách mà Tác nhân có thể thực sự thực thi một cách an toàn.
Từ góc độ này, điều ERC-8211 muốn giải quyết không phải là cách Tác nhân AI đưa ra quyết định mà là khi Tác nhân đưa ra quyết định, liệu có cách nào tự nhiên, ổn định và an toàn hơn để thực thi quyết định đó trên chuỗi hay không. Điều này cho phép thực thi trên chuỗi lần đầu tiên có biểu mẫu được thiết kế nguyên bản cho Tác nhân AI.
2. Chính xác thì điều gì đã được thay đổi trong ERC-8211?
Bước đột phá cốt lõi của ERC-8211 không phải là nhồi nhét nhiều bước hơn vào một chữ ký mà là nâng cấp xử lý hàng loạt từ chuỗi giao dịch với các tham số được mã hóa cứng thành "chương trình trong đó các tham số được đánh giá động tại địa điểm thực thi".
Nghe có vẻ trừu tượng nhưng cũng không khó hiểu. Viên chức dùng một câu để miêu tả: Từ giao dịch đến chương trình.
Điều này có nghĩa là ERC-8211 không còn theo lô. Hãy coi nó như một danh sách các hành động được thực hiện theo trình tự mà là một chương trình thực thi được đánh giá trong thời gian chạy và có các điều kiện an toàn. Khi được chia nhỏ một cách cụ thể, nó đạt được điều này thông qua ba nguyên hàm có thể kết hợp:
- Trình tìm nạp: xác định nơi tham số này nhận giá trị. Đó có thể là một truy vấn về số dư hiện tại của một địa chỉ, để các tham số không còn là ảnh chụp nhanh tại thời điểm ký mà là số đọc theo thời gian thực được ghi lại từ trạng thái trên chuỗi tại thời điểm thực thi;
- Ràng buộc (ràng buộc): Sau khi giải quyết xong các tham số, chúng phải được kiểm tra thông qua các ràng buộc nội tuyến - chẳng hạn như "USDC trao đổi phải ít nhất ≥ 2500" hoặc "độ trượt giá không được vượt quá 0,5%". Những ràng buộc này được xác minh trước khi giá trị được chuyển đến cuộc gọi tiếp theo. Nếu có mục nào bị lỗi, toàn bộ lô sẽ bị rollback ngay lập tức;
- Vị ngữ (điều kiện kích hoạt): có thể hiểu là người gác cổng giữa các bước. Họ không chịu trách nhiệm tạo ra các giá trị nhưng chịu trách nhiệm đánh giá xem có nên tiếp tục thực thi hay không. Ví dụ: trong kịch bản xuyên chuỗi, lô ở phía Ethereum có thể được bảo vệ bởi "WETH đến từ xuyên chuỗi" thông qua vị từ Đã nhận được", nó sẽ không được gửi cho đến khi được nhận;
Trong thiết kế này, mỗi tham số phải trả lời hai câu hỏi: thứ nhất, giá trị này đến từ đâu khi được thực thi; thứ hai, những điều kiện nào cần phải được đáp ứng trước khi nó thực sự được sử dụng trong lệnh gọi, để sau khi kết hợp cả ba, một lô không còn chỉ là một chuỗi giao dịch mà là một
Trong phân tích cuối cùng, mô hình tinh thần của xử lý hàng loạt tĩnh là thực hiện danh sách ba bước A, B và C theo thứ tự; trong khi mô hình tinh thần của ERC-8211 là chương trình có điều kiện - sau khi A được thực thi, đầu ra thực sự của A được lấy làm đầu vào của B chỉ nhập vào C khi nó đáp ứng các ràng buộc; Cơ chế "xử lý hàng loạt thông minh" được thiết kế đặc biệt cho Đại lý AI và các hoạt động DeFi phức tạp, bởi vì trong các hoạt động trên chuỗi truyền thống, việc hoàn thành chiến lược DeFi phức tạp thường yêu cầu nhiều giao dịch độc lập: rút tiền từ thỏa thuận cho vay, trao đổi mã thông báo và gửi vào một thỏa thuận khác (đọc mở rộng "Toàn cảnh về các giao thức AI được mã hóa: Bắt đầu từ phần chính chiến trường Ethereum, làm thế nào để xây dựng hệ điều hành mới cho AI Agent? 》).
Mỗi bước yêu cầu chữ ký và xác nhận riêng biệt, điều này vốn đã phức tạp đối với người dùng và thậm chí còn là điểm nghẽn đối với các Tác nhân AI yêu cầu hoạt động tự động tần số cao. Giải pháp ERC-8211 là cho phép kết hợp và thực hiện nhiều hoạt động blockchain trong một giao dịch. Giá trị thực tế của từng bước được phân tích động trong quá trình thực hiện và các điều kiện được xác định trước phải được đáp ứng trước khi có thể tiếp tục bước tiếp theo.
Ví dụ: Đại lý có thể hoàn tất giao dịch đã ký: rút tiền từ Aave → trao đổi số tiền thực tế nhận được trên Uniswap → lưu trữ kết quả trao đổi trong Hợp chất - tất cả được thực hiện nguyên tử mà không cần viết hợp đồng thông minh mới.
3. Tại sao nó liên quan nhiều đến ví, đặc biệt là ví thông minh?
Lý do ERC-8211 xứng đáng được ngành ví quan tâm không chỉ vì nó phù hợp với Agent mà còn vì nó sẽ xác định lại vị thế của ví trong các liên kết tương tác.
Trước đây, ví giống như một công cụ ký tên an toàn hơn. Trách nhiệm của nó là giữ khóa riêng, hiển thị các giao dịch, cho phép người dùng xác nhận và sau đó gửi chữ ký. Vai trò này đã đủ quan trọng trong kỷ nguyên EOA và sẽ tiếp tục được thiết lập trong kỷ nguyên trừu tượng hóa tài khoản. Tuy nhiên, nếu ngày càng có nhiều hoạt động trên chuỗi được Đại lý hoàn thành trong tương lai thì vai trò của ví sẽ trở nên quan trọng hơn.
Lý do rất đơn giản. Khi người dùng không còn kiểm soát từng hành động trên chuỗi mà bắt đầu ủy quyền cho Đại lý thực hiện một bộ mục tiêu, ví phải có khả năng thực hiện đối tượng tương tác cấp cao hơn này. Những gì nó cần hiển thị không còn chỉ là địa chỉ hợp đồng và một phần dữ liệu cuộc gọi mà là toàn bộ chương trình thực thi "ý định - logic giá trị - phán đoán có điều kiện - kết quả cuối cùng".
Do đó, những gì các ví trong tương lai cần hiểu không còn chỉ là giao dịch mà còn là thủ tục. ERC-8211 cung cấp khả năng nắm bắt rõ ràng hơn về các ví ở lớp này vì nó ghi rõ ràng các ngữ nghĩa thực thi này vào cấu trúc mã hóa, bao gồm các tham số đến từ đâu, những điều kiện nào phải được đáp ứng, khi nào nên tiếp tục và khi nào cần quay lại. Chúng không phải là các hộp đen ẩn trong logic back-end mà là các đối tượng có thể được giải thích, mô phỏng và hiển thị bằng ví.
Từ góc độ của ví, toàn bộ cơ chế này cuối cùng đều hướng đến một điều giống nhau, đó là người dùng không còn ký một loạt lệnh gọi cơ bản khó hiểu đầy đủ nữa mà đang ký một chương trình thực thi hướng đến kết quả, có ranh giới rõ ràng và các điều kiện có thể xác minh được:
- Tác nhân AI có thể chịu trách nhiệm hiểu ý định của người dùng và tạo ra đường dẫn;
- Ví có trách nhiệm hiển thị đường dẫn này để người dùng xem xét một cách rõ ràng hơn;
- Và người chuyển tiếp chỉ có trách nhiệm nộp khi đáp ứng đủ điều kiện và không có thẩm quyền giả mạo kết quả;
Đây là lý do tại sao việc thực thi không giam giữ được coi là điều kiện tiên quyết của Agentic DeFi, bởi vì các tác nhân thông minh có thể tham gia, nhưng chủ quyền, các ràng buộc và giải pháp cuối cùng vẫn còn trên chuỗi. Đây là lúc ERC-8211 thực sự phù hợp với ví thông minh, nghĩa là nó viết "biểu hiện an toàn của các ý định phức tạp" vào tiêu chuẩn lớp giao thức.
Điều đáng nói là ERC-8211 hoàn toàn tương thích với các khung trừu tượng hóa tài khoản như ERC-4337, EIP-7702 và ERC-7579. Nó không thay thế việc trừu tượng hóa tài khoản nhưng bổ sung thêm một lớp ngữ nghĩa thực thi theo chương trình mới cho Tác nhân bên cạnh việc trừu tượng hóa tài khoản.

Nếu ERC-4337 giải quyết được "Ai có thể thực hiện giao dịch thay mặt tôi", EIP-7702 giải quyết được "EOA" "Cách sở hữu tạm thời các khả năng của hợp đồng thông minh", thì sao? ERC-8211 giải quyếtkhi Tác nhân bắt đầu hoạt động cho tôi, liệu nó có thể hoàn thành toàn bộ chuỗi quyết định chỉ bằng một chữ ký hay không.
Nhìn lại sự phát triển của mô hình tương tác trên chuỗi của Ethereum trong 10 năm qua:
- Giai đoạn đầu tiên: một chữ ký = một lệnh gọi hàm (kỷ nguyên EOA)
- Giai đoạn thứ hai: một chữ ký = một tập hợp các lệnh gọi đóng gói tĩnh (kỷ nguyên ERC-4337, EIP-5792)
- Giai đoạn thứ ba: một chữ ký = chương trình ý định được đánh giá linh hoạt (ERC-8211) era)
Mỗi bước nhảy có nghĩa là người dùng (hoặc Đại lý đại diện cho người dùng) có thể thể hiện các mục tiêu phức tạp hơn với ít trở ngại hơn.
Mặc dù ERC-8211 vẫn đang trong giai đoạn dự thảo, các cuộc thảo luận kỹ thuật vẫn đang diễn ra và việc truy cập giao thức quy mô lớn vẫn sẽ mất thời gian, nhưng hướng đi mà nó chỉ ra là đủ rõ ràng. Khi Đại lý AI thực sự bắt đầu đưa ra quyết định trên chuỗi cho mọi người, chuỗi sẽ cần một cú pháp thực thi gốc phù hợp.
