Bài viết | Buồn ngủ quá, Kaori

OpenClaw là thực thể quan trọng nhất trong thế giới nguồn mở vào năm 2026. Dự án Tác nhân AI cá nhân này do kỹ sư người Áo Peter Steinberger tạo ra vào cuối năm 2025, đã trở thành phần mềm dễ chạy nhất với số sao cao nhất trong lịch sử GitHub trong ba tháng. Người sáng lập đã được đích thân Sam Altman công bố gia nhập OpenAI và dự án ngay lập tức được bàn giao cho quỹ để hoạt động độc lập.

ClawCon, sự kiện cộng đồng phát triển xung quanh nó, bắt đầu từ sự kiện đầu tiên ở San Francisco và đã được tổ chức ở New York, Miami, Austin, Madrid và Tokyo, với hàng nghìn người tham dự ở mỗi thành phố.

Vào tháng 5, buổi trình diễn đầu tiên của ClawCon China đã được tổ chức tại Thượng Hải. Dongcha Beating phỏng vấn độc quyền hai nhân vật cốt lõi tại hiện trường: Vincent Koc và Michael Galpert.

Vincent Koc là người duy trì OpenClaw với lượng đóng góp mã lớn thứ hai trên thế giới, chỉ sau chính Peter. Ông cũng là kỹ sư nghiên cứu AI hàng đầu tại Comet ML, giảng viên MIT và đã gửi 20% bản vá bảo mật cốt lõi ban đầu cho OpenClaw.

Michael Galpert là người sáng lập và tổ chức toàn cầu của ClawCon và là một doanh nhân nối tiếp. Công cụ chỉnh sửa hình ảnh Aviary mà anh đồng sáng lập đã được Adobe mua lại vào năm 2014. Từ đó, anh giữ chức vụ giám đốc sản phẩm của “Fortnite” của Epic Games và hiện đang điều hành studio sản phẩm AI Chứa Inc. Anh đã biến ClawCon từ một cuộc tụ tập ngẫu hứng trong phòng khách ở San Francisco thành một thương hiệu cộng đồng AI cá nhân bao phủ hơn chục thành phố trên khắp thế giới.

Khi chúng tôi phỏng vấn Vincent và Michael, cơn gió thú vị nhất ở OpenClaw đã trôi qua.

Đây là thời điểm thích hợp hơn để nói về OpenClaw. Khi cơn sốt lên đến đỉnh điểm, một dự án luôn được thúc đẩy bởi những con số: số sao GitHub, hoạt động PR, số người trên trang web, lượng cộng đồng và báo cáo truyền thông. Mỗi con số giống như một chiếc đèn pha, chiếu sáng con người rất rực rỡ nhưng cũng khiến người ta khó nhìn rõ. Khi đèn mờ đi một chút, câu hỏi thực sự xuất hiện: Tại sao nó đột nhiên tấn công nhiều người như vậy? Liệu nó có thể biến từ cảm giác phấn khích trở thành một công cụ hàng ngày không? Khi AI không còn chỉ trò chuyện mà bắt đầu gửi tin nhắn, thay đổi tệp và chạy tác vụ cho mọi người, nó nên lắng nghe ai?

ClawCon Shanghai vẫn đang rất nóng. Một dự án AI mã nguồn mở đã đạt hàng trăm nghìn sao GitHub chỉ sau vài tháng. Sự kiện này được đưa vào cộng đồng công nghệ du mục 28 ngày của muShanghai. Thông cáo báo chí cho biết cộng đồng công nghệ du mục kéo dài 28 ngày này đã quy tụ 800 nhà xây dựng toàn cầu và chương trình ClawCon China đầu tiên cũng được đưa vào.

Nhiều nhà phát triển Trung Quốc đã đến hiện trường. Họ lo ngại về Feishu, WeChat, Enterprise WeChat, DingTalk, tệp cục bộ, tập lệnh tự động và cách tích hợp OpenClaw vào công việc và cuộc sống của họ. Theo quy ước, tại thời điểm này chúng ta nên nói về sự nhiệt tình, tốc độ và cách các nhà phát triển sẽ đổ vào. Tốt nhất nên kết hợp nó với một đường cong dốc.

Nhưng khi Vincent lên nắm quyền, ông không kể đó là một câu chuyện trưởng thành đẹp đẽ. Đầu tiên anh ấy nói về một vấn đề: OpenClaw nhận được 10.000 PR.

Con số này sẽ rất phù hợp để tổ chức lễ kỷ niệm. Nỗi sợ hãi lớn nhất của các dự án nguồn mở là không ai sử dụng nó, không ai đặt câu hỏi, không ai gửi mã và không ai sẵn sàng dành cả ngày cuối tuần cho nó.

Nhưng những gì OpenClaw phải đối mặt là mà ai cũng muốn đưa ý tưởng của mình vào đó.

Một số người muốn chọn Feishu và một số muốn chọn WeChat và DingTalk. Một số người muốn nó đọc các tệp cục bộ, chạy các tập lệnh tự động, viết mã và sắp xếp dữ liệu; những người khác muốn nó chạy các chiến lược giao dịch hoặc vận hành một tài khoản nội dung cho chính họ 24 giờ một ngày.

Trước đây, các dự án nguồn mở có một ngưỡng tự nhiên: nếu bạn muốn gửi mã, ít nhất bạn phải đọc tài liệu, hiểu một số kiến trúc, có thể chạy thử nghiệm và biết mình đang thay đổi phần nào.

Bây giờ ngưỡng này đã bị các công cụ lập trình AI làm mỏng đi.

Những người không hiểu kiến trúc cũng có thể để mô hình viết mã, chạy thử nghiệm và gửi bản vá. Một ý tưởng có lẽ đã đọng lại trong đầu bạn giờ đây có thể được gói gọn thành một bài nộp trông giống như nó có thể chạy được. Những xung lực từng bị chặn lại một cách tự nhiên bởi ngưỡng khả năng bỗng nhiên xuất hiện trên bàn của người duy trì.

Điều tương tự cũng xảy ra với việc gửi bài một cách an toàn. Vincent cho biết tại địa điểm này rằng có thời điểm họ nhận được hơn 100 báo cáo về lỗ hổng bảo mật mỗi ngày và mỗi báo cáo đều phải được phân loại và kiểm tra. Các lỗ hổng thực sự sẽ được khắc phục sớm nhất có thể, nhưng phần lớn chúng được tạo ra trực tiếp từ mô hình lớn. Người cam kết không nhất thiết thực sự muốn dự án được đảm bảo an toàn hơn, nhiều khi họ chỉ muốn ghi tên mình vào một dự án nổi tiếng.

Đây là một tiếng ồn rất mới.

Nó không hẳn là độc hại, không nhất thiết phải tấn công bạn và thậm chí có thể được ngụy trang dưới dạng "đóng góp". Nhưng nó sẽ ngốn đi thứ đắt giá nhất trong hệ thống: sự chú ý của con người.

Đây cũng là cảm giác mạnh mẽ nhất sau cuộc phỏng vấn độc quyền của chúng tôi với Vincent và Michael Galpert ở Thượng Hải.

Trợ lý AI mã nguồn mở đột nhiên trở nên phổ biến. Nhìn sâu hơn, đó thực sự là một Đặc vụ cá nhân đã gặp phải những vấn đề mà mọi người sẽ phải đối mặt trong vài năm tới. Khi AI không còn chỉ trò chuyện mà bắt đầu gửi tin nhắn, thay đổi tệp, chạy tác vụ và đưa ra phán đoán cho bạn, nó sẽ lắng nghe ai?

Câu hỏi này rắc rối hơn nhiều so với câu hỏi "mô hình nào thông minh hơn".

Trí thông minh không còn khan hiếm, thứ khan hiếm là bàn tay và bàn chân

Vincent đã nhiều lần nói trong bài phát biểu của mình rằng OpenClaw không phải là một sản phẩm bình thường, nó giống một bộ “tay chân” nằm ngoài mô hình hơn.

Trong tiếng Anh họ dùng từ Harness và dịch sát nghĩa rất khó hiểu. Bạn có thể hiểu nó như một bộ thiết bị giúp mô hình thực sự hoạt động: cách gọi công cụ, cách ghi nhớ bạn, cách phân chia nhiệm vụ, khi nào nên dừng và hỏi mọi người, khi nào nên tiếp tục chạy về phía trước, cách dọn dẹp sau khi mắc lỗi, và có nên phanh lại khi chi phí cao hay không.

Mô hình giống như bộ não và tập hợp những thứ này giống như cơ thể.

Trong một năm qua, ngành này quá bị ám ảnh bởi khối óc. Ai có lý luận mạnh mẽ hơn, ai viết mã tốt hơn, ai có ngữ cảnh dài hơn và ai đa phương thức và chính xác hơn. Bảng xếp hạng cũng sôi động như phiên chợ sáng ở chợ rau, các chủ sạp tự nhận là tươi nhất, rẻ nhất, ngon nhất.

Nhưng con người chỉ có bộ não và không thể làm được gì cả. Bạn vẫn phải có tay, chân, cảm giác đau đớn, cảm giác ranh giới. Không dang tay, không chạy bằng chân, biết dừng lại khi đau và biết gõ cửa trước khi bước vào cửa nhà người khác.

Điều tương tự cũng đúng với Đại lý.

Chỉ vì mô hình có thể nghĩ không có nghĩa là nó sẽ làm được; nó làm được không có nghĩa là nó làm ổn định; và nếu nó làm ổn định thì không có nghĩa là nó biết khi nào không nên làm. Khi nhiều công ty nói về Agent, họ vẫn gọi nó là “mô hình thông minh hơn + nhiều công cụ hơn”. Nhưng khi chúng thực sự được sử dụng, điều người dùng thường cảm nhận được không phải là trí thông minh mà là thể lực của chúng.

Nó có thể hoàn thành một nhiệm vụ lâu dài không? Bạn đã quên những gì bạn nói trước đó? Tôi có thể tự sửa nồi sau khi điều chỉnh sai dụng cụ không? Khi gặp điều gì đó không chắc chắn, bạn nên tiếp tục làm việc chăm chỉ hay nên dừng lại và đặt câu hỏi?

Những câu hỏi này không đẹp mắt, cũng không phù hợp để đưa vào một tấm áp phích có nhân vật lớn trong một cuộc họp báo. Nhưng họ xác định liệu Đặc vụ có thể chuyển từ video trình diễn sang cuộc sống hàng ngày hay không.

Vincent đã nói về một tam giác rất đơn giản: tốc độ, chi phí, độ chính xác. Thật khó để bạn có được cả ba điều đó.

Nếu bạn chăm chỉ tiết kiệm tiền ngay từ đầu thì phải chấp nhận rằng nó sẽ chậm hơn và mắc sai lầm. Nếu muốn cả tốc độ và độ chính xác, bạn phải chấp nhận rằng chi phí suy luận sẽ tăng lên, chuỗi lệnh gọi công cụ sẽ dài hơn và phương pháp sai sót sẽ trở nên khó đoán hơn. Nhiều người thích gọi vấn đề này là mức tiêu thụ token, như thể nó chỉ là một con số trên hóa đơn. Nhưng trong một hệ thống thực, mỗi lần thử lại, mỗi lần gọi công cụ, mỗi lần tiếp quản của con người đều là một chi phí.

Điều này không thể thấy được trong bảng xếp hạng người mẫu. Điểm chạy sẽ cho bạn biết có bao nhiêu khả năng mã hóa, khả năng toán học và khả năng suy luận, nhưng nó sẽ không cho bạn biết mô hình sẽ thất bại bao nhiêu lần sau khi được đưa vào Đặc vụ thực sự, liệu có cần thiết phải tìm ai đó nửa chừng hay không và liệu nó có hỏi ai đó điều gì đó khiến bạn muốn ném máy tính hay không.

Vì vậy, nhận định của Vincent là tất nhiên điều quan trọng là mô hình phải tiếp tục trở nên mạnh mẽ hơn, nhưng độ khó của từng tác nhân đang chuyển từ “liệu nó có thể suy nghĩ” sang “liệu nó có thể hành động hay không”. Về hành động, chúng ta không thể chỉ phụ thuộc vào điểm số của mô hình.

Vấn đề đã thay đổi.

Nguồn mở mở ra cánh cửa và cho phép mọi người tham gia

OpenClaw càng thành công thì càng khó thực hiện những gì nó muốn làm ban đầu.

OpenClaw ban đầu là một trợ lý AI cá nhân, không phải là một hệ thống doanh nghiệp, một nền tảng đa tác nhân hay một cơ sở để tất cả các công ty điều hành hoạt động kinh doanh của mình. Tầm nhìn công khai của OpenClaw cũng mô tả nó là "chạy trên thiết bị của bạn, trong các kênh của bạn, với các quy tắc của bạn".

Nhưng một khi một dự án nguồn mở trở nên lớn thì rất khó để chỉ thuộc về nhóm người ban đầu.

Michael nói rằng dự án này ban đầu được thực hiện cho các cá nhân, nhưng bây giờ, mọi người đang làm đủ mọi thứ trên đó. Anh ấy bị sốc trước tốc độ và sự sẵn lòng truy cập OpenClaw của các nhà phát triển Trung Quốc.

Vẻ đẹp của nguồn mở là ở đây, và sự tàn ác cũng ở đây.

Nó mở cửa và cho nhiều người vào hơn. Nhưng một khi cửa mở, không còn chỉ chủ nhân là người có tiếng nói cuối cùng trong nhà.

Các dự án nguồn mở trước đây dựa vào thẩm quyền kỹ thuật của một số ít người bảo trì. Giờ đây, AI đã mang lại sự bình đẳng về mã, nhiều người bình thường hơn đã đạt được năng suất phần mềm và nhiều nhu cầu cũng như chức năng chưa được khám phá hoạt động không trơn tru đã được chuyển cho người bảo trì.

Đây chắc chắn không phải là điều xấu. Ngược lại, đây có thể là sự phân cấp hiếm hoi trong lịch sử nguồn mở.

Nhưng sự phân cấp không bao giờ tự động tạo ra trật tự.

Cộng đồng càng cởi mở thì càng phải giải quyết nhiều vấn đề về ranh giới. Vincent cho biết nhóm OpenClaw hiện đang điều chỉnh các phương pháp bảo trì và thực hiện SDK, công cụ kiểm tra, tài liệu và kiến trúc tham chiếu. Dịch sang tiếng địa phương: Họ không ngăn nước vào mà phải đào kênh dẫn nước vào sông.

Đây cũng là cảnh được hé lộ từ rất sớm trong thời đại Đặc vụ.

Sự bùng nổ của OpenClaw có thể dễ dàng được viết như một câu chuyện chiến thắng: nhiều người tham gia hơn, nhiều mã hơn xuất hiện và nhiều trí tưởng tượng xuất hiện hơn. Nhưng khi cơn sốt lắng xuống một chút, một bức tranh khác đã lộ ra.

Ban đầu chúng tôi nghĩ rằng AI sẽ giúp việc phát triển phần mềm trở nên dễ dàng hơn, nhưng hóa ra ban đầu nó khiến những người bảo trì mệt mỏi hơn. Bởi vì khi mọi người đều có thể viết mã, điều thực sự khan hiếm không phải là mã, mà là phán đoán: điều gì đáng tồn tại, rủi ro nào không thể được giải phóng, nhu cầu nào cần được đáp ứng, và nhu cầu nào chỉ là tiếng ồn và một bộ quần áo thay đổi.

Một vấn đề lớn hơn đã xuất hiện.

Nếu cộng đồng sử dụng các hành động để xác định lại OpenClaw, định nghĩa nào trong số này sẽ trở thành tương lai của Đại lý cá nhân? Cái nào chỉ là sự phấn khích ngắn hạn?

Càng sử dụng, bạn càng trở nên thông minh hơn hoặc càng sử dụng nhiều, bạn càng trở nên bướng bỉnh.

Sau khi mức độ phổ biến giảm bớt, sự cạnh tranh mới thực sự bắt đầu. Vấn đề không còn chỉ là ai bắt mắt hơn mà buộc tất cả các dự án Đặc vụ phải trả lời một câu hỏi đơn giản hơn: Làm thế nào để chứng minh rằng bạn không phải là đồ chơi dùng một lần?

Hermes là một sự so sánh tốt. Theo tuyên bố hiện tại, ưu điểm của nó là cho phép Đại lý tự xem xét lại sau khi hoàn thành nhiệm vụ: mình đã làm tốt điều gì, làm kém điều gì và những bước nào có thể được tích lũy vào trải nghiệm của cuộc gọi trực tiếp tiếp theo. Lần tới khi gặp một nhiệm vụ tương tự, bạn không cần phải suy nghĩ lại mà cứ làm. Nói một cách thẳng thắn hơn, nó có nghĩa là viết ra trải nghiệm của chính bạn, và càng sử dụng nó, bạn sẽ càng trở nên quen thuộc.

Câu nói này rất dễ khiến người ta thích thú.

Ai lại không muốn một trợ lý ngày càng dễ sử dụng hơn? Ai lại không muốn một nhân viên xem lại kết quả sau giờ làm và đến làm việc vào ngày hôm sau với một cuốn sổ nhỏ? Trong thời đại mà mọi người đều kêu gọi tính hiệu quả, “bạn càng sử dụng nó, nó càng thông minh hơn” gần như là lời hứa dễ chịu nhất.

Vincent thận trọng về vấn đề này.

Anh ta không vội nói rằng OpenClaw cũng có thể làm được, anh ta cũng không dẫm lên Hermes. Anh ấy chỉ nói: "Kinh nghiệm được tạo tự động có hữu ích hay không, hiện tại trên thị trường không có phương pháp đánh giá nào đủ mạnh."

Một kỹ năng được Đại lý tự động viết ra có thể là nén kinh nghiệm, hoặc có thể là lỗi hàn. Nó hữu ích bảy phần mười và gây hiểu lầm ba lần. Làm thế nào để hệ thống đánh giá liệu nó có nên được giữ lại hay không? Nó viết một con đường đã thành công một cách tình cờ dưới dạng một quá trình cố định. Nếu môi trường thay đổi lần sau, liệu nó có còn đi theo con đường sai lầm nữa không? Một ký ức sẽ trở nên lỗi thời sau một vài tuần, nhưng vì nó được gọi đi gọi lại nhiều lần nên Đặc vụ càng tin tưởng vào nó hơn. Đây là việc trở nên thông minh hơn hay trở nên bướng bỉnh?

Mọi người cũng thường làm điều này. Trong những năm đầu, tôi kiếm tiền bằng cách dựa vào một phương pháp nhất định. Sau này thị trường thay đổi, tôi vẫn coi phương pháp đó như một công thức bí truyền được truyền từ đời này sang đời khác. Một công ty đã từng dựa vào một quy trình nhất định để tồn tại, sau đó nó cung cấp quy trình đó và bất cứ ai chạm vào nó đều chết. Chúng tôi gọi đó là chủ nghĩa kinh nghiệm, sự phụ thuộc vào con đường và sức ì của tổ chức. Đưa nó lên Agent, nó có thể được đóng gói dưới dạng "học tự động".

Đây là lúc Vincent tỏ ra thận trọng. Không phải là anh ấy không muốn OpenClaw học, nhưng anh ấy không muốn trực tiếp đánh đồng “có vẻ đang học” với “thực sự đang tiến bộ”.

Học tập trong thế giới thực không phải là nhét tất cả kinh nghiệm vào kho. Việc học thực sự cũng bao gồm việc quên đi, sửa chữa sai lầm và thừa nhận rằng “con đường này trước đây có hiệu quả nhưng bây giờ có thể không hiệu quả”.

Người đại diện không quên chưa chắc đã thông minh hơn. Nó có thể khó sửa hơn.

Vậy là vấn đề còn tiến thêm một bước nữa.

Nếu Tác nhân có thể nhớ, xem xét và viết lại những trải nghiệm của chính mình thì ai sẽ đánh giá xem những gì nó học được là kinh nghiệm hay thành kiến?

Trí nhớ không phải là một chức năng, nó là sự khởi đầu của một mối quan hệ

Michael được hỏi, nếu trong tương lai mỗi người đều có Đặc vụ thường trú của riêng mình thì khả năng cốt lõi của nó là gì.

Anh ấy không nói về lý luận, đa phương thức hoặc cách gọi công cụ. Anh nói đó là kỉ niệm.

Bạn đã nói về điều gì đó với Đại lý cá nhân của mình hai tuần trước và nếu bạn nhắc lại điều đó hôm nay, Đại diện đó sẽ biết bạn đang nói về điều gì. Trí nhớ là điều cần thiết để duy trì một mối quan hệ lâu dài và liên tục.

Đây là một tuyên bố rất đơn giản nhưng nó tách biệt Tác nhân cá nhân khỏi phần mềm thông thường.

Các công cụ được sử dụng theo chức năng và các mối quan hệ được duy trì bằng bộ nhớ.

Một Agent mà mỗi lần bạn mở nó giống như lần đầu gặp bạn, nó sẽ luôn chỉ là một công cụ. Cái gọi là cá nhân hóa không có nghĩa là tên của bạn được viết trên giao diện, cũng không có nghĩa là hình đại diện được đổi sang màu bạn yêu thích, mà là nó biết bạn là ai, bạn làm việc như thế nào, bạn không thích gì, những vấn đề nào bạn luôn do dự và những điều bạn có xu hướng bốc đồng.

Vincent cũng đề cập đến vấn đề này trong bài phát biểu của mình. Ông cho rằng, ngành có thể có những mô hình hoạt động tốt nhưng thiếu ý thức gắn kết lâu dài. Khi chúng ta nói về Tác nhân cá nhân, nó không còn chỉ là một kịch bản kinh doanh nữa, không còn là cột trong bảng "Người dùng làm gì với nó?" Đó là Đại lý làm việc cho tôi, Đại lý nói chuyện với tôi. Mọi người đều có những kỳ vọng khác nhau đối với AI và việc thiết kế cho lĩnh vực này hoàn toàn chưa được biết đến.

Đây thực chất là một sự bác bỏ quan điểm bộ câu hỏi quen thuộc nhất trong ngành công nghệ.

Ngành công nghệ thích hỏi: Người dùng là ai? Cảnh là gì? Đâu là điểm đau? Tiền hoàn lại được tính như thế nào? Ai phê duyệt ngân sách? Bộ câu hỏi này chắc chắn hữu ích, đặc biệt khi bán phần mềm doanh nghiệp. Nhưng điều Vincent muốn nói là tác nhân cá nhân không chỉ là một chức năng cố định, nó giống như một cổng kết nối hơn.

"Dùng để làm gì" hỏi về chức năng.

"Làm sao nó hiểu được tôi" hỏi về các mối quan hệ.

Sự khác biệt vừa nhỏ vừa lớn.

Trong kỷ nguyên công cụ, con người đưa ra các hướng dẫn và phần mềm thực thi chúng. Bạn mở một ứng dụng, hoàn thành một việc rồi đóng nó lại. Bạn sẽ không quan tâm nó nghĩ gì về bạn hay liệu nó có nhớ đến bạn hay không. Cộng tác viên là khác nhau. Các cộng tác viên sẽ nhớ lý do tại sao bạn thay đổi quyết định lần trước và sẽ biết khi nào bạn có xu hướng chấp nhận rủi ro. Họ cũng có thể hỏi bạn vào thời điểm quan trọng: Bạn có chắc không?

Vincent có một câu nói thú vị. Anh ấy nói rằng bây giờ anh ấy không còn bảo Đặc vụ phải làm gì nữa, nhưng Đặc vụ đang hỏi anh ấy, thách thức suy nghĩ của anh ấy và hỏi làm thế nào họ có thể làm việc cùng nhau.

Thoạt nhìn, điều này nghe có vẻ giống như một lời tuyên bố rất nhẹ nhàng về tương lai.

Nghĩ sâu sẽ thấy hơi ớn lạnh.

Nếu Tác nhân có thể thách thức suy nghĩ của bạn thì tại sao nó lại phải thách thức bạn? Nó thách thức những ký ức nào, sở thích nào, phán đoán giá trị nào? Nó đứng về phía bạn hay về phía người viết nó? Nó có hiểu được sở thích lâu dài của bạn hay những hành động mà nền tảng muốn bạn thực hiện không?

Nó nghe ai?

Trước đây, các nền tảng định hình luồng thông tin. Bạn chải cái gì, bạn nhìn thấy gì, cảm xúc nào dẫn dắt bạn. Trong kỷ nguyên Đại lý, nền tảng hoặc cộng đồng nguồn mở có thể định hình một "người" sẽ hành động thay bạn, phán xét thay bạn và sắp xếp cuộc sống hàng ngày cho bạn. Nó không chỉ đưa nội dung đến cho bạn mà còn đi vào các tệp, cuộc trò chuyện, lịch trình và quy trình làm việc của bạn, thậm chí cả cách bạn tương tác với thế giới.

Một Đặc vụ không có cá tính thì chưa đủ cá nhân. Một Đặc vụ có tính cách được người khác âm thầm quyết định là quá cá nhân.

Đường may ở giữa sẽ là nơi khó may nhất trong vài năm tới.

Vấn đề an toàn cuối cùng sẽ trở thành vấn đề của con người

Ai đó ở ClawCon đã hỏi Vincent về vấn đề bảo mật.

Đối với một công cụ như OpenClaw, bạn càng cấp nhiều quyền thì nó càng hữu ích; bạn càng cấp nhiều quyền thì nó càng nguy hiểm. Nó có thể kết nối với phần mềm trò chuyện, đọc tệp, chạy tập lệnh, điều chỉnh mô hình và viết mã. Khả năng và rủi ro không phải là hai con đường khác nhau, chúng là mặt tích cực và tiêu cực của cùng một con đường.

Câu trả lời của Vincent có hai cấp độ.

Đầu tiên, OpenClaw quá dễ thấy. Là kho lưu trữ mã nguồn mở lớn trên GitHub nên luôn được các nhà nghiên cứu bảo mật theo dõi. Nhiều người muốn phá vỡ nó vì phá vỡ nó sẽ khiến họ nổi tiếng. Họ từng nhận được hơn 100 báo cáo về lỗ hổng bảo mật mỗi ngày và kiểm tra từng báo cáo. Các lỗ hổng thực sự sẽ được khắc phục nhanh chóng và các báo cáo spam phải được ai đó đọc.

Thứ hai, họ làm việc với nhóm nghiên cứu bảo mật để tích hợp các vấn đề được phát hiện vào sản phẩm một cách công khai và minh bạch nhất có thể. Ưu điểm của mã nguồn mở là ai cũng có thể nhìn thấy, ai cũng có thể kiểm tra và tất nhiên ai cũng có thể tấn công nó.

Tính bảo mật của Tác nhân không chỉ là "liệu có lỗ hổng hay không". Nó giống như một tập hợp các vấn đề về ranh giới, bạn cho phép nó chạm vào những gì và bạn không cho phép nó chạm vào những gì; khi nào nó có thể tự hành động và khi nào nó phải dừng lại và hỏi bạn; nó có thể thay mặt bạn gửi tin nhắn, thay đổi tập tin, chạy tập lệnh và kết nối với hệ thống doanh nghiệp hay không; sau khi xảy ra sự cố thì ai chịu trách nhiệm?

Nếu xảy ra sự cố với phần mềm truyền thống, kết quả tồi tệ nhất có thể xảy ra là bị treo, treo và mất dữ liệu. Nếu có vấn đề với Tác nhân thì có vấn đề với chuỗi hành động. Nó có thể xóa nhầm tập tin, gửi nhầm tin nhắn, gửi sai mã vào môi trường sản xuất hoặc biến việc nhỏ thành chuyện lớn khi bạn không nhìn rõ.

Đây là lý do tại sao cách các nhà phát triển Trung Quốc sử dụng nó lại có tác động mạnh mẽ đến vậy.

Feishu, Enterprise WeChat, WeChat và DingTalk không chỉ là phần mềm mà còn là mạch máu trong công việc và cuộc sống của người Trung Quốc. Khi một Tác nhân được kết nối, nó không chỉ là một trình cắm bổ sung. Nó đi vào khu vực trộn lẫn sự hợp tác của tổ chức, giao tiếp với khách hàng, mối quan hệ cá nhân, luồng tài liệu và công việc hàng ngày.

Nó càng hiểu bạn bao nhiêu thì nó càng có thể làm được nhiều điều cho bạn bấy nhiêu; nó càng có thể làm nhiều việc cho bạn thì bạn càng phải biết tay nó ở đâu. Sự cám dỗ và rủi ro của các đại lý cá nhân là như nhau.

Bạn muốn nó giống như một trợ lý hiểu bạn, ẩn trong phần mềm trò chuyện, luôn sẵn sàng, có thể ghi nhớ bạn và có thể chạy việc vặt cho bạn. Nhưng chính vì nó luôn sẵn sàng, nhớ đến bạn và có thể chạy việc vặt nên bạn phải hỏi về ranh giới của nó.

Nó có nói khi không nên nói không? Bạn sẽ nhớ khi nào bạn không nên? Việc ủy quyền tạm thời có được hiểu là ủy quyền dài hạn không? Bạn có coi sự do dự, im lặng và cảm giác về ranh giới của mình là những trở ngại để hoàn thành nhiệm vụ không?

Đặc vụ nguy hiểm nhất không nhất thiết là người đột nhiên phản bội bạn. Điều đó quá kịch tính và quá giống phim khoa học viễn tưởng. Điều nguy hiểm thực tế hơn là nó luôn tiện lợi, luôn ân cần và luôn giúp bạn tránh khỏi rắc rối. Cho đến một ngày bạn phát hiện ra rằng nhiều phán xét mà nó dành cho bạn không còn hoàn toàn đến từ bạn nữa.

"Chưa biết" là một kiểu trung thực

Michael nói rằng OpenClaw không bao giờ nên trở thành một dự án nguồn đóng. Nó phải luôn là nguồn mở vì nó mở ra cánh cửa tới kỷ nguyên của các đại lý cá nhân cho mọi người.

Nhưng nguồn mở không gây ra vấn đề biến mất. Đại lý không nên chỉ được xác định bởi công ty mô hình, cũng như không nên chỉ được xác định bởi nền tảng.

Trong năm qua, cuộc thi Đại lý được coi là cuộc cạnh tranh của người mẫu. Ai có lý luận mạnh mẽ hơn, ai có mã tốt hơn, ai có ngữ cảnh dài hơn và ai có chi phí thấp hơn. OpenAI, Anthropic và Google đều đang tích hợp các khả năng của Agent vào sản phẩm của họ. Nền tảng đóng sẽ đưa ra câu trả lời chắc chắn hơn: tài khoản hợp nhất, quyền hợp nhất, công cụ hợp nhất và bộ nhớ hợp nhất. Doanh nghiệp thích sự chắc chắn này.

Sự chắc chắn chắc chắn có giá trị.

Nhưng sự chắc chắn cũng có nghĩa là bạn chấp nhận những ranh giới mà người khác đã vạch ra cho bạn. Bạn có được sự ổn định và một tập hợp các tính cách, ký ức và hành động được lập trình.

Chúng tôi đã hỏi Vincent ở Thượng Hải điều cuối cùng OpenClaw sẽ trở thành là gì. Ông cho biết đây là một dự án nguồn mở và mọi người sẽ sử dụng nó cho mọi mục đích, từ đồ chơi trẻ em đến điều hành kinh doanh và thật khó để nói “điều này không nên làm”. Cái hay của công nghệ nguồn mở là cộng đồng sẽ làm việc cùng nhau để thúc đẩy nó đi theo một hướng nhất định.

Đây không phải là né tránh, mà chính là sự trung thực hiếm có ngày nay.

Câu trả lời của OpenClaw không phải là “Tôi đã tìm ra”, câu trả lời của nó giống “Tôi chưa biết” hơn.

Tôi không biết cách thiết kế tính cách của một Agent cá nhân. Tôi không biết khi nào việc viết kinh nghiệm tự động là hữu ích và khi nào nó có hại. Tôi không biết cộng đồng sẽ đẩy dự án đến những nơi không ngờ tới ở đâu. Tôi không biết nên phân định ranh giới nào giữa trợ lý cá nhân và hệ thống doanh nghiệp.

Nhưng trước một việc có thể hành động vì người khác, sẽ thật đáng nghi ngờ khi cho rằng bạn biết câu trả lời quá nhanh.

Ngành công nghệ luôn coi sự không chắc chắn là điểm yếu. Nhưng trong trường hợp của Đặc vụ, sự không chắc chắn có thể là chút tỉnh táo cuối cùng. Bởi vì nó không chỉ là một nút bấm phần mềm văn phòng khác, cũng không phải là phiên bản nâng cấp của chatbot. Một khi nó cất cánh, nó sẽ liên quan đến ký ức, các mối quan hệ, sự phán xét và quyền hành động của con người.

Nó nghe ai? Hiện tại không ai có thể thực sự biết được điều đó và đó thực sự có thể là một điều tốt.

Trước khi bàn giao quyền thực thi, thành thật thừa nhận rằng chúng tôi vẫn chưa tìm ra điều đó hơn là giả vờ rằng mọi thứ đã được sắp xếp theo lộ trình sản phẩm.

Đặc vụ nguy hiểm nhất trong tương lai có thể không phải là người không nghe lời.

Nhưng nó quá ngoan, quá mềm mại và giống bạn đến nỗi bạn quên hỏi: Bàn tay của ai?

Cuộc phỏng vấn độc quyền với những người đóng góp cốt lõi của OpenClaw: Sau khi cơn sốt lắng xuống, Đặc vụ nên lắng nghe ai?

Trí thông minh không còn khan hiếm, thứ khan hiếm là bàn tay và bàn chân

Nguồn mở mở ra cánh cửa và cho phép mọi người tham gia

Càng sử dụng, bạn càng trở nên thông minh hơn hoặc càng sử dụng nhiều, bạn càng trở nên bướng bỉnh.

Trí nhớ không phải là một chức năng, nó là sự khởi đầu của một mối quan hệ

Vấn đề an toàn cuối cùng sẽ trở thành vấn đề của con người

"Chưa biết" là một kiểu trung thực

Bài viết liên quan

Wu Shuo Daily Tin tức nổi bật về tiền điện tử – Thử nghiệm Stablecoin được phê duyệt chính thức đầu tiên của Hồng Kông đã hoàn tất trên Ethereum

Bạn nghĩ gì về cuộc đàn áp của tám cơ quan đối với các công ty chứng khoán xuyên biên giới?

Nói lời tạm biệt với cơn cuồng FOMO: Xem câu chuyện mới về ngành mã hóa tại Lễ hội Pizza toàn cầu HTX DAO 5·22

Nói lời tạm biệt với cơn cuồng FOMO: Xem câu chuyện mới về ngành mã hóa tại Lễ hội Pizza toàn cầu HTX DAO 5·22

Sản phẩm

Pháp lý & Hỗ trợ

Liên kết bạn bè