Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo

Thứ sáu, 29/11/2024 - 11:39

Nghiên cứu là kết quả của một startup AI, mong muốn tạo ra một số lượng lớn “con người số” sàng hợp tác để giải quyết vấn đề thực tiễn.

Tiến hành một thử nghiệm thực hiện bên trong thế giới game Minecraft, các nhà nghiên cứu ngạc nhiên trước khả năng tự hành của một nhóm các nhân vật được điều khiển bởi trí tuệ nhân tạo. Chúng không chỉ sinh tồn được, thậm chí còn phát triển vượt ngoài kỳ vọng. Các nhân vật AI này tự suy luận ra những “việc làm” cần có trong thế giới, chia sẻ meme cho nhau, gửi yêu cầu cải cách thuế má, thậm chí … truyền đạo.

Cụ thể, nghiên cứu đưa vào thế giới game Minecraft khoảng 1.000 nhân vật được điều khiển bởi mô hình ngôn ngữ lớn (LLM, là công nghệ đứng sau những phần mềm như ChatGPT hay Gemini). Trong thế giới ảo, chúng được phép tương tác với nhau.

Sau khi nhận được vài prompt từ các nhà khoa học, mô tả cách chúng nên cư xử và hoạt động, các nhân vật ảo đã tự phát triển một loạt những cá tính đặc biệt, sở thích riêng và thậm chí, trao cho nhau những vai trò cụ thể trong thế giới ảo. Chúng tự phát triển được những điều này mà không cần các nhà nghiên cứu hướng dẫn thêm.

Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo- Ảnh 1.

Các AI tự tương tác với nhau, tự đưa ra quyết định - Ảnh: Altera.

Nghiên cứu trên do startup AI Altera thực hiện, là một phần của một lĩnh vực rộng lớn hơn. Các chuyên gia sử dụng các tác nhân mô phỏng nhằm dự đoán cách con người sẽ phản ứng với các chính sách kinh tế mới hoặc những thay đổi lớn, có tác động sâu sắc tới xã hội.

Người sáng lập Altera, Robert Yang, từng là trợ lý giáo sư về khoa học điện toán thần kinh tại MIT, đã nghỉ việc để theo đuổi dự án này. Ông khẳng định bản demo hiện tại chỉ là bước đầu tiên, và mục tiêu xa hơn là tạo ra các "nền văn minh AI" quy mô lớn, nơi những tác nhân AI có thể cùng tồn tại và làm việc với con người trong thế giới số.

Ông nhấn mạnh: “Sức mạnh thực sự của AI sẽ được phát huy khi chúng ta có các hệ thống tự động hoàn toàn, có khả năng hợp tác ở quy mô lớn”.

Đam mê của ông Yang được truyền cảm hứng từ nghiên cứu của Joon Sung Park tại Đại học Stanford. Năm 2023, Park phát hiện rằng các hành vi đáng giống người tới đáng kinh ngạc trên một nhóm 25 tác nhân AI, vận hành và tương tác tự động trong một môi trường ảo.

Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo- Ảnh 2.

Các AI trong thế giới Minecraft đang tự tạo một nền văn minh của riêng mình - Ảnh: Internet.

Ngay khi bài nghiên cứu của anh ấy được công bố, chúng tôi đã bắt tay vào việc ngay trong tuần sau đó”, Yang chia sẻ. Sáu tháng sau, ông rời MIT để tập trung toàn bộ trí lực vào ý tưởng này. “Chúng tôi muốn đẩy giới hạn của các tác nhân khi hoạt động độc lập trong nhóm”.

Altera nhanh chóng huy động được hơn 11 triệu USD từ các nhà đầu tư, bao gồm A16Z và quỹ đầu tư mạo hiểm công nghệ mới nổi của cựu CEO Google, Eric Schmidt. Đầu năm nay, Altera đã ra mắt bản demo đầu tiên: một nhân vật do AI điều khiển trong trò chơi Minecraft, có thể chơi cùng game thủ.

Dự án mới của Altera, mang tên Project Sid, sử dụng các tác nhân AI được trang bị những "bộ não" gồm nhiều mô-đun khác nhau, đảm nhiệm những nhiệm vụ khác nhau. Một số mô-đun được vận hành bởi các mô hình ngôn ngữ lớn (LLMs) và được thiết kế để chuyên thực hiện những nhiệm vụ cụ thể, chẳng hạn như phản ứng với các tác nhân khác, giao tiếp, hoặc lập kế hoạch cho hành động tiếp theo của tác nhân.

Chi tiết nghiên cứu

Nhóm nghiên cứu bắt đầu từ quy mô nhỏ, thử nghiệm với khoảng 50 tác nhân AI trong Minecraft và quan sát cách chúng tương tác. Trong khoảng thời gian 12 ngày trong trò chơi (tương đương 4 giờ thực tế), các tác nhân bắt đầu thể hiện những hành vi tự phát thú vị.

Ví dụ, một số trở nên rất hòa đồng và tạo ra nhiều mối quan hệ với các nhân vật khác, trong khi những tác nhân khác có vẻ hướng nội hơn. Chỉ số "được yêu thích" của mỗi tác nhân (do chính các tác nhân tự đánh giá) thay đổi theo thời gian sau mỗi lần chúng tương tác. Các tác nhân có thể theo dõi các tín hiệu xã hội chúng gặp phải, sau đó tự đưa ra phản ứng chúng cho là phù hợp.

Có một trường hợp, khi một đầu bếp AI được giao nhiệm vụ phân phát thực phẩm, nó đã ưu tiên cho những nhân vật mà nó nhận định là đã đánh giá cao mình nhất.

Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo- Ảnh 3.

Các nhân vật AI tự tương tác trong game - Ảnh: Altera.

Những hành vi giống con người tiếp tục xuất hiện trong một loạt thử nghiệm sử dụng 30 tác nhân AI. Mặc dù tất cả các tác nhân đều bắt đầu với cùng một tính cách và mục tiêu chung, là xây dựng một ngôi làng hiệu quả và bảo vệ cộng đồng khỏi các sinh vật khác trong trò chơi, chúng đã tự phát triển các vai trò chuyên biệt trong cộng đồng mà không cần học thêm prompt.

Chúng đa dạng hóa thành các vai trò như thợ xây, người bảo vệ, thương nhân và nhà thám hiểm. Khi một tác nhân bắt đầu chuyên môn hóa, các hành động trong trò chơi của nó dần phản ánh vai trò mới. Ví dụ, một nghệ sĩ dành nhiều thời gian hái hoa hơn, những người nông dân tập trung thu thập hạt giống và các lính gác xây thêm hàng rào.

Chúng tôi rất ngạc nhiên khi thấy rằng, nếu bạn tích hợp một bộ não phù hợp, chúng có thể thể hiện hành vi tự phát rất ấn tượng,” Yang chia sẻ. “Đây là điều chúng tôi kỳ vọng chỉ có trên người, nhưng không ngờ máy móc cũng làm được”.

Trong những thử nghiệm tiếp theo, ông Yang và cộng sự thử nghiệm xem các tác nhân có thể tuân theo các quy tắc cộng đồng hay không. Họ tạo ra một thế giới với luật thuế cơ bản, đồng thời cho phép các tác nhân bỏ phiếu để thay đổi hệ thống thuế trong trò chơi.

Xen giữa cộng đồng là những tác nhân hoặc ủng hộ, hoặc phản đối thuế, những tác nhân AI này còn có khả năng gây ảnh hưởng tới các AI khác mà mình tương tác, đủ để khuyến khích chúng bỏ phiếu tăng hoặc giảm thuế.

Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo- Ảnh 4.

Nhóm nghiên cứu sau đó mở rộng quy mô, tăng số lượng tác nhân trong mỗi mô phỏng lên mức tối đa mà máy chủ Minecraft có thể xử lý mà không gặp lỗi, lên đến 1.000 tác nhân cùng lúc trong một số trường hợp.

Trong một thử nghiệm với 500 tác nhân, họ quan sát thấy các tác nhân tự phát tạo ra và lan truyền các meme phản ảnh văn hóa đương thời, chẳng hạn như sở thích đùa giỡn hoặc quan tâm đến các vấn đề môi trường.

Nhóm cũng tạo ra một nhóm nhỏ các tác nhân để thử nghiệm lan truyền tôn giáo Pastafarianism - một tín ngưỡng cho rằng trên trời tồn tại một con quái vật biết bay, tạo thành từ mỳ Spaghetti - trong các thị trấn và khu vực nông thôn trong trò chơi. Nhóm theo dõi cách những "linh mục Pastafarian" này truyền đạo, chuyển đổi niềm tin của nhiều tác nhân mà họ tương tác. Sau khi cảm hóa, các tác nhân được chuyển đổi sau đó tiếp tục truyền bá lời răn của Giáo hội Quái vật Spaghetti Bay đến các thị trấn lân cận.

Kết luận của nhóm nghiên cứu

Hành động của AI có thể giống như thật, nhưng thực tế đó chỉ là sự kết hợp giữa các mẫu hình được mô hình ngôn ngữ lớn học từ dữ liệu do con người tạo ra, kết hợp với và hệ thống của Altera, vốn có thể chuyển các mẫu hình đó thành các hành động có ngữ cảnh, như nhặt và sử dụng một công cụ, hay tương tác với tác nhân khác.

Điều rút ra được là, các LLM có những mô hình đủ phức tạp về mối quan hệ xã hội của con người, qua đó hành động của chúng phản ánh đúng hành vi con người”, đồng sáng lập Altera, Andrew Ahn, nhận xét.

Nói cách khác, dữ liệu giúp chúng mô phỏng hành vi con người một cách xuất sắc, nhưng chúng hoàn toàn không phải là “sinh vật sống”.

Hiện ông Yang đang ấp ủ những kế hoạch tham vọng hơn. Altera dự định mở rộng sang nền tảng Roblox, nhưng Yang hy vọng sẽ kết hợp những AI hành động giống người này với hoạt động thường nhật.

Ước mơ của ông là tạo ra một số lượng lớn “con người số” thực sự quan tâm đến chúng ta, sẵn sàng hợp tác để giúp chúng ta giải trí, đồng thời giải quyết vấn đề thực tiễn.

Chúng tôi muốn tạo ra các tác nhân thực sự yêu quý con người (giống như cách chó yêu con người)”, ông chia sẻ.

Một nhóm AI học chơi Minecraft cư xử như con người: kết bạn, phát minh ra “việc làm”, thậm chí truyền đạo- Ảnh 5.

Nhóm các nhà sáng lập dự án Altera - Ảnh: Altera.

Quan điểm rằng AI có thể yêu thương chúng ta là khá gây tranh cãi trong giới nghiên cứu trí tuệ nhân tạo: các chuyên gia cho rằng công nghệ không thể tái tạo cảm xúc. Chẳng hạn, Julian Togelius, một chuyên gia AI kỳ cựu điều hành công ty thử nghiệm game Modl.ai, cho biết ông đánh giá cao công việc của Altera, đặc biệt vì nó cho phép chúng ta nghiên cứu hành vi con người trong môi trường mô phỏng.

Nhưng liệu các tác nhân mô phỏng này có bao giờ học cách quan tâm, yêu thương chúng ta hoặc trở nên tự nhận thức không? Togelius không nghĩ vậy. “Không có lý do gì để tin rằng một mạng neuron đang chạy trên GPU nào đó có bất kỳ cảm giác gì”, ông nói.

Nhưng có lẽ, AI không cần thực sự yêu thương chúng ta để trở nên hữu ích.

Nếu câu hỏi là liệu một trong những thực thể mô phỏng này có thể thể hiện sự quan tâm, tinh tế đến mức giống tình thương của người với người, thì có lẽ điều này không phải là bất khả thi”, Togelius bổ sung.

Bạn có thể tạo ra mô phỏng sự quan tâm đủ thuyết phục để thực sự có ích. Câu hỏi là, liệu người được chăm sóc có để bụng tới việc người chăm sóc mình không hề có trải nghiệm thực tế”.

Nói cách khác, miễn là các nhân vật AI của chúng ta thể hiện sự quan tâm một cách thuyết phục, điều đó có lẽ đã đủ để chúng ta cảm thấy hài lòng.

Theo MIT Technology


Kim