Auto-GPT là gì và bây giờ có nên lo lắng về trí tuệ nhân tạo hay không?

hình3.jpg

Auto-GPT là một công nghệ cách mạng mở ra khả năng mới cho ChatGPT, cho phép nó hoàn thành các nhiệm vụ một mình, tạo ra các lời gợi ý của chính nó để hoàn thành công việc.

Thông tin xung quanh Auto-GPT gần đây đã vượt qua cả ChatGPT, trở thành số một trên Twitter trong vài ngày liên tiếp.

Auto-GPT là gì?

Auto-GPT là một giao diện mã nguồn mở thử nghiệm cho GPT-4 và GPT-3.5, cho phép hoàn thành nhiệm vụ tự hướng (tự động).

Một chỉ cần cung cấp một danh sách các nhiệm vụ cần hoàn thành và Auto-GPT sẽ hoàn thành chúng.

Khác với ChatGPT, Auto-GPT tạo ra các câu gợi ý tự động để hoàn thành các mục tiêu đã cho.

Nếu cần thiết, Auto-GPT sẽ truy cập vào các trang web và công cụ tìm kiếm để thu thập dữ liệu để hoàn thành nhiệm vụ.

Điều làm cho khả năng thu thập dữ liệu từ bên ngoài của Auto-GPT trở nên đặc biệt là nó tự đánh giá được và xác minh tính chính xác của dữ liệu đã thu thập và loại bỏ những dữ liệu không chính xác hoặc chất lượng kém và tạo ra một nhiệm vụ phụ mới để thu thập dữ liệu tốt hơn.

Khả năng tự tạo ra các yêu cầu hoàn thành nhiệm vụ là lý do tại sao nó được gọi là một tác nhân trí tuệ nhân tạo tự động.

Trang chính thức của Auto-GPT trên GitHub mô tả nó như sau:

“Auto-GPT là một ứng dụng mã nguồn mở thử nghiệm, cho thấy khả năng của mô hình ngôn ngữ GPT-4.

Chương trình này, được điều khiển bởi GPT-4, kết hợp các "suy nghĩ" của LLM với nhau để đạt được mục tiêu mà bạn đặt.

Là một trong những ví dụ đầu tiên về GPT-4 hoạt động hoàn toàn tự động, Auto-GPT đẩy mạnh ranh giới của những gì có thể đạt được với trí tuệ nhân tạo.”

Để sử dụng Auto-GPT, bạn cần tạo tài khoản trả phí tại OpenAI.

Sau khi tạo tài khoản trả phí, bước tiếp theo là thu được một OpenAI API sẽ kết nối Auto-GPT với tài khoản truy cập OpenAI của bạn và tính tiền cho mọi tổng số lượng sử dụng của bạn.

API là viết tắt của Interface Lập Trình Ứng Dụng.

Đó là một công nghệ giúp phần mềm truyền thông an toàn với phần mềm khác.

API cho phép Auto-GPT truyền thông với GPT-4 và ChatGPT của OpenAI.

OpenAI diễn giải cách API của họ hoạt động:

"API của OpenAI có thể được áp dụng vào gần như bất kỳ nhiệm vụ nào liên quan đến hiểu hoặc tạo ra ngôn ngữ tự nhiên, mã hoặc hình ảnh."

Chúng tôi cung cấp một loạt các mẫu máy với các mức độ công suất khác nhau phù hợp cho các nhiệm vụ khác nhau, cũng như khả năng điều chỉnh tinh chỉnh mô hình tùy chỉnh của bạn.

Các mô hình này có thể được sử dụng cho mọi thứ, từ tạo nội dung đến tìm kiếm ngữ nghĩa và phân loại.

...API này được trang bị bởi một bộ các mô hình với khả năng và điểm giá khác nhau.

GPT-4 là mô hình mới nhất và mạnh mẽ nhất của chúng tôi.

GPT-3.5-Turbo là mô hình động lực của ChatGPT và được tối ưu hóa cho định dạng hội thoại."

Người dùng tài khoản OpenAI có thể thiết lập giới hạn cứng về số tiền OpenAI sẽ tính phí, và khi đạt đến giới hạn này, dịch vụ sẽ ngừng hoạt động.

Người dùng cũng có thể đặt một giới hạn mềm, sẽ gửi một email thông báo để báo cho người dùng tài khoản khi đạt đến một giới hạn đã đặt.

Giá cả được tính dựa trên một đơn vị đo lường gọi là token.

Một token có thể được coi như một đơn vị đo lường của từ.

OpenAI định nghĩa các token như sau:

"Đối với văn bản tiếng Anh, 1 token khoảng 4 ký tự hoặc 0.75 từ."

Số từ (tokens) được gửi qua API dưới dạng câu hỏi và số tokens (từ) chứa trong kết quả được sử dụng để tính toán chi phí sử dụng.

Một trăm mã thông báo có giá một đồng chưa đầy, $0.002

Ví dụ về những gì Auto-GPT có thể làm

Một người tên là Jon Miller (@botzero_net) đã chia sẻ trên Twitter một ví dụ thông minh về những gì Auto-GPT có thể làm được.

Anh ấy đã đăng tweet:

“Mục tiêu trí tuệ nhân tạo: Viết một yêu cầu nghệ thuật sáng tạo giữa hành trình để tạo ra một kiệt tác truyền cảm hứng sợ hãi trong con người.”

Một ví dụ khác về Auto-GPT được chia sẻ trên Twitter là việc tạo nên một bài viết đánh giá.

@SullyOmarr đã tweet những gì đã xảy ra tiếp theo:

"Trước tiên: Nó trực tiếp đến Google để tìm top 5 đánh giá giày chống nước."

Khi nó tìm được các liên kết, nó sẽ tự đặt ra các câu hỏi như

  • "Ưu điểm và nhược điểm của mỗi đôi giày?"
  • "Ưu điểm và nhược điểm của mỗi đôi giày chống nước trong top 5?"
  • "Top 5 đôi giày chống nước cho nam?"

Sau đó, anh ta ghi lại phân tích tiếp theo:

“Nó tiếp tục phân tích các trang web khác nhau, kết hợp với việc tìm kiếm trên Google, cập nhật các truy vấn của mình, cho đến khi nó hài lòng với kết quả.”

Đây là một ví dụ khi nó nghĩ "một cách phê phán".

Nó biết rằng một số đánh giá có thể bị thiên vị hoặc là giả mạo, vì vậy nó phải xác minh người đánh giá.”

Điều phiên bản Auto-GPT đã tạo ra các tác nhân con được giao nhiệm vụ phân tích các trang web được sử dụng cho nghiên cứu và khi tác nhân trí tuệ nhân tạo gặp vấn đề, nó đã tìm ra cách tiến lên không cần giúp đỡ từ bên ngoài.

Cuối cùng nó đã hoàn thành nhiệm vụ, tạo ra một bài phân tích nhiều đoạn văn về năm đôi giày, liệt kê những ưu điểm và nhược điểm của mỗi đôi giày, cùng một phần giới thiệu và kết luận.

Ngạc nhiên thay, toàn bộ quá trình nghiên cứu, phân tích và tạo ra chỉ mất tới tám phút và mười xu GPT-4 để hoàn thành.

Làm thế nào để Auto-GPT hoạt động?

Nếu trí tuệ nhân tạo (AI) thấy mình không thể hoàn thành nhiệm vụ, nó sẽ tạo ra những lời gợi ý mới để tìm cách tiếp tục.

Auto-GPT là một hệ thống trí tuệ nhân tạo tự động kích thích mình mà không cần các lời kích thích sáng tạo và chi tiết. Tất cả những gì nó cần là một tập hợp các mục tiêu để hoàn thành một nhiệm vụ.

Nó sẽ tạo các lời nhắc cần thiết để hoàn thành nhiệm vụ.

Chất lượng của Auto-GPT có thể nói là làm cho GPT-4 và ChatGPT mạnh mẽ hơn, đáng kinh ngạc đến mức không thể tin được.

Một trong những bí quyết của cách làm việc của Auto-GPT là khả năng tạo các công việc con cho mỗi mục tiêu, chia nhỏ từng nhiệm vụ thành nhiều bước.

Quản lý bộ nhớ cung cấp cho Auto-GPT khả năng lưu trữ dữ liệu quan trọng trong ngắn hạn và dài hạn để tránh việc lặp lại các bước, có thể lưu trữ dữ liệu để xử lý và duy trì một danh sách liên tục về những gì nó đang làm.

Trang GitHub của Auto-GPT liệt kê những tính năng quan trọng sau đây làm cho Auto-GPT hoạt động:

  • "Truy cập internet để tìm kiếm và thu thập thông tin"
  • "Truy cập vào các trang web và nền tảng phổ biến"
  • "Quản lý bộ nhớ dài hạn và ngắn hạn"
  • "Lưu trữ và tóm tắt file với GPT-3.5"
  • "GPT-4 để tạo ra văn bản"

Bạn cần cái gì để Auto-GPT hoạt động?

Auto-GPT không có giao diện người dùng đơn giản như nhiều phần mềm dành cho người dùng cuối khác.

Nhưng đừng để điều đó làm bạn nản lòng vì có một cách để mọi người sử dụng nó.

Có hai yêu cầu để sử dụng Auto-GPT:

  • Một môi trường để chạy chương trình
  • Một khóa API OpenAI

Trang GitHub của Auto-GPT liệt kê ba môi trường để lựa chọn:

  • VSCode + devcontainer: Đã được cấu hình trong thư mục .devcontainer và có thể sử dụng trực tiếp
  • Docker
  • Python 3.10 hoặc mới hơn

Trang GitHub cũng liên kết đến một hướng dẫn cài đặt Python trên Windows.

Các đối tác Ai tự động khác

Auto-GPT không phải là một đại diện trí tuệ nhân tạo tự động duy nhất, có một đại diện khác gọi là BabyAGI là một đoạn mã python.

BabyAGI

Trang GitHub mô tả như sau:

“Kịch bản Python này là một ví dụ về hệ thống quản lý công việc được cung cấp sức mạnh bởi trí tuệ nhân tạo (AI). Hệ thống sử dụng các API của OpenAI và Pinecone để tạo, ưu tiên và thực hiện các công việc. Ý tưởng chính của hệ thống này là nó tạo ra các công việc dựa trên kết quả của các công việc trước đó và mục tiêu đã được định trước.

Kịch bản sau đó sử dụng khả năng xử lý ngôn ngữ tự nhiên (NLP) của OpenAI để tạo ra các nhiệm vụ mới dựa trên mục tiêu, và Pinecone để lưu trữ và truy xuất kết quả nhiệm vụ cho ngữ cảnh.

Đây là phiên bản tối giản của Task-Driven Autonomous Agent gốc (28 tháng 3 năm 2023).

Nếu tất cả những điều trên nghe có vẻ phức tạp, vẫn còn một cách cho những người không làm việc trong lĩnh vực phát triển để sử dụng các AI Agents như Auto-GPT và BabyAGI.

Cách dễ dàng để chạy một AI-Agent

Tốc độ đổi mới AI vô cùng nhanh chóng và chỉ trong vòng hai tuần, các nhà phát triển đã tạo ra các cách thay thế để chạy Auto-GPT với giao diện dễ sử dụng cho người dùng.

Các giao diện này quá mới mẻ đến nỗi hiện đang ở chế độ thử nghiệm hoặc beta, nhưng chúng hoạt động rất tốt.

Cognosys.ai

Một giao diện người dùng AI trên nền web mới hoàn toàn là Cognosys.ai. Bạn vẫn cần có một khóa API OpenAI để sử dụng giao diện web Cognosys.ai.

Khi bạn đã có key API của OpenAI, bước tiếp theo là đăng nhập bằng ID Google của bạn hoặc tạo một tài khoản và mật khẩu.

Bây giờ việc sử dụng một AI agent trở nên đơn giản như việc điền một biểu mẫu và quan sát máy tính hoàn thành nhiệm vụ.

hình ảnh4.jpg

Agent.gpt

Một giao diện dễ sử dụng khác được gọi là AgentGPT, đang trong giai đoạn beta. AgentGPT hoạt động tương tự như Cognosys.ai.

AgentGPT miêu tả chính mình như sau:

“AgentGPT cho phép bạn cấu hình và triển khai các đại lý AI tự động.

Đặt tên cho AI tùy chỉnh của bạn và cho nó thực hiện bất kỳ mục tiêu nào có thể tưởng tượng. Nó sẽ cố gắng đạt được mục tiêu bằng cách nghĩ ra các nhiệm vụ để thực hiện, thực hiện chúng và học từ kết quả 🚀

Nền tảng này hiện đang trong phiên bản beta, chúng tôi đang làm việc trên:

  • Bộ nhớ dài hạn
  • Duyệt web
  • Tương tác với các trang web và người dùng”

Một tweet từ những người tạo ra AgentGPT giải thích thêm chi tiết hơn:

“Nó hoạt động bằng cách sử dụng mô hình để tạo ra một danh sách nhiệm vụ và sau đó thực hiện các nhiệm vụ theo cách lặp để đánh giá xem các nhiệm vụ đã hoàn thành hay cần các hành động phụ phần tiếp theo.”

“Trong tương lai, chúng tôi sẽ có bộ nhớ lâu dài thông qua @pinecone và cung cấp cho các mô hình khả năng truy vấn web…”

hình2.png

Godmode AI

Một trong số các giao diện AI đáng chú ý nhất hiện nay được gọi là Godmode.

Để sử dụng nó, trước tiên ta cần tạo một tác vụ. Giao diện sẽ phản hồi bằng các lời nhắc để sử dụng để xác định tác vụ đó.

Chọn một trong các gợi ý sẽ kích hoạt đại lý AI bắt đầu công việc của nó.

Godmode yêu cầu đăng nhập bằng tài khoản Google, GitHub hoặc Twitter.

Việc sử dụng Godmode vào thời điểm này không yêu cầu mã API của OpenAI để hoạt động, tuy nhiên, việc sử dụng mã API sẽ gia tăng sức mạnh của GPT-4 vào kết quả đầu ra của Godmode.

hình ảnh1.jpg

Các Đại lý AI Tự động

Một số người đã lo lắng về ChatGPT.

Nhưng các đại lý AI tự hành như Auto-GPT cho thấy rằng có nhiều điều OpenAI có thể làm hơn.

Đột phá của các đại lý tự động AI là hoàn toàn mới và đang ở đầu ngành công nghệ. Chúng được sản xuất bởi các nhà phát triển độc lập thay vì các công ty lớn như OpenAI và Google.

Các công nghệ này vẫn đang ở giai đoạn thử nghiệm và beta nhưng một số trong số chúng đã đủ trưởng thành để thực hiện những tác vụ đáng kinh ngạc như một con người thông thường mong đợi.

Công nghệ như Auto-GPT làm cho việc tưởng tượng một thời điểm mà nhà tuyển dụng có thể thuê một người để giao nhiệm vụ cho các đại lý trí tuệ nhân tạo làm công việc của năm nhân viên trở nên dễ dàng.

Không khó để tưởng tượng một thời điểm khi nhà tuyển dụng có thể loại bỏ người giám sát và chỉ cần phóng thích một đại diện trí tuệ nhân tạo để quản lý các đại diện trí tuệ nhân tạo.

Bài viết liên quan

Xem thêm >>

Khai phá sức mạnh của AI với HIX.AI!