ChatGPT hoạt động như thế nào?

moi-xanh.jpg

ChatGPT là một trong những công cụ mới được hỗ trợ bởi AI, nhưng các thuật toán hoạt động trong nền đã thực sự cung cấp năng lượng cho toàn bộ các ứng dụng và dịch vụ kể từ năm 2020. Vì vậy, để hiểu cách ChatGPT hoạt động, chúng ta cần bắt đầu bằng cách nói về ngôn ngữ cơ bản động cơ cung cấp năng lượng cho nó.

GPT trong ChatGPT chủ yếu là GPT-3 hoặc Generative Pre-training Transformer 3, mặc dù GPT-4 hiện khả dụng cho những người đăng ký ChatGPT Plus—và có thể sẽ sớm trở nên phổ biến hơn. Các mô hình GPT được phát triển bởi OpenAI (công ty đứng sau ChatGPT và trình tạo hình ảnh DALL·E 2), nhưng chúng hỗ trợ mọi thứ từ các tính năng AI của Bing đến các công cụ viết như Jasper và Copy.ai. Trên thực tế, hầu hết các trình tạo văn bản AI hiện có đều sử dụng GPT-3 và có khả năng sẽ cung cấp GPT-4 như một bước tiếp theo.

ChatGPT đã đưa GPT-3 trở nên nổi tiếng vì nó làm cho quá trình tương tác với trình tạo văn bản AI trở nên đơn giản và—quan trọng nhất—miễn phí cho tất cả mọi người. Ngoài ra, đó là một chatbot và mọi người đã yêu thích một chatbot tốt kể từ SmarterChild.

Mặc dù GPT-3 và GPT-4 là các Mô hình ngôn ngữ lớn (LLM) phổ biến nhất hiện nay, nhưng trong vài năm tới, có thể sẽ có nhiều sự cạnh tranh hơn. Ví dụ, Google có Bard —chatbot AI của nó—được cung cấp bởi công cụ ngôn ngữ riêng Mô hình ngôn ngữ con đường (PaLM 2). Nhưng hiện tại, sản phẩm của OpenAI là tiêu chuẩn thực tế của ngành. Nó chỉ là công cụ dễ dàng nhất để mọi người sử dụng.

Vì vậy, câu trả lời cho "ChatGPT hoạt động như thế nào?" về cơ bản là: GPT-3 và GPT-4. Nhưng hãy tìm hiểu sâu hơn một chút.

ChatGPT là gì?

ChatGPT là một ứng dụng được xây dựng bởi OpenAI. Bằng cách sử dụng các mô hình ngôn ngữ GPT, nó có thể trả lời câu hỏi của bạn, viết bản sao, soạn thảo email, tổ chức hội thoại, giải thích mã bằng các ngôn ngữ lập trình khác nhau, dịch ngôn ngữ tự nhiên sang mã và hơn thế nữa—hoặc ít nhất là cố gắng—tất cả đều dựa trên ngôn ngữ tự nhiên nhắc bạn cho nó ăn. Đó là một chatbot, nhưng là một chatbot thực sự rất tốt.

2.png

Mặc dù thật thú vị khi chơi xung quanh nếu bạn muốn viết một bài sonnet của Shakespearean về thú cưng của mình hoặc lấy một vài ý tưởng cho dòng tiêu đề cho một số email tiếp thị, nhưng điều đó cũng tốt cho OpenAI. Đó là một cách để có được nhiều dữ liệu từ người dùng thực và phục vụ như một bản trình diễn thú vị về sức mạnh của GPT, điều này có thể khiến bạn cảm thấy hơi mơ hồ trừ khi bạn tìm hiểu sâu về máy học.

Hiện tại, ChatGPT cung cấp hai mô hình GPT. Mặc định, GPT-3.5, kém hiệu quả hơn nhưng được cung cấp miễn phí cho mọi người. GPT-4 cao cấp hơn chỉ giới hạn cho những người đăng ký ChatGPT Plus và thậm chí họ chỉ nhận được một số câu hỏi giới hạn mỗi ngày.

Một trong những tính năng quan trọng của ChatGPT là nó có thể ghi nhớ cuộc trò chuyện mà bạn đang thực hiện với nó. Điều này có nghĩa là nó có thể thu thập ngữ cảnh từ bất cứ điều gì bạn đã hỏi nó trước đó và sau đó sử dụng điều đó để thông báo cuộc trò chuyện của nó với bạn. Bạn cũng có thể yêu cầu làm lại và chỉnh sửa, và nó sẽ đề cập lại bất cứ điều gì bạn đã thảo luận trước đó. Nó làm cho việc tương tác với AI giống như một sự qua lại thực sự.

Nếu bạn muốn thực sự cảm nhận về nó, hãy dành năm phút chơi với ChatGPT ngay bây giờ (miễn phí!), sau đó quay lại để đọc về cách thức hoạt động của nó.

ChatGPT hoạt động như thế nào?

Tập dữ liệu khổng lồ này được sử dụng để tạo thành một mạng lưới thần kinh học sâu [ ... ] được mô phỏng theo bộ não con người—cho phép ChatGPT tìm hiểu các mẫu và mối quan hệ trong dữ liệu văn bản [ ... ] để dự đoán văn bản nào sẽ xuất hiện tiếp theo trong bất kỳ câu cụ thể nào .

ChatGPT hoạt động bằng cách cố gắng hiểu lời nhắc của bạn và sau đó đưa ra các chuỗi từ mà nó dự đoán sẽ trả lời đúng nhất cho câu hỏi của bạn, dựa trên dữ liệu mà nó đã được huấn luyện.

Hãy thực sự nói về đào tạo đó. Đó là một quá trình mà AI non trẻ được đưa ra một số quy tắc cơ bản, sau đó nó được đặt trong các tình huống hoặc được cung cấp vô số dữ liệu để xử lý nhằm phát triển các thuật toán của riêng mình.

GPT-3 đã được đào tạo trên khoảng 500 tỷ "mã thông báo", cho phép các mô hình ngôn ngữ của nó gán nghĩa dễ dàng hơn và dự đoán văn bản tiếp theo hợp lý. Nhiều từ ánh xạ tới các mã thông báo đơn lẻ, mặc dù các từ dài hơn hoặc phức tạp hơn thường được chia thành nhiều mã thông báo. Trung bình, mã thông báo dài khoảng bốn ký tự. OpenAI đã giữ im lặng về hoạt động bên trong của GPT-4, nhưng chúng ta có thể yên tâm cho rằng nó đã được đào tạo trên cùng một tập dữ liệu vì nó thậm chí còn mạnh hơn.

image3.png
image4.png

Tất cả các mã thông báo đến từ một kho dữ liệu khổng lồ được viết bởi con người. Điều đó bao gồm sách, bài báo và các tài liệu khác về tất cả các chủ đề, phong cách và thể loại khác nhau — và một lượng nội dung không thể tin được được lấy từ internet mở. Về cơ bản, nó được phép tìm hiểu tổng số kiến thức của con người.

Bộ dữ liệu khổng lồ này đã được sử dụng để tạo thành một mạng lưới thần kinh học sâu—một thuật toán phức tạp, nhiều lớp, có trọng số được mô phỏng theo bộ não con người—cho phép ChatGPT tìm hiểu các mẫu và mối quan hệ trong dữ liệu văn bản và khai thác khả năng tạo ra các dữ liệu giống con người. phản hồi bằng cách dự đoán văn bản nào sẽ xuất hiện tiếp theo trong bất kỳ câu nào.

Mặc dù thực sự, điều đó ồ ạt bán rẻ mọi thứ. ChatGPT không hoạt động ở cấp độ câu—thay vào đó, nó tạo ra văn bản về những từ, câu và thậm chí cả đoạn văn hoặc khổ thơ có thể theo sau. Nó không phải là văn bản tiên đoán trên điện thoại của bạn thẳng thừng đoán từ tiếp theo; nó đang cố gắng tạo ra các phản hồi hoàn toàn mạch lạc cho bất kỳ lời nhắc nào.

Để tinh chỉnh thêm khả năng phản hồi nhiều lời nhắc khác nhau của ChatGPT, ChatGPT đã được tối ưu hóa cho đối thoại bằng một kỹ thuật gọi là học tăng cường với phản hồi của con người (RLHF). Về cơ bản, con người đã tạo ra một mô hình phần thưởng với dữ liệu so sánh (trong đó hai hoặc nhiều câu trả lời của mô hình được xếp hạng bởi các huấn luyện viên AI), để AI có thể biết đâu là câu trả lời tốt nhất.

5.png

Quay lại mạng lưới thần kinh mà nó hình thành. Dựa trên tất cả quá trình đào tạo đó, mạng nơ-ron của GPT-3 có 175 tỷ thông số hoặc biến cho phép nó nhận đầu vào—lời nhắc của bạn—và sau đó, dựa trên các giá trị và trọng số mà nó cung cấp cho các thông số khác nhau (và một lượng nhỏ tính ngẫu nhiên ), xuất ra bất cứ thứ gì nó cho là phù hợp nhất với yêu cầu của bạn. OpenAI chưa cho biết GPT-4 có bao nhiêu thông số, nhưng có thể đoán chắc chắn rằng nó hơn 175 tỷ và ít hơn con số 100 nghìn tỷ thông số từng được đồn đại. Bất kể con số chính xác là bao nhiêu, nhiều tham số hơn không có nghĩa là tốt hơn. Một số sức mạnh gia tăng của GPT-4 có thể đến từ việc có nhiều thông số hơn GPT-3, nhưng phần lớn có lẽ là do những cải tiến trong cách nó được huấn luyện.

Cuối cùng, cách đơn giản nhất để tưởng tượng nó giống như một trong những trò chơi "hoàn thành câu" mà bạn chơi khi còn nhỏ.

Cuối cùng, cách đơn giản nhất để tưởng tượng nó giống như một trong những trò chơi "hoàn thành câu" mà bạn chơi khi còn nhỏ. Ví dụ: khi tôi đưa cho ChatGPT bằng GPT-3 lời nhắc, "Zapier là…", nó trả lời:

"Zapier là một công cụ tự động hóa dựa trên web cho phép người dùng kết nối các ứng dụng web khác nhau với nhau để tự động hóa các tác vụ lặp đi lặp lại và cải thiện quy trình làm việc."

Đó là loại câu mà bạn có thể tìm thấy trong hàng trăm bài viết mô tả những gì Zapier làm, vì vậy nó là loại câu mà nó nói ra ở đây cũng hợp lý. Nhưng khi biên tập viên của tôi đưa ra lời nhắc tương tự, nó nói:

"Zapier là một công cụ tự động hóa dựa trên web cho phép người dùng kết nối các ứng dụng web khác nhau và tự động hóa quy trình làm việc giữa chúng."

Điều đó khá giống nhau, nhưng nó không hoàn toàn giống với phản hồi. Tính ngẫu nhiên đó (mà bạn có thể kiểm soát trong một số ứng dụng GPT-3 với cài đặt có tên là "nhiệt độ") đảm bảo rằng ChatGPT không chỉ phản hồi từng phản hồi đơn lẻ với số tiền tương đương với câu trả lời có sẵn. Mỗi lần, nó chạy từng lời nhắc thông qua toàn bộ mạng lưới thần kinh và tung một vài viên xúc xắc ở đây và ở đó để giữ cho mọi thứ luôn mới mẻ. Không có khả năng bắt đầu khẳng định rằng Zapier là màu của sao Hỏa, nhưng nó sẽ trộn lẫn các từ sau đây dựa trên khả năng tương đối của chúng.

(Đối với giá trị của nó, khi chạy trên GPT-4, ChatGPT cho biết: " Zapier là một công cụ tự động hóa dựa trên web cho phép người dùng tích hợp và tự động hóa các tác vụ giữa các ứng dụng và dịch vụ trực tuyến khác nhau." Tương tự như vậy!)

Nói ra lời nói, không phải kiến thức

Các nhà sản xuất ChatGPT là những người đầu tiên nói rằng nó có thể tạo ra thông tin không chính xác (và có thể gây hại), mặc dù họ đang nỗ lực khắc phục.

Đây là một ví dụ thuần hóa. Khi tôi yêu cầu ChatGPT sử dụng GPT-3 và GPT-4 trả lời "Harry Guinness là...", GPT-3 trả lời đầu tiên bằng cách hỏi Harry Guinness nào. Câu hỏi hay—thực sự có hai chúng ta! Vì vậy, tôi đã nói, "Harry Guinness nhà văn" (đó là tôi). GPT-4 đoán ngay tôi là ai, mặc dù cả hai câu trả lời đều rất hấp dẫn:

GPT-3: Harry Guinness là một nhà văn và nhà báo tự do có trụ sở tại Ireland. Anh ấy đã viết cho nhiều ấn phẩm khác nhau, bao gồm The New York Times, The Guardian, The Huffington Post và Popular Mechanics. Anh ấy bao gồm các chủ đề từ công nghệ và nhiếp ảnh đến du lịch và văn hóa.

GPT-4: Harry Guinness là một nhà văn, nhiếp ảnh gia và chuyên gia công nghệ người Ireland. Anh ấy đã viết cho nhiều ấn phẩm khác nhau, bao gồm How-To Geek, Lifehacker và Tuts+. Công việc của anh ấy chủ yếu tập trung vào công nghệ, hướng dẫn và thủ thuật, cũng như nhiếp ảnh và chỉnh sửa hình ảnh. Guinness đã tạo dựng được danh tiếng nhờ việc tạo ra các hướng dẫn chi tiết giúp người đọc hiểu các chủ đề phức tạp hoặc giải quyết các vấn đề một cách đơn giản.

Các dòng đầu tiên và cuối cùng của GPT-3 được lấy gần như nguyên văn từ các trang web khác nhau của tôi và tiểu sử tác giả trên web (mặc dù tôi thường tự liệt kê mình là một nhà văn và nhiếp ảnh gia tự do, không phải nhà báo). Nhưng danh sách các ấn phẩm về cơ bản được tạo thành. Tôi đã viết cho The New York Times , nhưng không phải cho The Guardian , The Huffington Post , hay Popular Mechanics (tôi viết thường xuyên cho Popular Science , vì vậy đó có thể là nguồn gốc của nó).

GPT-4 làm đúng phần nhiếp ảnh gia và thực sự liệt kê một số ấn phẩm mà tôi đã viết cho, điều này thật ấn tượng, mặc dù chúng không phải là ấn phẩm mà tôi tự hào nhất. Đó là một ví dụ tuyệt vời về cách OpenAI có thể tăng độ chính xác của GPT-4 so với GPT-3, mặc dù không phải lúc nào nó cũng đưa ra câu trả lời chính xác nhất .

Nhưng hãy quay lại GPT-3 vì lỗi của nó cung cấp một ví dụ thú vị về những gì đang diễn ra đằng sau hậu trường trong ChatGPT. Nó không thực sự biết bất cứ điều gì về tôi. Nó thậm chí không phải sao chép/dán từ internet và tin tưởng vào nguồn thông tin. Thay vào đó, nó chỉ đơn giản là dự đoán một chuỗi từ sẽ xuất hiện tiếp theo dựa trên hàng tỷ điểm dữ liệu mà nó có.

Ví dụ: The New York Times thường được nhóm với The GuardianThe Huffington Post hơn là với những nơi tôi đã viết bài, như Wired , Outside , The Irish Times , và dĩ nhiên, Zapier. Vì vậy, khi nó phải tìm ra những gì nên tiếp theo từ The New York Times , nó không rút ra từ thông tin đã xuất bản về tôi; nó lấy danh sách các ấn phẩm lớn từ tất cả dữ liệu đào tạo mà nó có. Nó rất thông minh và có vẻ hợp lý, nhưng nó không đúng.

GPT-4 thực hiện công việc tốt hơn nhiều và đóng đinh các ấn phẩm, nhưng phần còn lại của những gì nó nói thực sự giống như những câu tiếp theo hợp lý. Tôi không nghĩ rằng nó đánh giá cao danh tiếng của tôi: nó chỉ nói những điều mà tiểu sử nói. GPT-3 che giấu cách thức hoạt động của nó tốt hơn nhiều, mặc dù nó thực sự sử dụng cùng một kỹ thuật.

Tuy nhiên, thật ấn tượng về mức độ cải thiện của GPT. Hiện tại, GPT-4 bị khóa đối với đăng ký cao cấp, vì vậy, hầu hết nội dung ChatGPT mà bạn thấy sẽ dựa trên GPT-3, nhưng điều đó có thể thay đổi trong thời gian tới. Ai biết được GPT-5 sẽ mang lại điều gì.

API ChatGPT là gì?

OpenAI không có thái độ công bằng với công nghệ của mình. Công ty có một nền tảng API cho phép các nhà phát triển tích hợp sức mạnh của ChatGPT vào các ứng dụng và dịch vụ của riêng họ (tất nhiên là có tính phí).

Zapier sử dụng API ChatGPT để hỗ trợ tích hợp ChatGPT của riêng mình, cho phép bạn kết nối ChatGPT với hàng nghìn ứng dụng khác và thêm AI vào quy trình công việc quan trọng của doanh nghiệp. Dưới đây là một số ví dụ để giúp bạn bắt đầu, nhưng về cơ bản, bạn có thể kích hoạt ChatGPT từ bất kỳ ứng dụng nào.

Bạn cũng có thể sử dụng các mô hình khác của OpenAI—như DALL·E và Whisper—với tích hợp OpenAI của Zapier. Tự động hóa quy trình công việc liên quan đến tạo hình ảnh và phiên âm âm thanh, ngay từ các ứng dụng bạn đang sử dụng.

Bài đọc liên quan: Cách bạn có thể (và khi nào bạn không nên) sử dụng ChatGPT để viết nội dung tiếp thị

Bài viết liên quan

Xem thêm >>

Khai phá sức mạnh của AI với HIX.AI!