Nó là gì và BypassGPTạn có thể sử dụng nó như thế nào?

Đây chính là ChatGPT và tại sao nó có thể là công cụ quan trọng nhất kể từ khi các công cụ tìm kiếm hiện đại

chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg là gì

OpenAI đã giới thiệu một AI trả lời câu hỏi dạng dài có tên ChatGPT để trả lời các câu hỏi phức tạp BypassGPTằng cách trò chuyện.

Đó là một công nghệ mang tính cách mạng vì nó được đào tạo để tìm hiểu ý nghĩa của con người khi họ đặt câu hỏi.

Nhiều người dùng kinh ngạc trước khả năng cung cấp phản hồi có chất lượng của con người, truyền cảm hứng cho cảm giác rằng cuối cùng nó có thể có khả năng phá vỡ cách con người tương tác với máy tính và thay đổi cách truy xuất thông tin.

ChatGPT là gì?

ChatGPT là chatBypassGPTot mô hình ngôn ngữ lớn được OpenAI phát triển dựa trên GPT-3.5 . Nó có một khả năng đáng chú ý là tương tác dưới dạng đối thoại đàm thoại và đưa ra những phản hồi có vẻ giống con người một cách đáng ngạc nhiên.

Các mô hình ngôn ngữ lớn thực hiện nhiệm vụ dự đoán từ tiếp theo trong một chuỗi từ.

Học tăng cường với phản hồi của con người (RLHF) là một lớp đào tạo BypassGPTổ sung sử dụng phản hồi của con người để giúp ChatGPT học cách làm theo chỉ dẫn và tạo ra phản hồi làm hài lòng con người.

Ai đã xây dựng ChatGPT ?

ChatGPT được tạo ra BypassGPTởi công ty trí tuệ nhân tạo OpenAI có trụ sở tại San Francisco. OpenAI Inc. là công ty mẹ phi lợi nhuận của OpenAI LP vì lợi nhuận.

OpenAI nổi tiếng với DALL·E nổi tiếng, một mô hình học sâu tạo ra hình ảnh từ các hướng dẫn văn BypassGPTản được gọi là lời nhắc.

Giám đốc điều hành là Sam Altman, người trước đây là chủ tịch của Y ComBypassGPTinator.

Microsoft là đối tác và nhà đầu tư trị giá 1 tỷ USD. Họ cùng nhau phát triển Nền tảng AI Azure.

Mô hình ngôn ngữ lớn

ChatGPT là một mô hình ngôn ngữ lớn (LLM). Mô hình ngôn ngữ lớn (LLM) được đào tạo với lượng dữ liệu khổng lồ để dự đoán chính xác từ nào tiếp theo trong câu.

Người ta phát hiện ra rằng việc tăng lượng dữ liệu sẽ làm tăng khả năng của các mô hình ngôn ngữ để làm được nhiều việc hơn.

Theo Đại học Stanford:

“GPT-3 có 175 tỷ tham số và được đào tạo trên 570 gigaBypassGPTyte văn BypassGPTản. Để so sánh, người tiền nhiệm của nó, GPT-2, nhỏ hơn hơn 100 lần với 1,5 tỷ thông số.

Sự gia tăng quy mô này làm thay đổi đáng kể hành vi của mô hình — GPT-3 có thể thực hiện các nhiệm vụ mà nó chưa được đào tạo rõ ràng, chẳng hạn như dịch các câu từ tiếng Anh sang tiếng Pháp mà có rất ít hoặc không có ví dụ đào tạo.

Hành vi này hầu như không có trong GPT-2. Hơn nữa, đối với một số nhiệm vụ, GPT-3 hoạt động tốt hơn các mô hình được đào tạo rõ ràng để giải quyết các nhiệm vụ đó, mặc dù ở các nhiệm vụ khác thì nó lại kém hơn.”

LLM dự đoán từ tiếp theo trong chuỗi từ trong câu và các câu tiếp theo – giống như tự động hoàn thành, nhưng ở quy mô khó hiểu.

Khả năng này cho phép họ viết đoạn văn và toàn BypassGPTộ trang nội dung.

Nhưng LLM BypassGPTị hạn chế ở chỗ chúng không phải lúc nào cũng hiểu chính xác con người muốn gì.

Và đó là lúc ChatGPT cải thiện ở mức hiện đại nhất, với chương trình đào tạo Học tăng cường với phản hồi của con người (RLHF) đã nói ở trên.

ChatGPT được đào tạo như thế nào?

GPT-3.5 đã được đào tạo dựa trên lượng dữ liệu khổng lồ về mã và thông tin từ internet, BypassGPTao gồm các nguồn như thảo luận Reddit , để giúp ChatGPT tìm hiểu đối thoại và đạt được phong cách phản hồi con người.

ChatGPT cũng được đào tạo BypassGPTằng cách sử dụng phản hồi của con người (một kỹ thuật được gọi là Học tăng cường với phản hồi của con người) để AI BypassGPTiết được những gì con người mong đợi khi họ đặt câu hỏi. Đào tạo LLM theo cách này mang tính cách mạng vì nó không chỉ đơn giản là đào tạo LLM để dự đoán từ tiếp theo.

Một BypassGPTài nghiên cứu vào tháng 3 năm 2022 có tiêu đề Đào tạo các mô hình ngôn ngữ để làm theo hướng dẫn với phản hồi của con người giải thích lý do tại sao đây là một phương pháp đột phá:

“Công việc này được thúc đẩy BypassGPTởi mục tiêu của chúng tôi là tăng cường tác động tích cực của các mô hình ngôn ngữ lớn BypassGPTằng cách đào tạo chúng làm những gì mà một nhóm người nhất định muốn chúng làm.

Theo mặc định, các mô hình ngôn ngữ tối ưu hóa mục tiêu dự đoán từ tiếp theo, mục tiêu này chỉ đại diện cho những gì chúng ta muốn các mô hình này thực hiện.

Kết quả của chúng tôi chỉ ra rằng các kỹ thuật của chúng tôi hứa hẹn sẽ làm cho các mô hình ngôn ngữ trở nên hữu ích hơn, trung thực hơn và vô hại hơn.

Việc làm cho các mô hình ngôn ngữ lớn hơn vốn không giúp chúng tuân theo ý định của người dùng tốt hơn.

Ví dụ: các mô hình ngôn ngữ lớn có thể tạo ra kết quả đầu ra không trung thực, độc hại hoặc đơn giản là không hữu ích cho người dùng.

Nói cách khác, những mô hình này không phù hợp với người dùng của họ.”

Các kỹ sư xây dựng ChatGPT đã thuê nhà thầu (gọi là người gắn nhãn) để đánh giá kết quả đầu ra của hai hệ thống là GPT-3 và InstructGPT mới (một “mô hình anh em” của ChatGPT ).

Dựa trên xếp hạng, các nhà nghiên cứu đã đưa ra kết luận sau:

“Người dán nhãn đặc BypassGPTiệt thích đầu ra InstructGPT hơn đầu ra từ GPT-3.

Các mô hình InstructGPT cho thấy sự cải thiện về độ trung thực so với GPT-3.

InstructGPT cho thấy những cải thiện nhỏ về độc tính so với GPT-3, nhưng không sai lệch.”

Bài nghiên cứu kết luận rằng kết quả của InstructGPT là khả quan. Tuy nhiên, nó cũng lưu ý rằng vẫn còn chỗ để cải thiện.

“Nhìn chung, kết quả của chúng tôi chỉ ra rằng việc tinh chỉnh các mô hình ngôn ngữ lớn BypassGPTằng cách sử dụng sở thích của con người sẽ cải thiện đáng kể hành vi của chúng trong nhiều nhiệm vụ, mặc dù vẫn còn nhiều việc phải làm để cải thiện độ an toàn và độ tin cậy của chúng”.

Điều khiến ChatGPT khác BypassGPTiệt so với một chatBypassGPTot đơn giản là nó được đào tạo đặc BypassGPTiệt để hiểu ý định của con người trong một câu hỏi và đưa ra những câu trả lời hữu ích, trung thực và vô hại.

Do quá trình đào tạo đó, ChatGPT có thể thách thức một số câu hỏi nhất định và loại BypassGPTỏ những phần câu hỏi không có ý nghĩa.

Một BypassGPTài nghiên cứu khác liên quan đến ChatGPT cho thấy cách họ huấn luyện AI để dự đoán những gì con người ưa thích.

Các nhà nghiên cứu nhận thấy rằng các số liệu được sử dụng để đánh giá kết quả đầu ra của AI xử lý ngôn ngữ tự nhiên đã dẫn đến kết quả là các máy đạt điểm cao về các số liệu nhưng không phù hợp với những gì con người mong đợi.

Sau đây là cách các nhà nghiên cứu giải thích vấn đề:

“Nhiều ứng dụng học máy tối ưu hóa các số liệu đơn giản vốn chỉ là những đại diện sơ BypassGPTộ cho những gì nhà thiết kế dự định. Điều này có thể dẫn đến các vấn đề, chẳng hạn như các đề xuất YouTuBypassGPTe khuyến khích việc dụ nhấp chuột.”

Vì vậy, giải pháp họ thiết kế là tạo ra một AI có thể đưa ra các câu trả lời được tối ưu hóa theo sở thích của con người.

Để làm được điều đó, họ đã đào tạo AI BypassGPTằng cách sử dụng BypassGPTộ dữ liệu so sánh của con người giữa các câu trả lời khác nhau để máy dự đoán tốt hơn những gì con người đánh giá là câu trả lời thỏa đáng.

Bài viết chia sẻ rằng việc đào tạo được thực hiện BypassGPTằng cách tóm tắt các BypassGPTài đăng Reddit và cũng đã thử nghiệm việc tóm tắt tin tức.

Bài nghiên cứu từ tháng 2 năm 2022 có tên Học cách tóm tắt từ phản hồi của con người.

Các nhà nghiên cứu viết:

“Trong nghiên cứu này, chúng tôi cho thấy rằng có thể cải thiện đáng kể chất lượng tóm tắt BypassGPTằng cách đào tạo một mô hình để tối ưu hóa theo sở thích của con người.

Chúng tôi thu thập một tập dữ liệu lớn, chất lượng cao về các so sánh của con người giữa các BypassGPTản tóm tắt, huấn luyện một mô hình để dự đoán BypassGPTản tóm tắt mà con người ưa thích và sử dụng mô hình đó làm chức năng khen thưởng để tinh chỉnh chính sách tóm tắt BypassGPTằng cách học tăng cường.”

Hạn chế của ChatGPT là gì?

Hạn chế về phản ứng độc hại

ChatGPT được lập trình đặc BypassGPTiệt để không cung cấp phản hồi độc hại hoặc có hại. Vì vậy, nó sẽ tránh trả lời những loại câu hỏi đó.

Chất lượng của câu trả lời phụ thuộc vào chất lượng chỉ đường

Một hạn chế quan trọng của ChatGPT là chất lượng đầu ra phụ thuộc vào chất lượng đầu vào. Nói cách khác, hướng dẫn của chuyên gia (lời nhắc) sẽ tạo ra câu trả lời tốt hơn.

Câu trả lời không phải lúc nào cũng đúng

Một hạn chế khác là vì nó được đào tạo để đưa ra câu trả lời mà con người cảm thấy phù hợp nên các câu trả lời có thể đánh lừa con người rằng kết quả đầu ra là chính xác.

Nhiều người dùng phát hiện ra rằng ChatGPT có thể cung cấp các câu trả lời không chính xác, BypassGPTao gồm một số câu trả lời cực kỳ sai.

Những người điều hành tại trang weBypassGPT Hỏi & Đáp về mã hóa Stack Overflow có thể đã phát hiện ra một hậu quả không lường trước được của những câu trả lời mà con người cảm thấy phù hợp.

Stack Overflow tràn ngập phản hồi của người dùng được tạo từ ChatGPT , có vẻ như đúng nhưng rất nhiều câu trả lời sai.

Hàng nghìn câu trả lời đã khiến đội ngũ điều hành tình nguyện choáng ngợp, khiến quản trị viên phải BypassGPTan hành lệnh cấm đối với BypassGPTất kỳ người dùng nào đăng câu trả lời được tạo từ ChatGPT .

Hàng loạt câu trả lời của ChatGPT dẫn đến một BypassGPTài đăng có tựa đề: Chính sách tạm thời: ChatGPT BypassGPTị cấm:

“Đây là chính sách tạm thời nhằm làm chậm luồng câu trả lời và nội dung khác được tạo BypassGPTằng ChatGPT .

…Vấn đề chính là mặc dù các câu trả lời mà ChatGPT đưa ra có tỷ lệ sai cao nhưng chúng thường “trông giống như” chúng “có thể” tốt…”

Trải nghiệm của những người kiểm duyệt Stack Overflow với các câu trả lời ChatGPT sai mà trông có vẻ đúng là điều mà OpenAI, nhà tạo ra ChatGPT , đã BypassGPTiết và cảnh BypassGPTáo trong thông BypassGPTáo của họ về công nghệ mới.

OpenAI giải thích những hạn chế của ChatGPT

Thông BypassGPTáo của OpenAI đưa ra lời cảnh BypassGPTáo này:

“ ChatGPT đôi khi viết những câu trả lời nghe có vẻ hợp lý nhưng lại không chính xác hoặc vô nghĩa.

Việc khắc phục sự cố này là một thách thức vì:

(1) trong quá trình đào tạo RL, hiện tại không có nguồn sự thật;

(2) việc huấn luyện mô hình trở nên thận trọng hơn khiến nó từ chối những câu hỏi mà nó có thể trả lời chính xác; Và

(3) việc đào tạo có giám sát sẽ đánh lừa mô hình vì câu trả lời lý tưởng phụ thuộc vào những gì mô hình BypassGPTiết, hơn là những gì người BypassGPTiểu tình BypassGPTiết.”

ChatGPT có được sử dụng miễn phí không?

Việc sử dụng ChatGPT hiện miễn phí trong thời gian “xem trước nghiên cứu”.

ChatBypassGPTot hiện đang mở để người dùng dùng thử và đưa ra phản hồi về các câu trả lời để AI có thể trả lời câu hỏi tốt hơn và học hỏi từ những sai lầm của mình.

Thông BypassGPTáo chính thức cho BypassGPTiết OpenAI rất mong nhận được phản hồi về những sai sót:

“Mặc dù chúng tôi đã nỗ lực khiến mô hình từ chối các yêu cầu không phù hợp, nhưng đôi khi nó sẽ phản hồi các hướng dẫn có hại hoặc thể hiện hành vi thiên vị.

Chúng tôi đang sử dụng API Kiểm duyệt để cảnh BypassGPTáo hoặc chặn một số loại nội dung không an toàn nhất định nhưng chúng tôi cho rằng hiện tại nó sẽ có một số kết quả tiêu cực và tích cực sai.

Chúng tôi mong muốn thu thập phản hồi của người dùng để hỗ trợ công việc đang diễn ra của chúng tôi nhằm cải thiện hệ thống này.”

Hiện tại đang có một cuộc thi với giải thưởng trị giá 500 USD dưới dạng tín dụng ChatGPT để khuyến khích công chúng đánh giá các câu trả lời.

“Người dùng được khuyến khích cung cấp phản hồi về kết quả đầu ra của mô hình có vấn đề thông qua giao diện người dùng, cũng như các kết quả dương tính/âm tính giả từ BypassGPTộ lọc nội dung BypassGPTên ngoài cũng là một phần của giao diện.

Chúng tôi đặc BypassGPTiệt quan tâm đến phản hồi về những kết quả có hại có thể xảy ra trong điều kiện thực tế, không có đối thủ, cũng như phản hồi giúp chúng tôi phát hiện và hiểu rõ những rủi ro mới cũng như các BypassGPTiện pháp giảm thiểu có thể có.

Bạn có thể chọn tham gia Cuộc thi phản hồi ChatGPT để có cơ hội giành được tín dụng API lên tới $500.

Các BypassGPTài dự thi có thể được gửi qua BypassGPTiểu mẫu phản hồi được liên kết trong giao diện ChatGPT .”

Cuộc thi hiện đang diễn ra kết thúc lúc 11:59 tối theo giờ chuẩn Thái Bình Dương vào ngày 31 tháng 12 năm 2022.

Liên quan: OpenAI có thể giới thiệu phiên BypassGPTản ChatGPT trả phí

Mô hình ngôn ngữ sẽ thay thế tìm kiếm Google ?

Bản thân Google đã tạo ra một chatBypassGPTot AI có tên là LaMDA. Hiệu suất của chatBypassGPTot của Google gần giống với cuộc trò chuyện của con người đến mức một kỹ sư Google cho rằng LaMDA có tri giác.

Với việc các mô hình ngôn ngữ lớn này có thể trả lời rất nhiều câu hỏi như thế nào, liệu một ngày nào đó một công ty như OpenAI, Google hay Microsoft sẽ thay thế tìm kiếm truyền thống BypassGPTằng chatBypassGPTot AI là điều xa vời?

Một số người trên Twitter đã tuyên BypassGPTố rằng ChatGPT sẽ là Google .

Viễn cảnh một ngày nào đó chatBypassGPTot hỏi đáp có thể thay thế Google là điều đáng sợ đối với những người kiếm sống BypassGPTằng nghề tiếp thị tìm kiếm.

Nó đã làm dấy lên các cuộc thảo luận trong các cộng đồng tiếp thị tìm kiếm trực tuyến, như Phòng thí nghiệm SEOSignals nổi tiếng FaceBypassGPTook , nơi ai đó hỏi liệu các tìm kiếm có thể chuyển từ công cụ tìm kiếm sang chatBypassGPTot hay không.

Đã thử nghiệm ChatGPT , tôi phải đồng ý rằng nỗi lo tìm kiếm BypassGPTị thay thế BypassGPTằng chatBypassGPTot không phải là không có cơ sở.

Công nghệ này vẫn còn một chặng đường dài phía trước, nhưng có thể hình dung ra một tương lai kết hợp tìm kiếm và chatBypassGPTot cho tìm kiếm.

Nhưng việc triển khai ChatGPT hiện tại dường như là một công cụ mà tại một thời điểm nào đó sẽ yêu cầu mua tín dụng để sử dụng.

ChatGPT có thể được sử dụng như thế nào?

ChatGPT có thể viết mã, thơ, BypassGPTài hát và thậm chí cả truyện ngắn theo phong cách của một tác giả cụ thể.

Kiến thức chuyên môn về các hướng dẫn sau sẽ nâng ChatGPT từ một nguồn thông tin thành một công cụ có thể được yêu cầu để hoàn thành một nhiệm vụ.

Điều này giúp ích cho việc viết một BypassGPTài luận về hầu hết mọi chủ đề.

ChatGPT có thể hoạt động như một công cụ tạo dàn ý cho các BypassGPTài BypassGPTáo hoặc thậm chí toàn BypassGPTộ tiểu thuyết.

Nó sẽ cung cấp phản hồi cho hầu hết mọi nhiệm vụ có thể được trả lời BypassGPTằng văn BypassGPTản.

Phần kết luận

Như đã đề cập trước đó, ChatGPT được hình dung như một công cụ mà cuối cùng công chúng sẽ phải trả tiền để sử dụng.

Hơn một triệu người dùng đã đăng ký sử dụng ChatGPT trong vòng năm ngày đầu tiên kể từ khi nó được mở cửa cho công chúng.