ChatGPT của OpenAI bị thất bại khi trả lời

Hình-OpenAIs-ChatGPT.jpg

Đã gần 6 tháng kể từ khi ChatGPT của OpenAI ra mắt. Trên thực tế, công ty vừa mới ra mắt ChatGPT 4. Công nghệ này đã đưa thế giới lên một tầm cao mới.

ChatGPT là một mô hình ngôn ngữ được cung cấp bởi trí tuệ nhân tạo và đã được huấn luyện để thực hiện một số hoạt động, bao gồm dịch ngôn ngữ, tóm tắt thông tin và trả lời câu hỏi. Các khả năng đặc biệt của mô hình này đã nhận được nhiều sự chú ý đáng kể, và do đó, nhiều người đang bắt đầu đặt câu hỏi về triển vọng việc làm của họ.

Mô hình xử lý ngôn ngữ GPT-4 có thể được sử dụng để phân tích lượng lớn dữ liệu và từ đó tạo ra nội dung dựa trên kết quả của phân tích. Hơn nữa, công nghệ mới này cũng có khả năng phân tích lượng lớn văn bản để cung cấp thông tin về một điểm dữ liệu cụ thể đến người tiêu dùng.

Không có nghi ngờ gì rằng công nghệ sẽ tồn tại trong thời gian dài. Đương nhiên, nó giúp người dùng theo nhiều cách khác nhau. Trên một loạt các dịp, nó đã chứng minh khả năng thực hiện mọi thứ từ viết kịch bản đến giải quyết các bài tập khó nhất. Không có gì mà ChatGPT không thể hoàn thành. Tuy nhiên, cũng có những điều mà ChatGPT khó hơn.

1. ChatGPT được cung cấp sức mạnh bởi trí tuệ nhân tạo đã gặp một sự trở ngại khi không thể vượt qua kỳ thi Joint Entrance Examination (JEE) được khao khát ở Ấn Độ. Kỳ thi Joint Entrance Examination nổi tiếng vì độ khó và thu hút hàng ngàn sinh viên mỗi năm muốn nhận vào các trường kỹ thuật danh giá nhất ở Ấn Độ. Đây là một trong những kỳ thi định lượng khó nhất bao gồm các sơ đồ phức tạp và các con số.

Các sinh viên quan tâm đến việc tham gia các cơ sở giáo dục danh tiếng như IITs và NITs phải trước tiên vượt qua Kỳ thi Đầu vào Chung. Theo các báo cáo, ChatGPT đã không đạt kết quả tốt trong kỳ thi JEE Advanced.

Kết quả về hiệu suất của ChatGPT trong bài kiểm tra không đạt như mong đợi vì nó chỉ có thể giải quyết được 11 câu hỏi trong tổng số câu hỏi trong bài.

2. ChatGPT đã thành công trong quá khứ với một số bài kiểm tra khác nhau, có tính chất nổi bật và khó khăn. Đáng chú ý, ChatGPT đã thử và trả lời thành công tất cả 200 câu hỏi trong Kỳ thi Đủ điều kiện và Thẩm định Đại học Y tế (NEET), nơi yêu cầu thí sinh trả lời 180 câu hỏi trong tổng số 200 câu.

Mặc dù vậy, ChatGPT đã cố gắng trả lời tất cả 200 câu hỏi và kết quả của nó là 359 điểm trên 800. Cụ thể, ChatGPT đã làm rất tốt trong môn Sinh học của bài kiểm tra NEET, cho thấy khả năng đáp án chính xác hơn với các câu hỏi trong phần đó. Kết quả của ChatGPT trong bài kiểm tra NEET cho thấy nó có khả năng vượt trội trong các lĩnh vực khác, mặc dù không qua được kỳ thi JEE Advanced.

Thất bại mà ChatGPT trải qua trong kỳ thi JEE Advanced chỉ ra những hạn chế hiện diện ngay cả trong những mô hình AI tiên tiến nhất. Dù trí tuệ nhân tạo có tiềm năng gây đảo lộn trong nhiều ngành công nghiệp khác nhau, nhưng nó vẫn còn rất xa để cạnh tranh với trí tuệ con người trong các nhiệm vụ khó khăn.

Bộ chatbot ChatGPT của OpenAI đã không thành công trong một kỳ thi cạnh tranh khác.

3. ChatGPT đã tham gia kỳ thi của Ủy ban Dịch vụ Công cộng Liên bang (UPSC) theo yêu cầu của tạp chí Analytics India (AIM). Kỳ thi UPSC được coi là một trong những kỳ thi cạnh tranh khó nhất trên thế giới. Hàng năm có hơn 10 lakh ứng cử viên tham gia kỳ thi UPSC, nhưng chỉ có 5% trong số họ có thể vượt qua.

AIM đã cung cấp 100 câu hỏi từ kỳ thi UPSC Prelims năm 2022 cho ChatGPT.

Chatbot đã không đạt được kết quả tốt trong kỳ thi UPSC Prelims 2022, chỉ đạt được 54 điểm trên tổng số 100 điểm trong đề thi Số 1 (Bộ đề A) trong khi điểm yêu cầu là 87.54. Điều này cho thấy ChatGPT không qua được bài kiểm tra UPSC.

Các câu hỏi được dựa trên các chủ đề về khoa học tổng quát, lịch sử, địa lý, kinh tế, sinh thái và sự kiện hiện tại của Ấn Độ. Trò chuyện trực tuyến đã làm tốt với các câu hỏi liên quan đến địa điểm và nền kinh tế, nhưng nó thất bại thảm hại khi được hỏi về các sự kiện lịch sử diễn ra trước năm 2021.

Sự thực là tập dữ liệu của ChatGPT chỉ bao gồm đến năm 2021 có lẽ là yếu tố quyết định trong việc làm cho AI bot không thể trả lời đúng tất cả các câu hỏi trong bài kiểm tra.

4. Ngoài ra, kết quả kỳ thi CLAT cho ChatGPT cũng cao hơn trung bình. Trong kỳ thi CLAT UG, công cụ AI chỉ thành công trong việc giải đúng 50,83% câu hỏi. ChatGPT không thành công trong các danh mục câu hỏi logic và định lượng. Tuy nhiên, nó đã đạt kết quả xuất sắc trong danh mục Tiếng Anh và Thông tin hiện tại. Khi đối mặt với các câu hỏi dựa trên khái niệm, công cụ này đã gặp khó khăn vô cùng.

Phát hành vào tháng 11 năm 2022, ChatGPT đã được tiếp nhận rất tốt tại Hoa Kỳ. Công nghệ Trí tuệ Nhân tạo này đã thành công trong việc vượt qua kỳ thi Cấp Giấy phép Y tế Hoa Kỳ (USMLE) và các kỳ thi MBA khác tại Hoa Kỳ. Ngoài ra, nó cũng đã vượt qua thành công các kỳ thi Phỏng vấn Lập trình Google cho Kỹ sư Cấp độ 3.

Các chuyên gia thú y đã bị sốc gần đây khi ChatGPT có thể chẩn đoán đúng tình trạng của một con chó và cứu sống con vật.

Nhiều quốc gia, tuy nhiên, hiện nay có quan điểm trái ngược về ChatGPT và sẵn sàng thực hiện biện pháp mạnh mẽ đối với sáng kiến mới này. Gần đây, công nghệ này đã bị cấm ở hai quốc gia lớn, bao gồm ĐứcÝ. Những quốc gia này cho rằng ChatGPT của OpenAI thiếu các biện pháp bảo vệ để ngăn chặn trẻ em tiếp xúc với nội dung xúc phạm, chẳng hạn như hệ thống xác minh tuổi.

Ulrich Kelber, Ủy viên bảo vệ dữ liệu của Đức, đã đưa ra cảnh báo rằng Chat-GPT có thể bị cấm ở Đức do lo ngại về an ninh dữ liệu của người dùng, tương tự như đã xảy ra ở Italia.

Chúng ta hãy xem xét xem công nghệ dựa trên Trí tuệ Nhân tạo sẽ hoạt động như thế nào trong tương lai.

Cảm ơn bạn đã đọc! Hãy tiếp tục đồng hành để nhận thêm nhiều bài viết bổ ích như vậy!

Bài viết liên quan

Xem thêm >>

Khai phá sức mạnh của AI với HIX.AI!