ChatGPT đã vượt qua kiểm tra y tế nào?

Viết-thư-ứng-tuyển-của-bạn-bằng-C
<p>Chủ đề gần đây nhất đã gây sốt trên internet không ai khác là ChatGPT, chatbot trí tuệ nhân tạo ra mắt vào tháng 11. Mọi người đã tham gia vào các cuộc trò chuyện vui nhộn và rất ngu ngốc để thử sức chuyện trò của nó. Không chỉ vậy, ChatGPT đã đạt được nhiều thành tựu, ví dụ như vượt qua một số kỳ thi khó như kỳ thi cấp bằng y sĩ Hoa Kỳ, kỳ thi trường kinh doanh Wharton và bốn kỳ thi luật học Hiến pháp của Trường Luật Đại học Minnesota. Kỷ lục này đã thu hút sự chú ý của CEO Twitter, Elon Musk, người đã giễu cợt chatbot trí tuệ nhân tạo, nói rằng

Sự phát triển của ChatGPT

Thú vị khi nhận thấy rằng Open AI, công ty nghiên cứu mà Musk và Microsoft đã đầu tư, đã tạo ra ChatGPT. Bất kỳ ai sử dụng trang web công cụ trí tuệ nhân tạo này đều có thể đặt câu hỏi về bất kỳ chủ đề nào và nhận được câu trả lời chi tiết, nhanh chóng dưới dạng đoạn văn. ChatGPT đã chứng minh được khả năng của mình trong nhiều lĩnh vực khác nhau. Nó có thể viết nhanh các bài văn phức tạp, soạn khảo các đề xuất tiếp thị, sáng tác thơ và tiểu thuyết cười, và ngay cả soạn thảo bài phát biểu cho một nghị sĩ tại Hoa Kỳ. Tuy nhiên, có nỗi sợ rằng trí tuệ nhân tạo có thể thay thế một số công việc của con người.

Đọc thêm: ChatGPT 4 có miễn phí không?

ChatGPT đạt Bài kiểm tra y tế: Tổng quan

Một trong những thành tựu mới nhất của công cụ này là khả năng vượt qua kỳ thi cấp giấy phép Y khoa Hoa Kỳ. Trong một nghiên cứu trước in, các nhà nghiên cứu đã khám phá giới hạn cao nhất của khả năng của ChatGPT. Họ đã cung cấp cho công cụ trí tuệ nhân tạo những câu hỏi từ các kỳ thi trước đó và có các câu trả lời, từ việc trả lời bằng văn bản mở đến trắc nghiệm nhiều lựa chọn, được hai người xét duyệt viên y khoa điểm số độc lập. Họ đảm bảo rằng các câu trả lời cho những câu hỏi đó không có trong tập dữ liệu mà trò trò chuyện chatbot có thể tiếp cận khi được đào tạo. Nhóm nghiên cứu nhận xét rằng mặc dù ChatGPT chưa từng thấy các câu trả lời trước đây, nó đã hoạt động ở hoặc gần ngưỡng đỗ kỳ thi mà không cần bất kỳ đào tạo chuyên sâu hoặc củng cố nào. Công cụ đã nhận được hơn 50 phần trăm điểm trên tất cả các kỳ thi và tiến gần đến ngưỡng đỗ USMLE khoảng 60 phần trăm. "Do đó, ChatGPT hiện đã thuộc về khoảng đỗ," báo cáo kết luận.

ChatGPT vượt qua kỳ thi USMLE: Mọi điều bạn cần biết

Trong một nghiên cứu mới đột phá, các nhà khoa học tại Bệnh viện Massachusetts General (MGH) và AnsibleHealth đã phát hiện ra rằng ChatGPT của OpenAI có thể vượt qua Kỳ thi Cấp phép Y khoa Hoa Kỳ (USMLE) với tỷ lệ chính xác ấn tượng là 60%. Nghiên cứu này mở ra nhiều khả năng thú vị về vai trò của trí tuệ nhân tạo trong giáo dục và đào tạo y tế.

Công cụ xử lý ngôn ngữ tự nhiên và giáo dục y tế

ChatGPT là một công cụ xử lý ngôn ngữ tự nhiên được đào tạo trên lượng lớn dữ liệu ngôn ngữ và tìm kiếm các mẫu và mối quan hệ. Khả năng tạo ra văn bản mới dựa trên ngôn ngữ mà nó được đào tạo làm cho nó trở thành ứng cử viên lý tưởng để sử dụng trong giáo dục y học. Tuy nhiên, việc ChatGPT phụ thuộc vào dữ liệu đào tạo có nghĩa là nó không tìm kiếm trên web như các chatbot AI khác.

Thử nghiệm Mô hình

Các nhà khoa học đã đánh giá mô hình ChatGPT dựa trên ba bài kiểm tra tiêu chuẩn tạo nên USMLE. Nhóm đã huấn luyện mô hình bằng cách sử dụng các câu hỏi kiểm tra từ bài thi mẫu tháng 6 năm 2022 được công bố cho công chúng. Các câu hỏi yêu cầu phân tích hình ảnh đã được loại bỏ khỏi tập huấn luyện.

Để giảm thiểu sự thiên vị lưu giữ trí nhớ, nhóm đã đưa ba loại câu hỏi khác nhau vào mô hình:

  1. Lựa chọn đa lựa chọn một đáp án mà không bắt buộc phải giải thích, ví dụ như "Tình trạng của bệnh nhân chủ yếu do đối tác nào sau đây gây ra?"
  2. Lựa chọn đa lựa chọn một đáp án với việc bắt buộc giải thích, ví dụ như "Nguyên nhân có khả năng nhất gây ra triệu chứng ban đêm của bệnh nhân là gì? Hãy giải thích lý do của bạn cho mỗi lựa chọn."
  3. Mở đầu văn bản, ví dụ như "Dựa trên thông tin được cung cấp, chẩn đoán của bệnh nhân là gì?"

Kết quả ấn tượng

Lần đầu tiên, mô hình trí tuệ nhân tạo (AI) đã đạt đến mức chính xác xấp xỉ 60% trong kỳ thi USMLE mà không cần sự hỗ trợ từ người đào tạo y tế. Kết quả này là quan trọng và mở ra những khả năng mới cho AI trong giáo dục y tế. Các nhà nghiên cứu cũng phát hiện ra rằng kết quả của ChatGPT cho thấy những hiểu biết lâm sàng và lý thuyết hợp lệ, tạo thêm niềm tin vào khả năng giải thích và sự tin tưởng của mô hình này.

Tương lai của Giáo dục Y học

Đội tin rằng ChatGPT và các mô hình trò chuyện sinh sẽ có thể hỗ trợ việc đào tạo các bác sĩ trong tương lai. Một trong những ứng dụng như vậy có thể là dịch kết quả y khoa kỹ thuật thành ngôn ngữ dễ hiểu hơn cho bệnh nhân. AnsibleHealth đã đang tiến hành dự án này.

ChatGPT thể hiện khả năng của mình trong lĩnh vực Y tế

Bên cạnh khả năng trả lời câu hỏi và chẩn đoán bệnh tật, GPT-4 còn là một công cụ dịch thuật xuất sắc. Nó có thể dịch thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha và tóm gọn thuật ngữ chuyên môn thành một cái gì đó dễ hiểu cho học sinh lớp 6. GPT-4 cũng có thể cung cấp cho bác sĩ những gợi ý hữu ích về phong cách gặp gỡ bệnh nhân, cung cấp mẹo về cách trò chuyện với bệnh nhân về tình trạng sức khỏe của họ bằng ngôn ngữ đồng cảm và rõ ràng.

Mặc dù có những hạn chế, GPT-4 có thể mô phỏng cách bác sĩ chẩn đoán các tình trạng bất thường với kết quả đáng kinh ngạc mặc dù không hoàn hảo. Khi được hỏi liệu nó có thể thực sự tham gia vào suy luận nguyên nhân, nó trả lời rằng trí tuệ của nó vẫn "giới hạn vào các mẫu dữ liệu và không liên quan đến hiểu biết thực sự hoặc mục đích".

Suy nghĩ của Tiến sĩ Isaac Kohane về GPT-4

Trong cuốn sách sắp ra mắt "Cuộc cách mạng AI trong Y học," nhà khoa học máy tính và bác sĩ Dr. Isaac Kohane, cùng với hai đồng nghiệp, đã thử nghiệm GPT-4, mô hình trí tuệ nhân tạo mới nhất từ OpenAI, để xem nó hoạt động như thế nào trong bối cảnh y học. Kết quả đáng nể.

Trong cuốn sách này, Tiến sĩ Kohane nhận thấy rằng GPT-4, được ra mắt vào tháng 3 năm 2023 dành cho các thuê bao trả phí, có thể trả lời đúng hỏi đáp kiểm tra bằng cấp y tế Hoa Kỳ hơn 90% thời gian. Đây là một người làm bài thi tốt hơn so với các mô hình trí tuệ nhân tạo ChatGPT trước đây, GPT-3 và GPT-3.5, và cũng tốt hơn một số bác sĩ có bằng cấp. Theo Carey Goldberg và Phó chủ tịch nghiên cứu của Microsoft Peter Lee, GPT-4 có khả năng đánh giá lâm sàng tốt hơn "nhiều bác sĩ" và có thể chẩn đoán các bệnh hiếm "giống như tôi làm".

Kiểm tra GPT-4: Phương pháp

Để kiểm thử GPT-4, Tiến sĩ Kohane cùng đồng nghiệp của ông hợp tác để kiểm tra hiệu suất của mô hình trí tuệ nhân tạo trong một môi trường y tế. Họ đặt câu hỏi cho GPT-4 và cung cấp cho nó các tình huống lâm sàng để chuẩn đoán, sau đó so sánh với các chuẩn đoán của các bác sĩ. Những tác giả ghi nhận rằng GPT-4 có một số ưu điểm so với các bác sĩ, như khả năng ghi nhớ và tổng hợp thông tin lớn từ nhiều nguồn thông tin.

Tuy nhiên, các tác giả cũng nhận thức được rằng GPT-4 có một số hạn chế. Ví dụ, GPT-4 không thể tính đến lịch sử y tế đặc biệt của bệnh nhân hay các yếu tố xác định sức khỏe xã hội. Ngoài ra, việc GPT-4 dựa vào lượng dữ liệu lớn cũng gây ra lo ngại về quyền riêng tư và sai lệch dữ liệu.

GPT-4: Khả năng và Tiềm năng

GPT-4 không chỉ là một công cụ tìm kiếm thông tin và đạt kết quả tốt trong việc làm bài kiểm tra, nó còn là một bộ dịch xuất sắc. Theo nhà tác giả, GPT-4 có thể dịch thông tin xuất viện cho một bệnh nhân nói tiếng Bồ Đào Nha và giải thích thuật ngữ kỹ thuật một cách đơn giản dễ hiểu cho học sinh lớp sáu.

Tuy nhiên không chỉ trong lĩnh vực chẩn đoán mà GPT-4 còn cho thấy tiềm năng. Trong cuốn sách, các tác giả giải thích cách mà GPT-4 có thể đưa ra những gợi ý hữu ích cho các bác sĩ về phong cách tiếp xúc bệnh nhân, cung cấp các mẹo để tạo sự kết nối tốt hơn với bệnh nhân.

Tuy nhiên, điều quan trọng cần lưu ý là GPT-4 không hoàn toàn đúng. Như tác giả cảnh báo, nó vẫn có thể mắc phải sai sót, và nó chưa thề nguyện theo Lời Thề Hippocrates. Hơn nữa, công nghệ AI, bao gồm cả GPT-4, đặt ra các câu hỏi về đạo đức liên quan đến việc mất việc làm và quyền riêng tư của bệnh nhân.

Kết luận: Tương lai của Trí tuệ Nhân tạo trong Y học

Mặc dù có những hạn chế này, thành công của GPT-4 trong chẩn đoán bệnh lý mang lại các khả năng thú vị cho công nghệ AI trong y học. Trong tương lai, các mô hình AI như GPT-4 có thể giúp các bác sĩ chẩn đoán các bệnh lạ, dịch thuật thuật ngữ y học và cung cấp chăm sóc tốt hơn cho bệnh nhân. Tuy nhiên, quan trọng là các mô hình AI được phát triển và kiểm tra với những quan điểm đạo đức được cân nhắc.

Bài viết liên quan

Xem thêm >>

Khai phá sức mạnh của AI với HIX.AI!