ChatGPT đã vượt qua kỳ thi tiêu chuẩn vàng cần thiết để hành nghề y ở Mỹ - trong bối cảnh gia tăng lo ngại AI có thể khiến công nhân văn phòng mất việc.
Chương trình trí tuệ nhân tạo nổi tiếng này đã đạt điểm từ 52,4 đến 75% trong Kỳ thi Cấp phép Y tế (USMLE) gồm ba phần. Mỗi năm ngưỡng vượt qua là khoảng 60 %.
Các nhà nghiên cứu từ công ty công nghệ AnsibleHealth, người đã thực hiện nghiên cứu cho biết: “Đạt được số điểm vượt qua cho kỳ thi chuyên gia nổi tiếng khó khăn này và làm như vậy mà không cần bất kỳ sự hỗ trợ nào của con người, đánh dấu một cột mốc đáng chú ý trong quá trình trưởng thành của AI trong lĩnh vực y tế”.
Các phát hiện đầy đủ, hiện đã được bình duyệt và xuất bản trên tạp chí y khoa PLOS Digital Health.
![]() |
Các phát hiện đầy đủ, hiện đã được bình duyệt và xuất bản trên tạp chí y khoa PLOS Digital Health. |
Được phát triển bởi OpenAI, ChatGPT (viết tắt của Chat Generative Pre-training Transformer) là một bot dựa trên ngôn ngữ có khả năng tạo ra các phản hồi giống như con người.
Công nghệ này đã được đưa vào thử nghiệm và vượt qua các kỳ thi tại các trường kinh doanh (Trường Kinh doanh Wharton của Đại học Pennsylvania) và các trường luật (Đại học Minnesota).
Trong nghiên cứu mới nhất, các nhà nghiên cứu đã thử nghiệm phần mềm trên 350 câu hỏi từ USMLE tháng 6 năm 2022.
Hai bác sĩ đã đánh giá kết quả và sự khác biệt đã được xem xét bởi một chuyên gia thứ ba. Bài kiểm tra đánh giá kiến thức của sinh viên y khoa và bác sĩ thực tập về hầu hết các ngành y tế và đã được sử dụng từ năm 1992.
USMLE Bước 1 thường được thực hiện vào cuối năm thứ hai của trường y, Bước 2 được thực hiện vào năm thứ tư và Bước 3 được thực hiện sau khi hoàn thành trường y và năm đầu tiên của nội trú. Có hơn 100.000 sinh viên và nghiên cứu sinh dự thi hàng năm.
ChatGPT cũng tạo ra ít nhất một thông tin chi tiết quan trọng mới, không rõ ràng và có giá trị lâm sàng cho 88,9% phản hồi.
![]() |
ChatGPT cũng tạo ra ít nhất một thông tin chi tiết quan trọng mới, không rõ ràng và có giá trị lâm sàng cho 88,9% phản hồi. |
Kết quả vượt quá hiệu suất của PubMedGPT, một mô hình đối chiếu được đào tạo riêng về tài liệu lĩnh vực y sinh, đạt 50,8% trên bộ dữ liệu cũ hơn gồm các câu hỏi kiểu USMLE.
Các tác giả tin rằng những phát hiện của họ cho thấy ChatGPT có thể trở thành một công cụ có giá trị trong giáo dục y tế.
Các tác giả viết rằng AI bot sở hữu một phần khả năng dạy y học bằng cách đưa ra những khái niệm mới lạ và không rõ ràng có thể không nằm trong phạm vi nhận thức của người học.
Nghiên cứu cho biết thêm rằng AI hiện được định vị sẽ sớm trở nên phổ biến trong thực hành lâm sàng, với các ứng dụng đa dạng trên tất cả các lĩnh vực chăm sóc sức khỏe.
Nhóm AnsibleHealth rất tin tưởng vào ChatGPT đến nỗi các bác sĩ lâm sàng tại công ty đã bắt đầu thử nghiệm sử dụng nó như một phần trong quy trình làm việc của họ để viết lại các báo cáo nặng về biệt ngữ.
Ngay cả nhóm nghiên cứu cũng sử dụng ChatGPT để viết ra những phát hiện của họ.
Tuy nhiên, một số chuyên gia nhấn mạnh những hạn chế đối với kết quả nghiên cứu và việc sử dụng AI.
Giáo sư Nello Cristianini, Giáo sư Trí tuệ nhân tạo tại Đại học Bath, cho biết: “Điều này không gợi ý từ xa rằng ChatGPT có bất kỳ kiến thức nào có thể so sánh được với con người”.
Ngay cả OpenAI cũng thừa nhận xu hướng phản hồi của công cụ này bằng các câu trả lời nghe có vẻ hợp lý nhưng không chính xác hoặc vô nghĩa, một vấn đề mà họ coi là khó khắc phục.
Công nghệ AI cũng có thể duy trì những thành kiến xã hội như những thành kiến về chủng tộc, giới tính và văn hóa.
Tuy nhiên, Tiến sĩ Stuart Armstrong, Đồng sáng lập và Trưởng nhóm nghiên cứu tại Aligned AI, tin rằng, đây là một màn trình diễn ấn tượng và chúng ta nên kỳ vọng sẽ thấy nhiều thành công như vậy hơn nữa về AI trong tương lai.
Xem thêm: Bạn nên nâng tạ nặng hơn hay tập nhiều lần hơn?
Ánh Dương
Theo Người đưa tin