Apa Ujian Perubatan yang Telah Dilalui oleh ChatGPT?

Tulis surat permohonan anda dengan menggunakan ChatGPT.png

Topik yang baru-baru ini menghebohkan internet adalah ChatGPT, chatbot AI yang diperkenalkan pada bulan November lalu. Orang-orang telah berinteraksi dengannya dalam percakapan yang riang dan tidak resmi untuk menguji keahlian berbicaranya. Bukan hanya itu, ChatGPT telah mencapai banyak prestasi, seperti lulus ujian-ujuan yang sulit seperti ujian lisensi medis Amerika Serikat, ujian Wharton Business School, dan empat ujian Fakultas Hukum Universitas Minnesota dalam Hukum Tata Negara. Prestasi ini menarik perhatian CEO Twitter, Elon Musk, yang meledek chatbot AI tersebut dengan mengatakan "Saya yakin semuanya akan baik-baik saja." Mari kita lihat Ujian Medis Apa Saja yang Dilewati oleh ChatGPT?

Perkembangan ChatGPT

Menarik untuk dicatat bahawa Open AI, syarikat penyelidikan yang telah diinvestasikan oleh Musk dan Microsoft, mencipta ChatGPT. Semua pengguna laman web alat AI ini boleh mengajukan soalan tentang apa sahaja topik dan menerima jawapan yang cepat serta terperinci dalam bentuk perenggan. ChatGPT telah membuktikan keupayaannya dalam pelbagai domain. Ia boleh menulis esei segera dan kompleks, merancang pemasaran, menghasilkan puisi dan jenaka, dan juga merancang ucapan untuk seorang Ahli Parlimen di Amerika Syarikat. Namun, terdapat kebimbangan bahawa AI boleh mengambil alih beberapa pekerjaan manusia.

Juga baca: Adakah ChatGPT 4 Percuma Untuk Digunakan?

ChatGPT menjalani Ujian Perubatan: Gambaran Keseluruhan

Salah satu pencapaian terbaru alat ini adalah kemampuannya untuk lulus ujian Lisensi Medis AS. Dalam sebuah studi pra-cetak, para peneliti mengeksplorasi batas kemampuan ChatGPT. Mereka memberi pertanyaan dari ujian sebelumnya ke alat kecerdasan buatan ini dan menjadikan jawaban yang bervariasi, mulai dari tanggapan tertulis dengan jawaban terbuka hingga pilihan ganda, untuk dinilai oleh dua penilai dokter secara independen. Mereka memastikan bahwa jawaban-jawaban tersebut tidak ada di dalam dataset yang dapat diakses oleh chatbot ketika dilatih. Tim peneliti mencatat bahwa meskipun ChatGPT belum pernah melihat jawaban-jawaban sebelumnya, alat ini dapat tampil setara atau mendekati ambang batas kelulusan ujian tanpa adanya pelatihan khusus atau penguatan. Alat ini memperoleh skor lebih dari 50 persen pada semua ujian dan mendekati ambang batas kelulusan USMLE sekitar 60 persen. "Oleh karena itu, ChatGPT sekarang berada dalam rentang kelulusan yang memadai," demikian kesimpulan dalam makalah tersebut.

ChatGPT Lulus Ujian USMLE: Semua yang perlu anda tahu

Dalam satu kajian baharu yang memecah kebiasaan, ahli sains di Massachusetts General Hospital (MGH) dan AnsibleHealth telah menemui bahawa ChatGPT oleh OpenAI boleh lulus Peperiksaan Perlesenan Perubatan Amerika Syarikat (USMLE) dengan kadar ketepatan yang mengagumkan iaitu 60%. Penemuan ini membuka peluang menarik dalam peranan kecerdasan buatan (AI) dalam pendidikan dan latihan perubatan.

Alat Pemprosesan Bahasa Semula Jadi dan Pendidikan Perubatan

ChatGPT adalah satu alat pemprosesan bahasa semula jadi yang dilatih menggunakan jumlah data bahasa yang luas dan mencari corak dan hubungan. Kemampuannya untuk menghasilkan teks baru berdasarkan bahasa yang dilatih menjadikannya calon yang ideal untuk digunakan dalam pendidikan perubatan. Namun, kebergantungan ChatGPT pada data latihan bermakna ia tidak mengimbas web seperti chatbot AI lain.

Menguji Model

Para saintis menilai model ChatGPT berdasarkan tiga ujian piawai yang membentuk USMLE. Pasukan ini melatih model menggunakan soalan ujian dari sampel ujian Jun 2022 yang dikeluarkan kepada orang awam. Soalan yang memerlukan analisis visual telah dikecualikan dari set latihan.

Untuk mengurangkan kecenderungan ingatan memori, pasukan itu memasukkan tiga jenis pertanyaan yang berbeza ke dalam model:

  1. Pilihan jawapan pelbagai pilihan tunggal tanpa justifikasi paksa, sebagai contoh, "Keadaan pesakit kebanyakan disebabkan oleh patogen yang berikut?"
  2. Pilihan jawapan pelbagai pilihan tunggal dengan justifikasi paksa, sebagai contoh, "Apakah alasan yang paling mungkin untuk gejala nokturnal pesakit? Terangkan rasional anda untuk setiap pilihan."
  3. Pancingan terbuka, sebagai contoh, "Apakah diagnosis pesakit berdasarkan maklumat yang diberikan?"

Keputusan yang Mengagumkan

Bagi kali pertama, model AI lulus USMLE dengan ketepatan sekitar 60% tanpa bantuan pelatih klinik. Hasil ini sangat penting dan membuka peluang baru bagi AI dalam pendidikan kedokteran. Para peneliti juga menemukan bahwa hasil ChatGPT menunjukkan wawasan dan alasan klinis yang valid, yang lebih meningkatkan keyakinan dalam kemampuan model untuk dijelaskan dan dipercayai.

Masa Depan Pendidikan Perubatan

Pasukan ini percaya bahawa ChatGPT dan model perbualan generatif lain boleh membantu dalam melatih doktor-doktor masa depan. Salah satu aplikasi yang mungkin adalah untuk menterjemahkan keputusan perubatan teknikal ke dalam bahasa yang lebih mudah difahami oleh pesakit. AnsibleHealth telah mula menjalankan projek ini.

ChatGPT menunjukkan kebolehannya dalam Bidang Perubatan

Selain keupayanya untuk menjawab soalan dan mendiagnosis penyakit, GPT-4 juga merupakan seorang penterjemah yang cemerlang. Ia dapat menterjemahkan maklumat keluaran untuk pesakit yang bertutur dalam bahasa Portugis dan menyampaikan istilah teknikal dalam bentuk yang mudah difahami oleh pelajar tahun enam sahaja. GPT-4 juga boleh memberikan doktor dengan cadangan berguna mengenai adab di tempat tidur, memberikan tip tentang cara bercakap dengan pesakit mengenai keadaan mereka dengan penuh empati dan bahasa yang jelas.

Walaupun ada batasannya, GPT-4 boleh menggambarkan bagaimana doktor mendiagnosis keadaan dengan keputusan yang menakjubkan walaupun tidak sempurna. Apabila ditanya sama ada ia boleh melibatkan diri dalam penalaran kausal, ia menjawab bahawa kecerdasannya masih "terhad kepada corak dalam data dan tidak melibatkan pemahaman atau niat sebenar."

Pandangan Dr. Isaac Kohane tentang GPT-4

Dalam sebuah buku yang akan datang berjudul “Revolusi AI dalam Perubatan," ahli komputer dan doktor Dr. Isaac Kohane, bersama dengan dua rakan sejawat, menguji GPT-4, model kecerdasan buatan terbaru dari OpenAI, untuk melihat bagaimana ia berfungsi dalam konteks perubatan. Hasilnya sangat mengagumkan.

Di dalam buku itu, Dr. Kohane mencatat bahawa GPT-4, yang telah dikeluarkan kepada pelanggan yang membayar pada Mac 2023, dapat menjawab soalan-solan ujian perlesenan perubatan Amerika Syarikat dengan betul lebih daripada 90% dari masa. Ia adalah penjawab ujian yang lebih baik daripada model-model kecerdasan buatan ChatGPT sebelumnya, GPT-3 dan -3.5, dan lebih baik daripada beberapa doktor yang berlesen juga. Menurut Carey Goldberg dan Naib Presiden Penyelidikan Microsoft, Peter Lee, GPT-4 mempunyai keputusan yang lebih baik daripada "banyak doktor" dan dapat mendiagnosis keadaan jarang berlaku "sama seperti yang saya lakukan".

Mencuba GPT-4: Kaedahnya

Untuk menguji GPT-4, Dr. Kohane dan rakan-rakannya bekerjasama untuk melihat bagaimana prestasi model AI ini dalam suatu pengaturcaraan perubatan. Mereka mengajukan soalan-soalan kepada GPT-4 dan memberikan padanya skenario klinikal untuk didiagnosis, kemudiannya dibandingkan dengan diagnosis yang dibuat oleh doktor manusia. Para pengarang mencatat bahawa GPT-4 mempunyai beberapa kelebihan berbanding doktor manusia, seperti keupayaan untuk mengingati dan menyintesis maklumat yang banyak dari pelbagai sumber.

Bagaimanapun, penulis juga mengakui bahawa GPT-4 mempunyai beberapa kelemahan. Sebagai contoh, GPT-4 tidak dapat mengambil kira sejarah perubatan unik pesakit atau faktor penentu kesihatan sosial. Selain itu, kebergantungan GPT-4 terhadap jumlah data yang besar menimbulkan kebimbangan mengenai privasi data dan keberpihakan.

GPT-4: Keupayaan dan Potensi

GPT-4 bukan hanya sebuah pencari fakta yang baik dan seorang yang pandai dalam ujian; ia juga seorang penterjemah yang hebat. Menurut para pengarang, GPT-4 dapat menterjemahkan maklumat pelepasan untuk seorang pesakit yang bertutur dalam bahasa Portugis dan memudahkan bahasa teknikal menjadi sesuatu yang mudah difahami oleh pelajar tingkatan enam.

Tetapi bukan hanya dalam bidang diagnosis sahaja GPT-4 menunjukkan harapan. Dalam buku ini, penulis menerangkan bagaimana GPT-4 boleh memberi doktor cadangan berguna mengenai sikap terhadap pesakit, memberikan panduan untuk lebih berhubung dengan pesakit.

Walau bagaimanapun, adalah penting untuk diambil perhatian bahawa GPT-4 tidaklah sempurna. Seperti yang diingatkan oleh pengarang, ia masih boleh membuat kesilapan dan ia belum mengambil Sumpah Hippokrat. Lebih-lebih lagi, teknologi AI, termasuk GPT-4, menimbulkan persoalan etika mengenai pengguguran pekerjaan dan privasi pesakit.

Kesimpulan: Masa Depan Kecerdasan Buatan dalam Perubatan

Walaupun terdapat beberapa batasan ini, kejayaan GPT-4 dalam mendiagnosis penyakit-penyakit perubatan membawa kepada peluang yang mengujakan untuk teknologi AI dalam perubatan. Di masa depan, model-model AI seperti GPT-4 dapat membantu pengamal perubatan mendiagnosis penyakit-penyakit jarang, menerjemahkan jargon perubatan, dan memberikan penjagaan yang lebih baik kepada pesakit. Namun, adalah penting bahawa model-model AI ini dibangunkan dan diuji dengan pertimbangan etika yang sewajarnya.

Artikel Berkaitan

Lihat Lebih Banyak >>

Buka kunci kuasa AI dengan HIX.AI!