Bolehke ChatGPT lulus Peperiksaan Peguam Negara?

ChatGPT dan Peperiksaan Bar

Pelbagai ujian bar adalah ujian yang mencabar yang menilai pengetahuan dan keupayaan penalaran melalui esei, ujian prestasi, dan soalan pilihan berganda. Ia adalah ujian piawai yang digunakan oleh banyak bidang kuasa di Amerika Syarikat sebagai sebahagian daripada proses penerimaan bar mereka. Ia terdiri daripada tiga bahagian yang menilai pengetahuan calon terhadap prinsip undang-undang am, keupayaan untuk mengaplikasikan prinsip undang-undang kepada pola fakta yang spesifik, dan keupayaan untuk menyelesaikan tugas undang-undang.

Ujian ini direka untuk membolehkan peguam mendapat lesen di beberapa negeri tanpa perlu mengambil semula peperiksaan bar bagi setiap negeri. Skor lulus ditetapkan oleh setiap bidang kuasa, dan skor peperiksaan boleh dipindah ke bidang kuasa negeri lain, tertakluk kepada peraturan dan keperluan setiap bidang kuasa.

GPT-3.5 dan GPT-4, model bahasa besar OpenAI yang dibangunkan di atasnya ChatGPT, mempunyai keupayaan untuk menyelesaikan tugasan yang sukar yang memerlukan pengetahuan undang-undang yang meluas, pemahaman membaca, dan kecekapan menulis, sehingga tahap di mana mereka boleh mencapai piawaian peguam manusia di hampir semua bidang kuasa Amerika Syarikat. Persidangan Kebangsaan Pemeriksa Bar, yang mencipta bahagian pilihan ganda, telah mencatatkan bahawa peguam mempunyai kebolehan unik yang diperoleh melalui pendidikan dan amalan, yang ketika ini tidak dapat ditandingi oleh kecerdasan buatan.

Bagaimana prestasi ChatGPT dalam Peperiksaan Bar?

Pada awal tahun ini, kajian yang dijalankan oleh profesor dari Illinois Tech dan Michigan State College of Law menunjukkan bahawa ChatGPT 3.5 dapat mencapai kadar lulus dalam dua kategori peperiksaan bar multinegara (MBE) dan berprestasi dengan cara yang serupa dengan peserta ujian manusia dalam satu lagi kategori, menunjukkan pemahaman amnya dalam bidang undang-undang. Dalam kajian yang lain yang dijalankan oleh penyelidik OpenAI sendiri, ChatGPT berprestasi dengan baik dalam peperiksaan bar dan mendapatkan skor dalam peratusan ke-90 dalam kajian tersebut. ChatGPT hampir dapat menjawab dengan betul sebanyak 76% soalan pilihan pelbagai, meningkat daripada kadar 50% ChatGPT sebelum ini, dan melebihi prestasi rata-rata peserta ujian manusia sebanyak lebih daripada 7%.

ChatGPT mampu menghasilkan respons esei dan ujian prestasi yang kebanyakan relevan dan berkaitan secara logik. Ambang lulus ujian peguam bervariasi dari negeri ke negeri, dan di New York, skor 266, yang berada di sekitar persentil ke-50, diperlukan untuk lulus. Hasil ChatGPT menunjukkan bahawa kemampuan model bahasa besar meluas kepada tugas kompleks yang memerlukan pengetahuan undang-undang yang signifikan, pemahaman, dan kemampuan menulis. Model-model ini memenuhi garis panduan yang digunakan oleh peguam manusia di hampir semua bidang kuasa di Amerika Syarikat.

Adakah ChatGPT telah lulus peperiksaan bar?

ChatGPT telah lulus Peperiksaan Bar Seragam.

Apa skor ujian bar atas 1%?

300 adalah lebih kurang peratusan ke-90 tertinggi manakala skor 330 adalah lebih kurang peratusan ke-1 tertinggi.

Artikel Berkaitan

Lihat Lebih Banyak >>

Buka kunci kuasa AI dengan HIX.AI!