U-Turn oleh OpenAI: Tidak Melatih GPT-4 Menggunakan Data Pelanggan API

Dalam perubahan penting daripada amalan sebelumnya, OpenAI telah mengumumkan bahawa ia tidak akan lagi menggunakan data pelanggan yang dihantar melalui API-nya untuk melatih model bahasa yang luas seperti GPT-4.

Perubahan ini telah disahkan oleh Sam Altman, CEO OpenAI, dalam satu temubual baru-baru ini dengan CNBC.

Pendekatan Baru OpenAI terhadap Data Pengguna

Perubahan dasar OpenAI diumumkan pada tanggal 1 Maret 2023, saat perusahaan tanpa banyak bicara memperbarui syarat dan ketentuan layanan mereka untuk mencerminkan komitmen baru terhadap privasi pengguna.

Altman mengklarifikasi, "Jelas pelanggan tidak mahu kami melatih menggunakan data mereka, jadi kami telah menukar rancangan kami: Kami tidak akan melakukannya."

API, atau antara muka pengaturcaraan aplikasi, adalah rangkaian teknologi yang membolehkan pelanggan untuk berhubung terus ke perisian OpenAI.

Altman menyatakan bahawa OpenAI tidak menggunakan data API untuk latihan model "sejak lama", menunjukkan bahawa pengumuman rasmi ini mengesahkan praktik yang telah ada.

Akibat Bagi Pelanggan Perniagaan

Langkah OpenAI memiliki implikasi yang luas, terutama bagi pelanggan bisnisnya, yang termasuk perusahaan besar seperti Microsoft, Salesforce, dan Snapchat.

Syarikat-syarikat ini lebih cenderung menggunakan kemampuan API OpenAI untuk operasi mereka, oleh itu peralihan privasi dan perlindungan data ini adalah penting untuk mereka.

Bagaimanapun, langkah-langkah perlindungan data baru hanya terpakai kepada pelanggan yang menggunakan perkhidmatan API syarikat. Terkini, terma perkhidmatan OpenAI menyatakan, "Kami mungkin menggunakan Kandungan dari Perkhidmatan lain selain API kami."

Karena itu, bentuk input data lainnya, seperti teks yang dimasukkan ke dalam chatbot populer ChatGPT, masih dapat digunakan oleh OpenAI kecuali data tersebut dibagikan melalui API.

Kesan yang Lebih Meluas ke dalam Industri

Perubahan dasar OpenAI ini berlaku ketika industri menghadapi potensi impak model bahasa besar, seperti ChatGPT OpenAI, menggantikan material yang biasanya dicipta oleh manusia.

Sebagai contoh, Persatuan Penulis Amerika (Writers Guild of America) baru-baru ini memulakan mogok setelah perundingan antara Persatuan dan studio filem terhenti. Persatuan telah memperjuangkan sekatan penggunaan ChatGPT OpenAI untuk penghasilan skrip atau penyuntingan semula.

Keputusan OpenAI untuk tidak menggunakan data pelanggan untuk latihan menandakan satu titik penting dalam perbincangan yang sedang berlangsung tentang privasi data dan AI. Dalam mempelajari dan menerokai teknologi AI, memastikan privasi pengguna dan mengekalkan kepercayaan kemungkinan akan kekal menjadi fokus utama dalam perbincangan ini.

Evolusi ChatGPT: GPT-3 ke GPT-4

Perlu dicatat bahawa komitmen OpenAI untuk tidak menggunakan data pelanggan untuk latihan adalah berkenaan model bahasa terkini mereka, GPT-4, yang dikeluarkan pada 14 Mac 2023.

GPT-4 memperkenalkan beberapa peningkatan dibandingkan dengan pendahulunya, yaitu GPT-3, termasuk peningkatan ukuran batas kata yang signifikan (25.000 dibandingkan dengan batas kata 3.000 dari ChatGPT), ukuran jendela konteks yang lebih besar, dan kemampuan penalaran dan pemahaman yang lebih baik.

Satu ciri penting yang lain bagi GPT-4 adalah multimodaliti, atau keupayaan untuk memahami dan menafsir maklumat dari imej selain daripada teks. Model terkini ini menghasilkan teks yang lebih mirip manusia, dengan menggunakan ciri-ciri seperti emoji untuk memberikan perasaan yang lebih peribadi.

Walau bagaimanapun, saiz dan seni binaan sebenar GPT-4 masih dirahsiakan, menyebabkan spekulasi tentang butiran model tersebut.

Walaupun khabar angin tersebut, CEO OpenAI telah menafikan dakwaan khusus mengenai saiz model ini.

Berkenaan dengan prestasi, GPT-4 telah menunjukkan kelebihan dalam penjanaan teks tetapi juga ada beberapa kelemahan. Sebagai contoh, ia mendapat peratusan ke-54 dalam Penilaian Rekod Ijazah (GRE) Penulisan dan berada dalam peratusan ke-43 hingga ke-59 dalam peperiksaan Pengiraan AP Calculus BC.

Selain itu, ia berprestasi dengan baik dalam tugas pengkodean Leetcode yang mudah, tetapi prestasinya menurun dengan peningkatan kesulitan tugas.

Manakala butiran proses latihan GPT-4 tidak didokumentasikan secara rasmi, diketahui bahawa model GPT secara umum melibatkan pembelajaran mesin berleluasa dengan pelbagai jenis teks dalam internet.

Mengharapkan Kemajuan

Sebagai hasil daripada perubahan kepada polisi penggunaan data OpenAI, data yang digunakan untuk melatih model bahasa tidak termasuk maklumat yang dikongsi melalui API kecuali pengguna secara jelas bersetuju untuk menyumbangnya bagi tujuan ini.

Sementara teknologi ini terus berkembang dan semakin memainkan peran yang lebih signifikan dalam kehidupan kita, menarik melihat bagaimana perusahaan mengubah arah dan merespons kekhawatiran tentang menjaga data agar tetap privat dan memperoleh kepercayaan masyarakat.

Umpatan U-turn OpenAI: Tidak Melatih GPT-4 Berdasarkan Data Pelanggan API

Pendekatan Baru OpenAI terhadap Data Pengguna

Akibat Bagi Pelanggan Perniagaan

Kesan yang Lebih Meluas ke dalam Industri

Evolusi ChatGPT: GPT-3 ke GPT-4

Mengharapkan Kemajuan

Artikel Berkaitan