OpenAI GPT-4 Tiba di Pertengahan-Maret 2023

gpt-4-640b66db8c60d-sej-1520x800.jpg

CTO Microsoft Germany, Andreas Braun, mengesahkan bahawa GPT-4 akan dilancarkan dalam tempoh seminggu selepas 9 Mac 2023 dan ianya akan menjadi multimodal. Multimodal AI bermaksud ia akan mampu beroperasi dengan pelbagai jenis input, seperti video, imej dan bunyi.

Kemas kini: GPT-4 Dilancarkan pada 14 Mac 2023

OpenAI Telah Mengeluarkan GPT-4 pada 14 Mac 2023. Ini adalah model multimodal yang menerima promosi imej dan teks.

Modal merupakan frasa yang digunakan dalam pembelajaran mesin untuk merujuk kepada bentuk input seperti teks tetapi juga termasuk bunyi, visual, bau, dan lain-lain.

Pengumuman OpenAI menjelaskan tentang skala kemajuan GPT-4:

“...walaupun kurang cekap daripada manusia dalam banyak situasi dunia nyata, ia menunjukkan prestasi tahap manusia dalam pelbagai ukuran profesional dan akademik.

Sebagai contoh, ia lulus peperiksaan bar simulasi dengan skor kira-kira 10% teratas dalam penampilannya; sebaliknya, skor GPT-3.5 berada dalam 10% terbawah.

Kami telah mengambil masa 6 bulan untuk mengesan GPT-4 secara berulang kali menggunakan pengajaran daripada program ujian tantangan kami serta ChatGPT, menghasilkan hasil terbaik kami sepanjang masa (walaupun belum sempurna) dalam ketepatan fakta, kemampuan kawalan, dan mengekalkan garis panduan.”

Model Bahasa Multimodal yang Besar

Pentingnya pengumuman ini adalah bahawa GPT-4 adalah multimodal (SEJ meramalkan GPT-4 adalah multimodal pada Januari 2023).

Modality merujuk kepada jenis input yang (dalam kes ini) diproses oleh model bahasa yang besar.

Multimodal boleh merangkumi teks, ucapan, imej dan video.

GPT-3 dan GPT-3.5 hanya beroperasi dalam satu modaliti, teks.

Menurut laporan berita Jerman, GPT-4 mungkin dapat beroperasi dalam sekurang-kurangnya empat mod penjanaan, gambar, bunyi (pendengaran), teks dan video.

Dr. Andreas Braun, CTO Microsoft Germany dikutip:

"Kami akan memperkenalkan GPT-4 minggu depan, di sana kami akan memiliki model multimodal yang akan menawarkan kemungkinan yang benar-benar berbeda - misalnya video..."

Laporan itu kurang terperinci untuk GPT-4, jadi tidak jelas apakah apa yang dibagikan tentang multimodality itu khusus untuk GPT-4 atau hanya umum saja.

Pengarah Strategi Perniagaan Microsoft, Holger Kenn, menjelaskan multimodaliti tetapi laporan tersebut tidak jelas sama ada beliau merujuk kepada multimodaliti GPT-4 atau multimodaliti secara umum.

Saya percaya rujukannya kepada multimodaliti adalah khusus untuk GPT-4.

Berita tersebut menyatakan:

"Kenn menjelaskan tentang multimodal AI, yang dapat menterjemahkan teks tidak hanya menjadi gambar, tetapi juga menjadi musik dan video."

Sebuah fakta menarik lainnya adalah bahawa Microsoft sedang bekerja pada "metrik keyakinan" untuk mengakar AI mereka dengan fakta agar lebih dapat diandalkan.

Microsoft Kosmos-1

Ada sesuatu yang nampaknya tidak dilaporkan dengan cukup di Amerika Syarikat iaitu Microsoft merilis model bahasa multimodal yang dipanggil Kosmos-1 pada awal Mac 2023.

Menurut laporan dari situs berita Jerman, Heise.de:

“...pasukan tersebut menjalankan model yang telah dilatih kepada pelbagai ujian, dengan hasil yang baik dalam mengklasifikasikan imej, menjawab soalan mengenai kandungan imej, menamakan imej secara automatik, pengenalpastian teks optik dan tugas penghasilan pertuturan.

…Penalaran visual, iaitu membuat kesimpulan tentang imej tanpa menggunakan bahasa sebagai langkah perantara, nampaknya adalah kunci di sini…”

Kosmos-1 adalah satu mod multimoda yang menggabungkan modaliti tekst dan imej.

GPT-4 pergi lebih jauh daripada Kosmos-1 kerana ia menambahkan modaliti ketiga, video, dan juga nampaknya termasuk modaliti bunyi.

Bekerja Di Pelbagai Bahasa

GPT-4 kelihatan berfungsi dalam semua bahasa. Ia dikatakan mampu menerima soalan dalam bahasa Jerman dan menjawab dalam bahasa Itali.

Itu adalah contoh yang agak aneh kerana, siapa yang akan bertanya dalam bahasa Jerman dan ingin menerima jawaban dalam bahasa Itali?

Ini adalah apa yang telah disahkan:

“...teknologi ini sudah begitu maju sehingga praktis bisa “digunakan dalam semua bahasa”: Anda dapat bertanya dalam bahasa Jerman dan mendapatkan jawaban dalam bahasa Italia.

Dengan multimodalitas, Microsoft(-OpenAI) akan ‘membuat model-model ini komprehensif’.”

Saya percaya bahawa tujuan kemajuan ini adalah bahawa model ini melampaui bahasa dengan keupayaannya untuk mendapatkan pengetahuan melintasi pelbagai bahasa. Jadi jika jawapannya dalam Bahasa Itali, ia akan tahu dan dapat memberikan jawapan dalam bahasa di mana soalan tersebut ditanyakan.

Itu akan menjadikannya serupa dengan tujuan AI multimodal Google yang disebut MUM. MUM dikatakan dapat memberikan jawaban dalam Bahasa Inggeris walaupun data hanya tersedia dalam bahasa lain, seperti Jepun.

Aplikasi GPT-4

Tiada pengumuman semasa mengenai di mana GPT-4 akan muncul. Tetapi Azure-OpenAI telah disebut secara khusus.

Google sedang berusaha untuk mengejar Microsoft dengan mengintegrasikan teknologi yang bersaing ke dalam mesin pencarinya sendiri. Perkembangan ini lebih memperburuk persepsi bahwa Google tertinggal dan kurang kepemimpinan dalam AI untuk konsumen.

Google telah mengintegrasikan kecerdasan buatan (AI) ke dalam beberapa produk seperti Google Lens, Google Maps, dan bidang lain di mana pengguna berinteraksi dengan Google. Pendekatan ini adalah untuk memanfaatkan AI sebagai teknologi bantu, untuk membantu orang dalam tugas-tugas kecil.

Cara Microsoft melaksanakannya lebih terlihat dan akibatnya mengambil semua perhatian dan memperkuat gambaran bahwa Google sedang terhuyung-hayang dan berjuang untuk mengejar.

Baca pengumuman pelancaran rasmi OpenAI GPT-4 di sini.

Baca laporan asal dalam Bahasa Jerman di sini:

GPT-4 akan datang minggu depan - dan ia akan menjadi multimodal, kata Microsoft Germany

Artikel Berkaitan

Lihat Lebih Banyak >>

Buka kunci kuasa AI dengan HIX.AI!