Infodigital.co.id

Ini 6 Keunggulan o3-mini dari OpenAI

Pengguna Pro pun akan memiliki akses tak terbatas ke o3-mini dan o3-mini-high.

Keunggulan untuk STEM

Mirip dengan pendahulunya OpenAI o1, OpenAI o3-mini telah dioptimalkan untuk alasan STEM. o3-mini dengan upaya penalaran sedang menyamai kinerja o1 dalam matematika, pengkodean, dan sains, sekaligus memberikan respons yang lebih cepat.

Evaluasi yang dilakukan oleh penguji ahli pun menunjukkan bahwa o3-mini menghasilkan jawaban yang lebih akurat dan jelas, dengan kemampuan penalaran yang lebih kuat dibandingkan OpenAI o1-mini.

Penguji lebih menyukai respons o3-mini dibandingkan o1-mini sebanyak 56% dan mengamati penurunan kesalahan besar sebesar 39% pada pertanyaan sulit di dunia nyata.

Dengan upaya penalaran sedang, o3-mini juga menyamai kinerja o1 pada beberapa evaluasi penalaran dan kecerdasan yang paling menantang, termasuk American Invitational Mathematics Examination (AIME) dan Graduate-Level Google-Proof Q&A (GPQA).

Kecepatan dan Kinerja Model

Dengan kecerdasan yang sebanding dengan OpenAI o1, OpenAI o3-mini pun mampu menghadirkan kinerja yang lebih cepat dan peningkatan efisiensi.

Di luar evaluasi STEM yang disorot di atas, o3-mini menunjukkan hasil yang unggul dalam evaluasi matematika dan faktualitas tambahan dengan upaya penalaran sedang.

Dalam pengujian A/B, o3-mini memberikan respons 24% lebih cepat dibandingkan o1-mini dengan waktu respons rata-rata 7,7 detik dibandingkan 10,16 detik.

Masalah Keamanan

Sementara itu, salah satu teknik utama yang OpenAI gunakan untuk mengajarkan OpenAI o3-mini agar merespons dengan aman adalah penyelarasan yang disengaja.

Jadi, OpenAI melatih model untuk mempertimbangkan spesifikasi keselamatan yang ditulis manusia sebelum menjawab perintah para penggunanya.

“Mirip dengan OpenAI o1, kami menemukan bahwa o3-mini secara signifikan melampaui GPT-4o dalam hal evaluasi keamanan dan jailbreak yang menantang,” ungkap OpenAI.

Sebelum penerapan, OpenAI pun dengan cermat menilai risiko keselamatan o3-mini menggunakan pendekatan yang sama terhadap kesiapsiagaan, tim merah eksternal, dan evaluasi keselamatan seperti o1.

“Karena itu, kami berterima kasih kepada penguji keamanan yang mengajukan permohonan untuk menguji o3-mini di akses awal,” katanya.

Hemat Biaya

Sepertinya menyinggung keunggulan DeepSeek, model AI asal  China, peluncuran OpenAI o3-mini pun disebut menandai langkah lain dalam misi OpenAI untuk mendorong batas-batas kecerdasan buatan yang hemat biaya.

Dengan mengoptimalkan pertimbangan untuk domain STEM sekaligus menjaga biaya tetap rendah, OpenAI membuat AI berkualitas tinggi menjadi lebih mudah diakses.

Model ini melanjutkan rekam jejak OpenAI dalam menurunkan biaya intelijen yang mengurangi harga per token sebesar 95% sejak peluncuran GPT-4, sambil mempertahankan kemampuan penalaran tingkat atas.

“Seiring dengan meluasnya adopsi AI, kami tetap berkomitmen untuk menjadi yang terdepan, membangun model yang menyeimbangkan kecerdasan, efisiensi, dan keselamatan dalam skala besar,” pungkas OpenAI. (bdm)

Halaman: 1 2
Komentar

Iklan