
- sebulan lalu
Instagram hadirkan fitur dan program baru seperti Edits, Trial Reels, dan Drafts untuk mendukung kreator lebih bebas berekspresi tanpa tekanan.
OpenAI meluncurkan o3-mini, model kecerdasan buatan (AI) reasoning terbaru dalam keluarga model o mereka. Peluncuran ini dilakukan di tengah upaya OpenAI untuk terus berinovasi dan mempertahankan posisinya di pasar AI yang semakin kompetitif.
Tidak seperti kebanyakan model bahasa besar (LLM), model penalaran seperti o3-mini melakukan pemeriksaan fakta secara menyeluruh sebelum memberikan hasil. Hal ini membantu mereka menghindari beberapa kesalahan yang umumnya menjebak model lain.
Meskipun model penalaran membutuhkan waktu lebih lama untuk mencapai solusi, mereka cenderung lebih andal meskipun tidak sempurna dalam bidang-bidang seperti fisika, sains, dan matematika.
OpenAI memposisikan o3-mini sebagai model yang powerfull dan terjangkau. Model ini juga bertujuan untuk menyaingi dominasi model model dari Deepseek yang menawarkan kombinasi antara efisiensi dan kapabilitas yang tinggi pula.
Kamu bisa cek perbedaan model DeepSeek dengan ChatGPT pada artikel perbandingan DeepSeek dan ChatGPT untuk mengetahui lebih detailnya.
O3-mini telah di-fine-tune untuk masalah-masalah STEM (sains, teknologi, teknik, matematika), khususnya untuk pemrograman, matematika, dan sains. OpenAI mengklaim bahwa model ini sebagian besar setara dengan keluarga o1, o1 dan o1-mini, dalam hal kemampuan, tetapi berjalan lebih cepat dan lebih murah.
Perusahaan juga mengklaim bahwa penguji eksternal lebih menyukai jawaban o3-mini dibandingkan dengan o1-mini pada lebih dari separuh pengujian. O3-mini juga tampaknya membuat 39% lebih sedikit kesalahan pada pertanyaan dunia nyata yang sulit dalam pengujian A/B dibandingkan o1-mini, dan menghasilkan respons yang lebih jelas sembari memberikan jawaban sekitar 24% lebih cepat.
O3-mini akan tersedia untuk semua pengguna melalui ChatGPT mulai hari Jumat, tetapi pengguna yang membayar untuk paket ChatGPT Plus dan Team akan mendapatkan batas rate yang lebih tinggi, yaitu 150 query (permintaan) per hari.
Pelanggan ChatGPT Pro akan mendapatkan akses tanpa batas, dan o3-mini akan hadir untuk pelanggan ChatGPT Enterprise dan ChatGPT Edu dalam seminggu.
Pengguna dengan paket premium dapat memilih o3-mini menggunakan menu drop-down ChatGPT. Pengguna gratis dapat mengeklik atau mengetuk tombol "Reason" baru di bilah chat, atau meminta ChatGPT untuk membuat ulang jawaban.
Mulai hari Jumat, o3-mini juga akan tersedia melalui API OpenAI untuk developer terpilih, tetapi pada awalnya tidak akan memiliki dukungan untuk menganalisis gambar. Para developer dapat memilih tingkat upaya reasoning (rendah, sedang, atau tinggi) untuk membuat o3-mini berpikir lebih keras berdasarkan kasus penggunaan dan kebutuhan latensi mereka.
O3-mini dihargai $0,55 per 1 juta token input cache dan $4,40 per 1 juta token output, di mana satu juta token setara dengan sekitar 750.000 kata. Harga ini 63% lebih murah daripada o1-mini dan kompetitif dengan harga model penalaran R1 dari DeepSeek yang sebelumnya hadir dengan dominasinya dipasaran.
Dalam ChatGPT, o3-mini diatur ke upaya penalaran sedang, yang menurut OpenAI memberikan solusi yang seimbang antara kecepatan dan akurasi. Pengguna berbayar akan memiliki opsi untuk memilih "o3-mini-high" pada pemilih model, yang akan memberikan apa yang OpenAI sebut sebagai "kecerdasan lebih tinggi" dengan kompensasi respons yang lebih lambat.
Terlepas dari versi o3-mini mana yang dipilih pengguna ChatGPT, model ini akan bekerja dengan pencarian untuk menemukan jawaban terkini dengan link ke sumber web yang relevan.
OpenAI memperingatkan bahwa fungsionalitas ini hanyalah sebuah prototipe karena mereka berupaya untuk mengintegrasikan pencarian di seluruh model penalaran mereka.
"Meskipun o1 tetap menjadi model penalaran pengetahuan umum yang lebih luas, o3-mini menyediakan alternatif khusus untuk domain teknis yang membutuhkan presisi dan kecepatan," tulis OpenAI dalam postingan blog pada hari Jumat. "Peluncuran o3-mini menandai langkah lain dalam misi OpenAI untuk mendorong batas-batas kecerdasan yang hemat biaya."
Penting untuk dicatat bahwa o3-mini bukanlah model OpenAI yang paling kuat hingga saat ini, juga tidak melampaui model penalaran R1 DeepSeek pada beberapa tolok ukur pengujian.
O3-mini mengalahkan R1 pada AIME 2024, sebuah tes yang mengukur seberapa baik model memahami dan menanggapi instruksi yang kompleks, tetapi hanya dengan opsi penalaran yang tinggi.
O3-mini juga mengalahkan R1 pada tes yang berfokus pada pemrograman SWE-bench Verified (dengan selisih 0,1 poin), tetapi sekali lagi, hanya dengan upaya penalaran yang tinggi.
Pada upaya penalaran yang rendah, o3-mini tertinggal dari R1 pada GPQA Diamond, yang menguji model dengan pertanyaan fisika, biologi, dan kimia tingkat PhD. Namun, secara keseluruhan, o3-mini menjawab banyak query dengan biaya dan latensi rendah yang kompetitif.
OpenAI menegaskan bahwa o3-mini sama amannya atau lebih aman daripada keluarga model o1, berkat upaya red-teaming dan metodologi "penyelarasan deliberatif" yang membuat model berpikir tentang kebijakan keselamatan OpenAI saat mereka menanggapi query. Menurut perusahaan, o3-mini "secara signifikan melampaui" salah satu model andalan OpenAI, GPT-4o, pada evaluasi keamanan dan jailbreak.
Dengan merilis o3-mini, OpenAI berusaha menawarkan alternatif yang lebih terjangkau dan efisien dalam model penalaran AI. Model ini menjanjikan kinerja yang bersaing dalam domain STEM dengan biaya yang lebih rendah, menjadikannya pilihan yang menarik bagi pengguna individu, pengembang, dan organisasi yang memiliki anggaran terbatas.
Namun, perlu diingat bahwa meskipun terdapat peningkatan dari model sebelumnya, masih ada tantangan di berbagai ranah yang perlu diatasi. Persaingan untuk menyediakan layanan terbaik dengan harga yang terjangkau ini diperkirakan akan terus berlanjut.