OpenAI memperkenalkan Deep Research, agen AI baru yang dirancang untuk membantu pengguna melakukan penelitian mendalam dan kompleks menggunakan platform chatbot berbasis AI mereka, ChatGPT.
Dalam sebuah blog post, OpenAI menjelaskan bahwa fitur ini ditujukan untuk orang-orang yang melakukan pekerjaan berbasis pengetahuan di bidang-bidang seperti keuangan, sains, kebijakan, dan teknik, serta membutuhkan riset yang menyeluruh, tepat, dan andal.
Selain itu, fitur ini juga berguna bagi siapa saja yang melakukan pembelian yang biasanya memerlukan riset cermat, seperti mobil, peralatan, dan perabotan.
Intinya, ChatGPT Deep Research dirancang untuk situasi di mana kamu tidak hanya menginginkan jawaban atau ringkasan singkat, tetapi perlu mempertimbangkan informasi dengan teliti dari berbagai situs web dan sumber lain.
OpenAI menyatakan bahwa Deep Research sudah tersedia bagi pengguna ChatGPT Pro, dengan batasan 100 query (permintaan) per bulan. Selanjutnya, dukungan untuk pengguna Plus dan Team akan menyusul, diikuti oleh pengguna Enterprise.
OpenAI menargetkan peluncuran untuk pengguna Plus dalam waktu sekitar satu bulan dari sekarang dan berjanji bahwa batas query untuk pengguna berbayar akan jauh lebih tinggi segera.
Saat ini, peluncuran fitur ini juga dibatasi secara geografis dan belum ada jadwal untuk ketersediaan bagi pelanggan ChatGPT di Inggris, Swiss, dan Wilayah Ekonomi Eropa.
Untuk menggunakan ChatGPT Deep Research, kamu cukup memilih "Deep Research" di composer dan memasukkan query, dengan opsi untuk melampirkan file atau spreadsheet. Perlu diingat, fitur ini hanya tersedia melalui web untuk saat ini.
Integrasi aplikasi mobile dan desktop akan dilakukan di akhir bulan ini. Setelah melakukan ini, Deep Research akan memproses data dan ini dapat memakan waktu lima hingga 30 menit untuk memberikan jawaban, dan kamu akan menerima notifikasi setelah pencarian selesai.
Saat ini, output ChatGPT Deep Research hanya berupa teks. Namun, OpenAI berencana untuk segera menambahkan gambar, visualisasi data, dan output analitik lainnya yang tersemat. Selain itu, mereka juga berencana untuk menghubungkan sumber data yang lebih terspesialisasi, termasuk berbasis langganan dan sumber internal.
Fitur ini secara tidak langsung meningkatkan kapabilitas dari Chatbot AI ini setelah sebelumnya DeepSeek sempat unggul jauh seperti yang sebelumnya kami ulas pada artikel DeepSeek yang menggeser ChatGPT.
Pertanyaan pentingnya adalah, seberapa tepatkah ChatGPT Deep Research? Bagaimanapun, AI bukanlah teknologi yang sempurna dan rentan terhadap halusinasi dan jenis kesalahan lainnya yang dapat sangat berbahaya dalam skenario penelitian mendalam.
Karena itulah OpenAI mengklaim setiap output ChatGPT Deep Research akan didokumentasikan sepenuhnya, dengan kutipan yang jelas dan ringkasan pemikiran, sehingga memudahkan untuk mereferensi dan memverifikasi informasi.
Saat ini, masih belum jelas apakah langkah-langkah mitigasi tersebut akan cukup untuk memerangi kesalahan AI. Fitur pencarian web bertenaga AI OpenAI di ChatGPT, ChatGPT Search, tidak jarang membuat kesalahan dan memberikan jawaban yang salah atas pertanyaan.
Untuk meningkatkan akurasi Deep Research, OpenAI menggunakan versi khusus dari model penalaran (Reasoning) o3 yang baru saja diumumkan. Model ini dilatih melalui reinforcement learning.
OpenAI menguji ChatGPT Deep Research menggunakan Humanity's Last Exam, sebuah evaluasi yang mencakup lebih dari 3.000 pertanyaan tingkat ahli dalam berbagai bidang akademik.
Model o3 yang mendukung Deep Research mencapai akurasi 26,6%, yang mungkin terlihat seperti nilai yang gagal. Namun, Humanity's Last Exam dirancang lebih sulit daripada benchmark lainnya untuk tetap selangkah lebih maju dari kemajuan model. Menurut OpenAI, model Deep Research o3 jauh lebih unggul dari Gemini Thinking (6,2%), Grok-2 (3,8%), dan GPT-4o (3,3%).
Meskipun demikian, OpenAI mengakui bahwa ChatGPT Deep Research memiliki keterbatasan, dan terkadang membuat kesalahan serta kesimpulan yang salah. Deep Research mungkin kesulitan membedakan informasi yang otoritatif dari rumor, dan sering kali gagal menyampaikan ketika tidak yakin tentang sesuatu - serta dapat membuat kesalahan format dalam laporan dan kutipan.
Meskipun begitu, adanya keluaran yang mendalam dan didukung oleh kutipan yang baik ini mungkin terdengar lebih menarik dan jujur daripada rangkuman chatbot sederhana tanpa sumber yang jelas.
Jika semua ini terdengar familiar, Google sebenarnya mengumumkan fitur AI serupa dengan nama yang sama kurang dari dua bulan lalu. Persaingan untuk menghadirkan fitur yang dapat memberikan insight terbaik bagi konsumen akan terus berjalan.