
- sebulan lalu
nubia Pad Pro hadir dengan Snapdragon 8 Gen 3, layar 144Hz, AI audio, sistem pendingin, dan bonus pre-order menarik hingga 24 Juni 2025.
Pernah membayangkan robot membantu pekerjaan rumah tangga seperti menjemur pakaian atau merapikan meja? ByteDance, induk TikTok yang berbasis di Beijing, baru saja menghadirkan sebuah sistem canggih yang memungkinkan hal tersebut. Sistem bernama GR-3 ini diklaim mampu memahami perintah bahasa alami dan menerjemahkannya menjadi serangkaian tindakan nyata. Bukan sekadar konsep teoritis, robot bimanual bernama ByteMini bahkan sudah mampu memasukkan gantungan baju ke kaus lalu menempelkannya di rak. Menariknya, teknologi ini tetap berjalan lancar meskipun jenis pakaian yang digunakan saat uji coba berbeda dari data latihan awal.
Di situs resmi perusahaan, GR-3 digambarkan sebagai model vision-language-action berskala besar. Model ini memungkinkan robot melihat lingkungan sekitar, mengenali objek, dan mengeksekusi perintah yang diberikan secara lisan. Menurut keterangan yang diungkapkan Selasa lalu, robot bisa memahami instruksi untuk mengambil sebuah barang tertentu kemudian meletakkannya di lokasi spesifik. Tak hanya itu, robot dapat mengenali benda bukan saja dari namanya, tetapi juga ukurannya, seperti “piring yang lebih besar,” atau berdasarkan posisi, contohnya “yang ada di sebelah kiri.”
Lebih lanjut, pengembang GR-3 mengungkapkan bahwa robot dapat menyelesaikan tugas dengan satu perintah panjang. Sebagai contoh, “bersihkan meja makan” akan membuat robot bekerja secara mandiri, dari memindahkan barang-barang hingga merapikannya. Untuk mencapai hal ini, ByteDance menerapkan strategi pelatihan multifaset. Mereka memanfaatkan data vision-language yang sangat besar, data pergerakan manusia yang direkam melalui perangkat virtual reality, serta metode pembelajaran tiru (imitation learning) berbasis data pergerakan robot.
Salah satu aspek menarik adalah kemampuan robot menangani situasi yang belum pernah ditemui sebelumnya. Meskipun semua contoh pakaian yang digunakan dalam data latihan awal adalah lengan panjang, robot tetap bisa menangani kaus berlengan pendek saat demonstrasi. Ini mengisyaratkan kapabilitas adaptif yang lebih luas ketimbang sekadar mengikuti program statis.
Proyek ini dipimpin oleh departemen Seed di ByteDance, divisi khusus yang bertanggung jawab atas riset kecerdasan buatan dan pengembangan model bahasa berskala besar. Departemen tersebut didirikan pada 2023, tepat setelah OpenAI merilis ChatGPT pada akhir 2022. Saat ini, tim Seed membuka lebih dari 15 lowongan terkait robotika dan embodied intelligence, yaitu bidang yang menggabungkan AI ke dalam bentuk fisik untuk menangani tugas dunia nyata. Beberapa posisi pekerjaan bahkan menyebutkan bahwa perusahaan sedang mengerjakan “produk baru.”
Fokus ByteDance pada AI dan robotika sejalan dengan visi salah satu pendirinya, Zhang Yiming. Meskipun Zhang saat ini berbasis di Singapura dan tidak lagi terlibat dalam operasi harian, ia tetap melakukan perjalanan rutin ke Beijing untuk memantau riset di balik pengembangan teknologi ini. Zhang, yang melepas peran CEO dan ketua pada 2021, masih memegang kendali pada ranah keputusan strategis utama. Menurut laporan internal, kunjungan Zhang kerap berhubungan langsung dengan pertemuan tim AI inti ByteDance.
Langkah agresif ByteDance di bidang teknologi ini memperlihatkan bagaimana perusahaan terus bersaing dalam “perlombaan senjata” AI global, terutama setelah munculnya beragam penerapan kecerdasan buatan generatif.Dengan memadukan model vision-language hingga pembelajaran berdasarkan data virtual reality, GR-3 memberi gambaran masa depan kolaborasi antara robot dan manusia. Selain potensi dalam pekerjaan rumah tangga, pendekatan ini berpeluang diterapkan pada industri lain yang membutuhkan efisiensi dan presisi tinggi. Jika proyek terus berkembang, bukan tidak mungkin robot berbasiskan GR-3 akan digunakan secara luas dalam jangka waktu relatif singkat.