Manus mencapai prestasi luar biasa dalam Benchmark GAIA
Baru-baru ini, Manus mencapai hasil yang luar biasa dalam pengujian Benchmark GAIA, dengan kinerjanya melampaui model bahasa besar sekelas. Ini berarti Manus dapat menyelesaikan tugas-tugas kompleks secara mandiri, seperti negosiasi bisnis lintas negara, yang mencakup pemecahan klausul kontrak, prediksi strategi, pengembangan rencana, bahkan mengoordinasikan tim hukum dan keuangan.
Keunggulan Manus terutama terletak pada tiga aspek: kemampuan pemecahan tujuan dinamis, kemampuan penalaran lintas moda, dan kemampuan pembelajaran yang ditingkatkan oleh memori. Ia dapat membagi tugas besar menjadi ratusan sub-tugas yang dapat dieksekusi, sekaligus menangani berbagai jenis data, dan terus meningkatkan efisiensi pengambilan keputusan serta mengurangi tingkat kesalahan melalui pembelajaran penguatan.
Kemajuan ini sekali lagi memicu diskusi di industri tentang jalur evolusi AI: Apakah masa depan akan dikuasai oleh AGI atau MAS yang bekerja sama? Konsep desain Manus mengandung dua kemungkinan: yang pertama adalah jalur AGI yang mendekati kemampuan pengambilan keputusan komprehensif manusia melalui peningkatan berkelanjutan pada tingkat kecerdasan tunggal; yang kedua adalah jalur MAS yang bertindak sebagai koordinator super, memimpin ribuan Agen di bidang vertikal untuk bekerja sama.
Perdebatan ini sebenarnya mencerminkan inti dari kontradiksi antara efisiensi dan keamanan dalam perkembangan AI. Semakin dekat kecerdasan tunggal dengan AGI, semakin tinggi risiko pengambilan keputusan yang tidak transparan; sementara kolaborasi Multi-Agent dapat mengurangi risiko, namun mungkin kehilangan momen pengambilan keputusan penting karena keterlambatan komunikasi.
Evolusi Manus juga memperbesar risiko inheren dalam pengembangan AI, seperti privasi data, bias algoritma, dan serangan adversarial. Misalnya, dalam konteks medis, Manus perlu mengakses data genom pasien secara real-time; dalam negosiasi keuangan, mungkin melibatkan informasi laporan keuangan perusahaan yang belum dipublikasikan. Dalam negosiasi rekrutmen, mungkin memberikan saran gaji yang di bawah rata-rata untuk kandidat dari etnis tertentu; dalam peninjauan kontrak hukum, tingkat kesalahan dalam menilai ketentuan industri yang baru muncul mungkin mendekati setengah. Selain itu, peretas juga dapat memasukkan frekuensi suara tertentu, sehingga Manus salah menilai rentang penawaran lawan dalam negosiasi.
Tantangan ini menyoroti sebuah realitas yang serius: semakin pintar sistem, semakin luas pula permukaan serangannya.
Dalam bidang Web3, keamanan selalu menjadi topik yang sangat diperhatikan. Berdasarkan kerangka segitiga yang tidak mungkin yang diajukan oleh Vitalik Buterin (jaringan blockchain tidak dapat mencapai keamanan, desentralisasi, dan skalabilitas secara bersamaan), berbagai metode kriptografi telah muncul:
Model Keamanan Zero Trust: Konsep inti adalah "tidak mempercayai siapa pun, selalu melakukan verifikasi", menekankan verifikasi dan otorisasi identitas yang ketat untuk setiap permintaan akses.
Identitas Terdesentralisasi (DID): seperangkat standar pengidentifikasi yang memungkinkan entitas untuk mendapatkan pengenalan dengan cara yang dapat diverifikasi dan tahan lama, tanpa memerlukan registri terpusat.
Enkripsi Homomorfik Penuh (FHE): Memungkinkan melakukan perhitungan acak pada data terenkripsi tanpa mendekripsi data, cocok untuk skenario seperti komputasi awan dan outsourcing data.
Di antara mereka, enkripsi homomorfik sepenuhnya dianggap sebagai alat yang kuat untuk mengatasi masalah keamanan di era AI. Ini dapat berfungsi pada beberapa tingkat berikut:
Tingkat data: Semua informasi yang dimasukkan pengguna (termasuk fitur biometrik, nada suara) diproses dalam keadaan terenkripsi, bahkan sistem AI itu sendiri tidak dapat mendekripsi data asli.
Tingkat algoritma: Mewujudkan "pelatihan model terenkripsi" melalui FHE, bahkan pengembang pun tidak dapat mengintip jalur keputusan AI.
Tingkat kolaborasi: Beberapa Agent berkomunikasi menggunakan enkripsi ambang, satu node yang diretas tidak akan menyebabkan kebocoran data global.
Dalam bidang keamanan Web3, beberapa proyek telah mulai mengeksplorasi teknologi ini:
uPort diluncurkan pada tahun 2017 di jaringan utama Ethereum, merupakan salah satu proyek identitas terdesentralisasi yang lebih awal.
NKN meluncurkan mainnet-nya pada tahun 2019, berkomitmen untuk penerapan model keamanan tanpa kepercayaan.
Mind Network adalah proyek FHE pertama yang diluncurkan di mainnet dan bekerja sama dengan sejumlah lembaga terkenal.
Meskipun proyek keamanan ini mungkin tidak mendapat perhatian sebesar beberapa proyek spekulatif, mereka sangat penting untuk membangun ekosistem Web3 yang aman.
Seiring dengan teknologi AI yang semakin mendekati tingkat kecerdasan manusia, sistem pertahanan non-tradisional menjadi semakin penting. Teknologi seperti FHE tidak hanya dapat menyelesaikan tantangan keamanan saat ini, tetapi juga membangun fondasi untuk era AI kuat di masa depan. Dalam perjalanan menuju AGI, teknologi keamanan ini bukan lagi pilihan, melainkan kebutuhan untuk bertahan.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Prestasi terobosan Manus memicu kontroversi tentang jalur perkembangan AI dan keamanan. FHE dapat menjadi solusi kunci Web3.
Manus mencapai prestasi luar biasa dalam Benchmark GAIA
Baru-baru ini, Manus mencapai hasil yang luar biasa dalam pengujian Benchmark GAIA, dengan kinerjanya melampaui model bahasa besar sekelas. Ini berarti Manus dapat menyelesaikan tugas-tugas kompleks secara mandiri, seperti negosiasi bisnis lintas negara, yang mencakup pemecahan klausul kontrak, prediksi strategi, pengembangan rencana, bahkan mengoordinasikan tim hukum dan keuangan.
Keunggulan Manus terutama terletak pada tiga aspek: kemampuan pemecahan tujuan dinamis, kemampuan penalaran lintas moda, dan kemampuan pembelajaran yang ditingkatkan oleh memori. Ia dapat membagi tugas besar menjadi ratusan sub-tugas yang dapat dieksekusi, sekaligus menangani berbagai jenis data, dan terus meningkatkan efisiensi pengambilan keputusan serta mengurangi tingkat kesalahan melalui pembelajaran penguatan.
Kemajuan ini sekali lagi memicu diskusi di industri tentang jalur evolusi AI: Apakah masa depan akan dikuasai oleh AGI atau MAS yang bekerja sama? Konsep desain Manus mengandung dua kemungkinan: yang pertama adalah jalur AGI yang mendekati kemampuan pengambilan keputusan komprehensif manusia melalui peningkatan berkelanjutan pada tingkat kecerdasan tunggal; yang kedua adalah jalur MAS yang bertindak sebagai koordinator super, memimpin ribuan Agen di bidang vertikal untuk bekerja sama.
Perdebatan ini sebenarnya mencerminkan inti dari kontradiksi antara efisiensi dan keamanan dalam perkembangan AI. Semakin dekat kecerdasan tunggal dengan AGI, semakin tinggi risiko pengambilan keputusan yang tidak transparan; sementara kolaborasi Multi-Agent dapat mengurangi risiko, namun mungkin kehilangan momen pengambilan keputusan penting karena keterlambatan komunikasi.
Evolusi Manus juga memperbesar risiko inheren dalam pengembangan AI, seperti privasi data, bias algoritma, dan serangan adversarial. Misalnya, dalam konteks medis, Manus perlu mengakses data genom pasien secara real-time; dalam negosiasi keuangan, mungkin melibatkan informasi laporan keuangan perusahaan yang belum dipublikasikan. Dalam negosiasi rekrutmen, mungkin memberikan saran gaji yang di bawah rata-rata untuk kandidat dari etnis tertentu; dalam peninjauan kontrak hukum, tingkat kesalahan dalam menilai ketentuan industri yang baru muncul mungkin mendekati setengah. Selain itu, peretas juga dapat memasukkan frekuensi suara tertentu, sehingga Manus salah menilai rentang penawaran lawan dalam negosiasi.
Tantangan ini menyoroti sebuah realitas yang serius: semakin pintar sistem, semakin luas pula permukaan serangannya.
Dalam bidang Web3, keamanan selalu menjadi topik yang sangat diperhatikan. Berdasarkan kerangka segitiga yang tidak mungkin yang diajukan oleh Vitalik Buterin (jaringan blockchain tidak dapat mencapai keamanan, desentralisasi, dan skalabilitas secara bersamaan), berbagai metode kriptografi telah muncul:
Model Keamanan Zero Trust: Konsep inti adalah "tidak mempercayai siapa pun, selalu melakukan verifikasi", menekankan verifikasi dan otorisasi identitas yang ketat untuk setiap permintaan akses.
Identitas Terdesentralisasi (DID): seperangkat standar pengidentifikasi yang memungkinkan entitas untuk mendapatkan pengenalan dengan cara yang dapat diverifikasi dan tahan lama, tanpa memerlukan registri terpusat.
Enkripsi Homomorfik Penuh (FHE): Memungkinkan melakukan perhitungan acak pada data terenkripsi tanpa mendekripsi data, cocok untuk skenario seperti komputasi awan dan outsourcing data.
Di antara mereka, enkripsi homomorfik sepenuhnya dianggap sebagai alat yang kuat untuk mengatasi masalah keamanan di era AI. Ini dapat berfungsi pada beberapa tingkat berikut:
Tingkat data: Semua informasi yang dimasukkan pengguna (termasuk fitur biometrik, nada suara) diproses dalam keadaan terenkripsi, bahkan sistem AI itu sendiri tidak dapat mendekripsi data asli.
Tingkat algoritma: Mewujudkan "pelatihan model terenkripsi" melalui FHE, bahkan pengembang pun tidak dapat mengintip jalur keputusan AI.
Tingkat kolaborasi: Beberapa Agent berkomunikasi menggunakan enkripsi ambang, satu node yang diretas tidak akan menyebabkan kebocoran data global.
Dalam bidang keamanan Web3, beberapa proyek telah mulai mengeksplorasi teknologi ini:
Meskipun proyek keamanan ini mungkin tidak mendapat perhatian sebesar beberapa proyek spekulatif, mereka sangat penting untuk membangun ekosistem Web3 yang aman.
Seiring dengan teknologi AI yang semakin mendekati tingkat kecerdasan manusia, sistem pertahanan non-tradisional menjadi semakin penting. Teknologi seperti FHE tidak hanya dapat menyelesaikan tantangan keamanan saat ini, tetapi juga membangun fondasi untuk era AI kuat di masa depan. Dalam perjalanan menuju AGI, teknologi keamanan ini bukan lagi pilihan, melainkan kebutuhan untuk bertahan.