24
May 2025

Claude 4 Mengubah Dunia Coding: AGI di Depan Mata 2027?

  • open
  • 0
  • 24 May 2025
  • 24 May 2025
Claude 4: Revolusi AI dalam Pemrograman dan Agentik

Kemampuan Luar Biasa Claude 4 sebagai Model Software Engineering

Douglas merupakan bagian kunci dari model Claude 4 Anthropic yang baru saja dirilis dan menunjukkan kemampuan luar biasa sebagai model rekayasa perangkat lunak1. Model ini tidak main-main dalam hal otonomi. Kemampuan Claude 4 sangat mengesankan karena mampu bekerja secara otonom dan independen dengan menemukan informasi yang dibutuhkan serta menjalankan beberapa tes secara mandiri dalam repositori kode besar2.

Otonomi dan Independensi dalam Coding

Kalau berbicara tentang kemandirian, Claude 4 Opus menunjukkan kemampuan luar biasa sebagai model rekayasa perangkat lunak yang dapat menangani tugas-tugas yang tidak terspesifikasi dengan jelas dalam repositori kode besar3. Ini bukan sekedar kemampuan biasa. Model tersebut benar-benar mampu mengotonomikan dirinya di dalam kompleksitas kode yang besar dan rumit.

Apa yang membuat Claude 4 istimewa adalah sifat "relentless" yang tidak mudah menyerah dalam menyelesaikan tugas dan mampu mengunduh library Python untuk menyelesaikan tugas Photoshop yang seharusnya tidak dapat dilakukan4. Bayangkan betapa pintarnya model ini!

Peningkatan Kompleksitas dan Konteks Model

Peningkatan kemampuan model Claude 4 terjadi pada dua sumbu yaitu kompleksitas intelektual absolut dari tugas dan jumlah konteks atau tindakan berturut-turut yang dapat dipahami secara bermakna5. Dua dimensi ini sangat penting. Horison waktu yang dapat ditangani model Claude 4 mengalami ekspansi yang signifikan dibandingkan model sebelumnya6.

Ekspansi Temporal dan Kontekstual

Kemampuan model untuk memahami konteks jangka panjang ini adalah sebuah lompatan besar. Bukan hanya sekedar memproses informasi, tetapi benar-benar memahami hubungan antar elemen dalam rentang waktu yang panjang. Model AI telah mendemonstrasikan pemahaman fisika yang bermakna dan dapat menggambarkan hiu Lego di bawah air dengan refleksi cahaya dan bayangan yang benar meski tidak pernah melihatnya sebelumnya7.

Dukungan Tools dan Fokus Pengembangan Coding Agents

Dukungan tools seperti Claude Code memungkinkan model memiliki akses ke semua alat yang diperlukan untuk bekerja secara berguna tanpa perlu copy-paste dari chat box8. Ini sangat revolusioner. Semua perusahaan besar termasuk Anthropic, GitHub, OpenAI, dan Google sedang fokus mengembangkan coding agents dengan tingkat otonomi dan asinkronitas yang lebih tinggi9.

Integrasi dengan Platform Pengembangan

Anthropic akan meluncurkan GitHub agency yang memungkinkan pengguna memanggil Claude di mana saja dalam GitHub10. Masa depan software engineering akan menyerupai permainan Starcraft dalam hal koordinasi dan manajemen multiple agents11. Bayangkan kompleksitas koordinasi yang diperlukan!

Anthropic memprioritaskan coding karena dianggap sebagai langkah pertama untuk mempercepat penelitian AI itu sendiri12. Coding selalu menjadi indikator utama dalam AI, sehingga penurunan tersebut akan terlihat pertama kali di coding13.

Kemajuan dalam Memori, Instruction Following, dan Tool Use

Model Claude 4 menunjukkan kemajuan signifikan dalam tiga area yaitu memori, instruction following, dan tool use dengan penerapan Reinforcement Learning yang berhasil pada language models14. Ketiga aspek ini saling berkaitan erat. Anthropic sedang mengembangkan interpretability agent yang melakukan pekerjaan menemukan sirkuit dalam language models tanpa dilatih khusus untuk itu dan berhasil memenangkan alignment safety eval15.

Terobosan dalam Interpretability

Agent interpretabilitas berhasil memenangkan alignment safety eval yang disebut "auditing game" di mana model yang dimodifikasi harus dianalisis untuk menemukan kesalahannya16. Penelitian interpretabilitas telah mengalami kemajuan luar biasa dengan tim Chris Olah mencapai terobosan signifikan dalam memahami cara kerja internal model bahasa besar17.

Dalam jaringan saraf, fitur adalah pola aktivasi saraf yang sesuai dengan konsep18. Workshop interpretabilitas mekanistik tidak dimasukkan dalam konferensi ICML atau serupa, yang dianggap mengejutkan19. Universitas seharusnya lebih banyak memikirkan penelitian interpretabilitas sebagai sains murni model AI20.

Percepatan Pekerjaan Engineering dan Prediksi Masa Depan

AI agents saat ini mempercepat pekerjaan engineering secara signifikan dengan memberikan percepatan 1,5 kali lipat pada domain yang dikuasai engineer dan hingga 5 kali lipat pada domain baru21. Angka ini sangat mengesankan. Pada tahun 2027-2028 atau paling lambat akhir dekade ini, hampir dipastikan akan ada model yang mampu mengotomatisasi pekerjaan white collar apapun karena dapat dicoba berkali-kali di komputer22.

Prediksi Transformasi Dunia Kerja

Model AI akan mampu menggantikan pekerja jarak jauh pada tahun 2027 menurut prediksi dari staf teknis Anthropic dengan kemampuan yang meningkat drastis23. Skenario "AI 2027" dinilai sangat masuk akal dengan kemungkinan 20% untuk terjadi dan 90% karyawan lab AI yakin akan mendapatkan drop-in remote worker AGI pada 202724.

Coding agents yang saat ini masih dalam tahap awal diharapkan menjadi sangat kompeten pada akhir tahun ini dengan waktu check-in yang berubah dari 5 menit menjadi beberapa jam25. Pada akhir tahun, waktu check-in untuk AI agents diperkirakan akan menjadi beberapa jam untuk berbagai tugas26.

Evaluasi dan Generalisasi Kecerdasan

Pokemon Eval merupakan evaluasi yang sangat baik karena model tidak dilatih untuk itu dan mendemonstrasikan generalisasi kecerdasan ke tugas yang berbeda secara bermakna27. Kemampuan AI dalam coding bergantung pada kemampuan generalisasi dari pengalaman sebelumnya, mirip seperti seseorang yang diambil dari jalanan akan membuat kesalahan dalam akuntansi kecuali mereka memiliki pengalaman yang relevan28.

Paradigma Pre-training dan Reinforcement Learning untuk AGI

Mayoritas orang di bidang AI saat ini percaya bahwa paradigma pre-training plus reinforcement learning sudah cukup untuk mencapai AGI dengan model yang dapat diajarkan berbagai tugas tanpa mencapai ceiling intelektual29. Keyakinan ini sangat kuat di kalangan peneliti. Teknik pengembangan AI saat ini belum menunjukkan penurunan dan kombinasi yang ada masih bekerja dengan baik untuk mencapai AGI30.

Percepatan Scaling dan Jadwal Rilis

Enam hingga dua belas bulan ke depan akan difokuskan pada scaling up Reinforcement Learning untuk mengeksplorasi kemampuan baru dengan kemajuan yang sangat cepat31. Jadwal rilis model AI diharapkan akan jauh lebih cepat dibandingkan tahun lalu karena percepatan scaling32. Jadwal rilis yang semakin cepat akan membanjiri pengguna dengan berbagai klaim peningkatan kemampuan model setiap bulan33.

Dalam 2 tahun ke depan, orang-orang akan mulai melihat proposal ilmiah yang menarik dari AI34. Model AI cukup baik dalam menyerap nilai-nilai manusia secara default dari pre-training35. Sistem feedback AB testing dan thumbs up/down dapat mengarahkan pengembangan AI ke jalur yang keliru dan berbahaya36.

Konsumsi Energi dan Potensi Personalisasi Model AI

AI akan menggunakan lebih daripada 20% produksi energi Amerika Serikat pada tahun 2028 yang membutuhkan perubahan dramatis dalam infrastruktur energi37. Angka ini sangat mencengangkan. Model AI seperti Claude memiliki potensi personalisasi yang masih sangat terbatas, dimana manusia baru mengeksplorasi sekitar 1% dari kedalaman pemahaman yang mungkin dicapai38.

Personalisasi sebagai Differentiator

Personalisasi dan pemahaman model terhadap pengguna serta konteks perusahaan akan menjadi differentiator penting39. Metrik utama yang akan menentukan keberhasilan lab AI adalah efektivitas dalam mengkonversi accelerator, flops, dan kapital menjadi kecerdasan40. Model video dapat menggambarkan hiu Lego di bawah air dengan refleksi cahaya dan bayangan yang benar meski tidak pernah melihatnya41.

Kesimpulan

Claude 4 dari Anthropic menandai era baru dalam pengembangan AI, khususnya dalam bidang software engineering. Kemampuan otonom dan independen model ini dalam menangani repositori kode besar menunjukkan lompatan signifikan dalam kompleksitas intelektual dan konteks yang dapat dipahami. Dukungan tools seperti Claude Code dan fokus pada pengembangan coding agents oleh perusahaan-perusahaan besar menggambarkan arah masa depan yang jelas.

Kemajuan dalam memori, instruction following, dan tool use melalui Reinforcement Learning, serta terobosan dalam penelitian interpretabilitas, memberikan fondasi yang kuat untuk pengembangan AGI. Prediksi bahwa AI akan mampu mengotomatisasi pekerjaan white collar pada 2027-2028 dan menggunakan lebih dari 20% energi Amerika Serikat pada 2028 menunjukkan skala transformasi yang akan terjadi. Paradigma pre-training plus reinforcement learning yang dipercaya mayoritas peneliti AI sebagai jalan menuju AGI, diperkuat dengan percepatan scaling dan jadwal rilis yang semakin cepat, menunjukkan bahwa kita berada di ambang revolusi teknologi yang akan mengubah cara kerja dan kehidupan manusia secara fundamental.

Referensi

  • Unsupervised Learning: Redpoint's AI Podcast. (2025, May 23). Claude 4, Next Phase for AI Coding, and the Path to AI Coworkers. [Video]. Youtube. https://youtu.be/W1aGV4K3A8Y
  • Douglas, S. (2025, May 23). Claude 4, Next Phase for AI Coding, and the Path to AI Coworkers. Unsupervised Learning: Redpoint's AI Podcast. YouTube. https://youtu.be/W1aGV4K3A8Y

Download PDF tentang Claude 4: Revolusi AI dalam…
VIDEO
Penulis
Swante Adi Krisna
Swante Adi Krisna
Web Programmer, Blogger, Graphic Designer, Woodworking, Sarjana dan Magister Hukum, Magister Kenotariatan, Kemhan.