Ilmuwan MIT McGovern Institute menemukan kesamaan mengejutkan antara cara model AI reasoning (reasoning models) dan manusia memproses masalah kompleks. Semakin sulit problem, semakin lama waktu yang dibutuhkan keduanya.1 Ini bukan kebetulan.
Tim peneliti dipimpin Evelina Fedorenko, profesor ilmu otak dan kognitif. Hasil riset dipublikasikan jurnal PNAS pada 19 November 2025. Fakta bahwa ada konvergensi ini benar-benar cukup mengejutkan,
ujar Fedorenko.1
Mengapa Model Reasoning Berbeda dari LLM Biasa
Large Language Models (LLM) seperti ChatGPT dulu mudah dibuat bingung. Soal matematika? Gagal. Penalaran kompleks? Payah. Tapi sekarang beda ceritanya.
Model reasoning dilatih memecahkan masalah langkah demi langkah. Andrea Gregor de Varda, peneliti postdoctoral di lab Fedorenko, menjelaskan: Performa menjadi jauh lebih kuat jika model dibiarkan memecah masalah ke dalam bagian-bagian.
1 Metode reinforcement learning (pembelajaran penguatan) memberi reward untuk jawaban benar dan penalti untuk salah.
Perkembangan ini sejalan dengan munculnya model-model baru. GPT-5.1 dari OpenAI kini hadir dengan fitur adaptive thinking.2 Google juga meluncurkan Gemini 3 yang unggul di berbagai benchmark.3
Eksperimen: Token versus Waktu
De Varda membandingkan manusia dan AI dengan tujuh jenis masalah berbeda. Untuk manusia, diukur waktu respons dalam milidetik. Untuk AI? Bukan waktu proses karena itu tergantung hardware.
Yang diukur adalah token—bagian dari rantai pikiran internal model. Seolah-olah mereka berbicara dengan diri sendiri,
kata de Varda.1
| 📊 Jenis Masalah | 🧠 Manusia | 🤖 AI Reasoning | 📈 Tingkat Kesulitan |
|---|---|---|---|
| Aritmetika Numerik | Cepat | Token Sedikit | Rendah |
| Penalaran Intuitif | Sedang | Token Sedang | Sedang |
| Logika Deduktif | Sedang | Token Sedang | Sedang |
| Pemecahan Pola | Lama | Token Banyak | Tinggi |
| Penalaran Spasial | Lama | Token Banyak | Tinggi |
| Inferensi Abstrak | Sangat Lama | Token Sangat Banyak | Sangat Tinggi |
| ARC Challenge | Paling Lama | Token Paling Banyak | Tertinggi |
Hasilnya konsisten. Problem yang membuat manusia berpikir lama juga membuat AI menghasilkan lebih banyak token. ARC challenge—dimana pasangan grid berwarna merepresentasikan transformasi yang harus diinferensi—paling menguras kedua belah pihak.
Implikasi untuk Industri AI
Temuan ini punya dampak luas. Perusahaan teknologi besar seperti Amazon dan Microsoft terus menggelontorkan investasi masif untuk AI.4 Biaya kepatuhan regulasi AI global diprediksi mencapai 5 miliar dolar AS pada 2027.5
Di sisi lain, model AI buatan Tiongkok dengan biaya rendah mulai mengejar ketertinggalan. Kimi K2 Thinking dari Moonshot bahkan mengalahkan ChatGPT dan Claude di beberapa benchmark utama.6
Kesimpulan: Konvergensi yang Tidak Disengaja
Yang menarik, kesamaan ini tidak dirancang. Orang yang membangun model ini tidak peduli apakah mereka melakukannya seperti manusia. Mereka hanya ingin sistem yang bekerja baik,
tegas Fedorenko.1
Namun pertanyaan besar masih tersisa. Apakah model menggunakan representasi informasi serupa otak manusia? Bagaimana representasi itu ditransformasi menjadi solusi? Tim peneliti masih menyelidiki.
Satu hal pasti: meski model reasoning menghasilkan monolog internal saat memecahkan masalah, mereka tidak selalu menggunakan bahasa untuk berpikir. Output sering mengandung error atau bagian tidak masuk akal, meski jawaban akhir benar. Komputasi internal kemungkinan terjadi di ruang representasi abstrak non-linguistik—mirip cara manusia yang tidak menggunakan bahasa untuk berpikir.
Daftar Pustaka
- Michalowski, J. (2025, November 19). The cost of thinking. MIT News. https://news.mit.edu/2025/cost-of-thinking-1119
- Financial Express. (2025, November 13). ChatGPT with GPT 5.1 Instant, Thinking models launched. https://www.financialexpress.com/
- Beebom. (2025, November 20). Gemini 3 Pro vs ChatGPT 5.1: Google Has Cracked the Secret Sauce. https://beebom.com/
- Invezz. (2025, November 22). Amazon and Microsoft's AI bet hit a wall. https://invezz.com/
- The Hindu Business Line. (2025, November 19). Compliance costs due to AI regulations to go up to $5 billion by 2027. https://www.thehindubusinessline.com/
- MSN. (2025, November 9). What is Kimi AI? Chinese chatbot beats ChatGPT, Claude on major benchmarks. https://www.msn.com/

