{!-- ra:00000000000003ea0000000000000000 --}MIT Kembangkan Teknik Revolusioner untuk Tingkatkan Kemampuan AI - SWANTE ADI KRISNA
cross
Hit enter to search or ESC to close
MIT Kembangkan Teknik Revolusioner untuk Tingkatkan Kemampuan AI
8
July 2025

MIT Kembangkan Teknik Revolusioner untuk Tingkatkan Kemampuan AI

  • 37
  • 08 July 2025
MIT Kembangkan Teknik Revolusioner untuk Tingkatkan Kemampuan AI

Peneliti dari Massachusetts Institute of Technology (MIT) telah mengembangkan sebuah teknik pelatihan yang dapat meningkatkan akurasi Large Language Models (LLM) hingga enam kali lipat. Teknik yang disebut test-time training ini menjadi terobosan baru dlm dunia kecerdasan buatan yang bisa mengubah cara kerja AI di berbagai sektor.

Apa itu Test-Time Training?

Ekin Akyürek, penulis utama penelitian ini, menjelaskan bahwa test-time training adalah metode yg melibatkan pembaruan sementara pada parameter internal model saat deployment1. Berbeda dengan pembelajaran dalam konteks biasa, teknik ini memungkinkan model untuk benar-benar "belajar" keterampilan baru.

"Pembelajaran sejati - apa yg kami lakukan di sini dengan test-time training - adalah sesuatu yang tidak bisa dilakukan model ini sendiri setelah mereka dikirim," kata Akyürek1. Ini menjadi solusi untuk keterbatasan LLM yang sering gagal dalam tugas-tugas baru yang membutuhkan kemampuan penalaran kompleks.

Dampak untuk Dunia Bisnis Indonesia

Penelitian ini memiliki implikasi besar bagi perusahaan di Indonesia. Sebagai contoh, sebuah firma akuntansi yang menggunakan AI untuk meringkas laporan keuangan mungkin akan kesulitan ketika diminta memprediksi tren pasar. Dengan teknik baru ini, model AI yang sama bisa beradaptasi untuk tugas yang lebih kompleks seperti mengidentifikasi transaksi penipuan.

Aplikasi dalam Sektor Kesehatan

Di sektor kesehatan Indonesia, teknik ini berpotensi membantu dokter dalam diagnosis medis yang lebih akurat2. Model AI yang dilatih dengan test-time training dapat beradaptasi dengan kondisi medis spesifik yang jarang ditemui, meningkatkan kualitas pelayanan kesehatan di daerah terpencil.

Manfaat untuk Manajemen Rantai Pasokan

Perusahaan logistik di Indonesia juga dapat memanfaatkan teknologi ini untuk optimisasi rantai pasokan. AI dengan kemampuan adaptif ini bisa menangani situasi tak terduga seperti bencana alam atau gangguan transportasi yang sering terjadi di Indonesia3.

Cara Kerja dan Efisiensi

Para peneliti menggunakan teknik low-rank adaptation yang hanya memperbarui sejumlah kecil parameter model. Mehul Damani, salah satu peneliti, menyatakan bahwa mereka dapat mencapai peningkatan akurasi yang sangat besar hanya dengan melatih parameter yang sangat sedikit1.

Meskipun proses ini membutuhkan waktu lebih lama - dari kurang dari satu menit menjadi lima hingga sepuluh menit - peningkatan performa yang dihasilkan sangat signifikan. Ini sangat berguna untuk tugas-tugas sulit yang memerlukan keakuratan tinggi.

Tantangan dan Prospek Masa Depan

Teknik ini diuji pada dua dataset benchmark yang berisi masalah-masalah sangat kompleks seperti teka-teki IQ. Hasilnya menunjukkan peningkatan akurasi hingga enam kali lipat dibandingkan teknik pembelajaran dalam konteks biasa1.

Untuk masa depan, peneliti berencana mengembangkan model yang dapat belajar secara kontinu. Tujuan jangka panjangnya adalah menciptakan LLM yang dapat secara otomatis menentukan apakah perlu menggunakan test-time training atau cukup dengan pembelajaran dalam konteks saja.

Kesimpulan

Penelitian MIT ini membuka peluang besar bagi pengembangan AI yang lebih adaptif dan cerdas. Bagi Indonesia, teknologi ini dapat mempercepat transformasi digital di berbagai sektor, mulai dari kesehatan hingga logistik. Dengan kemampuan model AI untuk benar-benar "belajar" dari tugas baru, kita dapat mengharapkan solusi AI yang lebih fleksibel dan efektif dalam menghadapi tantangan kompleks masa depan.

Referensi

  • Zewe, A. (2025, Juli 8). Study could lead to LLMs that are better at complex reasoning. MIT News. https://news.mit.edu/2025/study-could-lead-llms-better-complex-reasoning-0708
  • Nature. (2025, Januari 16). Large Language Models and Large Multimodal Models in Medical Imaging: A Primer for Physicians. Journal of Nuclear Medicine. https://jnm.snmjournals.org
  • MIT Sloan. (2025, Juni 3). 3 ways businesses can use large language models. MIT Sloan. https://mitsloan.mit.edu
Download PDF tentang Implementasi Test-Time Trainin (telah di download 54 kali)
  • MIT Kembangkan Teknik Revolusioner untuk Tingkatkan Kemampuan AI
    Penelitian terbaru dari MIT menunjukkan bahwa teknik test-time training dapat meningkatkan akurasi Large Language Models hingga enam kali lipat dalam menyelesaikan tugas-tugas yang memerlukan penalaran kompleks, membuka peluang baru bagi pengembangan sistem AI yang lebih adaptif dan efektif dalam berbagai domain aplikasi praktis. ABSTRAK Keterbatasan Large Language Models (LLM) dalam menangani tugas-tugas baru yang memerlukan penalaran kompleks telah menjadi tantangan signifikan dalam pengembangan kecerdasan buatan. Penelitian ini mengeksplorasi implementasi teknik test-time training sebagai solusi inovatif untuk meningkatkan kemampuan adaptasi LLM terhadap domain-domain yang tidak familiar. Melalui pendekatan metodologis yang komprehensif, penelitian ini menguji efektivitas test-time training yang dikombinasikan dengan pembelajaran dalam konteks pada dataset benchmark yang berisi masalah-masalah kompleks. Hasil penelitian menunjukkan peningkatan akurasi hingga enam kali lipat dibandingkan dengan teknik pembelajaran konvensional. Implementasi low-rank adaptation dalam proses ini memungkinkan efisiensi komputasi yang optimal dengan hanya memperbarui sejumlah kecil parameter model. Temuan ini memiliki implikasi signifikan bagi pengembangan sistem AI yang lebih fleksibel dan adaptif, khususnya dalam aplikasi praktis seperti diagnostik medis, analisis finansial, dan manajemen rantai pasokan. Penelitian ini berkontribusi pada pemahaman yang lebih mendalam tentang mekanisme pembelajaran adaptif dalam arsitektur neural modern dan membuka jalan bagi pengembangan generasi baru LLM yang mampu melakukan pembelajaran berkelanjutan,
Penulis
Swante Adi Krisna
Penikmat musik Ska, Reggae dan Rocksteady sejak 2004. Gooners sejak 1998. Blogger dan ai paruh waktu sejak 2014. Graphic Designer autodidak sejak 2001. Website Programmer autodidak sejak 2003. Woodworker autodidak sejak 2024. Sarjana Hukum Pidana dari salah satu Perguruan Tinggi Negeri di Surakarta. Magister Hukum Pidana di bidang cybercrime dari salah satu Perguruan Tinggi Swasta di Surakarta. Magister Kenotariatan di bidang hukum teknologi, khususnya cybernotary dari salah satu Perguruan Tinggi Negeri di Surakarta. Bagian dari Keluarga Besar Kementerian Pertahanan Republik Indonesia.