{!-- ra:00000000000003ea0000000000000000 --}Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul! - SWANTE ADI KRISNA
cross
Hit enter to search or ESC to close
Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul!
16
September 2025

Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul!

  • 2
  • 16 September 2025

OpenAI kembali mengejutkan dunia artificial intelligence (kecerdasan buatan) dengan merilis dua model open-weight pertama mereka sejak GPT-2 di tahun 2019. Namun siapa sangka, hasil pengujian menunjukkan bahwa model yg lebih kecil justru memberikan performa terbaik1.

Tim peneliti dari DataRobot melakukan evaluasi komprehensif terhadap model gpt-oss-120b dan gpt-oss-20b menggunakan framework optimisasi workflow mereka, syftr. Yang mengejutkan, model 20b dengan pengaturan thinking effort rendah konsisten menempati posisi terdepan dalam berbagai benchmark, bahkan menyaingi konfigurasi medium dari model 120b2.

Strategi Pengujian yg Komprehensif

Pengujian tidak hanya membandingkan kedua model GPT-OSS saja. DataRobot membandingkan performa mereka dgn model-model open-weight kuat lainnya seperti qwen3-235b-a22b, glm-4.5-air, dan nemotron-super-49b. Evaluasi dilakukan pada empat dataset berbeda: FinanceBench untuk penalaran keuangan, HotpotQA untuk pertanyaan multi-hop, MultihopRAG untuk penalaran berbasis retrieval, dan PhantomWiki untuk pasangan Q&A sintetis3.

Fitur baru "thinking effort" dari OpenAI diuji dalam tiga mode: rendah, sedang, dan tinggi. Menariknya, penelitian menunjukkan bahwa lebih banyak pemikiran tidak selalu berarti jawaban yang lebih baik. Model 20b dengan upaya berpikir rendah justru memberikan respons yg lebih cepat dan biaya lebih murah tanpa mengorbankan akurasi4.

Hasil Mengejutkan: Kecil Tapi Bertenaga

Ketika dioptimalkan untuk latensi dan biaya, GPT-OSS 20b dengan thinking effort rendah muncul sebagai pemenang. Model ini tidak hanya cepat dan murah, tapi juga konsisten akurat dlm berbagai tugas non-saintifik. Sebaliknya, GPT-OSS 120b dengan upaya berpikir tinggi ternyata mahal dan biasanya tidak diperlukan5.

Analisis lebih mendalam pada FinanceBench menunjukkan dinamika menarik. Saat mengoptimalkan untuk latensi, semua model GPT-OSS (kecuali high thinking effort) memiliki frontier Pareto yg serupa. Namun ketika mengoptimalkan untuk biaya, model 20b dengan upaya berpikir rendah melompat ke akurasi 57%, sementara konfigurasi medium 120b justru turun 22%.

Implikasi untuk Industri AI

Rilis GPT-OSS menandai kembalinya OpenAI ke ekosistem open-source setelah enam tahun absen. Model gpt-oss-120b menggunakan arsitektur Mixture-of-Expert (MoE) yang hanya mengaktifkan sebagian parameter, membuatnya lebih efisien6. Versi 20b bahkan dapat dijalankan di laptop dan smartphone, membuka aksesibilitas AI untuk pengguna yang lebih luas7.

Platform cloud seperti Neysa di India telah mengintegrasikan GPT-OSS ke dalam katalog Velocis mereka, bersama dengan keluarga model terkemuka lainnya seperti Llama, DeepSeek, dan Qwen. Langkah ini memperkuat permainan AI berdaulat India dan memberikan kontrol penuh kepada perusahaan atas inovasi mereka8.

Performa Terdepan di Benchmark Independen

Artificial Analysis, platform benchmarking pihak ketiga terkemuka, merilis laporan yang menempatkan model gpt-oss-120b Clarifai di posisi teratas untuk performa dan efisiensi biaya. Analisis independen ini menemukan bahwa Clarifai memberikan kecepatan, fleksibilitas, efisiensi, dan keandalan terdepan di sektor9.

Aksesibilitas Tanpa Batas Hardware Mahal

Salah satu keunggulan GPT-OSS adalah kemudahan aksesnya. Berbeda dgn model-model sebelumnya yg memerlukan server cloud mahal atau memori GPU yg ridiculous, pengguna kini dapat menggunakan gpt-oss:120b melalui layanan seperti DuckDuckGo tanpa investasi hardware ribuan dolar10.

Model 120b dapat berjalan pada single GPU NVIDIA 80GB, sementara versi 20b bahkan lebih ringan untuk deployment di berbagai perangkat. Fleksibilitas ini membuka peluang bagi developer dan perusahaan untuk mengimplementasikan AI tanpa barrier teknologi yg tinggi.

Kesimpulan

Peluncuran GPT-OSS menandai era baru dalam demokratisasi AI. Temuan bahwa model yg lebih kecil sering kali lebih efektif daripada yang besar memberikan wawasan penting bagi industri. Dengan framework seperti syftr yg memungkinkan optimisasi workflow sesuai prioritas spesifik - apakah itu kecepatan, biaya, atau akurasi - pengembang dapat menemukan sweet spot yang tepat untuk kebutuhan mereka.

Kehadiran GPT-OSS tidak hanya memperkaya ekosistem open-source AI, tapi juga menantang asumsi bahwa lebih besar selalu berarti lebih baik. Terkadang, membayar lebih mahal justru memberikan hasil yang kurang optimal.

Referensi

  • DataRobot. (2025, September 16). Are the New GPT-OSS Models Any Good? We put them to the test. DataRobot Blog. https://www.datarobot.com/blog/testing-gpt-oss-models/
  • Ars Technica. (2025, Agustus 5). OpenAI announces two "gpt-oss" open AI models, and you can download them today. https://arstechnica.com/ai/2025/08/openai-releases-its-first-open-source-models-since-2019/
  • Business World. (2025, September 8). AI Startup Neysa Sharpens India's Sovereign AI Play, Brings GPT-OSS To Its Platform. https://www.businessworld.in/article/ai-startup-neysa-sharpens-indias-sovereign-ai-play-brings-gpt-oss-to-its-platform-570689
  • The Manila Times. (2025, September 11). Artificial Analysis Ranks Clarifai's gpt-oss-120b Model at Top for Performance and Cost-Efficiency. https://www.manilatimes.net/2025/09/11/tmt-newswire/pr-newswire/artificial-analysis-ranks-clarifais-gpt-oss-120b-model-at-top-for-performance-and-cost-efficiency/2183021
  • MSN. (2025, September 11). I finally tried OpenAI's gpt-oss:120b LLM — and without needing thousands of dollars worth of hardware. https://www.msn.com/en-gb/money/technology/i-finally-tried-openais-120-billion-parameter-open-source-llm-and-without-needing-thousands-of-dollars-worth-of-hardware/ar-AA1MluhH
  • Gigazine. (2025, Agustus 6). OpenAI announces OpenWeight AI inference model 'gpt-oss', lightweight version can run on laptops and smartphones. https://gigazine.net/gsc_news/en/20250806-openai-gpt-oss/
  • The News. (2025, Agustus 5). OpenAI introduce GPT-OSS. https://www.thenews.com.pk/latest/1333608-openai-introduce-gpt-oss-open-weight-model
  • Yahoo News. (2025, Agustus 5). Sam Altman launches GPT-oss, OpenAI's first open-weight AI language model in over 5 years. https://ca.news.yahoo.com/sam-altman-launches-gpt-oss-180137754.html
  • ITC. (2025, Agustus 6). OpenAI presents gpt-oss AI models to run on a video card or laptop. https://itc.ua/en/news/openai-presents-gpt-oss-ai-models-to-run-on-a-video-card-or-laptop/
  • MSN. (2025, Agustus 6). Can you run OpenAI's new gpt-oss AI models on your laptop or phone? Here's what you'll need and how to do it. https://www.msn.com/en-gb/money/technology/can-you-run-openai-s-new-gpt-oss-ai-models-on-your-laptop-or-phone-here-s-what-you-ll-need-and-how-to-do-it/ar-AA1K3t2a
Download PDF tentang Analisis Performa dan Efisiens (telah di download 1 kali)
Penulis
Swante Adi Krisna
Penikmat musik Ska, Reggae dan Rocksteady sejak 2004. Gooners sejak 1998. Blogger dan ai paruh waktu sejak 2014. Graphic Designer autodidak sejak 2001. Website Programmer autodidak sejak 2003. Woodworker autodidak sejak 2024. Sarjana Hukum Pidana dari salah satu Perguruan Tinggi Negeri di Surakarta. Magister Hukum Pidana di bidang cybercrime dari salah satu Perguruan Tinggi Swasta di Surakarta. Magister Kenotariatan di bidang hukum teknologi, khususnya cybernotary dari salah satu Perguruan Tinggi Negeri di Surakarta. Bagian dari Keluarga Besar Kementerian Pertahanan Republik Indonesia.