Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul!

14
16 September 2025

Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul! - Image 2

OpenAI kembali mengejutkan dunia artificial intelligence (kecerdasan buatan) dengan merilis dua model open-weight pertama mereka sejak GPT-2 di tahun 2019. Namun siapa sangka, hasil pengujian menunjukkan bahwa model yg lebih kecil justru memberikan performa terbaik¹.

Tim peneliti dari DataRobot melakukan evaluasi komprehensif terhadap model gpt-oss-120b dan gpt-oss-20b menggunakan framework optimisasi workflow mereka, syftr. Yang mengejutkan, model 20b dengan pengaturan thinking effort rendah konsisten menempati posisi terdepan dalam berbagai benchmark, bahkan menyaingi konfigurasi medium dari model 120b².

Strategi Pengujian yg Komprehensif

Pengujian tidak hanya membandingkan kedua model GPT-OSS saja. DataRobot membandingkan performa mereka dgn model-model open-weight kuat lainnya seperti qwen3-235b-a22b, glm-4.5-air, dan nemotron-super-49b. Evaluasi dilakukan pada empat dataset berbeda: FinanceBench untuk penalaran keuangan, HotpotQA untuk pertanyaan multi-hop, MultihopRAG untuk penalaran berbasis retrieval, dan PhantomWiki untuk pasangan Q&A sintetis³.

Fitur baru "thinking effort" dari OpenAI diuji dalam tiga mode: rendah, sedang, dan tinggi. Menariknya, penelitian menunjukkan bahwa lebih banyak pemikiran tidak selalu berarti jawaban yang lebih baik. Model 20b dengan upaya berpikir rendah justru memberikan respons yg lebih cepat dan biaya lebih murah tanpa mengorbankan akurasi⁴.

Hasil Mengejutkan: Kecil Tapi Bertenaga

Ketika dioptimalkan untuk latensi dan biaya, GPT-OSS 20b dengan thinking effort rendah muncul sebagai pemenang. Model ini tidak hanya cepat dan murah, tapi juga konsisten akurat dlm berbagai tugas non-saintifik. Sebaliknya, GPT-OSS 120b dengan upaya berpikir tinggi ternyata mahal dan biasanya tidak diperlukan⁵.

Analisis lebih mendalam pada FinanceBench menunjukkan dinamika menarik. Saat mengoptimalkan untuk latensi, semua model GPT-OSS (kecuali high thinking effort) memiliki frontier Pareto yg serupa. Namun ketika mengoptimalkan untuk biaya, model 20b dengan upaya berpikir rendah melompat ke akurasi 57%, sementara konfigurasi medium 120b justru turun 22%.

Implikasi untuk Industri AI

Rilis GPT-OSS menandai kembalinya OpenAI ke ekosistem open-source setelah enam tahun absen. Model gpt-oss-120b menggunakan arsitektur Mixture-of-Expert (MoE) yang hanya mengaktifkan sebagian parameter, membuatnya lebih efisien⁶. Versi 20b bahkan dapat dijalankan di laptop dan smartphone, membuka aksesibilitas AI untuk pengguna yang lebih luas⁷.

Platform cloud seperti Neysa di India telah mengintegrasikan GPT-OSS ke dalam katalog Velocis mereka, bersama dengan keluarga model terkemuka lainnya seperti Llama, DeepSeek, dan Qwen. Langkah ini memperkuat permainan AI berdaulat India dan memberikan kontrol penuh kepada perusahaan atas inovasi mereka⁸.

Performa Terdepan di Benchmark Independen

Artificial Analysis, platform benchmarking pihak ketiga terkemuka, merilis laporan yang menempatkan model gpt-oss-120b Clarifai di posisi teratas untuk performa dan efisiensi biaya. Analisis independen ini menemukan bahwa Clarifai memberikan kecepatan, fleksibilitas, efisiensi, dan keandalan terdepan di sektor⁹.

Aksesibilitas Tanpa Batas Hardware Mahal

Salah satu keunggulan GPT-OSS adalah kemudahan aksesnya. Berbeda dgn model-model sebelumnya yg memerlukan server cloud mahal atau memori GPU yg ridiculous, pengguna kini dapat menggunakan gpt-oss:120b melalui layanan seperti DuckDuckGo tanpa investasi hardware ribuan dolar¹⁰.

Model 120b dapat berjalan pada single GPU NVIDIA 80GB, sementara versi 20b bahkan lebih ringan untuk deployment di berbagai perangkat. Fleksibilitas ini membuka peluang bagi developer dan perusahaan untuk mengimplementasikan AI tanpa barrier teknologi yg tinggi.

Kesimpulan

Peluncuran GPT-OSS menandai era baru dalam demokratisasi AI. Temuan bahwa model yg lebih kecil sering kali lebih efektif daripada yang besar memberikan wawasan penting bagi industri. Dengan framework seperti syftr yg memungkinkan optimisasi workflow sesuai prioritas spesifik - apakah itu kecepatan, biaya, atau akurasi - pengembang dapat menemukan sweet spot yang tepat untuk kebutuhan mereka.

Kehadiran GPT-OSS tidak hanya memperkaya ekosistem open-source AI, tapi juga menantang asumsi bahwa lebih besar selalu berarti lebih baik. Terkadang, membayar lebih mahal justru memberikan hasil yang kurang optimal.

Referensi

DataRobot. (2025, September 16). Are the New GPT-OSS Models Any Good? We put them to the test. DataRobot Blog. https://www.datarobot.com/blog/testing-gpt-oss-models/
Ars Technica. (2025, Agustus 5). OpenAI announces two "gpt-oss" open AI models, and you can download them today. https://arstechnica.com/ai/2025/08/openai-releases-its-first-open-source-models-since-2019/
Business World. (2025, September 8). AI Startup Neysa Sharpens India's Sovereign AI Play, Brings GPT-OSS To Its Platform. https://www.businessworld.in/article/ai-startup-neysa-sharpens-indias-sovereign-ai-play-brings-gpt-oss-to-its-platform-570689
The Manila Times. (2025, September 11). Artificial Analysis Ranks Clarifai's gpt-oss-120b Model at Top for Performance and Cost-Efficiency. https://www.manilatimes.net/2025/09/11/tmt-newswire/pr-newswire/artificial-analysis-ranks-clarifais-gpt-oss-120b-model-at-top-for-performance-and-cost-efficiency/2183021
MSN. (2025, September 11). I finally tried OpenAI's gpt-oss:120b LLM — and without needing thousands of dollars worth of hardware. https://www.msn.com/en-gb/money/technology/i-finally-tried-openais-120-billion-parameter-open-source-llm-and-without-needing-thousands-of-dollars-worth-of-hardware/ar-AA1MluhH
Gigazine. (2025, Agustus 6). OpenAI announces OpenWeight AI inference model 'gpt-oss', lightweight version can run on laptops and smartphones. https://gigazine.net/gsc_news/en/20250806-openai-gpt-oss/
The News. (2025, Agustus 5). OpenAI introduce GPT-OSS. https://www.thenews.com.pk/latest/1333608-openai-introduce-gpt-oss-open-weight-model
Yahoo News. (2025, Agustus 5). Sam Altman launches GPT-oss, OpenAI's first open-weight AI language model in over 5 years. https://ca.news.yahoo.com/sam-altman-launches-gpt-oss-180137754.html
ITC. (2025, Agustus 6). OpenAI presents gpt-oss AI models to run on a video card or laptop. https://itc.ua/en/news/openai-presents-gpt-oss-ai-models-to-run-on-a-video-card-or-laptop/
MSN. (2025, Agustus 6). Can you run OpenAI's new gpt-oss AI models on your laptop or phone? Here's what you'll need and how to do it. https://www.msn.com/en-gb/money/technology/can-you-run-openai-s-new-gpt-oss-ai-models-on-your-laptop-or-phone-here-s-what-you-ll-need-and-how-to-do-it/ar-AA1K3t2a

Download PDF tentang Analisis Performa dan Efisiens (telah di download 129 kali)

Model GPT-OSS Terbaru OpenAI Kalahkan Ekspektasi: Versi 20B Justru Lebih Unggul!
OpenAI kembali mengejutkan dunia artificial intelligence (kecerdasan buatan) dengan merilis dua model open-weight pertama mereka sejak GPT-2 di tahun 2019. Namun siapa sangka, hasil pengujian menunjukkan bahwa model yg lebih kecil justru memberikan performa terbaik.

Penulis

Swante Adi Krisna

Penikmat musik Ska, Reggae dan Rocksteady sejak 2004. Gooners sejak 1998. Blogger dan ai paruh waktu sejak 2014. Graphic Designer autodidak sejak 2001. Website Programmer autodidak sejak 2003. Woodworker autodidak sejak 2024. Sarjana Hukum Pidana dari salah satu Perguruan Tinggi Negeri di Surakarta. Magister Hukum Pidana di bidang cybercrime dari salah satu Perguruan Tinggi Swasta di Surakarta. Magister Kenotariatan di bidang hukum teknologi, khususnya cybernotary dari salah satu Perguruan Tinggi Negeri di Surakarta. Bagian dari Keluarga Besar Kementerian Pertahanan Republik Indonesia.

GUEST POSTS

Tiga Wujud Kebudayaan Jadi Kunci Pelestarian Tradisi Nusantara
Dr. Sumarji, S.H., M.H.
GUESTPOST 25/06/2024 37173
Tantangan Perlindungan Anak di Era Revolusi Industri 4.0
Dr. Sumarji, S.H., M.H.
GUESTPOST 24/06/2024 40133
Misteri Brajadenta: Leganda Sakti dari Jambanan yang Menginspirasi
Dr. Sumarji, S.H., M.H.
GUESTPOST 23/06/2024 3598
Wayang Cangkruk Sanggar Brojodento Lestarikan Tradisi Jawa
Dr. Sumarji, S.H., M.H.
GUESTPOST 23/06/2024 35212

3D, AI, VECTOR IMAGE & VIDEO SWANTE ADI KRISNA

Gargoyle Infernal 🔥: Karya 3D Swante Adi Krisna Era Pra-AI

KARYAKU 01/11/2025 9129
Monster Desain 🎨 Karya Swante Adi Krisna: Menelusuri Kreativitas Pra-AI

KARYAKU 01/11/2025 10128
Seniman Hukum Ciptakan Masterpiece 3D: Tengkorak Berkendara Vespa Bersenjata
Poser 3D di Deviantart Swante Adi Krisna
KARYAKU 23/09/2025 18153
Karya 3D Werewolf Era Pra-AI Membuktikan Kreativitas Tak Terbatas
Poser 3D di Deviantart Swante Adi Krisna
KARYAKU 21/09/2025 22190
Karya 3D Spider-Man Era Pre-AI Memukau: Swante Adi Krisna & Poser 7
Poser 3D di Deviantart Swante Adi Krisna
KARYAKU 21/09/2025 20111

TRENDING TOPIK DI INDONESIA

Leicester vs Fiorentina: Laga Persahabatan Panas Minggu Ini
Google Trends Indonesia Minggu, 03 Agustus 2025 20:10 WIB (5000+ pencarian)
KEMHAN 03/08/2025 28187
Lomba 17an Jadi Trending, Warga Antusias Siapkan HUT RI ke-80
Google Trends Indonesia Minggu, 03 Agustus 2025 21:00 WIB (100+ pencarian)
KEMHAN 03/08/2025 84212
Hugo Ekitiké Resmi Bergabung dgn Liverpool: Striker Termahal Kedua The Reds!
Google Trends Indonesia Selasa, 05 Agustus 2025 02:50 WIB (200+ pencarian)
KEMHAN 04/08/2025 34210
Mbappe Cetak Gol, Los Blancos Kokoh di Puncak LaLiga 2025
Google Trends Indonesia Sabtu, 13 September 2025 21:40 WIB (20000+ pencarian)
KEMHAN 13/09/2025 16238
Promo Superindo Anniversary Guncang Pasar, Minyak Goreng Cuma Rp36 Ribu!
Google Trends Indonesia Senin, 04 Agustus 2025 15:00 WIB (100+ pencarian)
KEMHAN 04/08/2025 63217