Lebih dari 395 juta spesimen tanaman dan jamur tersimpan di herbaria seluruh dunia. Koleksi ini merupakan rekaman tak tertandingi kehidupan tumbuhan Bumi sepanjang masa1. Salah satunya berasal dari ekspedisi legendaris Kapten Cook pada 1770, ketika kapal Endeavour terdampar di Great Barrier Reef untuk perbaikan. Botanis Joseph Banks dan Daniel Solander mengumpulkan ratusan tanaman yang kini menjadi bagian dari 170.000 spesimen di herbarium University of Melbourne2.
Digitalisasi herbarium menjadi tantangan monumental. Namun kini, teknologi Artificial Intelligence (Kecerdasan Buatan) membuka akses cepat terhadap kekayaan informasi biodiversitas ini.
Hespi: Alat AI yang Merevolusi Akses Data
Tim peneliti University of Melbourne mengembangkan Hespi (herbarium specimen sheet pipeline) sebagai solusi3. Perangkat lunak open-source (sumber terbuka) ini menggabungkan teknik computer vision (visi komputer) canggih dengan object detection (deteksi objek), klasifikasi gambar, dan Large Language Model (Model Bahasa Besar).
Proses kerja Hespi cukup sederhana namun efektif. Pertama, sistem mengambil gambar lembaran spesimen yang berisi tanaman tertekan dan teks identifikasi. Kemudian mengekstrak teks menggunakan kombinasi optical character recognition (pengenalan karakter optik) dan pengenalan tulisan tangan4. Karena membaca tulisan tangan sulit bagi manusia maupun komputer, Hespi memanfaatkan GPT-4o untuk mengoreksi kesalahan dan meningkatkan hasil secara substansial.
Kecepatan dan Akurasi Tinggi
Dalam hitungan detik, Hespi menemukan label utama pada lembaran herbarium dan membaca informasi di dalamnya. Ini termasuk nama taksonomi, detail kolektor, lokasi, lintang dan bujur, serta tanggal pengumpulan5. Data tersebut langsung dikonversi ke format digital, siap digunakan untuk penelitian.
Pengujian terhadap ribuan gambar spesimen dari University of Melbourne Herbarium dan koleksi lain di seluruh dunia menunjukkan tingkat akurasi tinggi. Sebagai contoh, Hespi berhasil mendeteksi dan mengekstrak semua komponen relevan dari spesimen alga cokelat besar yang dikumpulkan tahun 1883 di St Kilda6.
| Aspek 🔍 | Metode Manual | Hespi (AI) |
|---|---|---|
| Kecepatan ⚡ | Berjam-jam per spesimen | Beberapa detik |
| Akurasi 🎯 | Tergantung operator | Tinggi dan konsisten |
| Biaya 💰 | Tenaga kerja intensif | Efisien setelah setup |
| Skalabilitas 📊 | Terbatas | Dapat direplikasi |
| Tulisan Tangan ✍️ | Menantang | GPT-4o assist |
| Verifikasi ✅ | Langsung | GUI untuk cek manual |
| Waktu Digitalisasi 🕐 | Puluhan tahun | Dipercepat drastis |
Tantangan Digitalisasi Masif
Untuk membuka potensi penuh herbaria, institusi di seluruh dunia berupaya mendigitalisasi koleksinya. Ini berarti memotret setiap spesimen dengan resolusi tinggi dan mengonversi informasi pada labelnya menjadi data digital yang dapat dicari7.
Herbaria besar seperti National Herbarium of New South Wales dan Australian National Herbarium menggunakan sistem conveyor belt (ban berjalan) berkapasitas tinggi untuk memotret jutaan spesimen dengan cepat. Bahkan dengan tingkat automasi ini, mendigitalisasi 1,15 juta spesimen di National Herbarium NSW memakan waktu lebih dari tiga tahun8.
Solusi untuk Institusi Kecil
Bagi institusi kecil tanpa peralatan skala industri, prosesnya jauh lebih lambat. Staf, relawan, dan citizen scientist (ilmuwan warga) memotret spesimen dan mentranskrip label secara manual dengan susah payah. Dengan kecepatan saat ini, banyak koleksi tidak akan sepenuhnya terdigitalisasi selama puluhan tahun mendatang9. Penundaan ini membuat data biodiversitas dalam jumlah besar tetap terkunci.
Peneliti di ekologi, evolusi, ilmu iklim, dan konservasi sangat membutuhkan akses ke dataset biodiversitas skala besar yang akurat. Pendekatan lebih cepat menjadi esensial.
Aplikasi Inovatif dan Masa Depan
Herbaria sudah berkontribusi pada masyarakat dalam banyak cara: dari identifikasi spesies dan taksonomi hingga pemantauan ekologi, konservasi, pendidikan, bahkan investigasi forensik10. Dengan memobilisasi volume besar data terkait spesimen, sistem AI seperti Hespi memungkinkan aplikasi baru dan inovatif pada skala yang tidak pernah mungkin sebelumnya.
AI telah digunakan untuk mengekstrak pengukuran daun mendetail dan sifat lainnya dari spesimen terdigitalisasi secara otomatis. Ini membuka koleksi historis berabad-abad untuk penelitian cepat tentang evolusi dan ekologi tanaman11. Dan ini baru permulaan — computer vision dan AI dapat segera diterapkan dengan berbagai cara lain, lebih mempercepat dan memperluas penelitian botani di tahun-tahun mendatang.
Beyond Herbaria: Koleksi Museum dan Arsip
Pipeline (jalur kerja) AI seperti Hespi memiliki potensi mengekstrak teks dari label di koleksi museum atau arsip mana pun yang memiliki gambar digital berkualitas tinggi. Langkah berikutnya adalah kolaborasi dengan Museums Victoria untuk mengadaptasi Hespi guna menciptakan pipeline digitalisasi AI yang sesuai untuk koleksi museum12.
Pipeline AI ini akan memobilisasi data biodiversitas untuk sekitar 12.500 spesimen dalam koleksi graptolite fosil yang signifikan secara global di museum tersebut. Proyek baru dengan Australian Research Data Commons (ARDC) juga dimulai untuk membuat perangkat lunak lebih fleksibel, memungkinkan kurator di museum dan institusi lain menyesuaikan Hespi untuk mengekstrak data dari berbagai jenis koleksi — tidak hanya spesimen tanaman13.
Kesimpulan
Teknologi transformasional ini mengubah cara kita mengakses data biodiversitas. Kolaborasi manusia-AI dapat membantu mengatasi salah satu hambatan terbesar dalam digitalisasi koleksi — transkripsi manual data label yang lambat14. Memobilisasi informasi yang sudah terkunci di herbaria, museum, dan arsip di seluruh dunia sangat penting untuk membuatnya tersedia bagi penelitian lintas disiplin yang diperlukan untuk memahami dan mengatasi krisis biodiversitas.
Daftar Pustaka
- AIhub. (2025, September 29). Botanical time machines: AI is unlocking a treasure trove of data held in herbarium collections. https://aihub.org/2025/09/29/botanical-time-machines-ai-is-unlocking-a-treasure-trove-of-data-held-in-herbarium-collections/
- Ibid.
- Loc. cit.
- AIhub, Op. cit.
- AIhub, Op. cit.
- AIhub, Op. cit.
- Yahoo News Australia. (2025, August 18). Botanical time machines: AI is unlocking a treasure trove of data held in herbarium collections. https://au.news.yahoo.com/botanical-time-machines-ai-unlocking-050838478.html
- Ibid.
- ANI News. (2025, September 29). How AI-Driven Data Pipelines Are Revolutionizing Business Operations. https://www.aninews.in/news/business/how-ai-driven-data-pipelines-are-revolutionizing-business-operations20250929182210/
- Computer Weekly. (2025, October 30). Astronomer: Why data pipelines control the flow of AI. https://www.computerweekly.com/blog/CW-Developer-Network/Astronomer-Why-data-pipelines-control-the-flow-of-AI
- The Hindu. (2025, June 30). Indian Virtual Herbarium, biggest database of country's flora, is a global hit. https://www.thehindu.com/news/national/indian-virtual-herbarium-biggest-database-of-countrys-flora-grabbing-eyeballs-across-the-world/article65737063.ece
- St. Louis Today. (2024, July 8). MoBot uses AI to learn how trees move. And to save millions of plant specimens. https://www.stltoday.com/news/local/metro/article_fb9f9660-3885-11ef-8f5a-57b61f2acc14.html
- Natural History Museum. (2024, December 20). Quantifying Species Distributions and Changes in a Global Biodiversity Hotspot using Museum Specimens and AI. https://www.nhm.ac.uk/our-science/study/postgraduate/phd-opportunities/projects/quantifying-species-distributions-in-global-biodiversity-hotspot.html
- Unite.AI. (2025, November 3). Incredibuild Acquires Kypso to Accelerate Code Development Pipelines in the AI-Native Era. https://www.unite.ai/incredibuild-acquires-kypso-to-accelerate-code-development-pipelines-in-the-ai-native-era/







