Anthropic secara diam-diam merilis fitur yang bisa mengubah cara kita membangun sistem agentik. Claude Code v2.1.172, yang dirilis pada 10 Juni 2026, memungkinkan sub-agent untuk meluncurkan sub-agent lainnya. Batasnya adalah lima level kedalaman. Perubahan ini terlihat sederhana di changelog, tetapi implikasinya untuk arsitektur AI agent sangat besar dan berpotensi mengubah best practices yang sudah dianut selama dua tahun terakhir.
Menurut laporan dari Byte Iota, Boris Cherny yang memimpin Claude Code di Anthropic menyebut motivasi utama fitur ini adalah: agents kicking off agents as a way to better manage context. Ini bukan tentang menjalankan lebih banyak pekerjaan secara paralel, melainkan tentang mengisolasi pekerjaan yang noisy agar tidak mengotori konteks percakapan utama. Dalam konteks AI agent, konteks yang terlalu penuh dengan data intermediate sering kali menurunkan kualitas output dari model utama.
Sebelumnya, Anthropic menerapkan aturan keras: sub-agent tidak boleh membuat sub-agent lain. Aturan itu bertahan dua tahun tanpa pengecualian. Sekarang, developer bisa membuat hierarki sub-agent hingga lima level dalam. Batas lima level ini bersifat hard dan diatur di server-side. Tidak ada setting untuk menaikkan, menurunkan, atau menonaktifkannya. Keputusan ini menunjukkan bahwa Anthropic sangat berhati-hati dalam merilis kemampuan rekursif ini, mengingat potensi risiko infinite loop atau penggunaan token yang tidak terkontrol.
Contoh praktis yang sangat relevan: sebuah sub-agent yang sedang menganalisis log bisa meluncurkan sub-agent Haiku khusus untuk menjalankan grep dan regex. Sub-agent Haiku itu kemudian mengembalikan ringkasan satu baris ke parent. Parent tidak pernah melihat 50.000 token log mentah. Dia hanya melihat verdict yang bersih. Pola ini sangat mirip dengan konsep function calling dalam programming, di mana sebuah fungsi abstrak kompleksitas dan hanya mengembalikan hasil akhir.
Sebaiknya kita memikirkan nested sub-agent sebagai recursion call stack dengan batas kedalaman lima frame. Setiap frame membawa system prompt sendiri, model selection sendiri, dan context window 200K token sendiri. Parent hanya membaca apa yang dikembalikan leaf. Semua proses di tengah, pencarian, pembacaan file, reasoning intermediate, menghabiskan token dan kemudian menghilang dari pandangan parent. Konsep ini mirip dengan variable scoping dalam pemrograman: variabel yang didefinisikan di dalam fungsi tidak bisa diakses dari luar fungsi.
Rantai debugging praktis bisa terlihat seperti ini:
main session (Opus) -> triage-lead (Opus) -> repro-runner (Sonnet) -> log-summariser (Haiku)
Layer 1 memuat incident. Layer 2 menjelajah ke empat kandidat penyebab. Agent yang menyelidiki korelasi log, tugas yang noisy dan token-heavy, meluncurkan Layer 3 Haiku agent untuk mengerjakan grep dan mengembalikan hasil satu baris. Thread utama melihat empat verdict bersih, bukan 50.000 token log mentah. Itulah use case sebenarnya: bukan lebih banyak agent, tetapi hasil yang lebih bersih dari agent yang sudah ada. Sebelumnya, parent harus membuang token tambahan untuk re-grounding diri setelah menerima output yang berantakan dari sub-agent.
Mayoritas rantai yang paling bermanfaat hidup di kedalaman 2-3. Lima level adalah ceiling, bukan target. Penggunaan paling efektif adalah saat kita perlu mengisolasi tugas yang menghasilkan banyak token intermediate. Contohnya: analisis log dari server yang panjang, pencarian codebase yang luas dengan ribuan file, pemrosesan data batch yang melibatkan transformasi multi-step, atau debugging multi-step yang melibatkan banyak file dan dependensi.
Fitur ini juga mengubah cara kita berpikir tentang cost management dalam sistem agentik. Dengan menyembunyikan pekerjaan token-heavy di sub-agent bawah, parent bisa menggunakan model yang lebih mahal (Opus) hanya untuk koordinasi dan pengambilan keputusan strategis, sementara leaf menggunakan model yang lebih murah (Haiku) untuk tugas eksekusi dan data processing. Strategi ini secara signifikan bisa menurunkan biaya operasional agent, terutama untuk perusahaan yang memproses volume besar data setiap harinya.
Perubahan ini membuka pola desain baru yang sebelumnya mustahil. Kita sekarang bisa membangun true hierarchical agent systems, di mana setiap layer memiliki tanggung jawab yang jelas dan terisolasi. Ini mirip dengan konsep microservices dalam software engineering, tetapi di level AI agent. Setiap layer bisa memiliki SLA, cost budget, dan model yang berbeda.
Developer perlu memperhatikan beberapa hal saat mengadopsi fitur ini. Pertama, tracing dan observability menjadi lebih penting. Dengan hierarki yang dalam, debugging yang terjadi di level bawah bisa sulit dilacak. Tools observability yang bisa melihat seluruh stack akan menjadi sangat berharga. Kedua, prompt engineering untuk setiap layer harus jelas agar tidak terjadi misalignment antar parent dan child. Parent harus mendefinisikan ekspektasi yang jelas tentang format output yang diharapkan dari child. Ketiga, latency total akan meningkat karena setiap spawn memerlukan round trip ke server. Untuk aplikasi real-time, hierarki yang terlalu dalam mungkin bukan pilihan terbaik.
Anthropic belum merilis dokumentasi resmi yang mendalam untuk fitur ini, tetapi changelog v2.1.172 sudah tersedia untuk pengguna Claude Code. Developer yang ingin bereksperimen bisa langsung mengupdate ke versi terbaru dan mencoba hierarki sub-agent di workflow mereka. Jika Anda sudah menggunakan Claude Code untuk debugging atau code review, cobalah spawn sub-agent untuk tugas-tugas yang sebelumnya memenuhi konteks percakapan Anda. Hasilnya mungkin akan mengejutkan: percakapan yang lebih fokus dan biaya yang lebih rendah.
Sumber utama artikel ini berdasarkan analisis dari Byte Iota: Claude Code v2.1.172. Untuk informasi lebih lanjut tentang Claude Code, kunjungi dokumentasi resmi Anthropic.
Dapatkan feedback, users, dan eksposur dari komunitas kreator, developer, dan entrepreneur digital Indonesia.
Submit Produk → Pelajari Dulu