Bug Logging OpenAI Codex Bisa Habiskan 640 TB SSD per Tahun
AP
Adrian Prat

Dipublikasikan 22 Juni 2026

Bug Logging OpenAI Codex Bisa Habiskan 640 TB SSD per Tahun

OpenAI Codex, agent coding berbasis AI yang baru dirilis, menghadapi masalah serius yang tidak terduga. Sebuah bug pada sistem logging SQLite-nya menyebabkan penulisan data berkelanjutan ke SSD lokal pengguna, dengan potensi konsumsi hingga 640 TB per tahun. Angka ini sangat besar, terutama mengingat SSD consumer umumnya memiliki rating endurance sekitar 600 TBW (Terabytes Written).

Masalah ini pertama kali dilaporkan oleh pengguna di GitHub melalui issue #28224. Setelah sekitar 21 hari penggunaan, SSD utama pengguna tersebut telah menulis sekitar 37 TB data. File yang menjadi penyebab utama adalah database SQLite di ~/.codex/logs_2.sqlite beserta file WAL dan SHM-nya.

Mekanisme Bug dan Dampaknya

Bug ini bukan sekadar file log yang membesar. Database SQLite tersebut menggunakan mekanisme AUTOINCREMENT yang terus meningkat walau data lama sudah dihapus. Menurut laporan, pada satu titik database hanya menyimpan sekitar 506.149 baris, namun counter AUTOINCREMENT telah melampaui 5,5 miliar ID. Gap tersebut mencapai faktor 10.000x, yang mengindikasikan churn data masif di balik layar.

Walau ukuran file database saat ini hanya sekitar 1,2 GiB, total data yang ditulis jauh lebih besar karena adanya Write-Ahead Logging (WAL), checkpoint, rewrite halaman, dan amplifikasi write di level filesystem serta perangkat. Pengguna memperkirakan total historical log churn mencapai skala puluhan terabyte bahkan sebelum menghitung faktor amplifikasi tersebut.

Data lebih lanjut menunjukkan distribusi level log yang didominasi TRACE (70,7%) dan INFO (25,7%). Artinya, sebagian besar data yang ditulis adalah log verbosity tinggi yang mungkin tidak esensial untuk operasional normal Codex. Kontinu menulis log sebesar ini tanpa rotasi atau throttling yang efektif adalah root cause utama masalah endurance SSD.

Fix dan Respons OpenAI

Kabar baiknya, OpenAI merespons dengan cepat. Dua pull request telah di-merge pada 22 Juni 2026: PR #29432 dan PR #29457. Menurut pelapor, kombinasi kedua PR ini diperkirakan dapat mengurangi volume log sebesar 85%.

Namun, bagi pengguna yang sudah menjalankan Codex selama beberapa minggu, kerusakan potensial pada SSD mungkin sudah terjadi. SSD modern memang memiliki mekanisme wear leveling, tetapi menulis ratusan terabyte dalam waktu singkat tetap mempercepat degradasi cell flash secara signifikan.

Pelajaran untuk Pengembangan AI Tools

Insiden ini menegaskan pentingnya telemetry dan logging audit sejak hari pertama. Tools AI yang berjalan lokal seringkali dianggap "ringan" karena tidak memerlukan GPU server, namun perilaku I/O yang buruk bisa jauh lebih merusak daripada konsumsi CPU atau RAM.

Developer yang membangun agent AI atau IDE berbasis AI harus mempertimbangkan beberapa praktik terbaik. Pertama, implementasi log rotation yang agresif untuk mencegah akumulasi data tanpa batas. Kedua, penggunaan level log yang sesuai environment, membedakan antara mode debug dan production. Ketiga, audit I/O periodik menggunakan tools seperti iotop atau fs_usage untuk mendeteksi anomaly sejak dini. Keempat, transparansi kepada pengguna tentang data yang ditulis ke disk lokal agar tidak ada kejutan di kemudian hari.

OpenAI Codex adalah produk yang masih baru, dan bug seperti ini wajar muncul pada fase awal. Respons cepat dari tim engineering menunjukkan komitmen terhadap kualitas. Bagi developer Indonesia yang mulai mengadopsi Codex untuk workflow sehari-hari, pastikan untuk memantau penggunaan disk secara rutin dan update ke versi terbaru setelah patch tersedia.

Analisis Teknis SQLite dan Write Amplification

Untuk memahami mengapa file 1,2 GiB bisa menghasilkan puluhan terabyte write, perlu dipahami cara kerja SQLite secara internal. Setiap kali transaksi dilakukan, SQLite menulis ke Write-Ahead Log (WAL) terlebih dahulu sebelum melakukan checkpoint ke database utama. Proses checkpoint ini melibatkan rewrite halaman data yang seringkali tidak sequential, memicu amplifikasi write di level filesystem dan SSD controller.

Selain itu, penggunaan AUTOINCREMENT pada primary key menyebabkan SQLite menyimpan metadata tambahan untuk melacak ID tertinggi yang pernah digunakan. Ketika data dihapus, ID tidak pernah direcycle, sehingga metadata terus tumbuh meskipun jumlah baris aktif tetap konstan. Kombinasi metadata growth, WAL rotation, dan page fragmentation menciptakan perfect storm bagi endurance SSD.

Di sisi pengguna, gejala ini sangat sulit dideteksi tanpa monitoring disk usage yang aktif. Tidak ada notifikasi dari Codex bahwa log telah menulis puluhan terabyte. Hanya pengguna yang secara rutin memeriksa SMART data SSD atau menggunakan tools monitoring I/O yang menyadari ada sesuatu yang salah. Ini menunjukkan bahwa transparency dan observability harus menjadi first-class citizen dalam desain tools AI.

Bagi developer Indonesia yang bekerja dengan hardware terbatas atau laptop dengan SSD berkapasitas kecil, bug ini sangat relevan. Mengabaikan logging behavior bisa berarti mengurangi umur SSD dari lima tahun menjadi beberapa bulan saja. Praktik terbaik adalah selalu mengecek folder cache dan log aplikasi AI secara berkala, serta menggunakan symbolic link untuk memindahkan direktori log ke drive eksternal jika memungkinkan.

Reaksi Komunitas dan Tindakan Pencegahan

Di forum Hacker News, bug ini mendapat perhatian besar dengan ratusan komentar. Banyak developer veteran menyarankan agar OpenAI segera mengimplementasikan log rotation bawaan dan default log level yang lebih konservatif. Ada juga diskusi tentang perlunya sandboxing lebih ketat untuk tools AI agar tidak bisa menulis ke disk secara tak terbatas tanpa izin eksplisit pengguna.

Sementara itu, pengguna Codex disarankan untuk segera update ke versi terbaru setelah PR di-merge. Bagi yang belum bisa update, solusi sementara adalah secara manual membatasi ukuran folder ~/.codex atau menjalankan Codex di environment terisolasi seperti container Docker dengan volume terpisah. Langkah sederhana ini bisa menyelamatkan SSD dari write amplification yang tidak perlu.

Secara filosofis, insiden ini mengingatkan kita bahwa kemudahan penggunaan tidak boleh mengorbankan keamanan dan durability hardware. Tools AI yang powerful harus datang dengan tanggung jawab yang sama besar dari sisi engineering untuk memastikan tidak ada side effect tersembunyi yang merugikan pengguna.