← Catatan

Checklist Eksekusi Eksperimen — Kenapa Single Run Tidak Cukup dan Apa yang Harus Dicatat

Sebelum mulai:

  • Jumlah run per skenario sudah ditentukan (minimal 5 untuk statistik dasar, idealnya 10–30)
  • Execution plan tertulis: urutan skenario, seed per run, interval antar run
  • Logging diuji di satu run percobaan — pastikan semua output terekam

Saat menjalankan:

  • Setiap run diberi ID unik
  • Timestamp dicatat otomatis
  • Parameter konfigurasi yang digunakan disimpan bersama output
  • Jangan ubah kode atau konfigurasi di tengah sesi eksperimen

Format log minimum per run:

run_id, timestamp, scenario, seed, [metrik-1], [metrik-2], ..., notes

Setelah semua run selesai:

  • Hitung: berapa run berhasil dari berapa yang direncanakan
  • Jika ada yang gagal: catat penyebab dan dokumentasikan
  • Verifikasi format konsisten di semua run
  • Backup raw log sebelum diproses

Aturan sederhana: jika kamu tidak bisa menjawab "run ke berapa ini, dengan konfigurasi apa, dan apa hasilnya" untuk setiap baris di dataset kamu — logging belum cukup.

Helmi Bahara
Tentang penulis Helmi Bahara

Systems Architect & AI Workflow Thinker