Langsung ke konten utama
Mode cepat berada dalam pratinjau penelitian. Fitur, harga, dan ketersediaan dapat berubah berdasarkan umpan balik.
Mode cepat adalah konfigurasi kecepatan tinggi untuk Claude Opus, membuat model hingga 2,5x lebih cepat dengan biaya per token yang lebih tinggi. Aktifkan dengan /fast ketika Anda membutuhkan kecepatan untuk pekerjaan interaktif seperti iterasi cepat atau debugging langsung, dan nonaktifkan ketika biaya lebih penting daripada latensi. Mode cepat bukan model yang berbeda. Mode ini menggunakan Claude Opus dengan konfigurasi API berbeda yang memprioritaskan kecepatan daripada efisiensi biaya. Anda mendapatkan kualitas dan kemampuan yang identik dengan respons yang lebih cepat. Mode cepat didukung pada Opus 4.8, Opus 4.7, dan Opus 4.6. Mode ini tidak tersedia pada Sonnet, Haiku, atau model lainnya.
Mode cepat untuk Opus 4.6 sudah usang dan akan dihapus sekitar 30 hari setelah peluncuran Opus 4.8. Setelah penghapusan, mode cepat pada Opus 4.6 kembali ke kecepatan standar dengan harga standar. Migrasikan ke Opus 4.8 atau Opus 4.7 untuk mempertahankan percepatan.
Mode cepat memerlukan Claude Code v2.1.36 atau lebih baru. Periksa versi Anda dengan claude --version.
Yang perlu diketahui:
  • Gunakan /fast untuk mengaktifkan mode cepat di Claude Code CLI. Mode cepat tidak didukung di ekstensi VS Code.
  • Harga mode cepat per MTok input/output adalah $10/$50 pada Opus 4.8 dan $30/$150 pada Opus 4.7 dan Opus 4.6.
  • Tersedia untuk semua pengguna Claude Code pada paket berlangganan (Pro/Max/Team/Enterprise) dan Claude Console.
  • Untuk pengguna Claude Code pada paket berlangganan (Pro/Max/Team/Enterprise), mode cepat tersedia hanya melalui penggunaan kredit dan tidak termasuk dalam batas laju penggunaan berlangganan.
Halaman ini mencakup cara mengaktifkan mode cepat, pertukaran biayanya, kapan menggunakannya, persyaratan, opt-in per sesi, dan perilaku batas laju.

Aktifkan mode cepat

Aktifkan mode cepat dengan salah satu cara berikut: Secara default, mode cepat bertahan di seluruh sesi. Administrator dapat mengonfigurasi mode cepat untuk disetel ulang setiap sesi. Lihat require per-session opt-in untuk detail. Untuk efisiensi biaya terbaik, aktifkan mode cepat di awal sesi daripada beralih di tengah percakapan. Lihat understand the cost tradeoff untuk detail. Ketika Anda mengaktifkan mode cepat:
  • Jika Anda berada di model yang berbeda, Claude Code secara otomatis beralih ke Opus
  • Anda akan melihat pesan konfirmasi: “Fast mode ON”
  • Ikon kecil muncul di sebelah prompt saat mode cepat aktif
  • Jalankan /fast lagi kapan saja untuk memeriksa apakah mode cepat aktif atau tidak
Ketika Anda menonaktifkan mode cepat dengan /fast lagi, Anda tetap berada di Opus. Model tidak kembali ke model sebelumnya. Untuk beralih ke model yang berbeda, gunakan /model. Opus 4.8 adalah default mode cepat di Claude Code v2.1.154 dan lebih baru. Pada v2.1.142 hingga v2.1.153, mode cepat default ke Opus 4.7.

Pahami pertukaran biaya

Mode cepat memiliki harga per-token yang lebih tinggi daripada Opus standar, dengan pengganda yang bervariasi menurut model:
ModelInput (MTok)Output (MTok)
Opus 4.8$10$50
Opus 4.7 dan Opus 4.6$30$150
Harga mode cepat datar di seluruh jendela konteks 1M token penuh. Untuk tarif Opus standar yang akan dibandingkan, lihat referensi harga Claude. Pertama kali Anda mengaktifkan mode cepat dalam percakapan, Anda membayar harga token input tanpa cache mode cepat penuh untuk seluruh konteks percakapan. Semakin dalam Anda berada dalam percakapan, semakin mahal biayanya, jadi mengaktifkan mode cepat dari awal lebih murah. Biaya diterapkan sekali per percakapan, jadi mematikan dan menyalakan kembali mode cepat nanti tidak mengulanginya. Untuk mekanismenya, lihat bagaimana mode cepat berinteraksi dengan prompt cache.

Tentukan kapan menggunakan mode cepat

Mode cepat terbaik untuk pekerjaan interaktif di mana latensi respons lebih penting daripada biaya:
  • Iterasi cepat pada perubahan kode
  • Sesi debugging langsung
  • Pekerjaan sensitif waktu dengan tenggat waktu ketat
Mode standar lebih baik untuk:
  • Tugas otonomi jangka panjang di mana kecepatan kurang penting
  • Pemrosesan batch atau pipeline CI/CD
  • Beban kerja sensitif biaya

Mode cepat vs tingkat usaha

Mode cepat dan tingkat usaha keduanya mempengaruhi kecepatan respons, tetapi dengan cara yang berbeda:
PengaturanEfek
Mode cepatKualitas model yang sama, latensi lebih rendah, biaya lebih tinggi
Tingkat usaha lebih rendahWaktu pemikiran lebih sedikit, respons lebih cepat, potensi kualitas lebih rendah pada tugas kompleks
Anda dapat menggabungkan keduanya: gunakan mode cepat dengan tingkat usaha yang lebih rendah untuk kecepatan maksimal pada tugas yang mudah.

Persyaratan

Mode cepat memerlukan semua hal berikut:
  • Hanya API Anthropic atau langganan: mode cepat tersedia melalui API Konsol Anthropic dan untuk paket langganan Claude menggunakan penggunaan kredit. Mode ini tidak tersedia di Amazon Bedrock, Google Vertex AI, Microsoft Azure Foundry, atau Claude Platform di AWS.
  • Penggunaan kredit diaktifkan: akun Anda harus memiliki penggunaan kredit diaktifkan, yang memungkinkan penagihan di luar penggunaan yang disertakan dalam paket Anda. Untuk akun individual, aktifkan ini di pengaturan penagihan Konsol Anda. Untuk Teams dan Enterprise, admin harus mengaktifkan penggunaan kredit untuk organisasi.
Penggunaan mode cepat ditagih langsung ke penggunaan kredit, bahkan jika Anda memiliki penggunaan yang tersisa di paket Anda. Ini berarti token mode cepat tidak dihitung terhadap penggunaan yang disertakan dalam paket Anda dan dikenakan biaya dengan tarif mode cepat dari token pertama.
  • Aktivasi admin untuk Teams dan Enterprise: mode cepat dinonaktifkan secara default untuk organisasi Teams dan Enterprise. Admin harus secara eksplisit mengaktifkan mode cepat sebelum pengguna dapat mengaksesnya.
Jika admin Anda belum mengaktifkan mode cepat untuk organisasi Anda, perintah /fast akan menampilkan “Fast mode has been disabled by your organization.” Jika daftar allowlist availableModels organisasi Anda mengecualikan model Opus mode cepat, /fast ditolak dengan “is not in your organization’s allowed models”.

Aktifkan mode cepat untuk organisasi Anda

Admin dapat mengaktifkan mode cepat di: Opsi lain untuk menonaktifkan mode cepat sepenuhnya adalah dengan menetapkan CLAUDE_CODE_DISABLE_FAST_MODE=1. Lihat Variabel lingkungan.

Require per-session opt-in

Secara default, mode cepat bertahan di seluruh sesi: jika pengguna mengaktifkan mode cepat, mode ini tetap aktif di sesi mendatang. Administrator pada paket Teams atau Enterprise dapat mencegah ini dengan menetapkan fastModePerSessionOptIn ke true di pengaturan terkelola atau pengaturan yang dikelola server. Ini menyebabkan setiap sesi dimulai dengan mode cepat mati, memerlukan pengguna untuk secara eksplisit mengaktifkannya dengan /fast.
{
  "fastModePerSessionOptIn": true
}
Ini berguna untuk mengontrol biaya di organisasi di mana pengguna menjalankan beberapa sesi bersamaan. Pengguna masih dapat mengaktifkan mode cepat dengan /fast ketika mereka membutuhkan kecepatan, tetapi mode ini disetel ulang di awal setiap sesi baru. Preferensi mode cepat pengguna masih disimpan, jadi menghapus pengaturan ini mengembalikan perilaku persisten default.

Tangani batas laju

Mode cepat memiliki batas laju terpisah dari Opus standar. Mode cepat pada Opus 4.8, Opus 4.7, dan Opus 4.6 berbagi pool batas laju yang sama: penggunaan pada salah satu dari mereka menarik dari batas yang sama. Ketika Anda mencapai batas laju mode cepat atau kehabisan kredit penggunaan:
  1. Mode cepat secara otomatis kembali ke kecepatan standar
  2. Ikon berubah menjadi abu-abu untuk menunjukkan cooldown
  3. Anda terus bekerja dengan kecepatan dan harga standar
  4. Ketika cooldown berakhir, mode cepat secara otomatis diaktifkan kembali
Untuk menonaktifkan mode cepat secara manual daripada menunggu cooldown, jalankan /fast lagi.

Pratinjau penelitian

Mode cepat adalah fitur pratinjau penelitian. Ini berarti:
  • Fitur dapat berubah berdasarkan umpan balik
  • Ketersediaan dan harga dapat berubah
  • Konfigurasi API yang mendasar dapat berkembang
Laporkan masalah atau umpan balik melalui saluran dukungan Anthropic biasa Anda.

Lihat juga