AI untuk Analisa Sales Call dan Coaching Tim
Coba hitung berapa banyak sales call tim Anda yang benar-benar pernah Anda dengarkan ulang minggu lalu. Kemungkinan besar jawabannya nol, atau satu kalau ada de …
Anda buka tagihan layanan AI di akhir bulan dan kaget angkanya dua kali lipat dari perkiraan, padahal jumlah pertanyaan tim Anda tidak banyak. Yang sering luput dari perhatian: AI tidak menagih per pertanyaan, tapi per token. Dan satu sesi yang menempelkan dokumen panjang bisa membakar token jauh lebih banyak daripada seratus pertanyaan pendek.
Token dalam AI adalah potongan kecil teks, bisa berupa satu kata pendek, bagian dari kata, tanda baca, atau spasi, yang dipakai model untuk membaca input dan menghasilkan jawaban. Model AI tidak berpikir dalam satuan kata atau karakter seperti manusia, melainkan dalam satuan token. Jumlah token inilah yang dipakai hampir semua penyedia untuk menghitung biaya dan menentukan seberapa cepat sebuah jawaban diproses. Memahami token adalah dasar untuk mengendalikan pengeluaran AI di bisnis Anda.
Bayangkan model AI sebagai taksi. Anda tidak membayar per perjalanan dengan tarif tetap, melainkan per kilometer yang dihitung argo. Token adalah "kilometer" itu. Setiap kata yang Anda kirim dan setiap kata yang dijawab model menambah jarak tempuh di argo.
Pertanyaan singkat seperti "Buatkan judul email promo" itu perjalanan dekat, argonya kecil. Tapi kalau Anda bilang "Ini laporan penjualan 20 halaman, tolong rangkum dan buat 10 ide kampanye", Anda menempuh jarak jauh karena seluruh isi laporan ikut "dibaca" dan dihitung sebagai token input. Lalu jawaban panjang model menambah token output. Argonya pun naik.
Itulah kenapa dua orang bisa pakai AI yang sama tapi tagihannya beda jauh. Yang menentukan bukan berapa kali bertanya, melainkan berapa total token yang lewat.
Saat teks masuk ke model AI, langkah pertama yang terjadi adalah tokenization, yaitu memecah teks menjadi token. Prosesnya kira-kira begini:
Setelah teks Anda jadi token, model memproses semuanya untuk memprediksi token berikutnya satu per satu sampai jawaban selesai. Inilah inti cara kerja model bahasa besar yang dibahas lebih dalam di artikel apa itu LLM. Setiap token yang masuk dan keluar dicatat, lalu dijumlahkan untuk menghitung biaya.
Satu catatan penting: tidak ada angka pasti berapa token per kata, karena tergantung bahasa dan penyedia. Patokan kasar untuk bahasa Inggris sekitar satu token per 0,75 kata. Bahasa Indonesia cenderung dipecah lebih banyak karena banyak penyedia mengoptimalkan tokenizer mereka untuk bahasa Inggris. Artinya teks Indonesia yang sama panjang sering memakan token lebih banyak. Ini detail kecil yang berdampak nyata ke tagihan kalau volume Anda besar.
Kalau Anda hanya pakai AI sesekali untuk bertanya, token mungkin tidak terasa. Tapi begitu Anda mulai mengotomatiskan proses, misalnya membalas chat pelanggan, merangkum laporan harian, atau menganalisis data penjualan, token jadi penentu langsung dari biaya operasional. Tiga hal yang perlu Anda pahami:
Biaya dihitung dari token input plus token output. Token input adalah semua yang Anda kirim: pertanyaan, instruksi, dan dokumen pendukung. Token output adalah jawaban model. Banyak penyedia mematok harga token output lebih mahal daripada token input, jadi jawaban yang bertele-tele ikut menaikkan biaya.
Konteks yang menumpuk ikut terhitung. Dalam percakapan panjang, model sering membaca ulang riwayat percakapan setiap kali Anda mengirim pesan baru. Riwayat itu masuk lagi sebagai token input. Jadi obrolan yang sudah panjang lebar bisa diam-diam menggandakan konsumsi token. Batas seberapa banyak teks yang bisa "diingat" sekaligus ini disebut context window.
Token menentukan kecepatan, bukan cuma biaya. Semakin banyak token yang harus diproses, semakin lama model menjawab. Untuk aplikasi yang melayani pelanggan secara langsung, prompt yang ramping bukan cuma lebih murah, tapi juga terasa lebih responsif.
Kabar baiknya, Anda tidak perlu jadi teknisi untuk menghemat token. Beberapa kebiasaan praktis ini bisa langsung memangkas biaya AI tanpa mengurangi kualitas hasil:
1. Tulis prompt ringkas tapi jelas. Instruksi yang berbelit memakan token input tanpa menambah kualitas. Belajar menyusun perintah yang padat adalah inti dari prompt engineering. Daripada satu paragraf basa-basi, langsung sebut tugas, format, dan batasan.
2. Batasi panjang jawaban. Tambahkan instruksi seperti "jawab dalam maksimal 5 poin" atau "ringkas dalam 3 kalimat". Ini menekan token output yang sering lebih mahal. Contoh prompt hemat:
"Rangkum laporan ini jadi 3 poin penting untuk rapat. Maksimal 2 kalimat per poin. Jangan tambahkan pembuka atau penutup."
3. Jangan tempel dokumen yang tidak relevan. Kalau Anda hanya butuh jawaban dari halaman 2 sebuah laporan, jangan tempel seluruh laporan. Setiap halaman yang ikut masuk dihitung sebagai token input, padahal model tidak butuh semuanya.
4. Mulai sesi baru saat ganti topik. Karena riwayat percakapan ikut terhitung, jangan paksakan satu obrolan panjang untuk banyak topik berbeda. Sesi baru memulai argo dari nol.
5. Pilih model sesuai tugas. Untuk pekerjaan sederhana seperti mengoreksi tata bahasa atau membuat judul, model kecil yang murah sudah cukup. Simpan model mahal untuk tugas yang benar-benar butuh analisis dalam. Perbandingan praktisnya bisa Anda lihat di artikel Claude vs ChatGPT vs Gemini untuk UKM.
Kalau Anda ingin menghitung apakah penghematan ini sepadan dengan investasi waktu, kerangka berpikirnya ada di panduan cara mengukur ROI AI tools untuk UKM.
"Satu token sama dengan satu kata." Tidak selalu. Kata pendek bisa satu token, kata panjang bisa beberapa token, dan spasi serta tanda baca juga dihitung. Untuk bahasa Indonesia, satu kata sering jadi lebih dari satu token.
"Pertanyaan pendek pasti murah." Belum tentu. Kalau pertanyaan pendek Anda menempelkan dokumen besar atau muncul di tengah percakapan yang sudah panjang, token input bisa membengkak meski pertanyaannya cuma satu baris.
"Token hanya soal biaya." Token juga memengaruhi kecepatan respons dan ada batas maksimal token yang bisa diproses sekaligus, yaitu context window tadi. Lewat dari batas itu, model bisa "lupa" bagian awal percakapan.
"Bahasa apa pun konsumsi tokennya sama." Tidak. Karena banyak tokenizer dioptimalkan untuk bahasa Inggris, teks Indonesia umumnya memakai token lebih banyak untuk makna yang sama. Ini penting kalau volume penggunaan Anda besar.
Token jarang berdiri sendiri. Ia terhubung dengan beberapa konsep yang membentuk cara kerja AI modern:
Memahami token memberi Anda kontrol nyata: dari memilih model, menulis prompt, sampai memutuskan proses bisnis mana yang layak diotomatiskan. Untuk gambaran besar bagaimana semua ini diterapkan di bisnis lokal, lihat peluang AI untuk UKM Indonesia.
Apa itu token dalam AI?
Token adalah potongan kecil teks yang dipakai model AI untuk membaca dan menghasilkan jawaban. Satu token bisa berupa satu kata pendek, bagian dari kata, tanda baca, atau spasi. Model AI tidak menghitung kata atau karakter, melainkan token, dan jumlah token inilah yang menentukan biaya serta kecepatan.
Berapa banyak token dalam satu kata?
Tidak ada angka pasti karena tergantung bahasa dan penyedia. Sebagai patokan kasar untuk bahasa Inggris, satu token kira-kira setara 0,75 kata. Bahasa Indonesia dan kata yang jarang muncul biasanya dipecah jadi lebih banyak token, jadi teks Indonesia cenderung memakai token lebih banyak per kata.
Kenapa token memengaruhi biaya AI?
Hampir semua penyedia AI menagih berdasarkan jumlah token, bukan jumlah pesan. Biaya dihitung dari token input (prompt dan konteks yang Anda kirim) ditambah token output (jawaban yang dihasilkan). Semakin panjang prompt dan jawaban, semakin banyak token, dan semakin besar tagihannya.
Apa beda token input dan token output?
Token input adalah teks yang Anda kirim ke model, termasuk pertanyaan, instruksi, dan dokumen pendukung. Token output adalah teks yang dihasilkan model sebagai jawaban. Banyak penyedia mematok harga token output lebih mahal daripada token input, jadi jawaban panjang ikut menaikkan biaya.
Bagaimana cara menghemat token saat pakai AI?
Tulis prompt ringkas tapi jelas, jangan menempelkan dokumen yang tidak relevan, batasi panjang jawaban yang diminta, dan mulai percakapan baru saat topik berganti agar konteks lama tidak ikut terhitung berulang. Untuk tugas sederhana, pilih model yang lebih kecil dan murah.
Coba hitung berapa banyak sales call tim Anda yang benar-benar pernah Anda dengarkan ulang minggu lalu. Kemungkinan besar jawabannya nol, atau satu kalau ada de …
Ada satu kalimat dari Ethan He, yang sekarang memimpin Grok Imagine di xAI, yang harusnya bikin setiap pemilik bisnis berhenti sejenak. Dalam obrolan di podcast …
Anda kirim proposal Rp 80 juta hari Senin. Kamis belum ada balasan. Jumat Anda kirim "Halo Pak, sudah sempat dilihat proposalnya?" dan dibalas "Iya nanti kami d …
Seorang founder agensi di Surabaya pernah cerita ke saya, dia kirim 300 cold email dalam satu minggu pakai template yang sama. Hasilnya, dua balasan. Satu di an …
Konsultasi dan integrasi AI bersama praktisi: dari audit, implementasi AI agent dan otomasi, sampai adopsi tim. Mulai dari sesi diagnostic AI gratis 60 menit.
Konsultasi AI via WhatsApp