AI untuk Analisa Sales Call dan Coaching Tim
Coba hitung berapa banyak sales call tim Anda yang benar-benar pernah Anda dengarkan ulang minggu lalu. Kemungkinan besar jawabannya nol, atau satu kalau ada de …
Seorang pemilik toko online pernah bertanya ke saya kenapa tagihan AI-nya naik terus padahal "AI-nya kan sudah pintar dari sananya, kenapa masih bayar?". Pertanyaan itu sebenarnya menyentuh inti dari dua hal yang sering dikira sama padahal beda jauh: training dan inference.
Training vs inference adalah dua fase berbeda dalam siklus hidup model AI. Training adalah proses melatih model dengan data dalam jumlah besar sampai ia belajar pola, dilakukan sekali (atau berkala) oleh penyedia model dan butuh komputasi raksasa. Inference adalah proses memakai model yang sudah terlatih untuk menjawab pertanyaan atau membuat konten, dan inilah yang terjadi setiap kali Anda mengetik prompt. Sederhananya: training itu "sekolah", inference itu "kerja".
Memahami beda keduanya penting karena hampir semua biaya AI yang Anda bayar di operasional sehari-hari adalah biaya inference, bukan training. Mari kita bedah pelan-pelan.
Bayangkan seorang dokter. Sebelum bisa praktik, ia kuliah kedokteran bertahun-tahun, baca ribuan kasus, ikut residensi. Proses panjang dan mahal itu adalah training. Setelah lulus, setiap kali ada pasien datang, dokter mendiagnosis dalam hitungan menit memakai semua yang sudah ia pelajari. Itu inference.
Poin pentingnya: dokter tidak kuliah ulang setiap kali ada pasien baru. Pengetahuannya sudah "tertanam" dari masa sekolah. Begitu juga model AI. Setelah dilatih, "pengetahuannya" terkunci dalam jutaan bahkan miliaran parameter model. Saat Anda bertanya, model tidak belajar hal baru, ia cuma memakai apa yang sudah ada untuk merespons.
Analogi lain yang lebih dekat ke bisnis: training itu seperti merekrut dan melatih karyawan selama berbulan-bulan, sedangkan inference itu seperti karyawan tersebut mengerjakan tugas harian. Investasi besar di depan, lalu dipakai berulang kali.
Coba bawa ke skenario sehari-hari. Anda punya admin customer service. Bulan pertama Anda latih dia: kenalkan produk, ajarkan cara menjawab komplain, kasih contoh chat yang baik. Itu fase "training" yang makan waktu, tenaga, dan gaji di muka. Bulan kedua dan seterusnya, dia tinggal menjawab chat pelanggan satu per satu memakai pengetahuan yang sudah ia punya. Itu fase "kerja" alias inference. Anda tidak melatih ulang dia tiap kali ada chat masuk. Begitu juga AI: ongkos besar pelatihan sudah dibayar penyedia di awal, dan yang Anda bayar setiap hari adalah ongkos "dia menjawab".
Fase training terjadi di pusat data raksasa. Penyedia model seperti OpenAI, Anthropic, atau Google mengumpulkan data teks, gambar, atau kode dalam jumlah masif, lalu menjalankan proses yang membuat model menebak jawaban, dibandingkan dengan jawaban benar, dan menyesuaikan parameternya sedikit demi sedikit. Proses ini diulang berkali-kali sampai model jadi akurat. Ini butuh ribuan chip khusus yang berjalan selama berminggu sampai berbulan. Inilah yang melahirkan sebuah foundation model, yaitu model dasar serbaguna.
Fase inference terjadi saat model sudah jadi dan disajikan ke publik. Anda kirim prompt, model memproses input itu lewat parameter yang sudah terlatih, lalu menghasilkan output kata demi kata. Tidak ada penyesuaian parameter di sini. Model dalam keadaan "beku", hanya membaca dan menjawab.
Karena itu, sebagian besar penyedia menghitung biaya pemakaian AI berdasarkan jumlah token yang diproses saat inference, bukan saat training. Anda tidak ikut menanggung biaya melatih model dari nol, karena itu sudah ditanggung di awal oleh penyedia.
Ada satu detail yang sering bikin bingung pemilik UKM. Saat memakai AI, Anda membayar dua arah token sekaligus: token input (teks yang Anda kirim) dan token output (teks yang AI hasilkan). Keduanya dihitung di fase inference. Jadi kalau Anda menempelkan dokumen 10 halaman lalu meminta ringkasan satu paragraf, biaya terbesarnya justru di sisi input, bukan output. Memahami ini membantu Anda menebak dari mana tagihan membengkak: bukan dari "AI belajar terus", tapi dari berapa banyak teks yang lalu lalang setiap kali model dipanggil.
Membedakan training dan inference bukan sekadar pengetahuan teori. Ada tiga implikasi nyata buat pemilik UKM.
Pertama, soal biaya. Tagihan AI Anda naik bukan karena "melatih AI", tapi karena makin banyak pemakaian alias inference. Setiap percakapan, setiap dokumen yang diringkas, setiap email yang dibuat, semua memakan token inference. Kalau biaya naik, yang perlu dikontrol adalah volume dan efisiensi pemakaian, bukan "mematikan proses belajar". Untuk detail hitungannya, baca memahami biaya token AI.
Kedua, soal privasi data. Banyak founder khawatir "kalau saya kasih data perusahaan ke AI, nanti AI belajar dan bocor ke kompetitor". Faktanya, saat Anda pakai AI sehari-hari, itu inference, bukan training, jadi model tidak otomatis belajar permanen dari input Anda. Namun ini tergantung kebijakan tiap penyedia, sebagian bisa memakai data Anda untuk melatih versi berikutnya kecuali Anda menolak. Selalu cek pengaturan privasinya.
Ketiga, soal ekspektasi. Karena model "beku" saat inference, ia tidak tahu kejadian setelah tanggal pelatihannya dan tidak otomatis ingat percakapan lama. Kalau Anda ingin model paham konteks bisnis Anda secara konsisten, Anda perlu menyuapkan informasi itu lewat prompt atau teknik seperti RAG, bukan berharap ia "belajar sendiri".
Pemahaman training vs inference langsung berdampak ke keputusan praktis. Berikut cara memanfaatkannya.
Optimalkan inference, jangan obsesi melatih model sendiri. Bagi 99 persen UKM, melatih model dari nol itu tidak masuk akal, biayanya miliaran. Yang Anda butuhkan adalah memakai model yang sudah ada dengan cerdas. Fokuskan energi ke kualitas prompt, bukan ke training.
Pakai prompt yang efisien. Karena Anda bayar per pemakaian inference, prompt yang panjang dan bertele-tele berarti lebih banyak token dan biaya lebih tinggi. Belajar prompt engineering membuat hasil lebih baik dengan token lebih sedikit. Contoh prompt yang ringkas dan jelas:
"Ringkas keluhan pelanggan berikut jadi 3 poin utama dan 1 rekomendasi tindakan. Maksimal 100 kata. Teks: [tempel teks keluhan]."
Pertimbangkan fine-tuning hanya kalau benar-benar perlu. Kalau Anda punya pola tugas yang sangat spesifik dan berulang ribuan kali, barulah fine-tuning (versi ringan dari training) mungkin layak. Tapi untuk kebanyakan kasus, kombinasi prompt yang baik plus konteks yang relevan sudah cukup dan jauh lebih murah.
Hitung skala sebelum scale up. Inference per permintaan memang murah, tapi kalau Anda otomatiskan ke ribuan transaksi per hari lewat AI automation bisnis, totalnya bisa signifikan. Hitung dulu volume realistis Anda sebelum membangun otomasi besar.
Supaya tidak abstrak, bandingkan dua pemilik bisnis yang sama-sama mau pakai AI untuk balas chat pelanggan.
Toko A langsung berpikir, "Saya mau AI yang khusus paham produk saya, berarti saya harus melatih AI sendiri." Ia mencari jasa pelatihan model, dengar angka puluhan juta, lalu mundur dan menyimpulkan AI mahal dan ribet. Padahal yang ia butuhkan bukan training.
Toko B berpikir berbeda. Ia tahu yang ia butuhkan adalah inference yang cerdas. Ia menyiapkan satu dokumen berisi daftar produk, harga, kebijakan retur, dan FAQ pelanggan. Setiap kali ada chat, dokumen ringkas itu ia selipkan ke dalam prompt sebagai konteks. Hasilnya AI menjawab seakurat toko yang "dilatih khusus", tapi tanpa biaya pelatihan sama sekali. Bedanya cuma cara berpikir: Toko B paham bahwa konteks bisa disuapkan saat inference, tidak harus ditanam lewat training.
Pelajaran praktisnya: sebelum berpikir "latih AI sendiri", tanya dulu apakah masalah Anda bisa diselesaikan dengan konteks yang tepat di prompt. Sembilan dari sepuluh kasus UKM, jawabannya bisa.
Karena melatih atau menyetel model itu mahal dan teknis, gunakan pegangan sederhana ini sebelum memutuskan.
Cukup inference (prompt yang baik) kalau: tugas Anda bervariasi, volumenya wajar (puluhan sampai ratusan kali sehari), dan konteks yang dibutuhkan bisa Anda tempelkan ke prompt. Contoh: bikin caption, balas email, ringkas laporan, brainstorming ide. Ini mencakup hampir semua kebutuhan UKM.
Tambahkan konteks via RAG kalau: Anda butuh AI menjawab berdasarkan banyak dokumen internal yang terlalu besar untuk ditempel manual setiap kali, misalnya ratusan halaman SOP atau katalog. Di sini AI tetap inference, hanya saja diberi akses mengambil potongan dokumen yang relevan.
Pertimbangkan fine-tuning kalau: Anda punya satu jenis tugas yang sangat berulang, formatnya kaku, dan dijalankan ribuan kali, sampai-sampai menulis ulang instruksi panjang di setiap prompt jadi tidak efisien. Contoh: mengklasifikasi ribuan tiket support ke kategori baku setiap hari. Bahkan di kasus ini, hitung dulu apakah penghematan token sepadan dengan biaya dan kerumitan menyetel model.
Aturan praktisnya: naik tangga dari yang termurah. Mulai dari prompt yang lebih baik, baru naik ke konteks tambahan, dan fine-tuning adalah pilihan terakhir, bukan langkah pertama.
"AI belajar dari obrolan saya secara langsung." Tidak, secara default. Saat ngobrol, model sedang inference. Ia tidak mengubah dirinya berdasarkan chat Anda. Perubahan model hanya terjadi saat penyedia melatih ulang versi baru.
"Kalau saya bayar AI, sebagian buat melatih AI-nya." Hampir selalu tidak. Yang Anda bayar adalah biaya menjalankan model untuk Anda, yaitu inference. Biaya training ditanggung penyedia di muka.
"Model yang lebih besar selalu lebih mahal untuk dipakai." Tidak selalu sesederhana itu. Ukuran model memengaruhi biaya inference, tapi banyak penyedia kini menawarkan model kecil yang cepat dan murah untuk tugas ringan. Pilih model sesuai beban tugas.
"Inference itu instan dan gratis karena modelnya sudah jadi." Inference tetap butuh komputasi setiap kali dijalankan. Itu sebabnya jawaban AI muncul bertahap dan tetap ada biayanya, walau jauh lebih kecil dari training.
"Kalau saya pakai versi gratis, berarti tidak ada biaya inference." Biayanya tetap ada, hanya saja ditanggung penyedia sebagai biaya akuisisi, atau diganti dengan batasan pemakaian dan data Anda. Tidak ada inference yang benar-benar tanpa ongkos, yang ada cuma siapa yang menanggungnya.
Training dan inference adalah fondasi yang menjelaskan banyak istilah lain. Saat model menjalani training, yang sedang "diasah" adalah bobot di dalam neural network, dan keseluruhan pendekatan ini adalah bagian dari machine learning. Model bahasa yang Anda pakai sehari-hari, seperti yang dijelaskan di apa itu LLM, adalah hasil training masif yang kemudian Anda akses lewat inference.
Saat inference berjalan, faktor seperti temperature mengatur seberapa kreatif output, dan context window menentukan berapa banyak informasi yang bisa dibaca model dalam satu permintaan. Semua ini terjadi di fase inference, bukan training. Memahami pemisahan ini membuat Anda lebih jernih saat membaca dokumentasi atau memilih tools AI.
Apa bedanya training dan inference dalam AI?
Training adalah proses melatih model AI dengan banyak data sampai ia "belajar" pola, dilakukan satu kali (atau berkala) oleh penyedia model dan butuh komputasi sangat besar. Inference adalah proses memakai model yang sudah jadi untuk menjawab pertanyaan atau membuat konten, terjadi setiap kali Anda mengetik prompt dan jauh lebih ringan.
Apakah saya membayar untuk training atau inference saat pakai AI?
Hampir selalu inference. Saat Anda pakai ChatGPT, Claude, atau Gemini, biaya yang Anda tanggung (langganan atau per token) adalah biaya inference, yaitu biaya menjalankan model untuk merespons Anda. Biaya training raksasa sudah ditanggung penyedia model di awal.
Kenapa inference lebih murah daripada training?
Training memproses miliaran contoh data berkali-kali untuk membentuk seluruh kemampuan model, jadi butuh ribuan chip mahal selama berminggu atau berbulan. Inference cuma menjalankan model sekali per permintaan, jadi biayanya per pemakaian jauh lebih kecil, walau kalau dipakai jutaan kali totalnya tetap besar.
Apakah AI belajar dari percakapan saya secara real-time?
Tidak secara default. Saat Anda mengobrol, model sedang inference, bukan training, jadi ia tidak langsung "mengingat" atau belajar permanen dari chat Anda. Model hanya berubah kalau penyedia melatih ulang versi baru. Cek kebijakan privasi tiap penyedia soal apakah data Anda dipakai untuk training di masa depan.
Apakah fine-tuning termasuk training atau inference?
Fine-tuning termasuk training, tapi versi ringan. Anda mengambil model yang sudah dilatih lalu melatihnya lagi dengan data spesifik Anda agar lebih cocok untuk tugas tertentu. Setelah fine-tuning selesai, pemakaian model hasilnya tetap masuk fase inference seperti biasa.
Coba hitung berapa banyak sales call tim Anda yang benar-benar pernah Anda dengarkan ulang minggu lalu. Kemungkinan besar jawabannya nol, atau satu kalau ada de …
Ada satu kalimat dari Ethan He, yang sekarang memimpin Grok Imagine di xAI, yang harusnya bikin setiap pemilik bisnis berhenti sejenak. Dalam obrolan di podcast …
Anda kirim proposal Rp 80 juta hari Senin. Kamis belum ada balasan. Jumat Anda kirim "Halo Pak, sudah sempat dilihat proposalnya?" dan dibalas "Iya nanti kami d …
Seorang founder agensi di Surabaya pernah cerita ke saya, dia kirim 300 cold email dalam satu minggu pakai template yang sama. Hasilnya, dua balasan. Satu di an …
Konsultasi dan integrasi AI bersama praktisi: dari audit, implementasi AI agent dan otomasi, sampai adopsi tim. Mulai dari sesi diagnostic AI gratis 60 menit.
Konsultasi AI via WhatsApp