Founderplus
Tentang Kami
Business & Finance

Data Cleansing di Excel: Panduan Membersihkan Data Bisnis

Published on: Friday, Apr 03, 2026 By Tim Founderplus

Anda buka file Excel berisi data penjualan bulan lalu. Nama customer ada yang ditulis "PT Makmur Jaya", "pt makmur jaya", dan "PT. MAKMUR JAYA". Itu semua customer yang sama, tapi Excel menganggapnya tiga entitas berbeda.

Hasilnya? Laporan penjualan per customer jadi kacau. Pivot table menampilkan tiga baris terpisah. Total pembelian customer itu terpecah, dan Anda kehilangan gambaran sebenarnya.

Ini bukan masalah sepele. Data kotor adalah musuh utama setiap keputusan bisnis yang Anda ambil berdasarkan spreadsheet. Dan kabar baiknya, Excel punya semua alat yang Anda butuhkan untuk membersihkannya. Sebelum mulai, pastikan Anda sudah memahami dasar manajemen keuangan untuk founder agar konteks data yang Anda olah lebih jelas.

7 Masalah Data yang Paling Umum di Bisnis

Sebelum membersihkan, Anda harus tahu apa yang kotor. Berikut tujuh masalah data yang hampir pasti Anda temui di setiap file bisnis.

1. Data Duplikat

Ini raja segala masalah data. Satu transaksi muncul dua kali karena double entry. Satu customer terdaftar tiga kali karena ada yang input via WhatsApp, ada yang dari form website, dan ada yang manual di Excel.

Dampaknya langsung terasa di laporan. Revenue terlihat lebih besar dari kenyataan. Jumlah customer terlihat lebih banyak. Semua angka jadi inflated.

2. Format Teks Tidak Konsisten

"jakarta", "Jakarta", "JAKARTA", "Jkt". Semua merujuk ke kota yang sama, tapi Excel membacanya sebagai empat nilai berbeda. Ini sering terjadi ketika banyak orang yang input data, masing-masing dengan gaya penulisan sendiri.

3. Spasi Berlebih

Spasi di depan, di belakang, atau double spasi di tengah teks. Tidak terlihat oleh mata, tapi Excel menghitungnya sebagai karakter berbeda. "Ahmad " dan "Ahmad" adalah dua nilai berbeda menurut Excel.

4. Data Kosong (Blank Cells)

Kolom nomor telepon kosong untuk 30% customer. Kolom alamat hanya terisi setengah. Data kosong membuat analisa tidak lengkap dan formula tertentu seperti VLOOKUP bisa menghasilkan error.

5. Typo dan Salah Ketik

"Surabya" bukan "Surabaya". "Prdouk A" bukan "Produk A". Typo kecil tapi impactnya besar ketika Anda filter atau pivot data berdasarkan kolom tersebut. Satu huruf salah, dan data itu tidak masuk ke kelompok yang benar.

6. Format Tanggal Campur-campur

"12/03/2026", "12-Mar-2026", "2026-03-12", "12 Maret 2026". Empat format tanggal berbeda di satu kolom. Excel bisa salah membaca mana yang hari dan mana yang bulan, terutama format DD/MM vs MM/DD.

7. Angka Tersimpan Sebagai Teks

Anda tidak bisa SUM kolom harga karena angkanya tersimpan sebagai teks. Ini sering terjadi pada data dari export CSV marketplace. Tanda-tandanya: angka rata kiri (bukan rata kanan), atau ada segitiga hijau kecil di pojok sel.

Fungsi Excel Kunci untuk Data Cleansing

Anda tidak perlu menghafal ratusan formula. Cukup kuasai fungsi-fungsi berikut ini, dan 90% masalah data bisa Anda selesaikan.

TRIM: Hapus Spasi Berlebih

=TRIM(A2)

TRIM menghapus semua spasi di awal dan akhir teks, serta mengurangi double spasi di tengah menjadi satu spasi. Fungsi ini adalah langkah pertama yang harus Anda lakukan di hampir setiap kolom data teks.

CLEAN: Hapus Karakter Non-Printable

=CLEAN(A2)

Data dari export CSV atau copy-paste dari website sering membawa karakter tersembunyi yang tidak terlihat di layar tapi mengganggu formula. CLEAN menghapus semua karakter non-printable. Kombinasikan dengan TRIM untuk hasil terbersih: =TRIM(CLEAN(A2)).

PROPER, UPPER, LOWER: Standarisasi Kapitalisasi

=PROPER(A2)    → "Jakarta Selatan"
=UPPER(A2)     → "JAKARTA SELATAN"
=LOWER(A2)     → "jakarta selatan"

Pilih satu standar dan terapkan ke seluruh kolom. PROPER paling umum dipakai untuk nama orang dan kota. UPPER cocok untuk kode produk atau SKU.

SUBSTITUTE: Ganti Teks Tertentu

=SUBSTITUTE(A2, "Jkt", "Jakarta")

Gunakan SUBSTITUTE untuk menyeragamkan singkatan atau variasi penulisan. Berbeda dengan Find & Replace, SUBSTITUTE bisa dimasukkan ke dalam formula yang lebih kompleks dan di-nest dengan fungsi lain.

VALUE: Konversi Teks ke Angka

=VALUE(A2)

Ketika angka tersimpan sebagai teks dan tidak bisa di-SUM, VALUE mengkonversinya kembali menjadi angka. Sering diperlukan setelah import data dari CSV marketplace seperti Shopee atau Tokopedia.

Fitur Excel yang Sering Dilupakan untuk Cleansing

Selain formula, Excel punya beberapa fitur built-in yang sangat powerful untuk data cleansing tapi jarang dipakai oleh kebanyakan user.

Remove Duplicates

Pilih range data, lalu klik Data → Remove Duplicates. Pilih kolom mana yang dijadikan acuan duplikasi. Excel akan menghapus baris duplikat dan memberi tahu berapa baris yang dihapus.

Peringatan penting: selalu backup data sebelum menjalankan Remove Duplicates. Fitur ini langsung menghapus baris, tidak bisa di-undo setelah file disimpan. Pastikan Anda sudah memverifikasi mana yang benar-benar duplikat.

Find & Replace dengan Wildcards

Ctrl+H bukan hanya untuk mengganti teks biasa. Anda bisa pakai wildcard: tanda tanya (?) untuk satu karakter apa saja, dan asterisk (*) untuk deretan karakter apa saja.

Contoh: cari "Jk*" dan replace dengan "Jakarta" untuk menangkap "Jkt", "Jkrt", "Jkta" sekaligus. Ini jauh lebih efisien daripada mengganti satu per satu.

Text to Columns

Data alamat atau nama lengkap sering tercampur dalam satu kolom. Text to Columns (menu Data) memecah satu kolom menjadi beberapa kolom berdasarkan delimiter seperti koma, spasi, atau karakter tertentu.

Flash Fill (Excel 2013+)

Flash Fill mendeteksi pola dari contoh yang Anda berikan. Ketik format yang Anda inginkan di baris pertama, lalu tekan Ctrl+E. Excel akan otomatis menerapkan pola yang sama ke seluruh kolom.

Contoh: dari "ahmad.sanjaya@email.com", Anda ketik "Ahmad Sanjaya" di kolom sebelah. Flash Fill akan mengekstrak nama dari email untuk baris selanjutnya.

Workflow 8 Langkah Data Cleansing

Jangan asal bersihkan. Ikuti urutan ini supaya proses cleansing Anda terstruktur dan tidak ada yang terlewat.

Langkah 1: Backup data asli. Copy file original ke folder terpisah. Jangan pernah bekerja langsung di file sumber. Ini prinsip dasar yang sering diabaikan.

Langkah 2: Identifikasi masalah. Scan setiap kolom. Cek apakah ada blank cells, format tidak konsisten, atau angka yang tersimpan sebagai teks. Gunakan conditional formatting untuk highlight cells yang kosong atau bermasalah.

Langkah 3: Hapus baris dan kolom yang tidak relevan. Export dari marketplace sering membawa kolom-kolom yang tidak Anda butuhkan. Hapus sebelum mulai cleansing agar file lebih ringan dan fokus.

Langkah 4: Bersihkan spasi dan karakter tersembunyi. Terapkan =TRIM(CLEAN()) ke semua kolom teks. Ini langkah paling dasar tapi impactnya besar.

Langkah 5: Standarisasi format teks. Terapkan PROPER, UPPER, atau LOWER sesuai kebutuhan. Gunakan SUBSTITUTE untuk menyeragamkan singkatan.

Langkah 6: Perbaiki format tanggal dan angka. Pastikan semua tanggal dalam satu format. Gunakan VALUE untuk kolom angka yang tersimpan sebagai teks. Untuk memahami metrik apa yang perlu Anda lacak setelah data bersih, baca panduan KPI untuk UKM.

Langkah 7: Hapus duplikat. Jalankan Remove Duplicates setelah semua format sudah konsisten. Kalau Anda menghapus duplikat sebelum standarisasi, bisa ada duplikat yang lolos karena penulisan berbeda.

Langkah 8: Validasi hasil. Bandingkan total baris sebelum dan sesudah. Cek apakah total SUM masih masuk akal. Spot-check 10-20 baris secara random.

Contoh Nyata: Bersihkan Data Penjualan dari Export Shopee

Mari kita terapkan workflow di atas ke skenario yang sangat umum. Anda punya data penjualan 1.000 baris dari export CSV Shopee.

Masalah yang biasanya ditemukan:

Nama produk tidak konsisten. "Kaos Polos Hitam L", "kaos polos hitam - L", "KAOS POLOS HITAM (L)". Harga tersimpan sebagai teks karena ada titik pemisah ribuan dari format Shopee. Kolom tanggal ada yang format DD/MM/YYYY dan ada yang MM/DD/YYYY. Alamat customer banyak singkatan: "Jkt", "Sby", "Bdg".

Solusi langkah per langkah:

Pertama, backup file CSV original. Buka di Excel dan simpan sebagai .xlsx.

Kedua, hapus kolom yang tidak perlu. Dari 30+ kolom export Shopee, Anda mungkin hanya butuh 8-10 kolom: tanggal order, nama produk, harga, quantity, nama buyer, kota, status, dan nomor order.

Ketiga, bersihkan semua kolom teks dengan =TRIM(CLEAN(PROPER(A2))) di kolom helper baru. Ini sekaligus menghapus spasi, karakter tersembunyi, dan menyeragamkan kapitalisasi.

Keempat, gunakan SUBSTITUTE untuk menyeragamkan singkatan kota. =SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(B2,"Jkt","Jakarta"),"Sby","Surabaya"),"Bdg","Bandung"). Ya, formula ini panjang. Tapi Anda hanya perlu membuatnya sekali.

Kelima, konversi harga dari teks ke angka. =VALUE(SUBSTITUTE(C2,".","")) untuk menghapus titik pemisah ribuan dan mengkonversi ke angka.

Keenam, standarisasi tanggal. Gunakan DATEVALUE atau Text to Columns dengan format yang benar, lalu format cells ke DD/MM/YYYY.

Ketujuh, Remove Duplicates berdasarkan nomor order. Satu nomor order seharusnya hanya muncul satu kali.

Kedelapan, copy-paste values kolom helper, hapus kolom formula, dan validasi hasilnya. Sekarang data Anda siap untuk dianalisa, di-pivot, dan dijadikan dasar keputusan bisnis. Angka yang keluar dari data bersih ini bisa langsung Anda gunakan untuk mengukur growth metrics bisnis Anda.

Tips Mencegah Data Kotor Sejak Awal

Membersihkan data itu penting. Tapi lebih penting lagi mencegahnya kotor dari awal.

Buat template input yang jelas. Kalau tim Anda input data manual, sediakan dropdown untuk kolom-kolom yang pilihannya terbatas seperti nama kota, kategori produk, atau status order. Data Validation di Excel bisa memaksa input sesuai daftar yang sudah ditentukan.

Standardisasi format di SOP. Tulis di SOP tim: tanggal pakai DD/MM/YYYY, nama kota tulis lengkap, harga tanpa titik pemisah ribuan. SOP sederhana ini mengurangi pekerjaan cleansing secara drastis.

Otomasi import data. Kalau Anda rutin import data dari marketplace, buat template Excel yang sudah ada formula cleansing di kolom-kolom helper. Tinggal paste data baru, formula otomatis bekerja. Ini jauh lebih efisien daripada membersihkan secara manual setiap kali.

Untuk memahami bagaimana data yang sudah bersih bisa langsung dipakai untuk menghitung metrik bisnis, lihat panduan cara baca laporan keuangan UKM.

Kesalahan Fatal yang Harus Dihindari

Jangan cleansing di file original. Selalu kerja di copy. Satu kali Anda tidak sengaja menghapus data penting, maka baru terasa betapa pentingnya backup.

Jangan hapus duplikat sebelum standarisasi format. Urutan ini krusial. Standarisasi dulu, baru hapus duplikat. Kalau terbalik, duplikat yang formatnya berbeda akan lolos.

Jangan abaikan data kosong begitu saja. Blank cells bisa mengacaukan formula, terutama VLOOKUP dan COUNTIF. Isi dengan "N/A" atau "Tidak Tersedia" supaya formula tetap bekerja dan Anda tahu bahwa cell itu memang tidak ada datanya, bukan terlewat.

Jangan lupa paste values setelah selesai. Kolom helper yang berisi formula cleansing harus di-copy dan paste as values. Kalau tidak, formula bisa rusak ketika Anda pindahkan atau hapus kolom sumber.

FAQ

Apa itu data cleansing dan kenapa penting untuk bisnis?

Data cleansing adalah proses membersihkan data dari kesalahan, duplikasi, format yang tidak konsisten, dan nilai kosong. Tanpa data cleansing, keputusan bisnis Anda dibangun di atas fondasi yang rapuh. Angka yang keluar dari analisa bisa menyesatkan.

Berapa lama waktu yang dibutuhkan untuk data cleansing?

Tergantung volume dan tingkat kekotoran data. Untuk 1.000 baris dari export Shopee, biasanya 30-60 menit secara manual. Dengan workflow terstruktur dan formula Excel, bisa dipangkas jadi 10-15 menit.

Apakah Google Sheets bisa dipakai untuk data cleansing?

Bisa. Hampir semua fungsi yang dibahas di artikel ini tersedia di Google Sheets. Perbedaan utamanya ada di Flash Fill yang hanya tersedia di Excel desktop. Tapi Google Sheets punya fitur auto-suggest yang mirip.

Seberapa sering harus melakukan data cleansing?

Idealnya setiap kali Anda menerima data baru dari sumber eksternal. Kalau volume tinggi, minimal seminggu sekali sebelum membuat laporan mingguan. Prinsipnya: data masuk, langsung bersihkan sebelum diolah.

Apa kesalahan data cleansing yang paling sering dilakukan pemula?

Menghapus data yang dianggap duplikat tanpa verifikasi. Kadang data terlihat duplikat tapi sebenarnya transaksi berbeda dengan nama customer yang sama. Selalu cek kolom lain seperti tanggal, jumlah, atau nomor order sebelum menghapus.


Skill spreadsheet dan analisa data adalah fondasi keputusan bisnis yang lebih tajam. Pelajari dari dasar di Founderplus Academy dengan kursus-kursus praktis mulai dari Rp18.000.

Bangun sistem bisnis yang jalan, bukan cuma ide di kepala

15 sesi mentoring intensif selama 2 bulan. Bangun sistem operasi bisnis Anda bersama praktisi berpengalaman. Batch 2026 sekarang dibuka.

Daftar BOS Sekarang