Belajar Pandas: Alat Analisis Data Python 🐼
Pandas adalah library Python paling populer untuk mengolah data. Bayangkan seperti Excel versi programmer — tapi jauh lebih powerful!
Series — Kolom Data Berlabel
Series adalah struktur data 1 dimensi — seperti satu kolom di spreadsheet. Setiap nilai punya index (label) di sebelah kirinya.
pd.Series([10, 20, 30]) atau pd.Series({"Ali": 90, "Budi": 80})
series * 2 langsung mengalikan semua nilai — tidak perlu loop!
Simulasi Series Interaktif
Tambahkan data ke Series dan lihat bagaimana index dan value terbentuk secara berpasangan.
Masukkan nama dan nilai, lalu klik Tambah — lihat Series bertumbuh!
Kode Praktik Series
Membuat Series
Akses & Operasi Series
DataFrame — Tabel Data Lengkap
DataFrame adalah struktur data 2 dimensi seperti spreadsheet Excel — punya baris dan kolom. Setiap kolom adalah sebuah Series.
df["nama"] mengambil kolom "nama" sebagai Series.
df.loc[0] akses baris pertama. df.iloc[-1] baris terakhir.
Simulasi Membangun DataFrame
Tambahkan baris data siswa satu per satu dan lihat tabel terbentuk secara visual.
Isi form lalu klik Tambah Baris — perhatikan tabel bertambah baris baru!
| # | nama | nilai | kota |
|---|
Kode Praktik DataFrame
Membuat & Akses DataFrame
Tambah Kolom & Hapus
Eksplorasi Data — Kenali Datamu Dulu!
Sebelum menganalisis data, kamu perlu mengenal strukturnya dulu. Pandas punya tools bawaan yang powerful untuk ini.
df.head(n) Tampilkan n baris pertama (default 5). Cocok untuk ngintip data.df.tail(n) Tampilkan n baris terakhir. Cek apakah data sudah lengkap.df.info() Lihat tipe data tiap kolom dan jumlah nilai yang tidak kosong.df.describe() Statistik ringkasan: mean, min, max, std untuk kolom numerik.df.shape Tuple (jumlah baris, jumlah kolom). Contoh: (100, 5) = 100 baris, 5 kolom.Simulasi Eksplorasi Data
Klik tombol-tombol di bawah untuk melihat apa yang ditampilkan setiap fungsi eksplorasi Pandas.
Klik tombol untuk melihat hasilnya pada tabel di bawah!
Kode Praktik Eksplorasi
head, tail, shape, info
describe() — Statistik Ringkasan
Filtering — Saring Data yang Kamu Butuhkan
Filtering di Pandas bekerja dengan boolean mask — sebuah Series berisi True/False untuk setiap baris, lalu dipakai untuk menyaring DataFrame.
df[df["nilai"] >= 80] — ambil baris di mana nilai ≥ 80
df[(df["nilai"] >= 80) & (df["kota"] == "Jakarta")]
df.query("nilai >= 80 and kota == 'Jakarta'") — lebih mudah dibaca!
Simulasi Boolean Mask
Atur threshold nilai dan lihat baris mana yang lolos ✓ dan mana yang tidak lolos ✗.
| # | nama | nilai | kota | status |
|---|
Kode Praktik Filtering
Filter Sederhana
Filter Ganda & .query()
Groupby — Ringkas Data per Kategori
Groupby memisahkan data berdasarkan kategori, lalu menghitung agregasi (sum, mean, count, dll) untuk masing-masing grup. Seperti pivot table di Excel.
df.groupby("kota")["nilai"].mean() — rata-rata nilai per kota
.mean() rata-rata · .sum() jumlah · .count() cacah · .max() · .min()
df.groupby(["kota","jurusan"])["nilai"].mean()
Simulasi Groupby
Lihat bagaimana baris-baris data dikelompokkan, lalu dihitung rata-ratanya per grup.
Klik ▶ Jalankan Groupby dan lihat baris berwarna berkelompok, lalu hasil agregasi muncul!
| # | nama | kota | nilai |
|---|
| kota | rata-rata nilai |
|---|
Kode Praktik Groupby
Groupby Dasar
Groupby dengan agg()
Satukan Semua — Mini Proyek Analisis Data
Saatnya praktek! Kamu akan menganalisis data penjualan sederhana menggunakan semua yang sudah dipelajari.
- Buat DataFrame dari data penjualan
- Eksplorasi dengan
head()dandescribe() - Filter produk dengan pendapatan di atas rata-rata
- Groupby kategori dan hitung total penjualan