Traffine I/O

Bahasa Indonesia

2023-04-07

Indeks dalam Database

Indeks dalam Database

Di dunia database, pengambilan data dan eksekusi kueri adalah operasi yang kritis. Ketika berurusan dengan kumpulan data yang besar, mencari data yang diinginkan di dalamnya secara langsung dapat memakan waktu yang lama. Di sinilah indeks berperan. Sama seperti indeks dalam buku membantu Anda dengan cepat menemukan informasi tertentu tanpa membaca seluruh buku, indeks dalam database membantu mesin database menemukan data yang diinginkan tanpa harus memindai setiap baris di dalam tabel.

Tujuan dari Indeks

Indeks memiliki beberapa tujuan penting dalam sistem manajemen database.

  • Mempercepat Kueri
    Salah satu tujuan utama dari indeks adalah meningkatkan kecepatan operasi pengambilan data. Tanpa indeks, sistem manajemen database harus melakukan pemindaian tabel secara menyeluruh untuk setiap kueri, yang berarti harus memeriksa setiap catatan di dalam tabel. Indeks menyimpan data dalam cara yang memungkinkan sistem menemukan data yang dibutuhkan dengan lebih cepat, seringkali mengurangi jumlah operasi I/O disk secara drastis. Hal ini dapat membuat perbedaan yang signifikan dalam performa kueri, terutama dengan kumpulan data yang besar.

  • Menegakkan Keunikan
    Indeks dapat digunakan untuk memastikan bahwa tidak ada dua baris dalam database memiliki nilai yang sama untuk kolom-kolom tertentu. Ini disebut indeks unik. Misalnya, dalam tabel pengguna, Anda mungkin ingin memastikan bahwa tidak ada dua pengguna dengan alamat email yang sama. Dengan membuat indeks unik pada kolom email, database secara otomatis akan mencegah data baru dimasukkan jika akan menghasilkan alamat email yang duplikat.

  • Memfasilitasi Pengurutan dan Pengelompokan
    Selain mempercepat pengambilan data, indeks juga dapat memfasilitasi pengurutan dan pengelompokan data yang lebih cepat. Ketika data diindeks, seringkali disimpan dalam struktur yang terurut. Akibatnya, database kadang-kadang dapat menggunakan data yang terurut ini secara langsung daripada harus mengurutkan data lagi saat menjalankan kueri yang membutuhkan hasil yang terurut.

Cara Kerja Indeks

Indeks diimplementasikan sebagai struktur data yang menyimpan subset dari data dalam database. Bentuk indeks yang paling umum berisi salinan dari kunci primer setiap baris dalam tabel dan penunjuk lokasi setiap kunci dalam berkas data. Indeks ini struktural dalam cara yang memungkinkannya untuk dicari dengan sangat efisien.

Pada intinya, indeks terdiri dari dua komponen:

  • Kunci
    Ini adalah nilai dari kolom-kolom yang diindeks di dalam tabel. Biasanya disimpan dalam urutan yang terurut.

  • Penunjuk
    Ini adalah referensi ke lokasi setiap kunci dalam berkas data.

Kombinasi kunci dan penunjuk memungkinkan mesin database menggunakan indeks untuk dengan cepat menemukan lokasi data di berkas data tanpa harus memindai seluruh tabel.

Jenis-Jenis Indeks

Saya akan menjelaskan jenis-jenis indeks, dengan fokus pada tiga jenis yang paling umum: Indeks B-tree, Indeks Bitmap, dan Indeks Hash.

Indeks B-tree

Salah satu jenis indeks paling populer yang digunakan dalam database adalah indeks B-tree. B-tree merupakan singkatan dari Pohon Seimbang (Balanced Tree), dan ini adalah struktur data pohon yang seimbang dan mempertahankan data yang terurut serta memungkinkan pencarian, penambahan, dan penghapusan dalam waktu logaritmik.

Struktur Indeks B-tree

Indeks B-tree mengorganisir kunci-kunci dalam struktur hierarkis dan seimbang yang dikenal sebagai B-tree. Pohon ini terdiri dari serangkaian simpul, dengan simpul teratas disebut akar (root). Setiap simpul dalam pohon berisi sejumlah kunci-kunci dan penunjuk anak, yang diurutkan dalam urutan tertentu.

Simpul dibagi menjadi simpul internal dan simpul daun. Simpul internal memiliki kunci-kunci dan penunjuk anak, sedangkan simpul daun berisi kunci-kunci dan penunjuk ke catatan data aktual. B-tree dirancang sehingga simpul-simpul daun selalu berada pada kedalaman yang sama, memastikan keseimbangan dan akses yang efisien.

Keunggulan Indeks B-tree

  • Efisien dalam menangani kueri dengan rentang dan kueri kesetaraan.
  • Mendukung pengurutan, yang bermanfaat untuk pengurutan dan pengambilan dalam urutan tertentu.
  • Secara otomatis menyeimbangkan diri saat entri ditambahkan atau dihapus.

Indeks Bitmap

Indeks Bitmap digunakan ketika sebuah kolom memiliki kardinalitas rendah, yang berarti kolom tersebut memiliki jumlah nilai yang sangat terbatas.

Struktur Indeks Bitmap

Pada Indeks Bitmap, setiap nilai unik dalam kolom memiliki bitmap (larik bit) yang sesuai. Setiap bit dalam bitmap mewakili satu baris dalam tabel. Bit diatur menjadi 1 jika nilai kolom untuk baris tersebut cocok dengan nilai unik yang terkait, dan 0 jika tidak cocok.

Keunggulan Indeks Bitmap

  • Indeks bitmap sangat efisien dalam penggunaan ruang.
  • Mereka dapat digunakan secara efisien dalam kueri yang memiliki beberapa kondisi (operasi AND, OR).

Indeks Hash

Indeks Hash digunakan untuk skenario di mana kriteria pencarian mencari kecocokan yang tepat.

Struktur Indeks Hash

Dalam Indeks Hash, fungsi hash digunakan untuk memetakan kunci (nilai kunci indeks) ke alamat (lokasi catatan data dalam berkas data). Hasil keluaran dari fungsi hash, yang dikenal sebagai nilai hash, menunjukkan di mana data dapat ditemukan. Struktur ini dikenal sebagai tabel hash, dan berisi serangkaian ember (bucket).

Keunggulan Indeks Hash

  • Sangat efisien untuk pencarian yang membutuhkan kecocokan yang tepat.
  • Dapat lebih cepat daripada indeks B-tree untuk pola pencarian tertentu, terutama ketika distribusi kunci adalah seragam.

Contoh

Mari kita ilustrasikan indeks B-tree, Bitmap, dan Hash dengan contoh sederhana. Bayangkan kita memiliki sebuah tabel sederhana bernama Karyawan dengan data berikut:

EmployeeID Nama Departemen
1 Alice HR
2 Bob Sales
3 Carol HR
4 Dave IT
5 Eve Sales
6 Frank IT

Contoh Indeks B-tree

Jika kita membuat indeks B-tree pada kolom EmployeeID, struktur indeksnya mungkin akan terlihat seperti ini:

    [3]
   /    \
 [1,2]   [4,5,6]

Di sini, angka-angka tersebut mewakili Employee ID. Indeks B-tree mengorganisir ID-ID ini dalam struktur pohon yang memudahkan pencarian ID tertentu secara efisien. Misalnya, jika Anda mencari EmployeeID 5, database akan membandingkan 5 dengan 3, menentukan bahwa nilainya lebih besar, dan kemudian melihat simpul anak kanan [4,5,6] untuk menemukan catatan yang sesuai.

Contoh Indeks Bitmap

Jika kita membuat indeks Bitmap pada kolom Departemen, indeksnya mungkin akan terlihat seperti ini:

Department: HR    -> 1 0 1 0 0 0
            Sales -> 0 1 0 0 1 0
            IT    -> 0 0 0 1 0 1

Setiap bit mewakili satu baris dalam tabel. Misalnya, pada bitmap HR, bit pertama dan ketiga diatur menjadi 1, yang menunjukkan bahwa karyawan pertama dan ketiga berada di departemen HR. Indeks bitmap efisien saat kardinalitasnya rendah.

Hash Index Example

If we create a Hash index on the EmployeeID column, it might look like this:

Hashed Value of EmployeeID: 1 -> [Address of Record with EmployeeID 1]
                            2 -> [Address of Record with EmployeeID 2]
                            3 -> [Address of Record with EmployeeID 3]
                            4 -> [Address of Record with EmployeeID 4]
                            5 -> [Address of Record with EmployeeID 5]
                            6 -> [Address of Record with EmployeeID 6]

The hash index uses a hash function to directly map the Employee IDs to the address or location of the records in the data file. This allows for very fast access in case of equality searches but is not useful for range queries.

Memilih Jenis Indeks yang Tepat

Ketika mengelola sebuah database, penting untuk memilih jenis indeks yang tepat untuk mengoptimalkan performa. Pilihan indeks dapat secara signifikan memengaruhi seberapa cepat dan efisien kueri dieksekusi. Berikut adalah faktor-faktor yang mempengaruhi pilihan indeks dan bagaimana membandingkan indeks B-tree, Bitmap, dan Hash untuk membuat keputusan yang tepat.

  • Polanya Kueri
    Memahami jenis kueri yang akan dijalankan terhadap database sangat penting. Misalnya, jika aplikasi Anda sebagian besar melakukan pencarian persis, indeks Hash bisa menjadi pilihan yang ideal. Namun, jika aplikasi Anda sering menjalankan kueri rentang, indeks B-tree lebih sesuai.

  • Kardinalitas
    Indeks Bitmap sangat berguna untuk kolom-kolom dengan kardinalitas rendah, sedangkan indeks B-tree lebih efisien untuk data dengan kardinalitas tinggi.

  • Rasio Baca dan Tulis
    Pertimbangkan rasio operasi baca dan tulis pada database Anda. Jika database Anda didominasi oleh operasi baca, mengoptimalkan untuk bacaan yang lebih cepat dengan indeks tambahan mungkin menguntungkan. Namun, jika aplikasi Anda melibatkan operasi tulis yang sering (penyisipan, pembaruan, dan penghapusan), perlu berhati-hati dengan pengindeksan karena dapat memperlambat performa penulisan.

  • Ruang Disk
    Indeks menggunakan ruang disk. Penting untuk mempertimbangkan jumlah ruang disk yang tersedia dan seberapa banyak indeks yang akan digunakan.

  • Pemeliharaan
    Indeks membutuhkan pemeliharaan, terutama di lingkungan yang didominasi oleh operasi tulis. Misalnya, indeks B-tree mungkin perlu direkonstruksi atau diorganisir ulang secara berkala untuk menjaga performa.

Kerugian Indeks

Meskipun indeks merupakan alat yang kuat untuk mengoptimalkan performa database, mereka tidaklah tanpa kekurangan. Memahami kekurangan ini penting untuk manajemen database yang efektif.

  • Penggunaan Ruang Disk yang Meningkat
    Setiap indeks yang dibuat menggunakan ruang disk. Bergantung pada ukuran database dan jumlah indeks, ini dapat dengan cepat menambah penggunaan penyimpanan yang signifikan.

  • Performa Tulis yang Lebih Lambat
    Indeks dapat memperlambat performa operasi penyisipan, pembaruan, dan penghapusan. Setiap kali data dimodifikasi, indeks yang terkait juga perlu diperbarui. Tambahan pekerjaan ini dapat memperpanjang waktu operasi tulis.

  • Beban Pemeliharaan
    Indeks membutuhkan pemeliharaan. Saat data berubah, indeks dapat menjadi fragmentasi atau mengalami pembengkakan, yang memerlukan pembaruan atau pengorganisasian secara berkala untuk menjaga performa. Pemeliharaan ini dapat memerlukan resource yang intensif dan perlu direncanakan dengan hati-hati agar tidak mempengaruhi beban kerja produksi.

  • Kompleksitas
    Menggunakan beberapa indeks atau struktur indeks yang kompleks dapat memperkenalkan kompleksitas tambahan dalam desain database. Kompleksitas ini dapat membuat lebih sulit untuk memprediksi performa kueri dan dapat mempersulit pemecahan masalah performa.

Meskipun indeks tidak bisa dipisahkan dari optimasi performa kueri, mereka harus digunakan dengan bijak.

Ryusei Kakujo

researchgatelinkedingithub

Focusing on data science for mobility

Bench Press 100kg!