WELCOME TO MY BLOG RAHAYU

WELCOME TO MY BLOG RAHAYU

Sabtu, 08 Januari 2011

data warehouse dan olap

Data Warehouse

Apabila berbagai basis data selama beberapa tahun selalu dipelihara dan dikumpulkan maka kumpulan berbagai data periodik ini bisa disebut sebagai data warehouse. Kumpulan basis data ini dapat menjadi bahan untuk analisis data dan terutama untuk mendukung pengambilan keputusan, dan pada umumnya tidak digunakan oleh organisasi untuk memproses transaksi. Sistem untuktransaksi data harian biasa disebut sebagai On Line Transaction Processing(OLTP), sebagai perbandingan berikut ini disajikan tabel perbedaan Data Warehouse dan OLTP.
TABEL: Perbandingan antara Data Warehouse dan OLAP
Data Warehouse
OLTP
  • Lebih cendrung menangani data masa lalu
  • Data disimpan dalam satu macam platform
  • Melayani permintaan insidentil, tak berstruktur, dan bersifat heuristik
  • Mendukung pengambilan keputusan strategis
  • Data diorganisasi menurut subjek, misalnya menurut produk, supplier
  • Ber-orientasi pada analisis
  • Dapat mendukung kelompok manajerial yang berjumlah sedikit
  • Menangani data masa kini
  • Data bisa saja tersimpan dalam berbagai platform
  • Melayani permintaan yang periodik atau berulang
  • Mendukung pengambilan keputusan operasional (sehari-hari)
  • Data diorganisasi menurut fungsi, misalnya menurut penjualan atau menurut produksi
  • Ber-orientasi pada transaksi
  • Mendukung kelompok kerja operasional, berjumlah banyak
Sumber data dari Data Warehouse adalah data operasional dalam suatu organisasi seperti data pelanggan, data produk, dsb, kemudian ditambah dengan data eksternal misalnya dari Internet seperti data pemasok, dan data komersial lainnya.
Data Warehouse bersifat multidimensional, lebih dari dua dimensi, sementara tabel relasional untuk OLAP hanya berdimensi dua. Sebagai contoh berikut ini adalah tayangan data tiga dimensi dari data pembelian barang selama beberapa tahun.

Berdasarkan susunan data dimensional seperti diatas, analisis data dapat dilakukan misalnya untuk menjawab pertanyaan : “Berapa jumlah barang-1 yang disalurkan oleh pemasok-2 antara tahun (n-3) sampai dengan tahun (n-1)?”. Persoalan utama yang mungkin dihadapi adalah volume data warehouse tentu sangat besar sehingga diperlukan teknologi pemrosesan paralel sepertiSymmetric Multi Processor (SMP) atau Massively Parallel Processor(MPP).
Data Warehouse dapat dibangun menggunakan program aplikasi yang dirancang sendiri, tetapi tersedia beberapa perangkat lunak yang dipasarkan khusus untuk membangun data warehouse pada suatu organisasi, antara lain:
  • SourcePoint (Software AG)
  • HP Intelligent Warehouse (Hewlett Packard)
  • FlowMark (IBM)
Laudon dan Laudon (1998) dalam bukunya menuliskan beberapa langkah untuk membangun data warehouse organisasi, yaitu:
  1. Menentukan misi dan sasaran bisnis yang akan dicapai dengan membangun data warehouse.
  2. Melakukan identifikasi komponen data yang diperlukan dari basisdata operasional untuk membangun data warehouse.
  3. Merancang struktur basis data untuk data warehouse.
  4. Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan bisa diatur sedemikian rupa agar eksekusi program analisa data tidak terlalu lamban.
  5. Mentransfer data operasional secara periodik ke dalam basis data warehouse.
Selain data warehouse dikenal pula istilah data mart yang tidak merupakan bagian dari data warehouse untuk melayani kebutuhan organisasi dalam lingkup yang lebih sempit, misalnya kebutuhan bagian atau departemen tertentu dalam organisasi. Perbedaan antara data warehouse dan data mart antara lain:
  • Data mart difokuskan untuk keperluan pemakai yang terkait dalam sebuah departemen atau suatu fungsi bisnis.
  • Data mart biasanya mengandung data operasional yang tidak terlalu rinci seperti pada data warehouse.
  • Data mart umumnya mengandung informasi yang lebih sedikit dibanding dengan data warehouse.
Beberapa contoh produk data mart adalah sebagai berikut:
  • SmartMart (IBM)
  • Visual Warehouse (IBM)
  • PowerMart (Informatica)


arsitektur sistem basis data

ARSITEKTUR SISTEM BASIS DATA
Arsitektur system basis data memberikan kerangka kerja bagi pembangunan basis data.
1.1 LEVEL ARSITEKTUR BASIS DATA
Menurut ANSI/SPARC, arsitektur basis data terbagi atas tiga level yaitu :
Internal/Physical Level:
berhubungan dengan bagaimana data disimpan secara fisik (physical
storage)
External /View Level
berhubungan dengan bagaimana data di representasikan dari sisi setiap
user.
Conceptual/Logical Level
yang menghubungkan antara internal & external level
Berikut adalah gambar tiga level arsitektur system basis data

Contoh dalam sebuah basis data pegawai, ketiga level digambarkan sebagai berikut :
- Pada level konseptual, basis data mengandung informasi tenteang sebuah entity
yang disebut EMPLOYEE. Setiap EMPLOYEE mempunyai sebuah
EMP_NUMBER (6 karakter), DEP_NUMBER(4 karakter) & SALARY (5
digit desimal).
- Pada level internal, para pegawai direpresentasikan oleh STRORED_EMP,
panjang 20 byte. STORED_EMP terdiri atas 4 field yaitu flag/pointer, 6
byte, tiga field untuk atribut pegawai.
- User yang menggunakan PL/I mempunyai sisi pandang level eksternal dimana
pegawai direpresentasikan dalam sebuah record yang ditulis dengan sintaks PL/I
- Demikianlah pula user yang menggunakan COBOL mempunyai sisi pandang
level eksternal dimana pegawai direpresentasikan dalam sebuah record yang
ditulis dengan sintaks COBOL.
1.1.1 External Level /View Level
Adalah level user. Yang dimaksud dengan user adalah programmer, end user atau DBA.
Setiap user mempunyai ‘bahasa’ yang sesuai dengan kebutuhannya.
- programmer : bahasa yang digunakan adalah bahasa pemrograman seperti C,
COBOL, atau PL/I
- end user : bahasa yang digunakan adalah bahasa query atau menggunakan
fasilitas yang tersedia pada program aplikasi
pada level eksternal ini, user dibatasi pada kemampuan perangkat keras dan perangkat
lunak yang digunakan aplikasi basis data
1.1.2 Conceptual Level / Logical level
Conceptual level adalah sebuah representasi seluruh muatan informasi yang dikandung
oleh basis data. Tidak seperti level eksternal maka pada level conceptual, keberadaannya
tidak memperhitungkan kekurangan perangkat keras maupun perangkat lunak
pembangun aplikasi basis data. Didefinisikan sebagai sebuah Skema Konseptual
1.1.3 Internal/Physical Level
Adalah level terendah untuk merepresentasikan basis data. Record disimpan dalam media
penyimpanan dalam format byte. Didefinisikan sebagai sebuah Skema Internal.
1.2 PEMETAAN
1.2.1 Conceptual/internal Mapping :
Yaitu pemetaan yang mendefinisikan hubungan antara level konseptual dan level
internal. Pemetaan ini menjelaskan bagaimana record & field pada level konseptual
direpresentasikan pada level internal.
1.2.2 External/Conceptual Mapping :
Yaitu pemetaan yang mendefinisikan hubungan antara level eksternal dan
level konseptual. Contoh : beberapa field dapat mempunyai tipe yang
berbeda, field dan nama field dapat berubah, bebeapa field pada level
konseptual dapat dikombinasikan ke dalam satu field external.
1.3 MODEL-MODEL DATA
Yang dimaksud dengan model data adalah sekumpulan tool konseptual untuk
mendeskripsikan data, relasi-relasi antar data, semantic data & konsistensi konstrain.
Bermacam-macam model data terbagi dalam tiga kelompok besar yaitu :
Object-based logical models, record-based logical models, & physical models.
1. Object-based logical Models
Yang termasuk dalam kelompok ini adalah :
- Entity-relationship model
- Object-oriented model
- Semantic data model
- Functional data model
Dua dari model di atas yaitu : entity-relationship model & object-oriented model akan
dijelaskan lebih detil.
a. Entity-relationship Model
E-R model didasarkan atas persepsi terhadap dunia nyata yanga terdiri dari
sekumpulan objek, disebut entity dan hubungan antar objek tersebut, disebut
relationship. Entity adalah objek di dunia yang bersifat unik. Setiap entity
mempunyai atribut yang membedakannya dengan entity lainnya. Contoh :
entity Mahasiswa, mempunyai atribut nama, umur, alamat no. ktm.
Pemodelan data dengan model E-R menggunakan diagram E-R. Diagram E-R
terdiri dari :
! Kotak persegi panjang, menggambarkan himpunan entity
! Elip, menggambarkan atribut-atribut entity
! Diamon, menggambarkan hubungan antara himpunan entity
! Garis, yang menghubungkan antar objek dalam diagram E-R
b. Object-Oriented Model
Model berorientasi objek berbasiskan kumpulan objek. Setiap objek berisi :
1. Nilai yang disimpan dalam variable instant, dimana variable tersebut
“melekat” dengan objek itu sendiri.
2. Metoda : operasi yang berlaku pada objek yang bersangkutan
3. Objek-objek yang memiliki tipe nilai & metode yang sama
dikelompokkan dalam satu kelas. Kelas disini mirip dengan tipe data
abstrak pada bahasa pemrograman.
4. Sending a message : sebuah objek dapat mengakses data sebuah objek
yang lain hanya dengan memanggil metode dari objek tersebut.
c. Model-model lojik berbasis record
Terdapat beberapa model dalam kelompok ini :
c.1. Model Relasional ( Relational Model)
model relasional menggunakan kumpulan tabel-tabel untuk merepresentasikan data
& relasi antar data-data tersebut. Setiap tabel terdiri atas kolom-kolom, dan setiap
kolom mempunyai nama yang unik.

Derajat Relational

MODEL ER

  1. Entity ( objek ) à objek fisik
 à objek konsep        

  1. Relational ship ( hubungan ) 

  1. Atribut ( berisi dari bagian – bagian entity )


Atribut à key ( yang bersifat utama ) : nama
            à simple ( yang bersifat tunggal ) : npm
            à multi value ( yang bersifat bercabang ) : gelar, d3, S1, S2
            à komposit ( yang bersifat bisa dibagi ) : nama depan, nama     belakang
            à derivative ( turunan dari atribut lain ) : fakultas, jurusan




Mahasiswa       à  kerja à tugas mata kuliah
       
nama
       
nama depan
       
nama belakang
       
npm
       
gelar (d3,S1,S2)
       
fakultas
       
Jurusan

Nb :     Satu mahasiswa mengerjakan satu tugas matakuliah
            Satu mahasiswa mengerjakan banyak tugas matakuliah
            Banyak mahasiswa mengerjakan satu tugas