Resume Data Warehouse Pertemuan 5

  • STAR SCHEMA
Disebut star schema karena entity-relationship diagram atau ERD-nya yang menyerupai konstelasi bintang, beberapa bintang  besar (fact table) dikelilingi bintang-bintang yang lebih kecil (dimension tables). (Wikimedia Foundation, Inc., 2011) .
  1. Fact table menampung nilai-nilai metric yang direkam untuk suatu kejadian yang spesifik. Sehubungan dengan tujuan untuk menampul data atomik, biasanya terdapat sejumlah besar record (jutaan). Pengelolaan khusus dilakukan untuk meminimalisasi jumlah dan ukuran atribut dengan tujuan membatasi ukuran tabel keseluruhan dan mengatur performa. Fact tables biasanya berupa transaksi (fakta-fakta mengenai kejadian tertentu, misalnya penjualan), snapshot (fakta-fakta yang direkam pada suatu waktu tertentu, misalnya rincian Account pada awal bulan), dan tabel-tabel snapshot akumulasi (misalnya, penjualan month-to-date untuk suatu produk). 
  2. Dimension tables biasanya memiliki record yang lebih sedikit dibandingkan fact tables, tetapi bisa memiliki jumlah atribut yang besar untuk mendeskripsikan data fakta.
Menurut Lane (2005, pp. 19-3), kelebihan utama dari star schema adalah bahwa star schema:
  1. Menyediakan pemetaan langsung dan intuitif antara entitas-entitas bisnis yang sedang dianalisa oleh end users dan desain schema.
  2. Menyediakan performa teroptimasi untuk star query umum.
  3. Didukung oleh banyak business intelligence tools, yang dapat melakukan antisipasi atau bahkan membutuhkan agar schema data warehouse berisi tabel-tabel dimensi.
  • SNOWFLAKE SCHEMA
Merupakan varian dari skema bintang dimana table-table dimensi tidak terdapat data yang di denormalisasi. Dengan kata lain satu atau lebih table dimensi tidak bergabung secara langsung kepada table fakta tapi pada table dimensi lainnya. Sebagai contoh, sebuah dimensi yang mendeskripsikan produk dapat dipisahkan menjadi tiga table (snowflaked)
Keuntungan & Kerugian Snowflake Schema
  1. Keuntungan  menggunakan  model  Snowflake
o  Pemakain space yang lebih sedikit
o   Update dan maintenance yang lebih mudah
  1. Kerugian  menggunakan  model  ini  yaitu :
  • Model lebih komplek dan rumit 
  • Proses query lebih lambat 
  • Performance yang kurang bagus  

  • STARFLAKE SCHEMA
Menurut Connolly & Begg (2010, p1230) Starflake Schema adalah sebuah dimensiondal Data model yang memiliki tabel fakta di tengahnya dan dikelilingi oleh normalisasi dan denormalisasi tabel dimensi. Dari definisi diatas, maka dapat disimpulkan Starflake Schema adalah campuran antara star schema dan snowflake schema yang dimana table dimensi tidak hanya terdapat table yang dinormalisasi melainkan terdapat juga table dimensi yang didenormalisasi.


Outtriggers
Menurut Kimball (2010, p334) outriggers adalah tabel dimensi yang bergabung dengan tabel dimensi lainnya
tetapi hanya ada satu layer yang dihapus dari fact table.

  • REFERENSI
  1. http://supartod.wordpress.com/tag/star-schema/
  2. http://haniif.wordpress.com/2007/08/01/24-tinjauan-pustaka-data-warehouse-dan-olap/
  3. http://library.binus.ac.id/eColls/eThesisdoc/Bab2HTML/2013100090SIBab2003/page37.html
  4. http://effendyimagination.blogspot.com/2013/10/prinsip-prinsip-pemodelan-dimensi-nama-l.html
  5. Kimball,R.,Merz, R (1998). The Data Warehouse Lifecycle Toolkit. Expert Methods for Designing, Developing and Deploying Data Warehouses. Wiley Computer Publishing, Canada.

0 komentar:

Posting Komentar