Minggu, 08 September 2013

Data Warehouse

Nama   : L.Efendi
NIM    : 11.41010.0211
Tugas  : Pertemuan 1  [ MK Data Warehouse ]


Ada beberapa pendapat tentang data warehouse :
> Ralph Kimballdata warehouse adalah suatu sistem yang mengekstrak, membersihkan, menyesuaikan diri, dan mengirim sumber data ke dalam suatu data penyimpanan dimensional dan kemudian mendukung implementasi query dan analisis untuk tujuan pengambilan keputusan.

>  Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.

>  Menurut Bill Inmondata warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, bervariasi waktu, dan non-volatile, yang mendukung proses pengambilan keputusan oleh manajemen.

> Menurut Vidette Poedata warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.

  Jadi, dari beberapa pendapat tersebut bisa ditarik kesimpulan bahwa  Data Warehouse adalah kumpulan data dari berbagai sumber internal maupun eksternal yang dikumpulkan menjadi satu dalam tempat penyimpanan yang berukuran besar yang bisa digunakan untuk pengambilan keputusan, dan bersifat berorientasi subjek, terintegrasi, time-variant, dan non-volatine.


Apa yang dimaksud bersifat berorientasi subjek?
 Jadiii.. data di dalam Datawarehouse diperoleh berdasarkan enterprise subject seperti dari  customers, products dan sales. dan  didesain bukan pada proses atau aplikasi tertentu melainkan untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi.


Empat karakteristik dari Datawarehouse meliputi :

1. Subject oriented :  Sebuah data warehouse disusun dalam subjek utama, seperti pelanggan, suplier, produk, dan sales. Meskipun data warehouse terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan, data warehouse fokus pada pemodelan dan analisis data untuk pembuat keputusan. Oleh karena itu data warehouse mempunyai karakter menyediakan secara singkat dan sederhana gambaran seputar subjek lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan.

2. Terintegrasi ?
Kenapa data warehouse Terintegrasi? arti integrasi itu sendiri adalah penggabungan data dari beberapa sumber. jadi data warehouse terintegrasi karena data warehouse memiliki data yang diambil dari berbagai sistem operasional dan data eksternal maupun data internal.

3. Data warehouse bersifat time-variant (Rentang waktu) ?
            Data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu misalnya data yang disajikan adalah data antara 5 sampai 10 tahun. dan data yang digunakan adalah data yang disimpan minimal 5 tahun.

 4. Data warehouse bersifat non-volatile
            artinya data pada data warehouse tidak diupdate secara real time tetapi di refresh dari sistem operasional secara reguler.


Kegunaan dari data warehouse adalah :
            Mempermudah pembuatan aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data warehouse adalah  khusus untuk membuat suatu database yang dapat digunakan untuk mendukung proses analisa bagi para pengambil keputusan.


Arsitektur Data Warehouse
  Arsitektur data warehouse (lihat gambar di bawah) mencakup proses ETL (Extraction, Transformation, Loading) untuk memindahkan data dari operational data source dan sumber data eksternal lainnya ke dalam data warehouse .




 Nah, apa itu data transaksional?
  Itu adalah istilah untuk data yang digunakan dalam kegiatan organisasi sehari-hari. Dalam operasionalnya, data transaksi berubah  dan bertambah sesuai kondisi sebenarnya. Sebagai misal, data transaksi penjualan barang pada suatu swalayan yang ada di sistem aplikasi penjualan semacam Point of Sale (POS) yang bisasanya dioperasikan para kasir.


Sekarang, perhatikan gambar berikut :

  Data yang disimpan dalam datawarehouse diupload dari sistem di bagian-bagian  operasional (seperti pemasaran, penjualan, dll) ditunjukkan pada gambar di samping melalui mekanisme ETL.

          ETL singkatan dari Extract, Transform, and Load. Ekstrak dilakukan terhadap data yang berasal dari sumber. Data yang diekstrak tadi ditranformasikan ke dalam bentuk yang sesuai dengan kebutuhan operasional datawarehouse. Selanjutnya, data dalam data warehouse di-load untuk target-target akhir, seperti database lain, data store, data mart, atau data warehouse itu sendiri.


Elemen-elemen dasar Data Warehouse




Source System
  Operasional sistem yang berfungsi mencatat transaksi dari suatu bisnis. Source System biasa disebut juga sebagai Legacy System.

Data Staging Area
  Tempat penyimpanan data sementara, untuk melakukan proses Clean, Transform, Combine, Deduplicate, Household, archive, dan menyiapkan sumber data untuk digunakan Data Warehouse.

  Staging Area tidak diperuntukkan sebagai sumber data untuk reporting karena datanya masih kotor dan bersifat sementara.

Presentation Server
  Target mesin yang secara fisik adalah mesin dimana data dari Data Warehouse di organisasikan dan disimpan untuk dilakukan query oleh End User, Reporting dan aplikasi yang lain. Disini data disimpan dengan framework Dimmensional.

          Jika menggunakan Relational Database maka tabel akan diorganisasikan dalam bentuk Star-Schema, namun jika tidak menggunakan Relational Database maka akan disimpan dalam bentuk OLAP. (mengenai OLAP akan dibahas pada sesi tersendiri)

Business Process
           Dalam terminologi disini bukanlah Business Process seperti pada transaksional sistem, tetapi lebih tepat maksudnya adalah mengelompokkan sumber data menurut kesamaan temanya. Misalnya Finance, Marketing, Production. etc. Nantinya setiap Business Process akan diimplementasikan sebagai Data Marts.

Data Mart
          Potongan secara logika dari Data Warehouse secara keseluruhan. Data Mart bisa juga dilihat sebagai potongan secara logika dari data Warehouse terhadap suatu Business Process tertentu. (mengenai Data Mart, akan dibahas pada sesi tersendiri)

Data Warehouse
            Adalah sumber data yang bisa di Query dalam suatu perusahaan. Sebenarnya Data Warehouse adalah gabungan dari beberapa Data Marts.

ROLAP
Relational OLAP.

MOLAP
Multidimensional OLAP

End User Application
        Sekumpulan Tool yang bisa melakukan Query, Analisa Data, dan menampilkan informasi untuk mendukung kepentingan Bisnis.

            Paling tidak Tool ini juga dilengkapi dengan kemampuan untuk akses Data, fungsi Spreatsheet, fungsi grafik, dan ada fasilitas untuk menampilkan prompt dan menyederhanakan tampilan screen pada End User.

End User Data Access Tool
  Sebagai Client dari Data Warehouse. Pada Relational Data Warehouse, Client dapat mengirimkan SQL Request ke Server.

        Secepatnya End User Data Access Tool akan selesai pada SQL Session dan kembali untuk menampilkan pada screen Data dari suatu Report, Grafik, atau yang lebih tinggi seperti form suatu analisa pada User.

           End User Data Access Tool dapat saja sederhana seperti Ad-Hoc Query Tool atau bisa juga bisa complex seperti Data Mining yang canggih atau aplikasi modeling.

Modeling Application
         Data Warehouse Client yang canggih dengan kemampuan analytic yang dapat merubah bentuk atau menjadikan intisari dari output Data Warehouse.

Meta Data
   Semua informasi dalam lingkungan Data Warehouse namun bukan data itu sendiri, Misalnya informasi mengenai asal data source dari aplikasi apa, tabel apa, field apa, formula bisnis bagaimana, dsb. Meta Data perlu dibuatkan Catalog, diberi Version Stamp, di dokumentasikan dan di backup.


Sumber :
1.      http://bangungunanto.wordpress.com/2011/10/05/apa-itu-data-warehouse/
4.      Kimball, Ralph, 1998, The Data Warehouse Lifecycle Toolkit, Jhon Wiley & Sons, Inc.

6.      http://sharinginpo.blogspot.com/2011/01/datawarehouse.html


Tidak ada komentar:

Posting Komentar