Data Warehouse
Nama : L.Efendi
NIM : 11.41010.0211
Tugas : Pertemuan 1 [ MK Data Warehouse ]
Ada beberapa
pendapat tentang data warehouse :
> Ralph Kimball, data warehouse adalah
suatu sistem yang mengekstrak, membersihkan, menyesuaikan diri, dan mengirim
sumber data ke dalam suatu data penyimpanan dimensional dan kemudian mendukung
implementasi query dan analisis untuk tujuan pengambilan
keputusan.
>
Menurut W.H. Inmon dan Richard D.H., data warehouse adalah
koleksi data yang mempunyai sifat berorientasi
subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung
proses pengambilan keputusan management.
>
Menurut Bill Inmon, data warehouse adalah
kumpulan data yang berorientasi subjek, terintegrasi, bervariasi waktu,
dan non-volatile, yang mendukung proses pengambilan keputusan oleh
manajemen.
> Menurut Vidette Poe, data
warehouse merupakan database yang bersifat analisis dan read
only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Jadi, dari beberapa pendapat tersebut bisa ditarik
kesimpulan bahwa Data Warehouse adalah kumpulan data dari berbagai sumber internal
maupun eksternal yang dikumpulkan menjadi satu dalam tempat penyimpanan yang
berukuran besar yang bisa digunakan untuk pengambilan keputusan, dan
bersifat berorientasi subjek, terintegrasi, time-variant, dan
non-volatine.
Apa yang dimaksud bersifat berorientasi
subjek?
Jadiii.. data di dalam Datawarehouse diperoleh
berdasarkan enterprise subject seperti dari customers, products dan
sales. dan didesain bukan pada proses atau aplikasi tertentu melainkan
untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi.
Empat karakteristik dari Datawarehouse meliputi
:
1. Subject oriented : Sebuah data warehouse disusun dalam subjek utama, seperti pelanggan, suplier, produk, dan sales. Meskipun data warehouse terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan, data warehouse fokus pada pemodelan dan analisis data untuk pembuat keputusan. Oleh karena itu data warehouse mempunyai karakter menyediakan secara singkat dan sederhana gambaran seputar subjek lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan.
1. Subject oriented : Sebuah data warehouse disusun dalam subjek utama, seperti pelanggan, suplier, produk, dan sales. Meskipun data warehouse terkonsentrasi pada operasi harian dan proses transaksi dalam perusahaan, data warehouse fokus pada pemodelan dan analisis data untuk pembuat keputusan. Oleh karena itu data warehouse mempunyai karakter menyediakan secara singkat dan sederhana gambaran seputar subjek lebih detail yang dibuat dari data luar yang tidak berguna dalam proses pendukung keputusan.
2. Terintegrasi ?
Kenapa data warehouse Terintegrasi? arti integrasi itu sendiri adalah penggabungan data
dari beberapa sumber. jadi data warehouse terintegrasi karena data warehouse
memiliki data yang diambil dari berbagai sistem operasional dan data
eksternal maupun data internal.
3. Data warehouse bersifat time-variant (Rentang
waktu) ?
Data pada data warehouse dapat
dikatakan akurat atau valid pada rentang waktu tertentu misalnya data yang
disajikan adalah data antara 5 sampai 10 tahun. dan data yang digunakan adalah
data yang disimpan minimal 5 tahun.
4. Data warehouse bersifat non-volatile
artinya data pada data warehouse
tidak diupdate secara real time tetapi di refresh dari
sistem operasional secara reguler.
Kegunaan dari
data warehouse adalah :
Mempermudah pembuatan
aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data warehouse
adalah khusus untuk membuat suatu database yang dapat digunakan untuk
mendukung proses analisa bagi para pengambil keputusan.
Arsitektur Data Warehouse
Arsitektur data warehouse (lihat gambar di bawah) mencakup proses ETL (Extraction, Transformation, Loading) untuk memindahkan data dari operational data source dan sumber data eksternal lainnya ke dalam data warehouse .
Nah, apa itu data transaksional?
Itu adalah istilah untuk data yang digunakan dalam kegiatan organisasi sehari-hari. Dalam operasionalnya, data transaksi berubah dan bertambah sesuai kondisi sebenarnya. Sebagai misal, data transaksi penjualan barang pada suatu swalayan yang ada di sistem aplikasi penjualan semacam Point of Sale (POS) yang bisasanya dioperasikan para kasir.
Sekarang, perhatikan gambar berikut :
Data yang disimpan dalam datawarehouse diupload dari sistem di bagian-bagian operasional (seperti pemasaran, penjualan, dll) ditunjukkan pada gambar di samping melalui mekanisme ETL.
ETL singkatan dari Extract, Transform, and Load. Ekstrak dilakukan terhadap data yang berasal dari sumber. Data yang diekstrak tadi ditranformasikan ke dalam bentuk yang sesuai dengan kebutuhan operasional datawarehouse. Selanjutnya, data dalam data warehouse di-load untuk target-target akhir, seperti database lain, data store, data mart, atau data warehouse itu sendiri.
Elemen-elemen dasar Data Warehouse
Source System
Operasional sistem yang berfungsi mencatat transaksi dari suatu bisnis. Source System biasa disebut juga sebagai Legacy System.
Data Staging Area
Tempat penyimpanan data sementara, untuk melakukan proses Clean, Transform, Combine, Deduplicate, Household, archive, dan menyiapkan sumber data untuk digunakan Data Warehouse.
Staging Area tidak diperuntukkan sebagai sumber data untuk reporting karena datanya masih kotor dan bersifat sementara.
Presentation Server
Target mesin yang secara fisik adalah mesin dimana data dari Data Warehouse di organisasikan dan disimpan untuk dilakukan query oleh End User, Reporting dan aplikasi yang lain. Disini data disimpan dengan framework Dimmensional.
Jika menggunakan Relational Database maka tabel akan diorganisasikan dalam bentuk Star-Schema, namun jika tidak menggunakan Relational Database maka akan disimpan dalam bentuk OLAP. (mengenai OLAP akan dibahas pada sesi tersendiri)
Business Process
Dalam terminologi disini bukanlah Business Process seperti pada transaksional sistem, tetapi lebih tepat maksudnya adalah mengelompokkan sumber data menurut kesamaan temanya. Misalnya Finance, Marketing, Production. etc. Nantinya setiap Business Process akan diimplementasikan sebagai Data Marts.
Data Mart
Potongan secara logika dari Data Warehouse secara keseluruhan. Data Mart bisa juga dilihat sebagai potongan secara logika dari data Warehouse terhadap suatu Business Process tertentu. (mengenai Data Mart, akan dibahas pada sesi tersendiri)
Data Warehouse
Adalah sumber data yang bisa di Query dalam suatu perusahaan. Sebenarnya Data Warehouse adalah gabungan dari beberapa Data Marts.
ROLAP
Relational OLAP.
MOLAP
Multidimensional OLAP
End User Application
Sekumpulan Tool yang bisa melakukan Query, Analisa Data, dan menampilkan informasi untuk mendukung kepentingan Bisnis.
Paling tidak Tool ini juga dilengkapi dengan kemampuan untuk akses Data, fungsi Spreatsheet, fungsi grafik, dan ada fasilitas untuk menampilkan prompt dan menyederhanakan tampilan screen pada End User.
End User Data Access Tool
Sebagai Client dari Data Warehouse. Pada Relational Data Warehouse, Client dapat mengirimkan SQL Request ke Server.
Secepatnya End User Data Access Tool akan selesai pada SQL Session dan kembali untuk menampilkan pada screen Data dari suatu Report, Grafik, atau yang lebih tinggi seperti form suatu analisa pada User.
End User Data Access Tool dapat saja sederhana seperti Ad-Hoc Query Tool atau bisa juga bisa complex seperti Data Mining yang canggih atau aplikasi modeling.
Modeling Application
Data Warehouse Client yang canggih dengan kemampuan analytic yang dapat merubah bentuk atau menjadikan intisari dari output Data Warehouse.
Meta Data
Semua informasi dalam lingkungan Data Warehouse namun bukan data itu sendiri, Misalnya informasi mengenai asal data source dari aplikasi apa, tabel apa, field apa, formula bisnis bagaimana, dsb. Meta Data perlu dibuatkan Catalog, diberi Version Stamp, di dokumentasikan dan di backup.
Arsitektur data warehouse (lihat gambar di bawah) mencakup proses ETL (Extraction, Transformation, Loading) untuk memindahkan data dari operational data source dan sumber data eksternal lainnya ke dalam data warehouse .
Nah, apa itu data transaksional?
Itu adalah istilah untuk data yang digunakan dalam kegiatan organisasi sehari-hari. Dalam operasionalnya, data transaksi berubah dan bertambah sesuai kondisi sebenarnya. Sebagai misal, data transaksi penjualan barang pada suatu swalayan yang ada di sistem aplikasi penjualan semacam Point of Sale (POS) yang bisasanya dioperasikan para kasir.
Sekarang, perhatikan gambar berikut :
Data yang disimpan dalam datawarehouse diupload dari sistem di bagian-bagian operasional (seperti pemasaran, penjualan, dll) ditunjukkan pada gambar di samping melalui mekanisme ETL.
ETL singkatan dari Extract, Transform, and Load. Ekstrak dilakukan terhadap data yang berasal dari sumber. Data yang diekstrak tadi ditranformasikan ke dalam bentuk yang sesuai dengan kebutuhan operasional datawarehouse. Selanjutnya, data dalam data warehouse di-load untuk target-target akhir, seperti database lain, data store, data mart, atau data warehouse itu sendiri.
Elemen-elemen dasar Data Warehouse
Source System
Operasional sistem yang berfungsi mencatat transaksi dari suatu bisnis. Source System biasa disebut juga sebagai Legacy System.
Data Staging Area
Tempat penyimpanan data sementara, untuk melakukan proses Clean, Transform, Combine, Deduplicate, Household, archive, dan menyiapkan sumber data untuk digunakan Data Warehouse.
Staging Area tidak diperuntukkan sebagai sumber data untuk reporting karena datanya masih kotor dan bersifat sementara.
Presentation Server
Target mesin yang secara fisik adalah mesin dimana data dari Data Warehouse di organisasikan dan disimpan untuk dilakukan query oleh End User, Reporting dan aplikasi yang lain. Disini data disimpan dengan framework Dimmensional.
Jika menggunakan Relational Database maka tabel akan diorganisasikan dalam bentuk Star-Schema, namun jika tidak menggunakan Relational Database maka akan disimpan dalam bentuk OLAP. (mengenai OLAP akan dibahas pada sesi tersendiri)
Business Process
Dalam terminologi disini bukanlah Business Process seperti pada transaksional sistem, tetapi lebih tepat maksudnya adalah mengelompokkan sumber data menurut kesamaan temanya. Misalnya Finance, Marketing, Production. etc. Nantinya setiap Business Process akan diimplementasikan sebagai Data Marts.
Data Mart
Potongan secara logika dari Data Warehouse secara keseluruhan. Data Mart bisa juga dilihat sebagai potongan secara logika dari data Warehouse terhadap suatu Business Process tertentu. (mengenai Data Mart, akan dibahas pada sesi tersendiri)
Data Warehouse
Adalah sumber data yang bisa di Query dalam suatu perusahaan. Sebenarnya Data Warehouse adalah gabungan dari beberapa Data Marts.
ROLAP
Relational OLAP.
MOLAP
Multidimensional OLAP
End User Application
Sekumpulan Tool yang bisa melakukan Query, Analisa Data, dan menampilkan informasi untuk mendukung kepentingan Bisnis.
Paling tidak Tool ini juga dilengkapi dengan kemampuan untuk akses Data, fungsi Spreatsheet, fungsi grafik, dan ada fasilitas untuk menampilkan prompt dan menyederhanakan tampilan screen pada End User.
End User Data Access Tool
Sebagai Client dari Data Warehouse. Pada Relational Data Warehouse, Client dapat mengirimkan SQL Request ke Server.
Secepatnya End User Data Access Tool akan selesai pada SQL Session dan kembali untuk menampilkan pada screen Data dari suatu Report, Grafik, atau yang lebih tinggi seperti form suatu analisa pada User.
End User Data Access Tool dapat saja sederhana seperti Ad-Hoc Query Tool atau bisa juga bisa complex seperti Data Mining yang canggih atau aplikasi modeling.
Modeling Application
Data Warehouse Client yang canggih dengan kemampuan analytic yang dapat merubah bentuk atau menjadikan intisari dari output Data Warehouse.
Meta Data
Semua informasi dalam lingkungan Data Warehouse namun bukan data itu sendiri, Misalnya informasi mengenai asal data source dari aplikasi apa, tabel apa, field apa, formula bisnis bagaimana, dsb. Meta Data perlu dibuatkan Catalog, diberi Version Stamp, di dokumentasikan dan di backup.
Sumber :
1. http://bangungunanto.wordpress.com/2011/10/05/apa-itu-data-warehouse/
4.
Kimball, Ralph,
1998, The Data Warehouse Lifecycle Toolkit, Jhon Wiley &
Sons, Inc.
6.
http://sharinginpo.blogspot.com/2011/01/datawarehouse.html
Tidak ada komentar:
Posting Komentar