Senin, 30 September 2013

Arsitektur dan Infrastruktur
Pembuatan  Data  Warehouse  Penjualan  Produk  dan  Penerapan  Dalam  Studi  Kasus  Divisi Greenscope  Energy –  PT. Tustika  Nagata  Surabaya”

Nama   : L.Efendi
NIM    : 11.41010.0211
Tugas  : Pertemuan 4  [ MK Data Warehouse ]

Arsitektur Datawarehouse
Maksudnya adalah bagaimana datawarehouse dibangun, arsitektur tidak ada yang benar dan salah tetapi suatu arsitektur dibangun tergantung situasi dan kondisi. Arsitektur datawarehouse akan berpengaruh pada penggunaan dan pemeliharaan.          

Arsitektur, dalam konteks data organisasi penjualan produk, adalah konseptualisasi tentang bagaimana data warehouse dibangun. Tidak ada arsitektur yang benar atau salah, melainkan ada beberapa arsitektur yang ada untuk mendukung berbagai lingkungan dan situasi. Kelayakan arsitektur dapat dinilai dari bagaimana bantuan konseptualisasi di gedung, pemeliharaan, dan penggunaan data warehouse.
                      
Lapisan-lapisan arsitektur datawarehouse :
1. Operational database layer / Lapisan basis data operasional
a. Sumber data (source) untuk datawarehouse
b. Data lengkap, Data hari ke hari
c. Mempunyai nilai saat ini/ data berarti.
d. Tingkat kemungkinan data besar.

2. Data Access Layer/ Lapisan Akses Data
a. Tools untuk mengekstrak, mengubah dan mengambil(load) data.
b. Meliputi karakteristik datawarehouse.

3. Metadata Layer / Lapisan Metadata
a. File data tersimpan / Direktori
b. Lebih detil dari direktori data sistem, maksudnya lebih mendalam dari file data yang tersedia sebelumnya.
c. Ada pentunjuk untuk keseluruhan warehouse dan ada petunjuk data yang dapat diakses report khusus untuk di analisis.

4. Informational access layer (lapisan akses informasi)
a. Akses data dan juga tool untuk laporan dan analisis.
b. Tools Business Intelligence masuk ke tahap ini.

Pada suatu training, saya menjelaskan mengenai 4 alternatif arsitektur data warehouse berdasarkan gambar berikut :

Mari kita bahas sekilas mengenai keempat arsitektur data warehouse di atas:
  1. Enterprise Data Warehouse.
            Pada arsitektur ini, Data Warehouse merupakan satu-satunya penyimpanan data dari berbagai sumber di suatu organisasi. DWH ini juga yang dijadikan acuan utama dalam melakukan analisis, membuat laporan, dashboard, data mining, dan Business Intelligence. Kelebihan dari pendekatan ini adalah sumber data untuk analisis adalah hanya DWH ini, selain itu, kelebihannya yaitu semua data terintegrasi dengan baik (dengan syarat proses analisis dan perancangan DWH dilakukan dengan matang). Kekurangan pendekatan ini adalah ketika data yang dimiliki sudah sangat banyak, DWH dengan arsitektur Enterprise Data Warehouse bisa mengalami masalah kinerja, apalagi jika ditambah semakin banyaknya pengguna yang menembak DWH ini secara bersama-sama.

  1. Dependent Data Mart.
Saya melihat arsitektur ini sebagai kelanjutan dari Enterprise Data Warehouse. Ketika DWH pada EDW sudah dianggap berat, ditambah effort untuk mengupgrade infrastruktur yang kadang tidak ekonomis, maka dibuatlah data mart-data mart di satu atau lebih departemen untuk mengakomodasi kebutuhan laporan di departemen yang bersangkutan . Kelebihan dari arsitektur ini adalah  kinerja DWH menjadi lebih ringan. Jika sebelumnya sehari ada 10,000 hit yang ditujukan ke data warehouse, dengan adanya data mart baru, sebagian porsi hit tersebut akan mengarah ke data mart, misalkan porsi data warehouse tinggal 8,000 hit dan yang 2,000 ditujukan ke data mart. Jika satu data mart masih dianggap kurang, maka bisa dibuat data mart berikutnya untuk departemen lain, misalkan penjualan. Pembuatan data mart baru tersebut mungkin bisa mengurangi hit data warehouse menjadi 6,000. Begitu seterusnya hingga dicapai nilai yang optimal. Disamping manfaat dari sisi kinerja, dependent data mart juga memungkinkan setiap departemen melakukan tuning lebih jauh terhadap struktur tabel dimensional. Tuning  dimaksudkan  untuk meningkatkan kinerja sistem secara keseluruhan dalam mengakomodasi kebutuhan analisis departemen yang mungkin belum diakomodasi oleh data warehouse. Dibandingkan arsitektur dengan data mart yang lainnya, alternatif ini memiliki karakteristik Enterprise Data, yaitu data yang terdapat di DWH dan DM memiliki cakupan validitas di tingkat enterprise/organisasi/perusahaan karena tingkat tersebut sudah didapatkan ketika memasuki DWH.

  1. Independent Data Mart.
            Meskipun sama-sama memiliki DM seperti pada arsitektur Dependent Data Mart, alternatif  ini tidak memiliki Data Warehouse di dalamnya. Setiap DM harus memiliki strategi integrasi yang tidak terkait. Hal itu dikarenakan nature dari pembangunan DM adalah karena tingginya kebutuhan data untuk analisis pada suatu departemen dan tidak optimal jika harus menunggu dibuatnya DWH di level organisasi/perusahaan.  Karena itulah satu departemen memutuskan membuat DM versi departemen itu. Jika ada departemen lain yang memiliki kebutuhan analisis yang tinggi juga, maka dimungkinkan dorongan untuk membuat DM di departemen tersebut juga tinggi, ditambah adanya contoh departemen lain yang sudah membangun DM versi departemennya. Hal pokok yang biasanya menjadi kekurangan di pendekatan ini adalah data yang dihasilkan cenderung belum menjadi  level enterprise, namun masih di tingkat departemen. Hal tersebut dikarenakan  pembangunan DM mungkin hanya melibatkan departemen pembuat, dengan sedikit sekali-atau tanpa-keterlibatan departemen lain, sehingga aspek integrasi format data dan formula tidak terpenuhi.

  1. Enterprise Data Mart.
             Ini merupakan alternatif solusi antara Dependent Data Mart dan Independent Data Mart. Adanya staging yang berada di level Enterprise adalah sebagai area integrasi data dari berbagai sistem. Dengan demikian, data lebih dekat ke level enterprise. Namun demikian, kendala integrasi kadang juga menjadi masalah di sini, yaitu jika ketika mengembangkan DM untuk departemen A, departemen-departemen lain yang ada di organisasi tidak banyak dilibatkan, atau bahkan tidak dilibatkan sama sekali.

Infrastruktur Data warehouse
            Infrastruktur data warehouse terdiri dari software, hardware, pelatihan-pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang dibutuhkan untuk mengimplementasikan arsitektur data warehouse Poe (1998, p43). Salah satu instrument yang mempengaruhi keberhasilan pengembangan data warehouse adalah pengidentifikasian arsitektur mana yang terbaik dan infrastruktur yang dibutuhkan.

            Arsitektur dan infrastruktur sangat erat hubungannya. Arsitektur yang sama mungkin akan membutuhkan infrasturktur yang berbeda, tergantung pada lingkungan perusahaan ataupun organisasi.

Apa itu infrastuktur ? 
Infrastruktur adalah :
             “Sistem fisik dasar dari suatu negara atau populasi masyarakat, termasuk jalan, utilitas, air, limbah, dll Sistem ini dianggap penting untuk memungkinkan produktivitas dalam perekonomian. Mengembangkan infrastruktur sering memerlukan investasi awal yang besar, tapi skala ekonomi cenderung signifikan”

“Infrastruktur merupakan struktur fisik dan dasar organisasi yang diperlukan untuk operasi suatu masyarakat atau perusahaan,  atau layanan dan fasilitas yang diperlukan untuk sebuah ekonomi berfungsi.”
                                        
Layer Infrastuktur E-business 


Bagan diperoleh dari : http://psut.edu.jo/sites/raad/eBusiness_notes/Chapter%2003.pdf

Layer 1 : E-business services – Applications Layer
Lapisan paling atas yang langsung berinteraksi dengan user. Beragam jenis aplikasi e-business yang ada seperti :

1. Selling Chain Management Information System – sub-sistem yang secara langsung berinteraksi dengan pelanggan agar mereka dapat dengan mudah mengadakan akses terhadap produk dan jasa yang ditawarkan perusahaan, terutama yang berhubungan dengan aktivitas transaksi bisnis.

2. Customer Relationship Management Information System - sub-sistem yang berfungsi sebagai sarana komunikasi efektif antara pelanggan dengan perusahaan, terutama yang berkaitan dengan kebutuhan akan informasi maupun bentuk pelayanan lainnya sehubungan dengan produk atau jasa yang ditawarkan.

3. Enterprise Resource Planning Information System – sub-sistem yang secara langsung berfungsi mengintegrasikan proses-proses penciptaan produk atau jasa dari perusahaan, mulai dari dipesannya bahan-bahan mentah dan fasilitas produksi sampai dengan terciptanya produk jadi yang siap ditawarkan kepada pelanggan.

4. Management Control Information System – sub-sistem yang bertanggung jawab memberikan data dan informasi bagi keperluan pengambilan keputusan manajemen perusahaan dan stakeholder lainnya, baik keputusan-keputusan yang bersifat strategis maupun taktis sehari-hari

5. Administrative Control Information System – sub-sistem yang memiliki fungsi utama sebagai penunjang terselenggaranya proses-proses administasi Dan masih banyak jenis aplikasi penerapan dari e-business lainnya.

Layer 2 : System software layer
Lapisan yang mana di dalamnya terdapat sistem – sistem yang mendukung aplikasi agar dapat berjalan dengan baik seperti web browser, server software, software jaringan, sistem manajemen database, dan lain sebagainya.

Layer 3 : Transport or Network layer
Lapisan yang mengatur jaringan dan transportasi data (TCP / IP).

Layer 4 : Storage / physical layer
Lapisan di mana mencakup penyimpanan data baik yang tersimpan di dalam penyimpanan magnetis di dalam server web ataupun media penyimpanan sementara (RAM).

Layer 5 : Content and data layer
Lapisan yang mencakup isi dari data yang tersimpan seperti data konsumen, data transaksi dan lain sebagainya.

Kenapa dan Untuk apa Datawarehouse?
Disini saya akan memberikan ilustrasi untuk datawarehouse. Datawarehouse itu dimiliki oleh perusahaan yang sudah besar, yang memiliki banyak cabang, data yang banyak dan tentunya struktur organisasi yang kompleks.

Mari bayangkan sebuah perusahaan yang memiliki banyak transaksi, yang memiliki banyak cabang. Tentu data-data tersebut tersebar dilokasi yang berbeda, sistem operasi yang berbeda, bahkan di basisdata (database) yang berbeda. Nah, Lalu bagaimana seorang pimpinan/ manager mengambil sebuah keputusan?Tentu bagi sang pembuat keputusan hanya membutuhkan akses ke semua sumber data tersebut. Kalau melakukan query di setiap masing-masing cabang tentu tidak efisien dan tidak praktis. Atau bahkan data yang dimiliki oleh perusahaan adalah data-data terbaru, bukan data-data terdahulu dari perusahaan tersebut. Dari permasalahan ini, Datawarehouse hadir sebagai solusinya.

Jika mengandalkan database OLTP untuk dilakukan query terlalu besar. Datawarehouse dibuat agar prosesnya lebih efisien. Dan selalu berkompetitif, maksudnya di zaman saat ini perusahaan sudah mengandalkan teknologi datawarehouse untuk pengambilan keputusan di perusahaan.

Tujuan Akhir menggunakan Datawarehouse
· Menyediakan data organisasi yang mudah diakses oleh manager.
· Data yang berada di datawarehouse bersifat konsisten, dan merupakan kebenaran.
· Datawarehouse merupakan tempat, dimana data yang telah digunakan di publikasikan.
· Kualitas data di datawarehouse dapat diandalkan.

Sumber :
           1.      http://ar4y4sh1k1.wordpress.com/2010/04/07/datawarehouse/ 
                 (Diakses 07 April 2010)
           2.      http://noverino.wordpress.com/category/my-works/
                (Diakses 18 Maret 2011)
  1. http://ldse-bussiness.blogspot.com/2013/02/part-4-infrastruktur-e-business.html                            (Diakses 19 Februari  2013)



Sabtu, 21 September 2013

Materi KuLiah  [ Presentasi ]

Planning and Requirement Data Warehouse

Planning data warehouse

uPertama dan terpenting, menentukan apakah perusahaan Anda benar-benar membutuhkan data warehouse.

uApakah benar-benar siap untuk menggunakannya?

uAnda perlu mengembangkan kriteria untuk menilai nilai yang diharapkan dari data warehouse Anda.

uPerusahaan Anda harus memutuskan pada jenis data warehouse yang akan dibangun dan di mana untuk di tempatkan. 

Masalah Utama

  Perencanaan untuk Data Warehouse Anda dimulai dengan mempertimbangkan secara seksama isu-isu kunci. Jawaban untuk pertanyaan-pertanyaan kunci yang penting untuk perencanaan yang tepat dan berhasil menyelesaikan proyek. Oleh karena itu, marilah kita mempertimbangkan isu-isu terkait, satu per satu.

nValue and Expectations

nRisk assessment

nTop-down or Bottom-up

nBuild or Buy

Value and Expectations

uAkankah data warehouse Anda membantu para eksekutif dan manajer untuk melakukan perencanaan yang lebih baik dan membuat keputusan yang lebih baik?

uApakah akan meningkatkan bottom line? 

uApakah akan meningkatkan pangsa pasar?

uJika demikian, seberapa banyak? 

uApa yang manajemen ingin capai melalui data warehouse?

uSebagai bagian dari proses perencanaan secara keseluruhan, membuat daftar manfaat yang realistis dan harapan. Ini adalah titik awal.


Risk Assessment

   Selain itu kita harus dapat memperkirakan resikonya. Jika proyek gagal, berapa banyak uang yang akan sia-sia? Tapi penilaian risiko lebih dari menghitung kerugian dari biaya proyek. Penilaian risiko yang luas dan relevan dengan bisnis masing-masing. Gunakan kondisi budaya dan bisnis perusahaan Anda untuk menilai risiko. Sertakan penilaian ini sebagai bagian dari dokumen perencanaan Anda.

Top-down or Bottom-up

      Top-Down, dimana data warehouse dirancang menggunakan data model enterprise yang telah dinormalisasi.

Kelebihannya :

> menghasilkan dimensional view yang konsisten dari semua data yang berasal dari data cabang karena semua data cabang diload dari repository terpusat.

> sanggup menghadapi perubahan pada bisnis, membuat data dimensional cabang yang baru menjadi tugas yang mudah.

Kelemahannya :

merepresentasikan projek yang sangat besar dengan cakupan yang luas, sehingga membutuhkan biaya yang besar untuk mengimplementasikannya.

durasi waktu dari dimulainya projek sampai pengguna dapat merasakan manfaat warehouse memakan waktu yang cukup lama.

dapat menjadi tidak fleksible terhadap perubahan kebutuhan di tahap implementasi.

       Data pada cabang/pasar dibuat lebih dulu untuk menyediakan kapabilitas laporan dan analisis untuk proses bisnis tertentu. Data cabang ini dapat dikombinasikan untuk membuat sebuah data warehouse.

(+) nilai bisnis dapat dikembalikan secepat data cabang pertama dibuat. (kecepatan)

(-) sulit untuk memastikan kekonsistenan dimensi dari kesemua data cabang.


Build or Buy

uBerbagai macam dan kaya alat pihak ketiga dan solusi yang tersedia. Pertanyaan sebenarnya adalah berapa banyak data mart Anda jika Anda membangun sendiri? Berapa banyak dari ini dapat terdiri dari solusi siap pakai? Apa jenis campuran dan cocok harus dilakukan?

uIntinya adalah untuk melakukan pekerjaan rumah Anda dan menemukan keseimbangan yang tepat antara di rumah dan vendor perangkat lunak. Lakukan ini pada tahap perencanaan itu sendiri.

Requriment Data Warehouse

      System yang bekerja pada level operasional, walaupun System tersebut adalah suatu hal yang penting, tapi system tersebut tidak dapat menyediakan informasi yang bersifat strategis, karena itu para pelaku bisnis harus menemukan cara baru dalam mendapatkan informasi strategis.

    Misalnya Para pelaku bisnis butuh untuk tahu dimana lokasi terbaik membangun gudang penyimpanan, jenis produk mana yang harus dikembangkan, dan pasar produk mana yang harus mereka perkuat.

Data dalam skala yang besar sangat berguna untuk menjalankan operasional bisnis, tapi sering kali sulit untuk bisa dijadikan dasar dalam pengambilan kebijakan strategis dan tujuan bisnis. Karena data dari sebuah perusahaan sering kali tersebar dalam banyak bentuk yang saling tidak kompatibel antara satu System dengan System lainnya.


      Syarat-syarat yang diinginkan oleh informasi strategis yang akan digunakan dalam bisnisdiantaranya:

uIntegrated : harus terintergrasi denga pandangan-pandangan sistem lain yang ada dalam perusahaan.

uData integrity : informasi yang dihasilkan haruslah akurat dan sesuai dengan aturan bisnis yang ada.

uAccesible : kemudahan dalam mengaksesnya dan dapat mendukung dalam analisa bisnis.

uCredible : informasi yang dihasilkan pun juga harus bisa dipercaya dan bersumber pada satu pandangan bisnis yang tejaga.

uTimely : informasi yang tersedia memiliki jangka waktu tertentu dan siap pada waktu yang dibutuhkan.



Pembuatan  Data  Warehouse  Penjualan  Produk  dan  Penerapan  Dalam  Studi  Kasus  Divisi Greenscope  Energy –  PT. Tustika  Nagata  Surabaya

Nama   : L.Efendi
NIM    : 11.41010.0211
Tugas  : Pertemuan 3  [ MK Data Warehouse ]

No.1 - Cari Paper tema: Perusahaan yang ingin membangun Data Warehouse! 
(tidak boleh sama)

Dengan semakin berkembangnya banyak perusahaan manufaktur di Indonesia, akan sangat berpengaruh terhadap daya saing bagi perusahaan, sehingga perusahaan dituntut agar dapat memantau setiap proses penjualannya. Hal ini yang menyebabkan Greenscope Energy – PT. Tustika Nagata Surabaya dimana perusahan tersebut menghasilkan suatu barang atau benda yang bernilai guna bermula dari material kasar yang dikerjakan sesuai keinginan konsumen sehingga tercipta produk barang yang sesuai dengan apa yang diinginkan. Berdasarkan dari tahun ke tahun penjualan produk di Greenscope Energy – PT. Tustika Nagata Surabaya mengalami peningkatan yang signifikan. Namun lebih dari itu pihak manajemen mengalami kesulitan dalam mengelola laporan data penjualan dengan banyaknya berkas-berkas yang secara umum masih manual, sehingga dibutuhkan struktur penyimpanan data yang dapat memperbaiki efisiensi pengolahan dan penggalian data, terutama dalam membangun sebuah pola hubungan antar data yang dimaksud disni adalah data warehouse agar dapat memantau proses penjualan secara real time serta penggunaan association rule mining.
Kata Kunci — Association rule, data mining, data warehouse

I. PENDAHULUAN
            Green Scope Energy merupakan sebuah perusahaan yang bergerak dibidang manufacturing untuk alat-alat elektronika seprti lampu LED, Solar Cell, dan lain sebagainya. Produk-produk ini mempunyai banyak variasi jenis masing-masing produk sesuai dengan tingkatannya misalnya Lampu LED yang terdiri dari Lampu LED 9 Watt, Lampu LED 11 Watt, Lampu LED 20 Watt. Dalam menjalankan proses bisnis, bagian marketing Greenscope Energy – PT. Tustika Nagata Surabaya menemukan beberapa permasalahan yang terjadi di internal perusahaan khususnya dalam mengelola data laporan penjualan. Dalam menentukan kebijakan yang terkait dengan permasalahan yang terjadi, tentunya dibutuhkan keputusan yang menjadi solusi terbaik. Berdasarkan laporan data penjualan dari tahun ke tahun Greenscope Energy – PT. Tustika Nagata Surabaya telah mengalami peningkatan jumlah produksi sebesar 37%, sementara pada bagian marketing sendiri untuk mengelola data laporan penjualan masih kurang optimal. Sehingga dibutuhkan cara yang lebih efektif dan efisien untuk membantu jalannya proses bisnis perusahaan terutama bagian marketing perusahaan.

Pada dasarnya, banyak hal yang dapat kita lakukan lebih mudah jika kita menemukan solusi yang tepat dalam mengatasi permasalahan tersebut. Tujuan yang hendak dicapai dalam penelitian ini adalah untuk membuat data warehouse sebagai salah satu alternatif bagi perusahaan sebagai struktur penyimpanan data yang juga dapat memperbaiki pengolahan dan penggalian data, terutama dalam membangun sebuah pola hubungan antar data dan mengetahui informasi penting yang tersembunyi di dalam database melalui penggunaan association rule mining. Dengan begitu diharapkan bagian marketing perusahaan dapat lebih baik dalam memonitoring dan mengelola data internal perusahaan.

            Sementara apabila dibandingkan dengan data penjualan produk elektronik dari kompetitor lain, data penjualan di perusahaan ini memiliki salah satu keunikan yaitu merupakan produk elektronik yang mempunyai beberapa pelanggan tetap (agen). Produk yang ditawarkan merupakan produk yang diproduksi oleh perusahaan ini, dan produk yang di jual memiliki jenis yang berbeda sehingga pada tugas akhir ini ingin menemukan keterkaitan produk yang dibeli oleh pelanggan.

            Semoga dengan adanya tugas akhir ini diharapkan mampu menjadi salah satu solusi bagi perusahaan agar dapat lebih baik dalam menjalankan proses bisnisnya.

II. STUDI LITERATUR
A. Data Warehouse
            Data warehouse adalah kumpulan data yang dihasilkan untuk mendukung pengambilan keputusan serta merupakan sebuah gudang data baik data sekarang maupun data historis yang menarik bagi para manajer di seluruh organisasi. Data biasanya terstruktur dan tersedia dalam bentuk yang sudah siap dipakai untuk kegiatan proses Online Analytical Processing (OLAP), data mining, querying, reporting, dan aplikasi decision support lainnya). Sebuah data warehouse adalah koleksi data yang subject-oriented, integrated, time-variant, dan non-volatile dalam mendukung proses pengambilan keputusan manajemen [1]. Data warehouse adalah sebuah sistem yang mengekstrak, membersihkan, menyesuaikan diri, dan mengirimkan sumber data ke dalam sebuah penyimpanan data dimensional dan mendukung serta mengimplementasikan query dan analisis untuk tujuan pengambilan keputusan.

B. Association Rule Mining
Association rule mining atau pencarian aturan-aturan hubungan antar item dari suatu basis data transaksi atau basis data relasional, telah menjadi perhatian utama dalam masyarakat basis data.

            Fungsi association rule mining seringkali disebut dengan "market basket analysis", yang digunakan untuk menemukan relasi atau korelasi diantara himpunan item. Market basket analysis adalah Analisis dari kebiasaan membeli customer dengan mencari asosiasi dan korelasi antara item-item berbeda yang diletakkan customer dalam keranjang belanjaannya.

C. SQL Server
Structured Query Language (SQL) adalah sebuah bahasa yang dipergunakan untuk mengakses data dalam basis data relasional. Bahasa ini secara de facto merupakan bahasa standar yang digunakan dalam manajemen basis data relasional. Saat ini hampir semua server basis data yang ada mendukung bahasa ini untuk melakukan manajemen datanya. Mengetahui perintah perintah dasar sql merupakan modal awal untuk pengembangan database.

 SQL Server Reporting Services (SSRS) adalah platform laporan berbasis server yang menyediakan fungsionalitas pembuatan laporan untuk berbagai sumber data. SSRS terdiri dari kumpulan kakas yang digunakan untuk membuat, mengatur dan mengirim laporan, dan API yang memudahkan developer untuk mengintegrasikan laporan dengan aplikasi kustom.

III. METODE PENELITIAN
A. Pengumpulan data dan survey
            Pada tahap ini melakukan pengumpulan data dan survey mengenai data-data yang digunakan pada permasalahan tugas akhir ini. Data yang dipergunakan oleh penulis merupakan data penjualan dari tahun 2007 – tahun 2011 dengan satuan bulanan yaitu bulan Januari – Desember. Dimana jumlah data keseluruhan adalah 1564 data. Contoh data yang ditampilkan merupakan data penjualan pada tahun 2007 bulan Januari dapat dilihat pada Tabel 1.

 Dengan melakukan survei dan wawancara di Greenscope Energy – PT. Tustika Nagata Surabaya. Data yang diperoleh memiliki 4 atribut dengan scope time satuan bulanan untuk selanjutnya data yang diperoleh dari proses wawancara akan dilakukan langkah langkah sebagai berikut :

1. Melakukan cleansing data.
            Dalam proses cleansing data dimana penulis membuang data – data yang tidak diperlukan seperti tulisan yang dobel (sama), penulisan huruf yang tidak sama besar kecilnya, urutan yang tidak sama dirapikan, dan lain-lain.

Table 1. Contoh Data Pemesanan Produk

2. Membuat star schema.
Pada tahapan ini akan dilakukan perancangan star schema dan Desain Extract, Transformation, Loading (ETL) dikarenakan data warehouse menggunakan model data dimensional atau sering disebut sebagai star schema. Star schema mempunyai dua bagian, yaitu tabel fakta dan tabel dimensi. Setelah star schema dibuat maka proses selanjutnya adalah melakukan proses ETL dari database operasional ke database data warehouse. Sebelum proses ETL ini diproses harus dibuat dulu desain untuk proses ETL-nya.

3. Melakukan Extract, Transformation, Loading (ETL).
Pada tahapan ini proses ETL secara periodik mengekstrak data dari sumber sistem, mentranformasikannya ke sebuah format yang umum, dan kemudian memuatnya ke dalam data store target, yang umumnya sebuah data warehouse atau data mart. ETL sangat penting untuk integrasi data dan data warehousing.

4. Membuat cube.
Pada tahapan ini dimana dilakukan sebuah pembentukan database dimana data disimpan dalam bentuk cell, dan posisi dari sel-sel tersebut ditentukan oleh beberapa variable yang disebut dimensional. Hasil dari tahapan ini adalah sebuah visualisasi data warehouse yang telah dibuat sebelumnya.


5. Penerapan association rule mining.
            Proses penerapan association rule mining dibuat setelah hasil cube telah dapat ditampilkan. Dengan menggunakkan penerapan association rule mining penulis berharap pihak perusahaan dapat melihat tingkat kecendrungan produk yang dibeli konsumen.

B. Menentukan Tujuan
Pada tahap ini menentukan tujuan yang akan digunakan untuk pembuatan data warehouse dan penerapan penggunaan association rule mining dalam penyaranan cross-selling. Beberapa langkah dalam penentuan :
1. Analisa Strategis Perusahaan
Greenscope Energy – PT. Tustika Nagata Surabaya menginginkan proses pencatatan data penjualan yang dapat digunakan secara real time, dan dapat membantu dalam proses pengumpulan data penjualan yang telah lama dan juga dapat dilakukan analisa terhadap data tersebut seperti keterkaitan antar produk yang dibeli oleh pelanggan.

2. Penentuan dimensi
Semua dimensi diambil dari laporan data penjualan Greenscope Energy – PT. Tustika Nagata Surabaya.

3. Perancangan dan pembuatan data warehouse.
Pada tahap ini dilakukan proses perancangan data warehouse di awali dengan pembuatan desain yang disesuaikan dengan analisa kebutuhan perusahaan. Sesudah itu baru akan dilakukan pembuatan data warehouse.

4. Penerapan association rule mining dalam data warehouse.
Pada tahap ini dilakukan penerapan association rule mining pada data warehouse yang akan dibuat dengan menggunakan wizard dari SQL Server.

5. Penyesuaian Tampilan data warehouse dengan teknologi yang akan digunakan.
Pada tahap ini dilakukan penyesuaian tampilan dengan terminologi yang akan digunakan dalam pembuatan data warehouse.

Hasil dari metodologi tugas akhir dapat dilihat pada Gambar 2.


IV. DESAIN DAN IMPLEMENTASI
A. Analisis Proses Bisnis
            Seluruh pencatatan penjualan yang dilakukan oleh PT. Greenscope Energy masih bersifat manual, yaitu menggunakan metode paper work system yaitu seluruh aktifitas laporan penjualan masih menggunakan kertas yang dibantu dengan aplikasi Ms. Office, metode tersebut dianggap kurang efektif sehingga PT. Greenscope Energy mengharapkan adanya sebuah dukungan teknologi dalam mengelola data penjualan yang sangat besar dan juga proses pencatatan yang lebih terkomputerisasi agar dapat memberikan jaminan data agar tidak mengalami kehilangan data.

B. Analisis Tujuan Pembangunan Sistem Datawarehouse
Seluruh pencatatan penjualan yang dilakukan oleh PT. Greenscope Energy masih bersifat manual, yaitu menggunakan metode paper work system yaitu seluruh aktifitas laporan penjualan masih menggunakan kertas yang dibantu dengan aplikasi Ms. Office, metode tersebut dianggap kurang efektif sehingga PT. Greenscope Energy mengharapkan adanya sebuah dukungan teknologi dalam mengelola data penjualan yang sangat besar.

Data warehouse pada penelitian ini dibangun berdasarkan kebutuhan bagi PT. Green Scope Energy untuk dapat memiliki sistem pengumpulan data yang baik sehingga dapat mengetahui proses-proses transaksi penjualan dengan lebih mudah berdasarkan kebutuhan yang diinginkan oleh PT. Green Scope Energy.

C. Perancangan dan pembuatan data warehouse
Pada bagian ini akan dilakukan proses perancangan data warehouse yang selanjutnya akan dilakukan pembuatan data warehouse.

 Hasil pembuatan data warehouse, dapat ditunjukkan oleh star schema pada Gambar 3.


V. ANALISA HASIL IMPLEMENTASI
            Dari hasil analisa association rule mining dengan asumsi untuk melihat tingkat kecendrungan produk setiap kontraktor didapatkan hasil 9 rule yang memiliki nilai yang sama. 9 rule tersebut memiliki nilai importance 0, 778 dan nilai probability 1. Salah satu dari 9 rule penulis akan mengambil salah satu contoh yaitu Regulator = Existing, Lampu Industri 40 watt = Existing  Inverter = Existing. Dari hasil tersebut di jelaskan bahwa apabila konsumen membeli regulator dan lampu industri 40 watt maka kecendrungan perilaku konsumen juga membeli produk inverter. Dengan tingkat probability yaitu 1 maka dapat disimpulkan kemungkinan sudah sangat pasti. Dengan nilai probability 1 dapat dikatakan bahwa kemungkinannya cenderung pasti terjadi, apabila 0,5 adalah ragu – ragu, sedangkan < 0,5 dapat dikatakan cenderung tidak akan terjadi. Dengan mengambil nilai importance yang terbaik yaitu nilai importance yang terbesar, penulis mengambil 0,778 karena semakin ke bawah nilai importance yang di dapat semakin negatif jadi tidak perlu diambil. Pengaruh hasil importance sendiri terhadap keputusan cross selling adalah penjual bisa menawarkan produk kepada konsumen dengan produk yang sesuai dengan hasil analisa rule yang telah di dapatkan. Contoh : Terdapat seorang pembeli yang memesan regulator dan lampu industri 40 watt maka penjual di Greenscope Energy – PT. Tustika Nagata Surabaya dapat menawarkan Inverter Inverter sesuai hasil analisa rule yang telah di dapat.

        Hasil association rule mining dengan asumsi untuk setiap kontraktor dapat dilihat pada Gambar 4.

Penulis juga akan menampilkan hasil analisa association rule mining dengan asumsi untuk melihat tingkat kecendrungan produk setiap kontraktor per bulan. Dari hasil analisa tersebut didapatkan 1 buah rule yang merupakan rule yang terbesar dengan tingkat kepentingan produk sebesar 1,6 yaitu Regulator = Existing, Lampu Land Scape 40 Watt = Existing  Inverter = Existing dan tingkat probability 1 yang berarti pasti terjadi. Dengan penjelasan apabila konsumen membeli regulator dan lampu land scape 40 watt maka konsumen juga akan cenderung membeli inverter. Asumsi ini berlaku untuk mengetahui tingkat kecendrungan produk setiap kontraktor berikut dengan satuan waktu (bulanan). Hasil association rule mining setiap dim kontraktor dengan penambahan dim time (waktu) apabila dibandingkan dengan data penjualan yang ada hasilnya juga terbukti valid.    

Hasil association rule mining dengan asumsi untuk setiap kontraktor per bulan dapat dilihat pada Gambar 5.


VI. KESIMPULAN DAN SARAN
A. Kesimpulan
Data warehouse meupakan sarana untuk menyimpan data yang sebelumnya dilakukan secara kurang rapi dalam software aplikasi perkantoran oleh PT. Greenscope Energy - Tustika Nagata Surabaya. Dalam proses pemindahan data dilakukan secara ETL yaitu Extract, Tranformation, Loading.

Association rule mining merupakan teknik untuk mengetahui kombinasi item antar suatu barang yang berfungsi untuk mengetahui keterikatan antar suatu produk.

Berdasarkan hasil analisa data warehouse dan penerapan association rule mining dengan asumsi setiap dim kontraktor, biasanya produk yang dibeli cenderung tetap di masa lalu. Dimana disimpulkan bahwa terdapat 9 rule yang bernilai sama dan rule yang diambil merupakan rule dengan nilai importance terbesar sebesar 0,778 dengan probability 1. Nilai importance adalah nilai tingkat kepentingan produk. 9 rule tersebut antara lain :
1. Regulator = Existing, Lampu Industri 40 Watt = Existing  Inverter = Existing.
2. Regulator = Existing, Solar Cell 50 WP = Existing  Inverter = Existing.
3. Regulator = Existing, Solar Home System 100 WP = Existing  Inverter = Existing.
4. Regulator = Existing, Lampu Heavy Duty 40 Watt = Existing  Inverter = Existing.
5. Lampu Industri 40 Watt = Existing, Solar Home System 100 WP = Existing  Inverter = Existing.
6. Lampu Industri 40 Watt = Existing, Lampu Heavy Duty 40 Watt = Existing  Inverter = Existing.
7. Lampu Industri 40 Watt = Existing, Lampu LED 40 Watt = Existing  Inverter = Existing.
8. Solar Cell 50 WP = Existing, Solar Home System 100 WP = Existing  Inverter = Existing.
9. Solar Cell 50 WP = Existing, Lampu LED 20 Watt = Existing  Lampu Industri 40 Watt = Existing.

Dari hasil analisa association rule mining dengan asumsi setiap dim kontraktor apabila di bandingkan dengan data penjualan yang ada terbukti valid. Sedangkan penulis juga membandingkan dalam menganalisa hasil association rule mining setiap dim kontraktor dengan penambahan dim time ( waktu ). Hasilnya adalah Regulator = Existing, Lampu Land Scape 40 Watt = Existing  Inverter = Existing. Dari hasil analisa association rule mining tersebut di dapatkan nilai importance 1,6 dan nilai probability 1. Hasil association rule mining setiap dim kontraktor dengan penambahan dim time ( waktu ) apabila dibandingkan dengan data penjualan yang ada hasilnya juga terbukti valid.

B. Saran
Saran dari penulis untuk Greenscope Energy – PT. Tustika Nagata Surabaya dengan menggunakkan sistem cross selling perusahaan bisa mempermudah cara penawaran produk kepada konsumen dengan melibatkan hasil analisa tersebut. Tidak menutup kemungkinan apabila suatu saat perusahaan akan membuka cabang bagian penjualan produk maka dalam penataan ruangan juga bisa mempertimbangkan tata letak produk dengan melihat hasil analisa association rule mining. Saran bagi penelitian selanjutnya diharapkan dapat menggunakkan data yang transaksinya dilakukan setiap kali pembelian seperti mini market Indomart, Alfamart atau sejenisnya. Serta diharapkan ke depan terdapat pengklasifikasian pelanggan sehingga bisa menyarankan per katagori pelanggan.


Sumber :
[1] Amiruddin, I Ketut Eddy Purnama, Mauridhi Hery Purnomo (2007). Penerapan Association Rulemining Pada Data Nomor Unik Pendidik Dan Tenaga Kependidikan Untuk menemukan Pola Sertifikasi Guru.Institut Teknologi Sepuluh Nopember Surabaya.
[2] Kusnawi (2007), Pengantar Solusi Data Mining.Seminar Nasional Teknologi 2007 (SNT 2007) ISSN : 1978-9777.
[3] Turban, E. R. Shrda, J.E. Aronson, and D.King (2007). Business Intelegence : A Managerial Approach. Pearson Prentice Hal, Ney Jersey.
[4] O’Brien, James, A. (2005). Pengantar sistem informasi manajemen. Jakarta: Salemba Empat
[5] Peter rob, Carlos Corone, Steven Morries (2009), Database Systems, Design, Implementation and Management. 9th Edition, Pearson, 2009.
[6] Wirama Kasim, Sudianto Hendrik, Hermawan Yudhi (2008), The essential business intelegence in microsoft SQL server. Indonesia.NET Developer Community.
[7] S. Williams, N. Williams(2007),The Profitt Impact of Business Intelligence, MorganKaufmann, San Francisco, 2007.
[8] Kimball, Ralph, caserta, joe (2004). The Datawarehouse ETL Toolkit. New york : Willey Computer Publishing
[9] Inmon, W. H. (2002), Building the Data warehouse, 3. Edition. Wiley, New York [et al.].



No.2 --> Buat soal serta solusinya tentang segala yang berhubungan dengan data warehouse! (Minimal 3)

[ 1. ]  SEBUTKAN  DAN  JELASKAN  MINIMAL  4  FUNGSI  YANG  UMUM  DITERAPKAN DALAM  DATAMINING?

1.      Assosiation, adalah proses untuk menemukan aturan assosiatif antarasuatu kombinasi item dalam suatu waktu.
2.      Secuence, hampir sama dengan association bedanya seccuencediterapkan lebih dari satu periode.
3.      Clastering, adalah proses pengelompokan sejumlah data/obyek kedalam kelompok-kelompok data (klaster) sehingga setiap klaster akanberisi data yang saling mirip.
4.      Classification, adalah proses penemuan model atau fungsi yangmenjelaskan atau membedakan konsep atau kelas data, dengan tujuanuntuk dapat memperkirakan kelas dari suatu objek yang labelnya tidakdiketahui.

[ 2. ]  BERIKAN  4  CONTOH  DAN  PENJELASAN  IMPLEMENTASI  DATAMINING ?
Ø  Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik.

Ø  Telekomunikasi
Sebuah perusahaan telekomunikasi menerapkan data mining untuk melihatdari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harusditangani secara manual (dilayani oleh orang). Tujuannya tidak lain adalahuntuk menambah layanan otomatis khusus untuk transaksi-transaksi yangmasih dilayani secara manual. Dengan demikian jumlah operator penerimatransaksi manual tetap bisa ditekan minimal.

Ø  Keuangan
Financial Crimes Enforcement Network di Amerika Serikat baru-baru inimenggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi keuangan lainnya untuk mendeteksi transaksi-transaksi keuangan yang mencurigakan (seperti money laundry). Mereka menyatakan bahwa hal tersebut akan susah dilakukan jika menggunakan analisis standar. Mungkinsudah saatnya juga Badan Pemeriksa Keuangan Republik Indonesia menggunakan teknologi ini untuk mendeteksi aliran dana BLBI.

Ø  Asuransi
Australian Health Insurance Commision menggunakan data mining untukmengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. Hasilnya? Mereka berhasil menghemat satu juta dollar per tahunnya.  Tentu saja ini tidak hanya bias diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya.

[ 3. ]  SEBUTKAN 4 KEUNTUNGAN MENGGUNAKAN DATA WAREHOUSE!
1.      Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
2.      Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
3.      Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari basisdata OLTP ke data warehouse
4.      Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

[ 4. ]  SEBUTKAN 3 JENIS DASAR DAN KELEBIHAN DARI 3 JENIS DASAR SISTEM DATA WAREHOUSE!

Ø  Data Warehouse Fungsional, yaitu sistem mudah dibangun dengan biaya relatif murah.

Ø  Data Warehouse Terpusat, yaitu data benar-benar terpadu karena konsistensinya yang tinggi.

Ø  Data Warehouse Terdistribusi,nya yaitu data tetap konsisten karena sebelum data di gunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi.

[ 5. ] SEBUTKAN DAN JELASKAN 4 TAHAP AWAL METODOLOGI DALAM PERANCANGAN  BASIS DATA UNTUK DATA WAREHOUSE?
  1. Predictive modeling,Adalah untuk membantu model untuk memprediksi suatu nilai yang mempunyai cirri-ciri tertentu.
  2. Association analysis, adalah untuk menghasilkan sejumlah rule yang menjelaskan sejumlah data yang terhubung kuat satu dengan yang lainnya.
  3. Clustering,Adalah untuk mengelompokan data yang sejenis sehingga data yang berada di cluster yang sama mempunyai banyak kesamaan dibandingkan dengan data yang ada di cluster yang berbeda.
  4. Anomaly detectionadalah untuk menemukan anomaly atau outlier yaitu data yang berbeda dengan data-data yang lainnya.