Pengantar Data Warehouse & Data Mining pada umumnya

Pengantar Data Warehouse & Data Mining




Salah satu dampak yang dihasilkan dari terdapatnya sesuatu sistem data merupakan timbulnya banyak informasi. Informasi yang terdapat ini berasal dari sistem operasional yang berperan buat menanggulangi transaksi yang terpaut dengan proses bisnis yang ditangani oleh sistem data tersebut.

 

Contoh: sistem data presensi karyawan menimbulkan informasi jumlah kedatangan kedatangan karyawan tiap hari dengan informasi yang ditaruh bergantung pada apa yang diperlukan oleh sistem data tersebut( misalkan: no induk pegawai, jam masuk, pintu masuk, dsb.).

 

Bayangkanlah sistem data ini dipakai di industri yang jumlah karyawannya sebanyak 1000 orang. Apabila informasi ini dipakai sepanjang seminggu masa kerja saja( 5 hari), hingga informasi yang masuk dalam basis informasi terdapat 1000 x 5= 5000 baris. Kamu tinggal kalikan saja apabila mau menghitung jumlah informasi yang ditaruh sepanjang seminggu waktu operasional, sebulan, sampai setahun. Itu baru satu sistem data saja. Di korporasi yang besar sistem data yang terdapat berjumlah banyak dengan bermacam guna serta tujuannya. Kesimpulannya permasalahan selanjutnya timbul.

 

Informasi warehouse merupakan data- data yang beorientasi subjek, terintegrasi, mempunyai ukuran waktu, dan ialah koleksi senantiasa( non- volatile), yang digunakan dalam menunjang proses pengambilan keputusan. Sebaliknya informasi mining timbul sehabis banyak dari owner informasi baik perorangan ataupun organisasi hadapi penimbunan informasi yang sudah terkumpul sepanjang sebagian tahun, misalnya informasi pembelian, informasi penjualan, informasi nasabah, informasi transaksi, email serta sebagainya. Setelah itu timbul persoalan dari owner informasi tersebut, apa yang wajib dicoba terhadap tumpukan informasi tersebut.

 

Informasi mining ialah prinsip dasar dalam menyusunkan informasi dalam jumlah yang sangat banyak serta mengambil data– data yang berkaitan dengan apa yang dibutuhkan semacam apa yang biasa dicoba oleh seseorang analis. Dengan meningkat banyaknya jumlah informasi yang terdapat dalam model bisnis yang kita jalani dalam industri ini, hingga peran

Informasi warehouse merupakan database yang berisi informasi dari sebagian system operasional yang terintegrasi serta terstruktur sehingga bisa digunakan buat menunjang analisa serta proses pengambilan keputusan dalam bisnis.

 

Informasi warehouse didesain buat kita dapat melaksanakan query secara kilat. Data diturunkan dari informasi lain, dicoba rolling up buat dijadikan ringkasan, dicoba pembedahan drilling down buat memperoleh data lebih perinci, ataupun memandang pola yang menarik ataupun memandang trend( kecenderungan).

 

Terdapat 4 tugas yang dapat dicoba dengan terdapatnya informasi warehouse

1. Pembuatan laporan

Pembuatan laporan ialah salah satu khasiat informasi warehouse yang sangat universal dicoba. Dengan memakai query simpel didapatkan laporan/hari, perbulan, pertahun ataupun jangka waktu kapanpun yang di idamkan.

 

2. On- Line Analytical Processing( OLAP)

OLAP mendayagunakan konsep informasi multi ukuran serta membolehkan para pemakai menganalisa informasi hingga mendetail, tanpa mengetikkan satupun perintah SQL. Perihal ini dimungkinkan sebab pada konsep multi ukuran, hingga informasi yang berbentuk kenyataan yang sama dapat dilihat dengan memakai guna yang berbeda. Sarana lain yang terdapat pada sofware OLAP merupakan sarana rool- up serta drill- down. Drill- down merupakan keahlian buat memandang perinci dari sesuatu data serta roll- up merupakan sebaliknya.

 

3. Informasi mining

Informasi mining ialah proses buat menggali pengetahuan serta data baru dari informasi yang berjumlah banyak pada informasi warehouse, dengan memakai kecerdasan buatan( Artificial Intelegence), statistik serta matematika. Informasi mining ialah teknologi yang diharapkan bisa menjembatani komunikasi antara informasi serta pemakainya.

 

Sebagian pemecahan yang diberikan informasi mining antara lain:

 Menduga sasaran pasar

Informasi mining bisa mengelompokkan( clustering) model- model pembeli serta melaksanakan klasifikasi terhadap tiap pembeli serta melaksanakan klasifikasi terhadap tiap pemebeli cocok dengan ciri yang di idamkan.



 Baca juga : Pengantar Basis Data



Memandang pola beli dari waktu ke waktu

Informasi mining bisa digunakan buat memandang pola beli dari waktu ke waktu.

 

cross- market analysis

Informasi mining bisa dimanfaatkan buat memandang ikatan antara satu produk dengan produk yang lain.

 

Profil pelanggan

Informasi mining dapat menolong pengguna buat memandang profil pembeli sehingga bisa dikenal kelompok pembeli tertentu cenderung kepada sesuatu produk apa saja.

 

Data summary

Informasi mining bisa membuat laporan summary yang bertabiat multi ukuran serta dilengkapi dengan data statistik yang lain.


4. Proses data executive

Informasi warehouse bisa membuat ringkasan data yang berarti dengan tujuan membuat keputusan bisnis, tanpa wajib menjelajahi totalitas informasi. Dengan memakai informasi warehouse seluruh laporan sudah diringkas serta bisa pula mengenali seluruh rinciannya secara lengkap, sehingga memudahkan proses pengambilan keputusan. Data serta informasi pada laporan informasi warehouse jadi sasaran informative untuk user.


Ciri Informasi Warehouse

1. Subject Oriented( Berorientasi subject)

Informasi warehouse berorientasi subject maksudnya informasi warehouse didesain buat menganalisa informasi bersumber pada subject- subject tertentu dalam organisasi, bukan pada proses ataupun guna aplikasi tertentu. Informasi warehouse diorganisasikan disekitar subjek- subjek utama dari industri( customers, products serta sales) serta tidak diorganisasikan pada area- area aplikasi utama( customer invoicing, stock control serta product sales). Perihal ini disebabkan kebutuhan dari informasi warehouse buat menaruh data- data yang bertabiat selaku penunjang sesuatu keputusan, dari pada aplikasi yang berorientasi terhadap informasi.

Jadi dengan kata lain, informasi yang ditaruh merupakan berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbandingan antara informasi operasional serta informasi warehouse ialah:

Data Operasional

Data Warehouse

Dirancang berorientasi hanya pada aplikasi

dan fungsi tertentu

Dirancang berdasar pada subjek-subjek

tertentu(utama)

Focusnya pada desain database dan

proses

Focusnya pada pemodelan data dan

desain data

Berisi rincian atau detail data

Berisi data-data history yang akan dipakai

dalam proses analisis

Relasi antar table berdasar aturan

terkini(selalu mengikuti rule(aturan) terbaru)

Banyak aturan bisnis dapat tersaji antara tabel-tabel


















2. Integrated( Terintegrasi)

Informasi Warehouse bisa menaruh data- data yang berasal dari sumber- sumber yang terpisah kedalam sesuatu format yang tidak berubah- ubah serta silih terintegrasi satu dengan yang lain. Dengan demikian informasi tidak dapat dipecah- pecah sebab informasi yang terdapat ialah sesuatu kesatuan yang mendukung totalitas konsep informasi warehouse itu sendiri.

Ketentuan integrasi sumber informasi bisa dipadati dengan bermacam metode sepeti tidak berubah- ubah dalam penamaan variable, tidak berubah- ubah dalam dimensi variable, tidak berubah- ubah dalam struktur pengkodean serta tidak berubah- ubah dalam atribut raga dari informasi.

Contoh pada area operasional ada bermacam berbagai aplikasi yang bisa jadi pula terbuat oleh pengembang yang berbeda. Oleh sebab itu, bisa jadi dalam aplikasi- aplikasi tersebut terdapat variable yang mempunyai iktikad yang sama namun nama serta format nya berbeda. Variable tersebut wajib dikonversi jadi nama yang sama serta format yang disepakati bersama. Dengan demikian tidak terdapat lagi kerancuan sebab perbandingan nama, format serta lain sebagainya. Barulah informasi tersebut dapat dikategorikan selaku informasi yang terintegrasi sebab kekonsistenannya.


3. Time- variant( Rentang Waktu)

Segala informasi pada informasi warehouse bisa dikatakan akurat ataupun valid pada rentang waktu tertentu. Buat memandang interval waktu yang digunakan dalam mengukur keakuratan sesuatu informasi warehouse, kita bisa memakai metode antara lain:

Metode yang sangat simpel merupakan menyajikan informasi warehouse pada rentang waktu tertentu, misalnya antara 5 hingga 10 tahun ke depan.

Metode yang kedua, dengan memakai alterasi/ perbandingan waktu yang disajikan dalam informasi warehouse baik implicit ataupun explicit secara explicit dengan faktor waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada dikala informasi tersebut diduplikasi pada tiap akhir bulan, ataupun per 3 bulan. Faktor waktu hendak senantiasa terdapat secara implisit didalam informasi tersebut.

Metode yang ketiga, alterasi waktu yang disajikan informasi warehouse lewat serangkaian snapshot yang panjang. Snapshot ialah tampilan dari sebagian informasi tertentu cocok kemauan pemakai dari totalitas informasi yang terdapat bertabiat read- only.


4. Non- Volatile

Ciri keempat dari informasi warehouse merupakan non- volatile, artinya informasi pada informasi warehouse tidak di- update secara real time namun di refresh dari sistem operasional secara reguler. Informasi yang baru senantiasa ditambahkan selaku suplemen untuk database itu sendiri

dari pada selaku suatu pergantian. Database tersebut secara kontinyu meresap informasi baru ini, setelah itu secara incremental disatukan dengan informasi tadinya.

Berbeda dengan database operasional yang bisa melaksanakan pembaharuan, insert serta delete terhadap informasi yang mengganti isi dari database sebaliknya pada informasi warehouse cuma terdapat 2 aktivitas memanipulasi informasi ialah loading informasi( mengambil informasi) serta akses informasi( mengakses informasi warehouse semacam melaksanakan query ataupun menampilan laporan yang diperlukan, tidak terdapat aktivitas updating informasi).


 Baca juga : Pengantar Basis Data

0 Response to "Pengantar Data Warehouse & Data Mining pada umumnya"

Post a Comment

Iklan Atas Artikel

Iklan Tengah Artikel 1

Iklan Tengah Artikel 2

Iklan Bawah Artikel