- Subject Oriented
Setiap tipe perusahaan memiliki set yang unik dari subjek datawarehouse
mereka.
- Integrated
Data-data yang ada harus di integrasikan untuk kemudian dikonversi,
reformat, resequenced, summerized, dan menghasilkan data yang memiliki sebuah
gambaran daru suatu perusahaan.
- Non-Volatile
Data pada DWH dapat diakses, namun tidak dapat diupdate/ubah. Data yang ada
hanya berupa sebuat snapshot, yang berformat static.
- Time Variant
Semua data yang ada di DWH masing-masing memiliki time stamp yang
berbeda-beda.
2. Elemen-elemen
DWH :
Terdapat berbagai level
kedetailan pada sebuah data pada DWH :
1. Older level of detail
Mengandung data-data pada tahun-tahun yang lampau
2. Current level of detail
Mengandung data-data masa sekarang.
3. A level of lightly summarized data(
Datamart)
Mengandung gabungan dari old detail dan current
detail.
4. A level of lightly summarized data.
Data-data yang mau dicari
3. Lokal DWH dan Global DWH
Persamaan :
·
Keduanya
mengandung historical data
·
Keduanya
memiliki fungsi yang sama
·
Banyak
data akan didistribusikan melalui banyak prosesor. Scara logika, hanya terdapat
sebuah DWH, namun secara fisik, ada banyak DWH yang saling terhubung namun
dipisahkan oleh prosesor yang berlainan. Hal ini disebut Technological
distributed Datawarehouse.
·
Perlunya
pengaturan ketika pertumbuhan DWH terjadi.
Perbedaan :
Local
1. Menampilkan ulang data dan prosessing
remote site
2. Exists for different geographical regions
or for different technical community.
3. Scope of DWH is local
4. Sumber dari local DWH adalah sistem
operasional
5. Pemetaan data yang ada merupakan pilihan
dari pembuat, yaitu local designer dan developer.
6. Tidak ada struktur data dari satu local
DWH ke yang lain.
Global :
1. Menampilkan ulang bagian bisnis yang
terintegrasi dalam bisnis
2. Scope dari Global DWH adalah bisnis yang
terintegrasi pada suatu perusahaan.
3. Sumber dari Global DWH adalah local DWH
4. Didesain dan di definisikan secara
tersentral, berdasarkan pada definisi dan identifikasi dari data penting
perusahaan.
5. Mengandung data yang :
·
Harus
diintegrasikan
·
Butuh
untuk dimanage secara global
·
Penting
bagi keseluruhan bagian yang ada pada perusahaan
4. Eksternal data di DWH :
1. Masalah : frekuensi ketersediaan
Tidak ada suatu pattern yang fix dari kedatangan
data eksternal.
Solusi :
Monitoring yang konstant harus dilakukan sehingga eksternal data yang benar
dapat diambil.
2. Masalah : bahwa data tidak disiplin
Reformating dan membuat struktur data harus
dilakukan sebelun data ini digunakan.
Solusi :
Membuat kembali struktur eksternal data, sehingga eksternal data tadi
kompatibel dengan internal data.
3. Masalah: eksternal data tidak dapat
diprediksi
Eksternal data datang dari sumber manapun pada
waktu yang berlainan.
Solusi :
a.
Pengalokasian
eksternal data pada sebuah penyimpanan medium.
b.
Pembuatan
2 buah penyimpanan untuk eksternal data.
Unstructured data di dalam DWH :
Merupakan data yang digolongkan
sebagai aktivitas personal.
Macam Tipe format yang ada:
·
Email
·
Spreadsheet
·
Text
File
·
Document
·
PDF
·
PPT
Solusi
: Pembagian berdasarkan dua garis besar yaitu komunikasi dan dokumentasi.
5. ETL : Extract / Load / Transform
ETL dibuat dengan maksud untuk melakukan proses
pengintegrasian data pada lingkungan operasional secara otomatis.
Ada dua macam ETL software :
·
Software
yang menghasilkan code.
·
Software
yang menghasilkan “a run-time module” yang memiliki parameter.
Penghasil
code lebih baik daripada penghasil “a run-time module”, karena penghasil code
dapat mengakses data pada formatnya masing-masing.
Sedangkan
penghasil “a run-time module” hanya dapat mengakses data pada format tertentu.
Ketika proses pentransformasian data menjadi format tertentu, banyak data yang
hilang.
Manfaat
ETL : Pentransformasian pada data dalam jumlah besar.
Tidak ada komentar:
Posting Komentar