Minggu, November 21, 2010

Kisi-Kisi Uas Data WareHouse

1. Karakteristik DataWarehouse
  • Subject Oriented
Setiap tipe perusahaan memiliki set yang unik dari subjek datawarehouse mereka.
  • Integrated
Data-data yang ada harus di integrasikan untuk kemudian dikonversi, reformat, resequenced, summerized, dan menghasilkan data yang memiliki sebuah gambaran daru suatu perusahaan.
  • Non-Volatile
Data pada DWH dapat diakses, namun tidak dapat diupdate/ubah. Data yang ada hanya berupa sebuat snapshot, yang berformat static.
  • Time Variant
Semua data yang ada di DWH masing-masing memiliki time stamp yang berbeda-beda.


2. Elemen-elemen DWH :
      Terdapat berbagai level kedetailan pada sebuah data pada DWH :
1.      Older level of detail
Mengandung data-data pada tahun-tahun yang lampau
2.      Current level of detail
Mengandung data-data masa sekarang.
3.      A level of lightly summarized data( Datamart)
Mengandung gabungan dari old detail dan current detail.
4.      A level of lightly summarized data.
Data-data yang mau dicari

3. Lokal DWH dan Global DWH
      Persamaan :
·         Keduanya mengandung historical data
·         Keduanya memiliki fungsi yang sama
·         Banyak data akan didistribusikan melalui banyak prosesor. Scara logika, hanya terdapat sebuah DWH, namun secara fisik, ada banyak DWH yang saling terhubung namun dipisahkan oleh prosesor yang berlainan. Hal ini disebut Technological distributed Datawarehouse.
·         Perlunya pengaturan ketika pertumbuhan DWH terjadi.

Perbedaan :
      Local
1.      Menampilkan ulang data dan prosessing remote site 
2.      Exists for different geographical regions or for different technical community.
3.      Scope of DWH is local
4.      Sumber dari local DWH adalah sistem operasional
5.      Pemetaan data yang ada merupakan pilihan dari pembuat, yaitu local designer dan developer.
6.      Tidak ada struktur data dari satu local DWH ke yang lain.

Global :
1.      Menampilkan ulang bagian bisnis yang terintegrasi dalam bisnis
2.      Scope dari Global DWH adalah bisnis yang terintegrasi pada suatu perusahaan.
3.      Sumber dari Global DWH adalah local DWH
4.      Didesain dan di definisikan secara tersentral, berdasarkan pada definisi dan identifikasi dari data penting perusahaan.
5.      Mengandung data yang :
·         Harus diintegrasikan
·         Butuh untuk dimanage secara global
·         Penting bagi keseluruhan bagian yang ada pada perusahaan

4. Eksternal data di DWH :
1.      Masalah : frekuensi ketersediaan
Tidak ada suatu pattern yang fix dari kedatangan data eksternal.
Solusi  : Monitoring yang konstant harus dilakukan sehingga eksternal data yang benar dapat diambil.
2.      Masalah : bahwa data tidak disiplin
Reformating dan membuat struktur data harus dilakukan sebelun data ini digunakan.
Solusi  : Membuat kembali struktur eksternal data, sehingga eksternal data tadi kompatibel dengan internal data.
3.      Masalah: eksternal data tidak dapat diprediksi
Eksternal data datang dari sumber manapun pada waktu yang berlainan.
Solusi  :
a.       Pengalokasian eksternal data pada sebuah penyimpanan medium.
b.      Pembuatan 2 buah penyimpanan untuk eksternal data.

      Unstructured data di dalam DWH :
      Merupakan data yang digolongkan sebagai aktivitas personal.
      Macam Tipe format yang ada:
·         Email
·         Spreadsheet
·         Text File
·         Document
·         PDF
·         PPT
      Solusi : Pembagian berdasarkan dua garis besar yaitu komunikasi dan dokumentasi.

5.      ETL : Extract / Load / Transform
ETL dibuat dengan maksud untuk melakukan proses pengintegrasian data pada lingkungan operasional secara otomatis.

Ada dua macam ETL software :
·         Software yang menghasilkan code.
·         Software yang menghasilkan “a run-time module” yang memiliki parameter.
      Penghasil code lebih baik daripada penghasil “a run-time module”, karena penghasil code dapat mengakses data pada formatnya masing-masing.
      Sedangkan penghasil “a run-time module” hanya dapat mengakses data pada format tertentu. Ketika proses pentransformasian data menjadi format tertentu, banyak data yang hilang.
      Manfaat ETL : Pentransformasian pada data dalam jumlah besar.

Tidak ada komentar:

Posting Komentar