November 25, 2014

Resume Data Warehouse Pertemuan 10

Menentukan ketetapan data untuk ETL

Data Quality
- Mark Mosley (2008) mengatakan Data Quality adalah level data yang menyatakan data tersebut akurat, lengkap, terbaru, konsisten dan sesuai dengan semua kebutuhan bisnis.

Data Quality Characteristic
- Accuracy
Data harus benar, nilai valid adalah nilai yang akurat. Kesalahan penulisan (typografi) nama adalah contoh ketidakakuratan data, misalnya salah dalam ejaan, singkatan dll.

- Accessibility
Data dapat dengan mudah diakses, dan dimengerti , serta dapat digunakan sesuai dengan keperluan yang dibutuhkan.

- Completeness
Data harus relevan dengan tujuan meraka disimpan. Kita bisa menyimpan dengan sangat akurat, contoh : data tentang warna kesukaan dan jenis rambut datap diisikan dengan tepat waktu, tapi apakah data ini sesuai dengan kebutuhan untuk perawatan pasien?

- Consistency
Data berkualitas harus konsisten. Penggunaan singkatan yang memiliki 2 arti berbeda merupakan contoh yang tepat akan kurangnya konsistensi dapat menimbulkan masalah.
Contoh : perawat yang mungkin menggunakan singkatan CPR untuk cardiopulmonary Resuscititation (teknik penyelamatan hidup yang berguna dalam keadaan darurat, termasuk serangan jantung atau hampir tenggelam) dan menggunakan CPR untuk computer-based patient record (informasi tentang status kesehatan individu dan perawatan. ini berfokus pada tugas-tugas yang berkaitan langsung dengan perawatan pasien) di lain waktu, akan membingungkan.
  
- Integrity
Setiap data harus berhubungan atau dapat dihubungkan dengan data-data lain sehingga setiap data bisa saling terkait.

- Timeliness
Ketetapan waktu atau up to date, jadi data itu harus teruptodate agar bisa digunakan untuk mengambil keputusan.
Contoh : nilai lab untuk pemeriksaan kritis harus tersedia untuk penyedia layanan kesehatan dengan tepat waktu. Hasil akurat yang terlambat disediakan dari tenggat waktu yang seharusnya atau bahkan tersedia setelah kepulangan pasien akan mengecilkan atau meniadakan nilai gunanya bagi perawatan pasien.

- Validity
Validitas data adalah sejauh mana data tersebut dapat di jelaskan dengan benar dan sah sesuai dengan fakta-fakta yang ada sebenarnya.


Data Quality Critical
- Data yang berkualitas dapat :

  • Meningkatkan kepercayaan diri dalam pengambilan keputusan
  • Memperbaiki pelayanan kpd Customer
  • Meningkatkan kesempatan untuk menghasilkan value yang lebih baik bagi pelayanan
  • Mengurangi resiko dari keputusan yang sifatnya berbahaya
  • Mengurangi biaya, terutama untuk pemasaran,
  • Mengembangkan strategi untuk pembuatan keputusan
  • Meningkatkan produktivitas dengan memangkas beberapa proses
  • Menghindari efek komplikasi dari data yang terkontaminasi
Data Quality Challanges
Sumber Data
1. Penuaan Data
2. Kesalahan Input
3. Penipuan
4. Sistem Konversi

Validasi Data
1. Duplikasi data
2. Beberapa Atribut yang tercampur dalam satu field
3. Ejaan yang berbeda untuk nama yang sama
4. Tidak adanya atribut fungsi

Biaya besar untuk menjaga kualitas data
1. Mengatur data agar selalu berkualitas membutuhkan biaya yang tidak sedikit.
2. Membutuhkan orang-orang yang berkompeten untuk me-manage data

Data Quality Tools
- Data Auditing
Data auditing meningkatkan akurasi dan kebenaran data pada sumbernya. Tools ini pada umumnya membandingkan data di database sumber dengan aturan bisnis yang ada.

- Data Cleansing
Data cleanshing digunakan dalam staging area yang berguna untuk standarisasi dan verifikasi data terhadap data yang tidak dikenali. 
Fitur yang terdapat dalam data cleanshing :
> Data Parsing
> Data Standarization
> Data Correction
> Data Transformation
> Householding

- Data Migration
Data migration digunakan untuk mengestrak data dari sumber untuk dikirim ke staging area dan dari staging area ke data warehouse.

Data Quality Initiative
Untuk bisa sukses, Data Quality program harus bisa dimulai oleh CEO, didukung oleh jajaran direksi dan dijalankan oleh manajer yang khusus bertugas mengatur kualitas data.

0 Comment:

Posting Komentar