Agus Tugas Basis Data Satu

  • November 2019
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Agus Tugas Basis Data Satu as PDF for free.

More details

  • Words: 4,262
  • Pages: 15
agus riadi c1

da ta w are house, d ata m in ing, xml- d ata b as ed syst em dat a w areho us e data warehouse adalah kumpulan data yang dirancang untuk mendukung pengambilan keputusan manajemen. data warehouse berisi data yang berbeda-beda yang memberikan gambaran kondisi bisnis pada saat tertentu. datawarehouse mendukung kemampuan melakukan query untuk mendukung pengambilan keputusan, data warehouse lebih mudah dipahami oleh customer dilihat kebutuhan informasi mereka dalam menaksir keadaan finansial, produk dan layanan, serta waktu untuk memasarkan produk dan layanan baru. yang terpenting – mungkin juga harapan yang beresiko – data warehousing dapat dilihat sebagai teknologi, dengan kemampuan unik untuk mengolah informasi, bertujuan untuk menghasilkan pendapatan yang tinggi dan memperbesar keuntungan. multi dimensional

modeling (mdm)

untuk memodelkan da

ta war ehouse

multidimensional modeling (mdm) adalah salah satu pendekatan untuk memberi arti (atau warehousing) pada gunungan data tersebut. mdm tidak terikat pada representasi fisik dari data. dapat dipisahkan dari multidimensional database, tidak terlalu sulit untuk dimengerti atau dipraktekan serta bukan mode yang terbaru atau terakhir mdm adalah teknik untuk memodelkan bisnis secara konseptual sebagai sekumpulan ukuran yang dijabarkan oleh segi bisnis secara umum. sangat berguna untuk pergantian, peringkasan dan penyusunan data untuk analisis. sangat kontras dengan online trasaction processing (oltp) system, yang didesain sekitar entitas, relationship, functional decomposition, dan state transition analysis, mdm untuk data warehousing berdasarkan fakta, dimensi, hirarki dan sparsity. mdm didesain untuk data numerik, seperti nilai, jumlah, berat, dan kejadian, dalam oltp permasalahan adalah “bagaimana membuat model yang memenuhi proses transaksi”, dalam mdm permasalahan adalah “ apa keuntungan bagi saya dengan pelanggan, dengan organisasi?” bagian yang menarik dari mdm adalah kesederhanaanya. desain oltp boleh jadi mimiliki selusin atau bahkan ribuan tabel, yang menyebabkan kesulitan bagi manajer untuk memahami desain data dalam rangka menganalisis data. mdm lebih sederhana, model tidak

1

agus riadi c1 hanya dimengerti oleh orang bisnis, tetapi juga diexpresikan dengan cara yang natural oleh user. desain konseptual mdm yang baik, dapat diimplementasikan dalam database relasional, multidimensional, bahkan object-oriented database. mdm didesain untuk menunjang pelaporan dan kebutuhan analisis. dapat dijelaskan dengan membedakannya dengan model relasional dalam beberapa hal: mdm melihat informasi dari prespektif “potongan waktu” bahkan transaksi atomik. sistem oltp merekam kejadian diskrit dari transaksi. contohnya isian jurnal, pesanan pembelian, billing,dll. mdm tidak mempedulikan actual event, hanya hasil kuantitatif pada suatu interval waktu, seperti hari, minggu atau bulan. mak a da ri it u : •

data warehouse sangat dekat dengan pengambilan keputusan dan masuk dalam sistem penunjang pengambilan keputusan (decession support system -- dss)



data warehouse memberikan kemudahan bagi manajer untuk menganalisis data operasional yang sangat besar dalam rangka pengambilan keputusan



multidimensional modeling (mdm) adalah salah satu cara untuk memodelkan datawarehouse



internet, teknologi media penyimpanan, dan platform baru akan merubah masa depan dari data warehousing.

pengembangan data warehouse meliputi pengembangan sistem untuk mengekstrak data dari sistem dan instalasi sistem basisdata warehouse yang memungkinkan manajer dapat mengakses data secara fleksibel. secara umum istilah data warehouse mengacu kepada basis data yang berbeda-beda yang dikumpulkan dari seluruh bagian perusahaan. sistem gudang data (data warehouse) dibangun untuk mengatasi masalah teknis dan bisnis dalam kasuskasus sejenis diatas, yaitu kasus kasus yang berkaitan dengan pengunaan data dan informasi untuk mengambil keputusan bisnis dan manajemen. data hanya diambil dan diproses sekali, disimpan didalam data warehouse (proses ini disebut etl = extract, transform, load); hanya bagian proses yang unik dari setiap pemakaian data yang dilaksanakan masing-masing (biasanya menggunakan software khusus – specialized tool). fungsi utama data warehouse adalah: mengambil (termasuk data dari luar yang dibutuhkan, misalnya daftar kode pos dari kantor pos), mengumpulkan, mempersiapkan (transforming, seperti membersihkan, mengintegrasikan, decoding), menyimpan (loading), dan menyediakan

2

agus riadi c1 data untuk pemakai atau aplikasi yang bersifat query/reporting (read-only); hanya satu data terpercaya ini yang digunakan oleh semua yang membutuhkan (single version of truth), untuk pelaporan, analisa informasi dan mengambil keputusan (analytical application) sekali data masuk kedalam data warehouse, data yang memang dirancang dan ditujukan untuk bukan hanya satu atau sejumlah pemakaian yang sudah diketahui, dapat digunakan untuk aplikasi mendatang dan belum pernah sebelumnya terpikirkan- bandingkan ini dengan pembangunan aplikasi operasional (fungsional)! kar ak ter istik sum ber dat a un tuk d at a w arehouse data warehouse (dw) menyimpan data yang berasal dari satu atau lebih sumber. dw tidak menciptakan data baru. data yang disimpan didalam dw sering diolah sebelum disajikan untuk end-user, misalnya diringkas (summary) sebelum dicetak sebagai laporan. tulisan ini membahas 6 karakteristik penting dari sumber data yang perlu diperhatikan waktu merancang dan membangun dw.  ar ah •

pemilik sumber data mengirim ke dw.



pengelola dw mengambil data dari sumber sesuai jadwal yang sudah disetujui bersama pemiliknya.

pendekatan kedua lebih populer, karena pemilik data pada prinsipnya cukup memberi ijin dan menyetujui kapan pengelola dw boleh mengambil data yang diperlukan. pada pendekatan pertama, pemilik data terbebani untuk membuat program baru dan/atau menjalankan job untuk mengambil data yang diinginkan untuk disimpan di dw, dimana proyek dw mungkin tidak ada hubungan dengan aplikasi yang menjadi sumber data atau bukan prioritasnya. saya lebih menyukai pendekatan pertama, dengan dua alasan utama: 1. pemilik data yang paling tahu seluk beluk datanya. 2. menggalakkan spirit atau kultur “berbagi data” (information sharing) didalam perusahaan. dengan sponsor pimpinan yang efektif, pendekatan pertama pembangunan dw akan memberikan hasil yang lebih besar nilainya – nilai “corporate information sharing culture”.  as al •

dari dalam; ini merupakan sumber data utama untuk dw, berasal dari biasanya aplikasi-aplikasi untuk operasi, transaksi, dan administrasi perusahaan.



dari luar; misalnya data yang diperoleh/dibeli/berlangganan dari biro statistik,

3

agus riadi c1 seperti demografis konsumen; dari kode pos dari kantor pos, misalnya untuk segmentasi geografis pasar; standar iso, seperti kode mata-uang dan kode negara.  frek uensi • 1.

satu kali (one time); diperlukan:

waktu awal/pertama kali mengisi dw, bila sejarah data sebelum tanggal mulai ini perlu/diinginkan disimpan di dw.

2. untuk recovery, dari backup, bila ada masalah yang mengharuskan dw dihapus seluruh/sebagian datanya dan dikembalikan ke status data sebelum terjadi masalah. 3. untuk menggabungan data (merge), bila dua atau lebih dw dijadikan satu. •

berkala (regular); sesuai jadwal yang dirancang, untuk menambahkan data baru dan perubahan (incremental update). beberapa data (tabel database) mungkin lebih efektif/efisien diupdate seluruh datanya (total refresh) daripada incremental.

 form at beberapa format sumber data yang populer (paling sering ditemui) adalah: •

file (text, flat); biasanya hasil perubahan data yang nara sumbernya memiliki format

bukan

relational

database.

flat

file

paling

populer

karena

kesederhanaannya memudahkan pengambilan (extract) dan pengolahannya (transform) dengan kecepatan tinggi. banyak piranti end-user, terutama olap (online analytical processing) dan data mining, yang menganjurkan input datanya berupa flat file. oracle menyediakan utility sql*loader untuk mengambil flat file dan menyimpannya di table database. sejak release 9, disediakan fungsi untuk “melihat” flat file sebagai tabel database (disebut external table) •

relational database; terutama bila database system-nya sama dengan yang digunakan di dw, pengambilan, pengolahan dan penyimpannya ke dw dapat menggunakan teknik dan program yang sama dengan proses etl yang lain

4

agus riadi c1 (extract, tranform, load). •

odbc; fasilitas yang “membungkus” sumber data dan formatnya sehingga “dilihat” sebagai tabel database.

 keser agam an bila data berasal dari berbagai sumber, dengan struktur dan nama-nama field yang berbeda, juga kadang mengandung makna berbeda, mereka perlu diseragamkan sebelum disimpan terintegrasi ke dw tidaklah sederhana. selain kompleksitas teknis, proses penyeragaman membutuhkan persetujuan bersama seluruh komunitas end-user. misalnya kasus nama, apakah perlu dipisah menjadi beberapa bagian, seperti nama panggilan, nama tengah, dan nama keluarga? apakah nama tengah boleh/cukup satu karakter (singkatan)? contoh lain, jumlah penjualan. apakah dinyatakan dalam satu mata uang? ini nilai penjualan bersih, atau termasuk komisi dan diskon?  kebe rsihan menjaga kualitas sumber data merupakan proses dan tanggung jawab paling penting dan rumit perancangannya dalam membangun dw. idealnya, semua data yang tersimpan di dw harus bersih, untuk menjamin kepercayaanya bagi end-user, terutama bila data di dw menjadi dasar pengambilankeputusan para pimpinan. apa yang harus dilakukan bila misalnya nama seorang pelanggan yang data disumbernya disimpan dua kali dengan ejaan berbeda? memiliki dua alamat rumah yang berbeda? apakah keduanya benar, karena memang sudah berubah (legitimate changes)? mengambil sumber data dan menyimpannya kedalam dw, dengan benar, konsisten, pada waktunya, serta sesuai persetujuan bersama pemilik dan seluruh komunitas end-user, merupakan ukuran kualitas dan kehandalan dw yang maha penting.

mengenal dat a w arehouse saya masih ingat, betapa suksesnya kami (waktu itu saya masih di indonesia) mengerjakan proyek yang sama untuk sejumlah bank.; yaitu memproses penutupan akhir hari dipusat komputer (system adalah terpusat, centralized), menyampaikan informasi (laporan) kesemua cabang untuk buka kantor disetiap esok hari kerja. laporan berisi misalnya posisi rekening nasabah yang hari sebelumnya mengadakan transaksi. juga disiap- dan disebar-kan laporan

5

agus riadi c1 sejenis untuk kantor wilayah yang mencakup cabang-cabang dibawah naungannya, dan seterusnya berantai mengikuti jenjang otonomi sistem perkantorannya. laporan ini berjenis-jenis, meskipun semuanya menggunakan sumber data yang sama. selain format (layout), strukturnya juga bervariasi. ada yang diurutkan berdasar besarnya transaksi, jenis laporan lain berdasar tipe rekening, dan untuk kantor wilayah misalnya diurutkan dan dikelompokkan per kantor cabang. selain penggunaan sumber data yang sama, ada sebagian proses yang sama diulang untuk setiap cabang (job stream sama sekali terpisah), terutama proses untuk mengambil data yang dibutuhkan (extraction) dari database milik sistem operasional bank (yang disiang harinya dipakai untuk menangani segala macam transaksi, baik atas permintaan pelanggan melalui kantor cabang, atm maupun internet banking, juga proses administrasi oleh bank sendiri). situasi ini dapat digambarkan sebagai berikut :

mengapa mengambil dan memproses data yang sama berulang kali? pertanyaan inilah yang menjadi alasan utama mengapa data warehouse diperlukan. ada alasan lain, akibat situasi diatas, yang selalu menimbulkan keraguan pemakai tingkat-atas (senior manager, misalnya kepala wilayah) akan kebenaran informasi yang diperolehnya. laporan harian pada contoh bank-bank diatas diatas dijadikan sumber data oleh fungsi-fungsi dikantor cabang dan wilayah, untuk membuat laporan yang lain untuk keperluan masing-masing. akibat berantainya penggunaan dan pemrosesan individu ini (terutama re-entry manual, perbedaan pengertian nilai data (definisi dan makna) dan formula perhitungan), maka bila mereka mengadakan rekonsiliasi kembali berdasar laporan individu tersebut (misalnya waktu rapat manajemen antar fungsi), hampir selalu muncul masalah inconsistency informasi.

6

agus riadi c1 sistem gudang data (data warehouse) dibangun untuk mengatasi masalah teknis dan bisnis dalam kasus-kasus sejenis diatas, yaitu kasus kasus yang berkaitan dengan pengunaan data dan informasi untuk mengambil keputusan bisnis dan manajemen. bandingkan gambar 2 berikut ini dengan gambar 1.

data hanya diambil dan diproses sekali, disimpan didalam data warehouse (proses ini disebut etl = extract, transform, load); hanya bagian proses yang unik dari setiap pemakaian data yang dilaksanakan masingmasing (biasanya menggunakan software khusus – specialized tool). fungsi utama data warehouse adalah: mengambil (termasuk data dari luar yang dibutuhkan, misalnya daftar kode pos dari kantor pos), mengumpulkan, mempersiapkan (transforming, seperti membersihkan, mengintegrasikan, decoding), menyimpan (loading), dan menyediakan data untuk pemakai atau aplikasi yang bersifat query/reporting (read-only); hanya satu data terpercaya ini yang digunakan oleh semua yang membutuhkan (single version of truth), untuk pelaporan, analisa informasi dan mengambil keputusan (analytical application) seperti digambarkan di gambar 2, sekali data masuk kedalam data warehouse, data yang memang dirancang dan ditujukan untuk bukan hanya satu atau sejumlah pemakaian yang sudah diketahui, dapat digunakan untuk aplikasi mendatang dan belum pernah sebelumnya terpikirkan- bandingkan ini dengan pembangunan aplikasi operasional (fungsional)! empa t k arak ter istik dat a warehouse ada 4 sifat yang mencirikan data yang disimpan didalam data warehouse – ini didefinisikan oleh salah satu mahaguru data warehousing (bill inmon) : •

subje ct

orien ted

: aplikasi untuk operasi perusahaan (operational system)

berorientasi pada proses (mengotomasi fungsi-fungsi dari proses bersangkutan – function oriented). misalnya di bank, aplikasi kredit mengotomasi fungsi-fungsi:

7

agus riadi c1 verifikasi lamaran dan credit checking, pemeriksaan kolateral, approval, pendanaan, tagihan, dan seterusnya. didalam data warehouse data-data yang dihasilkan dari proses kredit ini, diatur kembali (dikelompokkan) dan diintegrasikan (digabung) dengan data-data dari fungsi-fungsi lain, agar berorientasi pada misalnya nasabah dan produk. •

int eg ra ted : data dari macam-macam aplikasi transaksi (untuk bank misalnya: tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada yang spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk kredit ada kolateral, untuk rekening koran ada overdraft) – didalam data warehouse data-data yang sama harus diintegrasikan disatu database, termasuk misalnya diseragamkan formatnya (sederhana tetapi paling sering terjadi – aplikasiaplikasi sering dibeli vendor berbeda, dibuat dengan/dijalankan di teknologi berbedabeda)



time vari ant : data warehouse menyimpan sejarah (historical data). bandingkan dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir! waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse. didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data warehouse; juga hampir selalu disimpan versi, misalnya terjadi perubahan definisi kode pos, maka yang lama dan yang baru ada semua didalam data warehouse kita. sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah!



non-v ol atile : sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete).

terlihat,

bahwa

keempat

karakteristik

ini

saling

terkait



kesemuanya

harus

diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan. dan, implementasi keempat karakteristik ini membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem operasional.

dat a m ini ng data mining (dm) adalah salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database skala besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. definisi umum dari dm itu sendiri adalah serangkaian proses untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui secara manual dari suatu kumpulan data.

8

agus riadi c1 data mining adalah suatu kelas aplikasi database yang berfungsi melakukan pencarian polapola tersembunyi di dalam suatu kumpulan data yang bisa digunakan untuk memprediksikan tren atau perilaku yang akan datang. misalnya, perangkat lunak data mining bisa membantu perusahaan ritel untuk menemukan pelanggan yang memiliki ketertarikan tertentu. istilah ini umumnya dipersempit artinya yaitu hanya untuk menggambarkan perangkat lunak yang merepresentasikan data dengan cara-cara yang baru. namun sebenarnya perangkat lunak data mining tidak hanya berfungsi mengubah presentasi tersebut, melainkan juga menemukan relasi

tak

dikenal

antar-data.

data mining dikenal di dunia sains dan matematis namun juga digunakan secara lebih luas oleh para pemasar untuk merangkum data konsumen dari beragam web site. data mining memang salah satu cabang ilmu komputer yang relatif baru. dan sampai sekarang orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, karena data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb. ada pihak yang berpendapat bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. namun pihak lain berpendapat bahwa database berperanan penting di data mining karena data mining mengakses data yang ukurannya besar (bisa sampai terabyte) dan disini terlihat peran penting database terutama dalam optimisasi query-nya. lalu apakah data mining itu? apakah memang berhubungan erat dengan dunia pertambangan.. tambang emas, tambang timah, dsb. definisi sederhana dari data mining adalah ekstraksi informasi atau pola yang penting atau menarik dari data yang ada di database yang besar. dalam jurnal ilmiah, data mining juga dikenal dengan nama knowledge discovery in databases (kdd). kehadiran data mining dilatar belakangi dengan problema data explosion yang dialami akhirakhir ini dimana banyak organisasi telah mengumpulkan data sekian tahun lamanya (data pembelian, data penjualan,

data

nasabah,

data

transaksi dsb.). hampir semua data tersebut dimasukkan dengan menggunakan aplikasi komputer yang digunakan untuk menangani transaksi sehari-hari yang kebanyakan adalah oltp (on line transaction processing). bayangkan

9

agus riadi c1 berapa transaksi yang dimasukkan oleh hypermarket semacam carrefour atau transaksi kartu kredit dari sebuah bank dalam seharinya dan bayangkan betapa besarnya ukuran data mereka jika nanti telah berjalan beberapa tahun. pertanyaannya sekarang, apakah data tersebut akan dibiarkan menggunung, tidak berguna lalu dibuang, ataukah kita dapat me-‘nambang’-nya untuk mencari ‘emas’, ‘berlian’ yaitu informasi yang berguna untuk organisasi kita. banyak diantara kita yang kebanjiran data tapi miskin informasi. jika anda mempunyai kartu kredit, sudah pasti anda bakal sering menerima surat berisi brosur penawaran barang atau jasa. jika bank pemberi kartu kredit anda mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar rp. 1.000 per buah maka biaya yang dihabiskan adalah rp. 1 milyar!! jika bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah rp. 12 milyar!! dari dana rp. 12 milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? mungkin hanya 10 %-nya saja. secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia. persoalan di atas merupakan salah satu persoalan yang dapat diatasi oleh data mining dari sekian banyak potensi permasalahan yang ada. data mining dapat menambang data transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang memang potensial untuk membeli produk tertentu. mungkin tidak sampai presisi 10%, tapi bayangkan jika kita dapat menyaring 20% saja, tentunya 80% dana dapat digunakan untuk hal lainnya. lalu apa beda data mining dengan data warehouse dan olap (on-line analytical processing)? secara singkat bisa dijawab bahwa teknologi yang ada di data warehouse dan olap dimanfaatkan penuh untuk melakukan data mining. gambar di samping menunjukkan posisi masing-masing teknologi :

dari gambar di atas terlihat bahwa teknologi data warehouse digunakan untuk melakukan olap, sedangkan data mining digunakan untuk melakukan information discovery yang informasinya lebih ditujukan untuk seorang data analyst dan business analyst (dengan ditambah visualisasi tentunya). dalam prakteknya, data mining juga mengambil data dari data warehouse. hanya saja aplikasi dari data mining lebih khusus dan lebih spesifik dibandingkan olap mengingat database bukan satu-satunya bidang ilmu yang mempengaruhi data mining, banyak lagi bidang ilmu yang turut memperkaya data mining seperti: information science (ilmu informasi), high performance computing, visualisasi, machine learning, statistik, neural networks (jaringan syaraf tiruan), pemodelan matematika, information retrieval dan information extraction serta pengenalan pola. bahkan pengolahan citra (image processing) juga digunakan dalam rangka melakukan data mining terhadap data image/spatial. dengan memadukan teknologi olap dengan data mining diharapkan pengguna dapat melakukan hal-hal yang biasa dilakukan di olap seperti drilling/rolling untuk melihat data lebih dalam atau lebih umum, pivoting, slicing dan dicing. semua hal tersebut diharapkan nantinya dapat dilakukan secara interaktif dan dilengkapi dengan visualisasi. data mining tidak hanya melakukan mining terhadap data transaksi saja. penelitian di bidang

10

agus riadi c1 data mining saat ini sudah merambah ke sistem database lanjut seperti object oriented database, image/spatial database, time-series data/temporal database, teks (dikenal dengan nama text mining), web (dikenal dengan nama web mining) dan multimedia database. meskipun gaungnya mungkin tidak seramai seperti ketika client/server database muncul, tetapi industri-industri seperti ibm, microsoft, sas, sgi, dan spss terus gencar melakukan penelitian-penelitian di bidang data mining dan telah menghasilkan berbagai software untuk melakukan data mining: •

intelligent miner dari ibm. berjalan di atas sistem operasi aix, os/390, os/400, solaris dan windows nt. dijual dengan harga sekitar us$60.000. selain untuk data ibm juga mengeluarkan produk intelligent miner untuk teks. web site: www.software.ibm.com/data/iminer/fortext www-4.inm.com/software/data/iminer/fordata/index.html •



microsoft juga telah menambahkan fasilitas data mining di microsoft sql server 2000. web site: www.microsoft.com/sql/productinfo/feaover.htm



enterprise miner dari sas. berjalan di atas sistem operasi aix/6000, cms, compaq tru64 unix, hp-ux, irix, intel abi, mvs, os/2, open vms alpha, open vms vax, solaris, dan windows. web site: www.sas.com



mineset dari silicon graphics. berjalan di atas sistem operasi windows 9x/nt dan irix. dijual per seat seharga us$995, server (windows nt) seharga us$35.000 dan untuk irix dijual us$50.000. web site: www.sgi.com/software/mineset



clementine dari spss. berjalan di atas sistem operasi unix dan windows nt. web site: www.spss.com/software/clementine

beberapa penelitian sekarang ini sedang dilakukan untuk memajukan data mining diantaranya adalah peningkatan kinerja jika berurusan dengan data berukuran terabyte, visualisasi yang lebih menarik untuk user, pengembangan bahasa query untuk data mining yang sedapat mungkin mirip dengan sql. tujuannya tidak lain adalah agar end-user dapat melakukan data mining dengan mudah dan cepat serta mendapatkan hasil yang akurat. penera pan dat a mining sebagai cabang ilmu baru di bidang computer, cukup banyak penerapan yang dapat dilakukann oleh data mining. apalagi ditunjang ke-kaya-an dan ke-anekaragam-an berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. di bidang apa saja penerapan data mining dapat dilakukan? artikel singkat ini berusaha memberikan

11

agus riadi c1 jawabannya. o

anal isa pa sar dan mana jem en

untuk analisa pasar, banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik. beberapa solusi yang bisa diselesaikan dengan data mining diantaranya : •

me nemb ak ta rget p asa r

data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya. •

meli hat pola beli pemak ai da ri wak tu ke w akt u

data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola belinya berbeda dengan ketika dia masih bujangan. •

cross -ma rket ana lysis

kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. berikut ini saya sajikan beberapa contoh:  cari pola penjualan coca cola sedemikian rupa sehingga kita dapat mengetahui barang apa sajakah yang harus kita sediakan untuk meningkatkan penjualan coca cola?  cari pola penjualan indomie sedemikian rupa sehingga kita dapat mengetahui barang apa saja yang juga dibeli oleh pembeli indomie. dengan demikian kita bisa mengetahui dampak jika kita tidak lagi menjual indomie.  cari pola penjualan



prof il cus tomer

data mining dapat membantu anda untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa

12

agus riadi c1 saja. •

identif ikasi kebut uhan cust omer

anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung/membeli. •

me nil ai lo yalit as cust omer

visa international spanyol menggunakan data mining untuk melihat kesuksesan programprogram customer loyalty mereka. anda bisa lihat di www.visa.es/ingles/info/300300.html



in forma si summa r y

anda juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-dimensi dan dilengkapi dengan informasi statistik lainnya. o •

anal isa peru sahaa n dan manaj emen res ik o

perenc ana an k eu angan dan e val uas i aset

data mining dapat membantu anda untuk melakukan analisis dan prediksi cash flow serta melakukan contingent claim analysis untuk mengevaluasi aset. selain itu anda juga dapat menggunakannya untuk analisis trend. •

perenc ana an sumbe r da ya (reso urce planning)

dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan dari masing-masing resource, anda dapat memanfaatkannya untuk melakukan resource planning. •

per saing an (c ompetiti on)  sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan

competitive

intelligence.

data

mining

dapat

membantu anda untuk memonitor pesaing-pesaing anda dan melihat market direction mereka.  anda juga dapat melakukan pengelompokan customer anda dan memberikan variasi harga/layanan/bonus untuk masing-masing grup.  menyusun strategi penetapan harga di pasar yang sangat

13

agus riadi c1 kompetitif. hal ini diterapkan oleh perusahaan minyak repsol di spanyol dalam menetapkan harga jual gas di pasaran. o

telek omun ik asi

sebuah perusahaan telekomunikasi menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana sajakah yang masih harus ditangani secara manual (dilayani oleh orang). tujuannya tidak lain adalah untuk menambah layanan otomatis khusus untuk transaksi-transaksi yang masih dilayani secara manual. dengan demikian jumlah operator penerima transaksi manual tetap bisa ditekan minimal.

o

keuangan

financial crimes enforcement network di amerika serikat baru-baru ini menggunakan data mining untuk me-nambang trilyunan dari berbagai subyek seperti property, rekening bank dan transaksi

keuangan

lainnya

untuk

mendeteksi

transaksi-transaksi

keuangan

yang

mencurigakan (seperti money laundry). mereka menyatakan bahwa hal tersebut akan susah dilakukan

jika

menggunakan

analisis

standar.

anda

bisa

lihat

di

www.senate.gov/~appropriations/treasury/testimony/sloan.htm. mungkin sudah saatnya juga badan pemeriksa keuangan republik indonesia menggunakan teknologi ini untuk mendeteksi aliran dana blbi. o

asur ans i

australian health insurance commision menggunakan data mining untuk mengidentifikasi layanan kesehatan yang sebenarnya tidak perlu tetapi tetap dilakukan oleh peserta asuransi. hasilnya? mereka berhasil menghemat satu juta dollar per tahunnya. anda bisa lihat di www.informationtimes.com.au/data-sum.htm. tentu saja ini tidak hanya bisa diterapkan untuk asuransi kesehatan, tetapi juga untuk berbagai jenis asuransi lainnya. o

olah raga

ibm advanced scout menggunakan data mining untuk menganalisis statistik permainan nba (jumlah shots blocked, assists dan fouls) dalam rangka mencapai keunggulan bersaing (competitive advantage) untuk tim new york knicks dan miami heat.

14

agus riadi c1 o

as tro nomi

jet propulsion laboratory (jpl) di pasadena, california dan palomar observatory berhasil menemukan 22 quasar dengan bantuan data mining. hal ini merupakan salah satu kesuksesan penerapan data mining di bidang astronomi dan ilmu ruang angkasa. anda bisa lihat di www-aig.jpl.nasa.gov/public/mls/news/skicat-pr12-95.html.

o

int er net w eb su rf- aid

ibm surf-aid menggunakan algoritma data mining untuk mendata akses halaman web khususnya yang berkaitan dengan pemasaran guna melihat prilaku dan minat customer serta melihat ke-efektif-an pemasaran melalui web. dengan melihat beberapa aplikasi yang telah disebutkan di atas, terlihat sekali potensi besar dari penerapan data mining di berbagai bidang. bahkan beberapa pihak berani menyatakan bahwa data mining merupakan salah satu aktifitas di bidang perangkat lunak yang dapat memberikan roi (return on investment) yang tinggi. namun demikian, perlu diingat bahwa data mining hanya melihat keteraturan atau pola dari sejarah, tetapi tetap saja sejarah tidak sama dengan masa datang. contoh: jika orang terlalu banyak minum coca cola bukan berarti dia pasti akan kegemukan, jika orang terlalu banyak merokok bukan berarti dia pasti akan kena kanker paru-paru atau mati muda. bagaimanapun juga data mining tetaplah hanya alat bantu yang dapat membantu manusia untuk melihat pola, menganalisis trend dsb. dalam rangka mempercepat pembuatan keputusan.

15

Related Documents