Kode/Nama Rumpun Ilmu : 461/Sistem Informasi
USULAN PENELITIAN DOSEN PEMULA
IMPLEMENTASI PLUG-IN ANTI SPAM EMAIL CLIENT DENGAN METODE NAIVE BAYES CLASSIFIER
TIM PENGUSUL Nurlina, S. Kom., M.T (0929027601) Nurlindasari Thamsir, S. Kom., M. T (0920038502)
STMIK DIPANEGARA April 2015
RINGKASAN Sebagai pengguna email, tentunya sudah banyak pengalaman yang didapatkan dalam bertransaksi via email tersebut. dari tahun ke tahun pengguna teknologi email terus meningkat. Di samping sebagai pengguna dituntut juga adanya penanganan dalam keamanan data yang cukup memakan waktu dan biaya. Misalkan, antisipasi terhadap email yang bervirus, atau email yang berisikan sekedar iklan atau spam semata yang membuat inbox email pengguna menjadi melebihi kapasitas dan membuang banyak biaya maupun waktu dalam mendeteksi virus dari email yang masuk secara manual ataupun otomatis tergantung dari fasilitas email client yang digunakan oleh pengguna ataupun menyingkirkan email yang tidak berguna (spam) dari inbox pengguna tersebut. Dari penelitianpenelitian sebelumnya, email clientlah yang dilatih saja sehingga apabila pengguna mengganti PC ataupun laptopnya, maka akan tidak efisien dan tidak efektif lagi penggunaan email clientnya, karena otomatis pelatihan yang telah dilakukan, hilang dengan sendirinya. Berangkat dari permasalahan tersebut, maka peneliti berencana merancang suatu plug-in anti spam yang dipasang pada email client khusus menyaring spam saja dari inbox pengguna dengan menggunakan metode Naive Bayes Classifier. Plug-in tersebut nantinya akan digunakan oleh pengguna yang akan bermanfaat dalam menyaring dan memisahkan email spam dan email ham secara otomatis setelah dilakukan pelatihan. Sehingga apabila si pengguna mengganti PC atau laptop yang bersistem operasi berbeda dari sebelumnya, tidak akan mempengaruhi kualitas dari plug-in anti spam yang telah diinstal selama email yang digunakan berdomain sama dengan sebelumnya. Kata Kunci
: email client, email spam, plug-in, Naive Bayes Classifier
DAFTAR ISI HALAMAN JUDUL .............................................................................................. i HALAMAN PENGESAHAN............................................................................... ii RINGKASAN ....................................................................................................... iii DAFTAR ISI......................................................................................................... iv BAB I PENDAHULUAN...................................................................................... 1 1. 1 Latar Belakang ................................................................................... 1 1. 2 Rumusan Masalah .............................................................................. 3 1. 3 Batasan Penelitian .............................................................................. 4 1. 4 Tujuan Penelitian ............................................................................... 4 BAB II TINJAUAN PUSTAKA .......................................................................... 5 BAB III METODE PENELITIAN .................................................................... 11 3. 1 Lokasi dan Waktu Penelitian ........................................................... 11 3. 2 Parameter Penelitian ........................................................................ 11 3. 3 Sumber Data (Analisis Data) ........................................................... 11 3. 4 Tahapan Penelitian........................................................................... 11 3. 5 Rancangan Penelitian....................................................................... 11 BAB IV BIAYA DAN JADWAL PENELITIAN ............................................. 13 4. 1 Anggaran Biaya ............................................................................... 13 4. 2 Jadwal Penelitian ............................................................................. 15 DAFTAR PUSTAKA DAFTAR LAMPIRAN
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi sekarang berkembang secara pesat. Khususnya di bidang internet, karena informasi dapat menciptakan dunia baru, membawa beragam dinamika dari dunia nyata. Seiring dengan perkembangan teknologi banyak bentuk – bentuk penyerangan terhadap sebuah situs web site, baik itu dilakukan oleh hacker, cracker, ataupun virus. Dengan makin banyaknya virus, kenyamanan saat berinternet-an pun ikut berkurang. Salah satu fasilitas internet yang sering kita gunakan adalah email. Akhir-akhir ini email merupakan hal yang sangat penting bagi kita, manfaatnya sering kita rasakan. Kita dapat menerima informasi atau bertukar pesan dengan cepat dan mudah. Karena fasilitas ini mengharuskan kita terhubung ke internet (sebagian besar penggunaan email terhubung ke internet kecuali dalam jaringan LAN/intranet) membuat resiko terserang virus semakin tinggi. Salah satu bentuk varian virus atau malware tersebut adalah spam. Spam yang berarti email sampah atau email yang tidak kita butuhkan, merupakan kata yang sering didengar. Kata spam konon berasal dari zaman viking dan tak ada sangkut pautnya dalam email (surat elektronik) yang biasa kita gunakan. Sebenarnya email yang dianggap spam itu tergantung dari sudut pandang masing-masing (sudut pandang subyektif secara individu). Contoh misalnya,Alex yang seorang perancang busana mendapatkan email yang berisi penawaran produk mode meskipun dia tidak menginginkannya tetapi dia tidak menganggap hal itu sebagai spam tetapi lain halnya jika yang menerimanya adalah Yusuf seorang tenaga IT disamping dia tidak menginginkannya dia juga akan merasa terganggu dengan penawaran tersebut karena tidak berhubungan sama sekali dengan dunia yang ia geluti (IT). Dampak buruk yang nyata atau langsung dapat dirasakan dari pengguna email dari spam ini adalah waktu yang terbuang sia-sia. Saat mengecek email yang ada pada inbox umumya pengguna email memilah mana email yang benar-benar email (penting) mana yang spam, tentu saja pengguna akan langsung menghapus spam saat menemukannya hal ini
akan menghabiskan waktu terkadang tak jarang email yang penting pun turut ikut terhapus, hal ini tentu saja sangat merugikan. Bagi orang-orang yang tidak dapat leluasa koneksi ke internet, bandwidth yang dibatasi oleh quota, juga quota pada inbox email akan sangat merugikan jika terkena dari spam ini. Spam juga dapat memborbardir mailing list dengan membuat copy-an suatu artikel yang sama . Di lain pihak, spam adalah sebuah masalah yang multidimensional. Sebagai masalah teknis, spammer menyalahgunakan atau menghabiskan resource jaringan. Komunitas milis Spam Brigade menjuluki spam sebagai “the biggest waste of bandwidth on the Internet and Usenet”. Spam bisa memenuhi mailbox, mengakibatkan mailserver sibuk, dan memperlambat layanan lainnya. Sebagai masalah bisnis, kegiatan spammer perlu dilawan karena banyak yang mempraktikkan penipuan. Dan terakhir, seperti ditekankan oleh narasumber P. Y. Adi Prasaja, spam juga sebuah masalah sosial: tindakan sebagian orang yang seenaknya menyalahgunakan sebuah fasilitas publik seperti Internet. Padahal agar fasilitas berjalan lancar diperlukan kerjasama dan sikap saling menjaga dari semua penggunanya. Karena fasilitas email yang murah dan kemudahan untuk mengirimkan ke berapapun jumlah penerima, maka spam mail menjadi semakin merajalela. Pada survey yang dilakukan oleh Cranor & La Macchia (1998), ditemukan bahwa 10% dari mail yang diterima oleh suatu perusahaan adalah spam-mail atau spammer. Tidak ada satupun cara yang benar-benar dapat mengatasi spam. Dari segi teknis untuk mengurangi spam, yaitu filtering. Telah terdapat beberapa metode filtering yang dapat digunakan untuk
mencegah spam diantaranya : Keyword filtering,
Signature –Based Filtering, Bayesian (Statistical) Filtering, Rule-based (heuristic) filtering, atau Challenge-response filtering. Filter anti spam yang cukup handal untuk menghalau spam adalah Bayesian Filtering atau filter Bayesian yang menggunakan algoritma Naive Bayes Classifier. Algoritma ini bekerja memanfaatkan metode statistika Bayesian untuk mengklasifikasikan dokumen dalam kategori tertentu berdasarkan tingkat kepercayaannya. Oleh sebab itu, tulisan ini akan membahas bagaimana cara suatu plug-in anti spam
untuk memisahkan antara email spam dan email ham dengan algoritma Naive Bayes Classifier. Algoritma Naive Bayes Classifier akan digunakan oleh peneliti untuk membuat atau merancang suatu plug-in. Plug-in ini yang akan menyimpan hasil training terhadap data email spam dan email ham pada email client Thunderbird. Plug-in dirancang oleh peneliti dengan tujuan agar user yang telah melatih / mentraining emailnya terhadap email spam dan email ham pada PC atau laptopnya, tidak akan kewalahan dalam mendapatkan lagi aplikasi anti spam tersebut karena apabila user mengganti atau menginstal ulang PC atau laptopnya karena disebabkan oleh suatu hal, maka otomatis plug-in tersebut juga akan dapat langsung diinstalnya pada email client yang digunakan. Jadi otomatis plug-in tersebut juga sama dengan backup data yang mempermudah setiap user dalam mengamankan emailnya dari spam ataupun ham. 1.2 Rumusan Masalah 1. Bagaimana menganalisis hasil pengklasifikasian email ham dan email spam dengan menggunakan plug-in pada email client ? Pengklasifikasian dilakukan dengan menggunakan teknik memperkenalkan account email uji coba untuk mendapatkan respon langsung dari para spammer dan mengirimkan input beberapa email dari sumber email lain yang sudah berstatus ham dan spam 2. Bagaimana plug-in anti spam metode Naive Bayes Classifier di sisi email client mampu mengklasifikasikan email ham dan email spam ? Pada sistem ini, sejumlah sampel email ham dan email spam akan dikirimkan untuk mengenali parameter-parameter dalam men-training plug-in anti spam metode Naive Bayes Classifier, parameter tersebut digunakan sebagai pengenalan cerdas bagi sistem untuk menyaring email. Dalam hal ini sistem akan mengenali email tersebut berdasarkan apa yang sudah di-training-kan pada plug-in anti spam dan akan mengklasifikasikan langsung ke dalam masing-masing folder yang sudah ditentukan.
3. Bagaimana plug-in anti spam mampu melakukan pengenalan email klasifikasi dengan data email secara acak? Plug-in anti spam dikirimkan input email spam dan email ham yang pernah ditraining dengan email yang belum pernah ditraining secara acak. Outputnya berupa pengenalan terhadap email ham atau email spam tersebut berdasarkan nilai yang ditraining dari email sebelumnya. 4. Berapa tingkat akurasi dan error dari plug-in anti spam metode Naive Bayes Classifier dalam mengenali email ham dan email spam ? Menghitung persentasi akurasi plug-in anti spam dalam mengenali setiap email ham dan email spam yang ditraining maupun yang tidak ditraining.
1.3 Batasan Penelitian Menganalisa hasil klasifikasi email spam dan email ham dengan hanya memperhatikan header dan body dari email, dan mengklasifikasikan email spam dan email ham menggunakan metode Naive Bayes Classifier pada plug-in email client yang tidak dapat melakukan pengecekan terhadap sebuah attachment atau file.
1.4 Tujuan Penelitian Plug-in tersebut akan bermanfaat dan membantu pihak user dalam mengelola email mereka dari serangan para spammer dan tidak akan mengulangi pelatihan/training lagi bila user mengganti perangkat keras yang digunakan sebelumnya, karena plug-in tersebut akan merekam pelatihan / training yang telah dilakukan sehingga user tidak akan menunggu setahun lebih dalam mengulangi penggunaan anti spam pada email client tersebut. 1. Untuk menganalisis hasil pengklasifikasian email ham dan email spam dengan menggunakan metode Naive Bayes Classifier 2. Untuk mengklasifikasikan email ham dan email spam pada anti spam pada plug-in anti spam metode Naive Bayes Classifier pada email client. 3. Untuk mengetahui tingkat akurasi plug-in anti spam dalam mengenali email ham dan email spam.
4. Untuk membuat plug-in terhadap email spam dan email ham berdasarkan data email yang ditraining ke dalam database secara otomatis dengan menerapkan metode Naive Bayes Classifier
BAB II TINJAUAN PUSTAKA Email Client, adalah tool atau software untuk mempermudah dalam mengatur atau mengelola email secara offline (tidak terhubung koneksi internet). Dengan adanya software email client, pesan email yang ada pada server email didownload terlebih dahulu ke dalam komputer anda dan setelah semua email di download, pesan email tersebut bisa anda kelola secara offline kapan saja tanpa harus terhubung ke internet. Contoh software email client : Microsoft Outlook, Thunderbird, Windows Live mail, dan lain-lain.Ada juga browser internet yang sudah langsung terintegrasi dengan layanan email client, contoh web browser tersebut adalah browser internet opera. Email Spam, Spam Email atau Email Spam adalah pesan email yang bersifat menyalahi aturan dan biasanya berisi iklan ataupun yang lainnya sehingga mengakibatkan ketidak nyamanan pengguna email. Spam email biasanya dikirim dalam jumlah yang banyak atau secara terus-menerus sehingga akan memenuhi inbox penerima email. Selain itu Spam email seringkali menggunakan software pengirim otomatis sehingga pesan yang dikirimkan bisa dalam jumlah yang banyak dan terus menerus. Banyak dari penyedia email membuat sistem untuk menangkal terhadap adanya email spam. Plug-in, pengertian plug-in harus disamakan dulu plug-in untuk apa dan dimana dipakainya, karena plug-in itu bisa berarti macam macam, plug-in ada juga di industri, di spare part dan sebagainya. Dalam dunia komputasi, plug-in yang juga disebut plug-in, addin, add-in, addon, add-on, snap-in, snapin, mirip juga dengan file extension, terdiri dari program computer yang berinteraksi dengan aplikasi host ( suatu web browser atau email klien misalnya) untuk menyediakan hal khusus, biasanya sangat spesifik fungsi yang diinginkan. Seringkali add-on dianggap sebagai batasan umum dalam uraian plug-in, extensions dan theme sebagai sub kategori. Suatu aplikasi didukung oleh plug-in ditujukan untuk berbagai alasan, antara lain adalah memungkinkan buat pihak ketiga membuat kemampuan tambahan pada aplikasi, mendukung fitur yang tidak terlihat,
menurunkan ukuran aplikasi dan memisah kode sumber karena tidak kompatibel dengan software yang berlisensi. Contoh aplikasi termasuk dengan plug-innya adalah Microsoft Office, Rockbox, Firmware untuk Digital Audio Players, Email Client, Software Graphic, Media Player, Paket Sniffer, Aplikasi Sensing Remote, Web Browser, beberapa Digital Mixing Console, Web Contain Management Systems, menggunakan plug-in untuk meningkatkan fungsinya. Dengan kata lain, Plug-in adalah sebuah program komputer yang menambah fungsionalitas sebuah program utama. Program utama biasanya memberikan semacam antarmuka (interface) agar plug-in dapat berinteraksi dengan program utama. Email Client, untuk mengakses layanan email diperlukan aplikasi di sisi klien sehingga pengguna dapat mendownload email. Aplikasi ini menghubungi email server dengan mengirimkan informasi account user dan password. Apabila server menerima account dan password tersebut maka email untuk suatu account akan didownload ke klien, biasanya menggunakan protokol POP3. Apabila seorang user mengirimkan email maka email server akan mendownload email tersebut menggunakan protokol SMTP. Naive Bayes Classifier, metode Bayesian Filtering merupakan metode anti spam filter yang handal. Metode ini mengenali spam berdasarkan kata-kata (token) yang terkandung pada sebuah email. Metode filter ini pertama kali perlu di-“training” menggunakan dua koleksi email, satu koleksi merupakan spam-mail, dan koleksi yang lain merupakan legitimate mail. Dengan cara seperti ini, pada setiap email baru yang diterima, Bayesian Filter dapat memperkirakan probabilitas spam berdasarkan kata-kata yang sering muncul di koleksi spam-mail atau di koleksi legitimate mail. Bayesian Filter efektif untuk mem-blok spam karena filter ini dapat secara otomatis mengkategorikan spam-mail atau legitimate mail. Naive Bayes Classifier, merupakan klasifikasi yang bersifat statistik, yang dapat memprediksi peluang-peluang keanggotaan kelas, seperti peluang bahwa suatu sampel yang diberikan termasuk kelas tertentu. Klasifikasi Naive Bayes Classifier didasarkan pada teorema Bayes [Han. 2011]. Teorema Bayes, algoritma Naive Bayes Classifier dinamai sesuai nama Thomas Bayes (1702-1761) yang pertama kali mengajukan persoalan statistik
yang kini dikenal sebagai teorema Bayes. Istilah Naive Bayes Classifier sendiri baru muncul sekitar tahun 1950-an. Sebelumnya, teorema Bayes banyak dipakai dalam berbagai bidang, mulai dari perhitungan matematis orbit benda langit, statistika medis, hingga bidang hukum [Rachli. 2007]. Misalkan X merupakan sampel data yang tidak diketahui label kelasnya dan Y melambangkan variabel kelas, untuk masalah klasifikasi akan dihitung P Y X , yaitu peluang kelas Y jika diberikan sampel data X . Peluang bersyarat
ini juga dikenal dengan peluang posterior untuk Y dengan syarat X . Peluang posterior P Y X didasarkan pada informasi sebelumnya yaitu peluang prior PY yang bebas terhadap X . Teorema Bayes digunakan untuk menghitung peluang posterior P Y X , dari PY , P X dan P X Y .
PY X
PX Y . PY P X
(1)
Filter Naive Bayes Classifier, bekerja dengan algoritma Naive Bayes Classifier yang mendeteksi spam dengan cara menghitung probabilitas dari suatu email berdasarkan isinya. Probabilitas ini dapat dihitung dengan terlebih dahulu membuat suatu database email spam dan database email ham. Database tersebut berisi kata-kata yang telah diekstraksi yang terdapat dalam email-email sampel. Kemudian dengan suatu metode training, filter anti-spam yang menggunakan algoritma Naive Bayes Classifier dapat dilatih untuk melihat kata-kata yang sering digunakan pada email spam, sehingga pada akhirnya dihasilkan filter anti-spam yang akurat dengan sekecil mungkin kesalahan [Han. 2011]. Teorema Bayes dalam konteks spam, menyatakan bahwa peluang sebuah email adalah spam, ditunjukkan oleh keberadaan beberapa kata (selanjutnya disebut atribut) tertentu didalamnya, adalah sama dengan peluang untuk menemukan atribut yang sama dalam sebuah email spam, dikalikan dengan peluang bahwa sebuah email adalah spam, dibagi dengan peluang untuk menemukan atribut yang sama dalam sembarang email [Rachli. 2007].
Pr spam kata
Pr kata spam . Pr spam Pr kata
( 2)
Filter Naive Bayes Classifier merupakan penggolong Naive Bayes Classifier yang sederhana dengan cara kerja sebagai berikut : 1. Setiap email diwakili oleh suatu vektor x x1 , x2 ,..., xn ,
dimana
x1 , x2 ,..., xn merupakan nilai dari atribut X 1 , X 2 ,...X n . 2. Menghitung peluang posterior untuk kelas email spam dan email ham dengan
syarat X . Dari teorema Bayes dan teorema peluang total, diberikan vektor x x1 , x2 ,..., xn pada suatu email, peluang bahwa email tersebut merupakan milik kelas c yaitu :
PC cX x
P C c . P X x C c P C k . P X x C k
k spam , ham
(3)
3. Peluang total adalah konstan untuk setiap kelas sehingga hanya perlu dihitung P C c . P X x C c . Peluang prior P C c dapat dihitung dengan
PC c
sc , di mana s c merupakan jumlah email kelas c dalam sampel s
training dan s merupakan jumlah seluruh email dalam sampel training. 4. Jika diberikan banyak atribut, maka akan sangat sulit untuk menghitung P X x C c . Untuk mengurangi perhitungan dalam mengevaluasi P X x C c , dibuat asumsi bahwa tidak ada ketergantungan antara atribut
yang satu dengan atribut yang lain atau yang biasa disebut kebebasan bersyarat
(conditional
independence).
Asumsi
ini
dibuat
untuk
menyederhanakan perhitungan dan inilah sebabnya disebut ”naive” [Han. 2011]. Kebebasan Bersyarat, misal X , Y , dan Z melambangkan tiga variabel acak. Variabel X dikatakan bebas secara bersyarat Y , yang diberikan Z , jika sesuai kondisi berikut : PX Y , Z PX Z
(4)
P X , Y Z
P X , Y , Z P Z
P X , Y , Z P Y , Z . P Y , Z P Z
P X Y , Z . P Y Z
Kebebasan
P X Z . P Y Z
bersyarat antara
(5 )
X dan Y juga dapat ditulis dalam bentuk berikut : Persamaan (4) digunakan untuk memperoleh baris terakhir persamaan di atas.
k P X C c P X i C c
(6)
i 1
Peluang P X i C c dapat dihitung dari data training yaitu P X i C c
sic , di sc
mana sic adalah jumlah email dalam kelas c dalam sampel training yang mengandung atribut ke-i.
5. Email X termasuk kelas email spam jika dan hanya jika P C spam . P X x C spam P C ham . P X x C ham
Dengan kata lain, email X merupakan kelas dengan peluang posterior P C c X x maksimum.
Keakuratan dan Tingkat Kesalahan, probabilitas tiap kata adalah unik untuk setiap user, dan dapat berubah sewaktu-waktu dengan adanya koreksi apabila filter keliru melakukan klasifikasi terhadap sebuah email. Hasilnya, akurasi filter anti-spam akan terus meningkat dari waktu ke waktu. Kemampuan ini sangat membantu untuk menghindari terjadinya false positives, ketika filter keliru mengidentifikasi email ham sebagai spam [Rachli. 2007]. False positives adalah email ham yang ditujukan kepada penerima, tetapi karena kesalahan dari
filter anti-spam,
dikategorikan
menjadi
email
spam.
Kesalahan
dalam
menghambat email-email ham H S pada umumnya lebih berat dibandingkan dengan membiarkan email-email spam melewati filter begitu saja
S H
[Androutsopoulus. 2004]. Misalkan bahwa menghambat satu email ham sama buruknya dengan membiarkan email spam sebanyak
H S S H ,
melewati filter
filter dapat ditraining untuk mengkategorikan email
sebagai spam jika :
P C spam X x P C ham X x
(7 )
Karena dianggap lebih beresiko maka dipilih nilai tertentu untuk memperkecil kemungkinan terjadinya false positive [Pratiwi. 2005].
Dalam pengklasifikasian, dua ukuran yang biasa digunakan adalah keakuratan (accuracy) dan tingkat kesalahan (error rate).
Acc
n H H nS S NH NS
Err
n H S nS H NH NS
Err 1 Acc Keterangan : Acc
:
tingkat keakuratan
Err
:
tingkat kesalahan
nH S
:
jumlah email ham yang dihalangi filter
nSH
:
jumlah email spam yang melewati filter
nH H
:
jumlah email ham yang melewati filter
nS S
:
jumlah email spam yang dihalangi filter
NH
:
jumlah seluruh email ham yang diklasifikasikan
NS
:
jumlah seluruh email spam yang diklasifikasikan
(8)
BAB III METODE PENELITIAN 3.1 Lokasi dan Waktu Penelitian Lokasi diadakannya penelitian ini pada Laboratorium STMIK Dipanegara yang beralamat di Jalan Perintis Kemerdekaan km. 09 Makassar dan direncanakan selama 12 bulan mulai bulan Juni 2016 sampai bulan Juni 2017. 3.2 Parameter Penelitian Yang menjadi parameter dalam penelitian ini adalah sebagai berikut : 1. Parameter input yaitu email spam dan email ham 2. Parameter output yaitu false positive dan false negative atau akurasi dan error. 3.3 Sumber Data (Analisis Data) Sumber data dalam penelitian ini adalah keseluruhan email spam dan email ham yang masuk dalam inbox account
[email protected]. 3.4 Tahapan Penelitian 1. Studi Literatur (Literature Study). Sumber data yang didapatkan dengan mengkaji literatur-literatur, buku-buku pustaka yang berkaitan dengan masalah yang dibahas dan juga melalui artikel-artikel dari internet yang relevan dengan permasalahan yang dibahas dalam penelitian ini. 2. Metode Pengambilan Data, yaitu Penelitian Lapangan (Field Research). Yaitu dengan cara mengadakan pengamatan langsung terhadap obyek yang diteliti. Untuk mendapatkan data di lapangan maka digunakan teknik observasi tanpa wawancara langsung. 3.5 Rancangan Penelitian Terdapat beberapa tahapan yang dilaksanakan dalam penelitian ini sebagai berikut : 1. Persiapan sebuah email baru dengan domain yahoo.com 2. Pengumpulan dan mempersiapkan data-data berupa : email spam dan email ham dengan melakukan subscribe pada milis account yahoogroups
3. Persiapan data penyelidikan lapangan dengan menerapkan observasi untuk mengetahui email ham, email spam, false positive dan false negative sehingga didapatkan akurasi dan errornya. 4. Plug-in pada email client untuk training dan testing dengan menggunakan algoritma Naive Naive Bayes Classifier yang diharapkan hasil kegiatan akhir ini email client / user tidak dipenuhi oleh banyaknya email spam dan dapat menerima semua email ham sesuai yang diharapkan.
BAB IV BIAYA DAN JADWAL PENELITIAN 4. 1 Anggaran Biaya 1. Honor Honor
Honor/Jam (Rp)
Ketua Anggota
6,250 5,000
Waktu (jam/m Minggu inggu) 6 48 5 48 SUB TOTAL (Rp)
Honor per Tahun (Rp) 1,800,000 1,200,000 3,000,000
2. Peralatan Penunjang Material Catridge printer Canon MP 258 (Hitam)
Justifikasi Pemakaian Mencetak proposal, laporan,angket, dll
Kuanti tas
Harga Satuan (Rp)
Biaya per Tahun (Rp)
1
150,000
150,000
Catridge printer Canon MP 258 (Warna)
Mencetak proposal, laporan,dll
1
161,000
161,000
Kertas A4 80 gr
Bahan pencetak proposal, laporan,dll
4
40,000
160,000
Jepitan kertas
Menjepit kertas
12
2,000
24,000
Modem
Menangkap Signal Provider
1
300,000
300,000
Pulsa Kartu Modem
Mengakses Internet
12
150,000
1,800,000
Tinta Printer 4 warna 100 ml
Bahan cetak proposal, laporan, dll
8
25,000
200,000
SUB TOTAL (Rp) 4. Perjalanan
2,795,000
Justifikasi Pemakaian
Kuanti tas
Harga Satuan (Rp)
Perjalanan dari rumah ke toko
Untuk mmbeli voucher modem
12
10,000
120,000
Perjalanan dari rumah ke perpustakaan dan toko buku
Untuk mencari referensi yg terkait
12
32,000
384,000
Material
SUB TOTAL (Rp) 5. Biaya Perancangan dan Pembuatan Justifikasi Kuanti Harga Material Pemakaian tas Satuan (Rp) Untuk Biaya perancangan merancang 1 1,800,000 perangkat keras perangkat keras Untuk Biaya perancangan merancang 2 2,000,000 perangkat lunak perangkat lunak SUB TOTAL (Rp) 6. Administrasi Nama Kegiatan Satuan Penyusunan Proposal 4 exp @ Rp 25.250 Penyusunan Laporan Akhir 7. Publikasi Ilmiah dan Seminar Nama Kegiatan Seminar penelitian
6 exp @ Rp 50,000
Biaya per Tahun (Rp)
504,000 Biaya per Tahun (Rp) 1,800,000
4,000,000 5,800,000 Jumlah (Rp) 101,000 300,000
SUB TOTAL (Rp)
401,000
Satuan Satu kali 50 peserta @ Rp. 50.000 SUB TOTAL (Rp)
Jumlah (Rp) 2,500,000
TOTAL ANGGARAN YANG DIPERLUKAN SELAMA 1 TAHUN (Rp)
2.500,000
15,000,000
4. 2 Jadwal Penelitian No 1 2 3 4
5 6 7
Jenis Kegiatan Merancang plug-in anti spam Subscribe account email lewat beberapa milis terkenal Mengobservasi inbox pada email Mengevaluasi plug-in anti spam melalui : - Mengirim email ham - Mengirim email spam - Respon email spam dan email ham langsung Mentraining total data email pada plug-in Menghitung False Positif, False Negatif, Akurasi dan Errornya Mengimplementasikan plug-in anti spam pada laptop berbeda
Bulan 1 2 3 4 5 6 7 8 9 10
11
12
DAFTAR PUSTAKA
Graham, Paul. 2002. A Plan for Spam. http://www.paulgraham.com/spam.html. Diakses tanggal 20 Agustus 2011 pukul 3.56 PM Han, Jiawei and M. Kamber. 2011. "Data Mining: Concepts and Techniques". USA: Academic Press. Ian Androutsopoulos, John Koutsias, V. Chandrinos, George Paliouras, and C. Spyropoulos. 2004. An evaluation of naive Naive Bayes Classifier antispam filtering. In Workshop on Machine Learning in the New Information Age. Lambert, Anselm, Analysis of Spam, A dissertation in Computer Science at University of Dublin, 2003. (Defiyanti, Sofi., D. L. Crispina Pardede. “Perbandingan Kinerja Algoritma ID3 dan C4.5 Dalam Klasifikasi Spam Mail”. Universitas Gunadarma). Diakses tanggal 26 Januari 2012 pukul 8.05 PM O’Brien,
. Cormac & Vogel, Carl “Comparing SpamAssassin with CBDF
email filtering” Rachli, Muhamad, 2007.
Email Filtering menggunakan Naïve Naive Bayes
Classifier. Bandung : Tugas Akhir Jurusan Teknik Elektro Institut Teknologi Bandung Schwartz, Alan. 2004. eBook “SpamAssassin” [Online]United States of America : O'Reilly Media, Inc.Diakses tanggal 19 juli 2011 pukul 9:36 AM http://kompas.health-tips-diseases.com/2009/06/definisiplugin.htmlhttp://kompas.health-tips-diseases.com/2009/06/definisiplugin.html Diakses tanggal 29 Maret 2015 pukul 12:30 AM http://tutorialisme.students.uii.ac.id/cara-setting-popimap-dan-smtp-gmail-padathunderbird-30/ Diakses
tanggal 29 Maret 2015 pukul 12:30 AM
www.ilmukomputer.com Diakses tanggal 29 Maret 2015 pukul 12:30 AM
LAMPIRAN 1 JUSTIFIKASI ANGGARAN PENELITIAN 1. Honor
Honor
Waktu Honor/Jam (jam/minggu) Minggu (Rp) 4
Honor per Tahun (Rp)
Ketua
6,250
6
48
1,800,000
Anggota
5,000
5
48
1,200,000
SUB TOTAL (Rp)
3,000,000
2. Peralatan Penunjang
Justifikasi Pemakaian
Material
Menangkap Signal Provider Mengakses Internet
Modem Pulsa Kartu Modem
Kuantitas
Harga Satuan (Rp)
Harga Peralatan Penunjang per Tahun (Rp)
1
300,000,-
300,000
12 bulan
150.000,-
1,800,000
SUB TOTAL (Rp)
2,100,000
3. Bahan Habis Pakai
Material Catridge printer Canon MP 258 (Hitam) Catridge printer Canon MP 258 (Warna) Kertas A4 80 gr
Harga Satuan (Rp)
Biaya per Tahun (Rp)
Justifikasi Pemakaian
Kuantitas
Mencetak proposal, laporan,angket, dll
1
150,000
150,000
Mencetak proposal, laporan,dll
1
161,000
161,000
Bahan pencetak proposal, laporan,dll
4
40,000
160,000
Justifikasi Pemakaian
Material
Kuantitas
Harga Satuan (Rp)
Biaya per Tahun (Rp)
Jepitan kertas
Menjepit kertas
12
2,000
24,000
Tinta Printer 4 warna 100 ml
Bahan cetak proposal, laporan, dll
8
25,000
200,000
SUB TOTAL (Rp)
684,000
4. Perjalanan
Kuantitas
Harga Satuan (Rp)
Biaya per Tahun (Rp)
Untuk membayar pasca bayar kartu modem
12
10,000
120,000
Mencari referensi sesuai kasus yang terkait
12
32,000
384,000
Justifikasi Pemakaian
Material Perjalanan dari rumah (kampus) ke toko Perjalanan dari rumah ke perpustakaan/to ko buku
SUB TOTAL (Rp)
504,000
5. Biaya Perancangan dan Pembuatan
Material
Justifikasi Pemakaian
Kuantitas
Harga Satuan (Rp)
1
1,800,000
1,800,000
2
2,000,000
4,000,000
Biaya perancangan Untuk merancang perangkat keras perangkat keras Biaya perancangan Untuk merancang perangkat lunak perangkat lunak SUB TOTAL (Rp)
Biaya per Tahun (Rp)
5,800,000
6. Administrasi Nama Kegiatan
Satuan
Jumlah (Rp)
Penyusunan Proposal
4 exp @ Rp 25.250
101,000
Penyusunan Laporan
5 exp @ Rp 50,000
250,000
Akhir SUB TOTAL (Rp)
351,000
7. Publikasi Ilmiah dan Seminar Nama Kegiatan Seminar penelitian
Satuan Satu kali 50 peserta @ Rp. 50.000
Jumlah (Rp) 2,500,000
SUB TOTAL (Rp)
2.500,000
TOTAL ANGGARAN YANG DIPERLUKAN SELAMA 1 TAHUN (Rp)
15,000,000
LAMPIRAN 2 SUSUNAN ORGANISASI TIM PENELITI DAN PEMBAGIAN TUGAS
NO
Nama
NIDN
Bidang Ilmu
1.
Nurlina, S. Kom., M.T
0929027601
Sistem Informasi
2.
Nurlindasari Thamsir
0920038502
Manajemen Informatika
Alokasi Waktu Uraian Tugas (jam/ minggu) 6 Jam/ Ketua Bertugas: Minggu 1. Sebagai koordinator selama pelaksanaan penelitian berlangsung. 2. Menganalisis penanganan email. 3. Merancang konsep sistem. 4. Merancang dan membuat perangkat keras sistem. 5. Merancang dan membuat perangkat lunak sistem. 6. Mengevaluasi pengujian sistem. 7. Mengimplementasikan sistem. 5 Jam/ Minggu
Anggota Bertugas : 1. Mengumpulkan alat dan bahan untuk penelitian. 2. Mengumpulkan literatur dan data. 3. Membuat perangkat keras sistem. 4. Membuat perangkat lunak sistem. 5. Melakukan pengujian sistem dengan menggunakan metode black box. 6. Melakukan pengujian sistem dengan menggunakan metode statistik. 7. Mengimplementasikan sistem
LAMPIRAN 3 BIODATA KETUA PENELITI A. Identitas Diri 1.
Nama Lengkap (dengan gelar)
Nurlina, S.Kom., M.T
2.
Jenis Kelamin
P
3.
Jabatan Fungsional
Asisten Ahli
4.
NIP/NIK/ Identitas Lainya
- / - / 737111 690276 0005
5.
NIDN
0929027601
6.
Tempat dan Tanggal Lahir
Ujung Pandang / 29 Februari 1976
7.
Email
[email protected]
8.
Nomor Telepon/HP
- / 085242092888
9.
Alamat Kantor
Jl. Perintis Kemerdekaan Km.9
10. Nomor Telepon/Faks
0411 (587194) / 0411 (588284)
11. Lulusan yang telah diselesaikan
S-1=1000 Orang
12. Mata Kuliah yang Diampu
1. Interaksi Manusia dan Komputer 2. Pemodelan dan Simulasi Sistem 3. Praktikum
Pemodelan
dan
Simulasi Sistem 4. Praktikum
Perangkat
Lunak
Aplikasi
B. Riwayat Pendidikan S-1 Nama Perguruan STMIK
S-2 Dipanegara Univ.
Hasanuddin
Tinggi
Makassar
Makassar
Bidang Ilmu
Manajemen Informatika
Teknik Informatika
Tahun
Masuk- 1995 – 2000
2008 – 2012
Lulus Perancangan
Sistem Studi
Banding
Spam-
Judul
Informasi Pelayanan Wesel Assassin
Dengan
dan
Skripsi/Thesis/
Pos Dalam Negeri Pada Tanpa Anti Spam di Sisi
Disertasi
POSINDO Kantor Cabang Client Makassar DR. Ir. Rhiza S. Sadjaad,
Nama Pembimbing/ Promotor
Drs. I Wayan Simpen, M.SI
MSEE dan DR. Armin
dan Drs. Badu Ahmad, MM Lawi, MEng
C. Pengalaman Penelitian Dalam 5 Tahun Terakhir Pendahuluan No.
Tahun
Judul Penelitian Sumber* Perancangan
1
2009
Aplikasi Yayasan
Pemasaran Rumah Pada STMIK PT. Pajaiang Indah Mks Perancangan Informasi
2
2011
3.000.000,00
Dipanegara
Sistem Yayasan Akademik STMIK
Berbasis Web Pada SMA Dipanegara Negeri
Jml (Juta Rp)
4
5.000.000,00
Bantimurung
Kab. Maros Perancangan 3
2012
Informasi Berbasis
Sistem Yayasan Akademik STMIK
Client
Pada LP3I Cab. Mks
Server Dipanegara
6.000.000,00
D. Pengalaman Pengabdian Kepada Masyarakat Dalam 5 Tahun Terakhir No
Tahun
Masyarakat Pelatihan
1
2009
Pendanaan
Judul Pengabdian Kepada
Sumber*
Jml (Juta Rp)
Multimedia Yayasan
Tingkat Dasar Pada CV. Dipanegara Media Ilmu Makassar
3.000.000,00
Makassar
Pelatihan Software Dasar Yayasan Micr. 2
2010
Excel
Penginputan dan
Pada Dipanegara Pemasukan Makassar
Pengeluaran
1.000.000,00
Dana
Masjid Djabal Thariq Pelatihan Internet I Pada Yayasan 3
2011
CV. Media Ilmu Makassar
Dipanegara
5.000.000,00
Makassar Pelatihan 4
2011
Komputer Gunung
Jaringan Yayasan di
Kelurahan Dipanegara
Sari
Kec. Makassar
3.000.000,00
Rappocini Mks Pelatihan Multimedia Pada Yayasan 5
2012
Kantor CV. Fika Karya Dipanegara Mandiri Mks
3.000.000,00
Makassar
E. Publikasi Artikel Ilmiah Dalam Jurnal Dalam 5 Tahun Terakhir No
1
Judul Artikel Ilmiah
Volume/ Nomor/Tahun
Nama Jurnal
Perancangan Sistem Informasi
Volume 08 -
Jurnal IT
Kesiswaan Pada SMU Negeri 1
September 2012
STMIK
Marioriawa Kab. Soppeng
ISSN : 2087-6505.
Handayani
Hal.: 69-80 Pengawasan
Aktivitas
dan
Volume 09,
Pembatasan Hak Akses User 2
Pada Sistem Operasi Windows di Bagian
Divisi Keuangan
Jurnal IT
Desember 2012 ISSN : 2087-6505.
PT.
Hal.: 96- 107
(Persero) Angkasa Pura I Mks
STMIK Handayani
F. Pemakalah Seminar Ilmiah (Oral Presentation) Dalam 5 Tahun Terakhir No
Nama Pertemuan
Waktu dan
Judul Artikel Ilmiah
Ilmiah/Seminar
Perancangan
Sistem
Tempat
Informasi
Akademik Berbasis Client Server
1. Prosiding
Pada
Lembaga
Pengembangan
Pendidikan Profesi
Dan
Indonesia
(LP3I) Cabang Makassar Perancangan
Sistem
Komputerisasi
Tes Masuk Calon Mahasiswa Baru 2.
Prosiding
Pada
Sekolah
Tinggi
Manajemen
Informatika dan Komputer (STMIK) Dipanegara Makassar
G. Karya Buku dalam 5 Tahun Terakhir No
Judul Buku
Tahun
Jumlah Halaman
Penerbit
H. Perolehan HKI Dalam 5 – 10 Tahun Terakhir No
Judul/Tema HKI
Tahun
Jenis
Nomor P/ID
I. Pengalaman Merumuskan Kebijakan Lainnya Dalam 5 Tahun Terakhir
No.
Judul/Tema/Jenis Rekayasa Sosial Lainnya yang Telah Diterapkan
Publik/Rekayasa
Tahun
Tempat Penerapan
Sosial
Respons Masyarakat
J. Penghargaan Yang Pernah Diraih Dalam 10 Tahun Terakhir (dari pemerintah, asosiasi atau institusi lainnya) No.
Jenis Penghargaan
Institusi Pemberi Penghargaan
Tahun
Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu persyaratan dalam pengajuan Penelitian Dosen Pemula.
Makassar, 01 Mei 2015 Pengusul,
(Nurlina, S. Kom., M.T)
LAMPIRAN 3 BIODATA ANGGOTA PENELITI 3.6 Identitas Diri
1 2 3 4 5 6 7 8
Nama Lengkap Jenis Kelamin Jabatan Fungsional NIK NIDN Tempat Tanggal Lahir e-mail Alamat Rumah
9 10
Nomor Telepon Hp Alamat Kantor
11 12
Nomor Telepon Lulusan yang telah dihasilkan Mata kuliah yang diampu Pemrograman Terstruktur Analisis dan Perancangan Sistem Manajemen Proyek Sistem Informasi
13
Nurlindasari Tamsir, S.Kom.,MT Perempuan Asisten Ahli 05211153 0920038502 Makassar, 20 maret 1985
[email protected] Jl. Komp PU Malllengkeri BTN Tabaria Blok N.9 Kelurahan : Mangasa Kecamatan : Tamalate Kota : Makassar Provinsi : Sulawesi Selatan Kode Pos : 90221 085255013331 STMIK Dipanegara Makassar Jl. Perintis Kemerdekaan Km. 9 Tamalanrea 0411-587194 S1 : 10.000 orang, S2 : -, S3 : -
A. Riwayat Pendidikan Nama Perguruan Tinggi Bidang Ilmu Tahun Masuk – Tahun Lulus Judul Skripsi/Thesis
S1 STMIK Dipanegara Makassar Sistem Informasi 2002 – 2007 Perancangan Sistem Informasi Retribusi Parkir Pada PD Parkir Makassar Raya Kota Makassar
S2 Universitas Hasanuddin Makassar Teknik Elektro Konsentrasi Teknik Informatika 2008 – 2010 Sistem Pengambilan Keputusan dalam Menentukan Jurusan di SMA Negeri Makassar Menggunakan Algoritma Naïve Bayesian
Nama Indra Samsie, M.Kom Pembimbing/Promotor Marsellus O.Kadang,
Prof. Dr. Ir. H.Muh. Arief, Dipl.Ing Dr. Armin Lawi, M. Eng
S.Kom
3.7 Pengalaman Penelitian Dalam 5 Tahun Terakhir No.
Tahun
Pendanaan
Judul Penelitian
Sumber *
Jumlah (Juta Rp)
3.8 Pengalaman Pengabdian Kepada Masyarakat Dalam 5 Tahun Terakhir No.
Tahun
Pendanaan Sumber * Jumlah (Juta Rp)
Judul Penelitian
3.9 Publikasi Artikel Ilmiah Dalam Jurnal Dalam 5 Tahun Terakhir No.
Volume/Nomor/ Tahun
Judul Artikel Ilmiah
Nama Jurnal
3.10 Pemakalah Seminar Ilmiah (Oral Presentation) Dalam 5 Tahun Terakhir No.
3.11 No.
3.12 No.
Nama Pertemuan Ilmiah / Seminar
Judul Artikel Ilmiah
Waktu dan Tempat
Karya Buku dalam 5 Tahun Terakhir Judul Buku
Tahun
Jumlah Halaman
Penerbit
Perolehan HKI Dalam 5 – 10 Tahun Terakhir Judul/Tema HKI
Tahun
Jenis
Nomor P/ID
3.13 Pengalaman Merumuskan Kebijakan Publik/Rekayasa Sosial Lainnya Dalam 5 Tahun Terakhir No.
Judul/Tema/Jenis Rekayasa Sosial
Tahun
Tempat
Respons
Lainnya yang Telah Diterapkan
Penerapan
Masyarakat
3.14 Penghargaan Yang Pernah Diraih Dalam 10 Tahun Terakhir (dari pemerintah, asosiasi atau institusi lainnya) No.
Jenis Penghargaan
Institusi Pemberi Penghargaan
Tahun
Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar dan dapat dipertanggungjawabkan secara hukum. Apabila di kemudian hari ternyata dijumpai ketidaksesuaian dengan kenyataan, saya sanggup menerima risikonya Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi salah satu persyaratan dalam pengajuan Penelitian Dosen Pemula.
Makassar, 01 Mei 2015 Pengusul,
(Nurlindasari Thamsir, S. Kom., M.T)