Menghitung data mining menggunakan Wekka
Menghitung data mining menggunakan Wekka...
example:
I. 5 Vold Cross-Validation
Nama dataset : age (Chronic_Kidney_Disease)
Jumlah data perkelas : 400
Jumlah Attribute = 25
Confusion Matrix
a b <-- classified as
249 1 | a = ckd
2 148 | b = notckd
a. Accuracy
A = (TP+TN)/(TP+TN+FP+FN)
A = 249+148/(249+148+2+1) = 0,9925
b. Precision
P = TP/TP+FP =
P = 249/249+2 = 0,992
c. Recall
R = TP/TP+FN
R = 249/(249+1) = 0,996
d. Specificity
FP Rate = TN/(TN+FP)
FP Rate = 148/(148+2) = 0,986
e. Sensitivity
TP Rate = TP/(TP+FN)
TP Rate = 249/(249+1) = 0,966
II. 10 Fold Cross-Validation
Nama dataset : age (Chronic_Kidney_Disease)
Jumlah data perkelas : 400
Jumlah attribut : 25
Confusion Matrix
a b <-- classified as
249 1 | a = ckd
147 | b = notckd
a. Accuracy
A = (TP+TN)/(TP+TN+FP+FN)
A = 249+147/(249+147+3+1) = 0,99
b. Precision
P = TP/TP/FP
P = 249/(249+3) = 0,988
c. Recall
R = TP/TP+FN
R = 249/(249+1) = 0,996
f. Specificity
FP Rate = TN/(TN+FP)
FP Rate = 147/(147+3) = 0,98
d. Sensitivity
TP Rate = TP/(TP+FN)
TP Rate = 249/(249+1) = 0,996
III. 60 Percentage split
Nama dataset : age (Chronic_Kidney_Disease)
Jumlah data perkelas : 400
Jumlah attribut : 25
Confusion Matrix
a b <-- classified as
103 0 | a = ckd
0 57 | b = notckd
a. Accuracy
A = (TP+TN)/(TP+TN+FP+FN)
A = 103+57/(103+57+0+0) = 1
b. Precision
P = TP/TP/FP
P = 103/(103+0) = 1
c. Recall
R = TP/TP+FN
R = 103/(103+0) = 1
g. Specificity
TN Rate = TN/(TN+FP)
TN Rate = 57/(57+0) = 1
d. Sensitivity
TP Rate = TP/(TP+FN)
TP Rate = 103/(103+0) = 1
IV. 70 Percentage split
Nama dataset : age (Chronic_Kidney_Disease)
Jmlh data perkelas : 400
Jumlah attribut : 25
4. Confusion Matrix
a b <-- classified as
76 0 | a = ckd
0 44 | b = notckd
a. Accuracy
A = (TP+TN)/(TP+TN+FP+FN)
A = 76+44/(76+44+0+0) = 1
b. Precision
P = TP/TP/FP
P = 76/(76+0) = 1
c. Recall
R = TP/TP+FN
R = 76/(76+0) = 1
h. Specificity
TF Rate = TN/(TN+FP)
TF Rate = 44/(44+0) = 1
d. Sensitivity
TP Rate = TP/(TP+FN)
TP Rate = 76/(76+0) = 1
V. Kesimpulan
Berdasarkan data diatas saya berkesimpulan bahwa perhitungan accuracy, precision, recall, sensitivity, dan sepcificity dari confusion matrix 60-40 %,70-30 %,5 Vold Cross-Validation, 10 Vold Cross-Validation, tidak kurang dari 0,9 atau mendekati sempurna yaitu 1.
• Sensitivity
Sensitivity merupakan teknik menganalisa resiko dengan tujuan untuk memperoleh informasi dengan hasil yang optimal dengan merubah variable yang paling sensitive dalam kondisi yang tidak pasti.
Atau bisa juga analisis yang menggunakan simulasi dengan menunjukan perubahan 1 variable yang paling sensitive maka kinerja akan berubah sekian persen pada bagian lainya. Bisa juga diartikan sensitivity adalah ukuran tingkatan derajat classifier dapat mengenal positive sample (“yes”) berdasarkan true positives yang dapat diprediksi secara benar jika yang diberikan adalah semple posotives.
• Specificity
Adalah ukuran tingkatan derajat classifier dapat mengenal negative sample (“no”) berdasarkan tru negatives yang dapat diprediksi secara benar jika yang diberikan adalah semple negatives.
• Overfitting
algoritma data mining untuk menemukan pola dalam training set yang tidak hadir dalam data umum. Bisa juga situasi dimana banyak error yang acak
Adalah ukuran tingkatan derajat classifier dapat mengenal negative sample (“no”) berdasarkan tru negatives yang dapat diprediksi secara benar jika yang diberikan adalah semple negatives.
• Overfitting
algoritma data mining untuk menemukan pola dalam training set yang tidak hadir dalam data umum. Bisa juga situasi dimana banyak error yang acak
Post a Comment