Arşiv | Data Mining RSS feed for this section

Process Mining ( Süreç Madenciliği )

16 Ara

Süreç madenciliği, Hesaba Dayalı Zeka ve Veri Madenciliği arasında yer alan nispeten genç bir araştırma disiplini diğer taraftan süreç modelleme ve analiz etme işidir.
Süreç Madenciliği fikri, günümüzdeki uygun (bilgi ) sistemlerle gerekli bilgiyi olay kayıtlarından ayıklayarak, gerçek süreci(Örn: Gerçekte Varolan Süreçler) geliştirmeyi ve izlemeyi hedeflemektedir.

Process Mining’in detaylı anlatıldığı sunum dökümanı için emrealic@live.com adresine mail gönderiniz.

Reklam

Matlab ile Karar Ağacı Uygulaması

24 Kas


Uygulama Kodları:
load carsmall Verileri yükleniyor ,matlab üzerinde bulunan bir dataset (ver kümesi)
**Tahmin parametreleri ve hedef sınıfı yapılandırılıyor
vars = {‘MPG’ ‘Cylinders’ ‘Horsepower’ ‘Model_Year’}; Düğümler için değerler tanımlanıyor
x = [MPG Cylinders Horsepower Model_Year]; Düğüm ifadeleri giriliyor
y = strcat(Origin,{}); Origin ile {} birleştiriliyor.
**Karar Ağacı sınıflandırma çalışması yapılıyor
t = classregtree(x, y, ‘method’,’classification’, ‘names’,vars, … ‘categorical’, [2 4], prune’,’off’); classregtree Matlab ağaç çizim fonksiyonu ile ağaç çiziliyor, budama yapılmadan
view(t) Ağaç Görüntüleniyor

**Test ediliyor
yPredicted = eval(t, x); Tahmin değerleri üretiliyor
cm = confusionmat(y,yPredicted); Matrix’e mevcut değerler alınıyor
N = sum(cm(:));  Matris Sütunları toplamı alınıyor
err = ( N-sum(diag(cm)) ) / N; Test Hatası çapraz matris ile alınıyor
**Budanan ağaçta overfitting önleniyor
tt = prune(t, ‘level’,2);  ağaç 2.seviyede budanıyor
view(tt) Budanmış ağaç görüntüleniyor

**görünmeyen yeni olay tahmin ediliyor
inst = [33 4 78 NaN]; Tahmin için yeni değerler giriliyor
prediction = eval(tt, inst) Ağacın vereceği sonuç tahmin olarak alınıyor

Optimizasyona Dayalı Sınıflandırma Modelleri

26 May

Veri Madenciliğinde kullanılan Optimizasyona dayalı sınıflandırma modelleri incelenmiştir.

Emre ALIÇ- 105112012

25.05.2011


İçindekiler
Destek Vektör Makinesi 3
Doğrusal olarak ayrılabilme durumu 3
Primal Çözüm 6
Lagrange Çarpanları 6
Karush-Kuhn-Tucker Koşulları 7
Dual Çözüm 8
Verilerin Doğrusal Olarak Ayrılamama Durumu 12
Doğrusal Olmayan Sınıflandırıcılar 16
Doğrusal Olmayan Özellik Uzayı 16
Çekirdek Fonksiyonlar 17
Destek Vektör Makinası ve Çekirdek Fonksiyonlar 18
Kaynakça 22

Destek Vektör Makinesi
Destek Vektör Makinesi (Support Vector Machine = SVM) veri madenciliğinde sınıflama problemlerinde kullanılan bir yöntemdir.Bu yöntem, sınıflandırmayı bir doğrusal yada doğrusal olmayan bir fonksiyon yardımıyla yerine getirir.Destek vektör makinesi yöntemi,veriyi birbirinden ayırmak için en uygun fonksiyonun tahmin edilmesi esasına dayanır.Daha çok makine öğrenmesi yöntemleri arasında yer alan bu yöntem günümüzde veri madenciliği alanında da tercih edilmeye başlanmıştır.
Doğrusal olarak ayrılabilme durumu
D veri kümesinin (X1,y1),(X2,Y2)…(Xn,Yn) biçiminde olduğunu varsayalım. Burada n veri kümesinin eleman sayısıdır ve y , {+1,-1} kümesinin elemanı olarak kabul edilir.[1]…
.
.
.

Optimizasyona Dayalı Sınıflandırma Modelleri Dökümanı Tıkla !

Süreç Madenciliği

28 Mar

Süreç madenciliğinin temel fikri günlük olarak kayıt edilen olayların arasından ayrıntıları yakalamaktır.Yakın zamana kadar süreç madenciliği alt süreçlerin analizini yapmak için kullanılırdı. Kapsamlı olarak süreç madenciliğinin görevi kompleks, örgütlü süreç yapılarının yeni teknikler kullanarak analiz işlemini geliştirmektir.

Her bilgi teknolojisi alanında canlı bir araştırma alanı olan süreç madeciliği B2B,ERP,CRM gibi alanlarda sıklıkla karşımıza çıkmaktadır.

Bir çok kurum kendi faaliyet kapsamlarında İş Süreçleri Analizi(BPA) ve İş aktivitesi Monotoring (BAM) çalışmaları yapmaktadır. Bu çalışmalar genellikle süreçlerin döngü süresi,sıklığı ve temel performans ölçütlerini incelemektedir. Süreç madenciliğinin amacı ise bu çalışmalardan öteye olayların nedenselliğini araştırıp daha ileri bilgi ve kavramlara ulaşmaktır.

Süreç Madenciliği için süreçlerin de uygun bir şekilde yapılandırılması gerekebilmektedir.Bu nedenle işletmelerde de iş süreçlerinin tasarımı,geliştirilmesi ve verimli yürütülmesi için yoğun ve sorunlu bir çalışma yapmak gerekmektedir.

Süreç Madenciliği aşamasında önce kurumların kendi içlerinde süreçleri yeniden analiz edilmesi yeniden modellenmesi ve optimize edilmesi gerekmektedir.Bu İşlemlerden sonra çeşitli Algoritmalarla süreçlerin detaylarından süreçlerin ayrıntılı nedensel kavramlarına ulaşılabilinir.

Örnek:Bir CRM sisteminde girilecek talebin değerlendirilmesi ve cevabın verilmesi sürecinde süreç aşamalarıdan nedensel ayrıntılı bilgiler elde edilerek kişilere ne koşullarda ne şekilde bilgi verildiği raporlanabilmektedir.

Emre ALIÇ