DERS ADI

: Metin ve Web Madenciliğine Giriş

Ders Bilgileri

Ders Kodu Ders Adı Ders Türü D U L AKTS
BİL 3102 Metin ve Web Madenciliğine Giriş SEÇMELİ 3 0 0 5

Dersi Veren Birim

Bilgisayar Bilimleri

Dersin Düzeyi

Lisans

Ders Koordinatörü

DOÇ.DR. METE EMİNAĞAOĞLU

Dersi Alan Birimler

Bilgisayar Bilimleri

Dersin Amacı

Bu derste Metin ve Web Madenciliğine Giriş, sorgular ve belgeler, belge önişleme, kelime dağılımları, düzeltme değerlendirmesi,otomatik indeksleme/etiketleme, karakter eşleştirme, sorgu genişletme, rassal graf modelleri, sosyal network analizi, grafiğe dayalıyöntemler, yarı-denetimli metin düzeltmesi, spamming ve anti-spamming yöntemler, metin özetleme, doğal dil işleme konularıanlatılacaktır.

Dersin Öğrenme Kazanımları

1   Metin madenciliği teknikleri konusunda bilgi sahibi olma
2   Web madenciliği teknikleri konusunda bilgi sahibi olma
3   Metin tabanlı dokümanlar üzerinde analiz yapabilme
4   Dıoğal Dil İşlemedeki çeşitli yöntem ve teknikler hakkında bilgi sahibi olma
5   Web araması ve indeksleme hakkında bilgi sahibi olma

Dersin Öğretim Türü

Örgün Öğretim

Dersin Önkoşulu/Önkoşulları

Yok

Ders İçin Önerilen Diğer Hususlar

Yok

Ders İçeriği

Hafta Konular Açıklama
1 Metin madenciliğine giriş, boolean çekme
2 Sözlükler
3 İndeksleri oluşturma, sıkıştırma
4 Skorlama, terim ağırlıklandırma
5 Skor hesaplama
6 Bilgi kazanımı
7 XML bilgi çekme
8 Arasınav
9 Dil modelleri
10 Metin sınıflandırma
11 Vektör uzay sınıflandırması
12 Destek Vektör Makineleri, Dokümanlar üzerinde makine öğrenimi
13 Düz ve hiyerarşik kümeleme
14 Web arama temelleri, web tarama ve indeksler Link analizi

Ders İçin Önerilen Kaynaklar

Ana kaynak:
Christopher D. Manning, Prabhakar Raghavan, Hinrich Schütze, An Introduction to Information Retrieval, Cambridge University Press, 2009.
Yardımcı kaynaklar:
Song, M., Handbook of Research on Text and Web Mining Technologies, Volume I-II, Y-F. B. Wu, 2007.
Jurafksy, D., Martin, J. H.., An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, 3rd ed., Stanford University, 2022.

Öğrenme ve Öğretme Yöntemleri

Ders anlatımı, ödev, problem çözme

Değerlendirme Yöntemleri

SIRA NO KISA KOD UZUN ADI FORMUL
1 VZ Vize
2 OD Ödev
3 FN Final
4 BNS BNS VZ * 0.30 + OD * 0.30 + FN * 0.40
5 BUT Bütünleme Notu
6 BBN Bütünleme Sonu Başarı Notu VZ * 0.30 + OD * 0.30 + BUT * 0.40


*** Bütünleme Sınavı Yapılmayan Birimlerde Bütünleme Kriteri Dikkate Alınmaz.

Değerlendirme Yöntemlerine İliskin Aciklamalar

Yok

Değerlendirme Kriteri

Ödev: % 30
Ara sınav: % 30
Final sınavı: % 40

Dikkat: Final sınavı ve ödev, kodlama temelli proje şeklindedir.

Dersin Öğretim Dili

Türkçe

Derse İlişkin Politika ve Kurallar

Derse zamanında gelinecek. Dönem boyunca derslerin %70'ine devam zorunludur.

Dersin Öğretim Üyesi İletişim Bilgileri

mete.eminagaoglu@deu.edu.tr

Ders Öğretim Üyesi Görüşme Gün ve Saatleri

İlan edilecektir.

Staj Durumu

YOK

İş Yükü Hesaplaması

Etkinlikler Sayısı Süresi (saat) Toplam İş Yükü (saat)
Ders Anlatımı 13 3 39
Haftalık Ders öncesi/sonrası hazırlıklar 12 1 12
Ödev Hazırlama 1 15 15
Final Sınavına Hazırlık 1 30 30
Vize Sınavına Hazırlık 1 15 15
Final Sınavı 1 2 2
Vize Sınavı 1 2 2
TOPLAM İŞ YÜKÜ (saat) 115

Program ve Öğrenme Kazanımları İlişkisi

PK/ÖKPK.1PK.2PK.3PK.4PK.5PK.6PK.7PK.8PK.9PK.10PK.11PK.12PK.13
ÖK.13
ÖK.23
ÖK.33444
ÖK.43444
ÖK.543544