Chris Pytka

TEACHING RD2 2012

Oceny z przedmiotu zostały zamieszczone na stronie Bogumiła.

Z powodu awarii zasilania zaliczenie ćwiczeń dla grupy drugiej zostało przesunięte na 31.05 na godz. 18.50. W celu zmniejszenia prawdopodobieństwa powtórki przygody z ostatniego czwartku, osoby korzystające z własnych laptopów proszone są o korzystanie z baterii.

Wyniki dzisiejszego (22.05) egzaminu zostaną zamieszczone na stronie Bogumiła.

Laboratorium XI (Algorytmy uczenia bez nadzoru)

  • kod do zajęć [R]

Wymagania odnośnie do raportu

Do 17.05.2012 wyślijcie raporty sporządzone indywidualnie albo w dwuosobowych grupach. Raporty o nazwie pliku NazwiskoImieIndeks.pdf (lub odpowiednio dla prac grupowych NazwiskoImieIndeksNazwiskoImieIndeks.pdf) wyślijcie proszę na adres ***@ci.edu.pl. Każdy dzień zwłoki wiąże się z karą w wysokości 4 punktów. Raport końcowy powinien demonstrować zastosowanie i porównanie dwóch poznanych metod do prognozowania wybranego zjawiska.

Raport powinień zawierać:
  • krótki opis i prezentację danych;
  • opcjonalną obróbkę danych (dyskretyzacja, standaryzacja, imputację itp.);
  • oszacowanie konkurencyjnych modeli na zbiorze treningowym;
  • przeprowadzenie i przedstawienie procesu wyboru/optymalizacji modelu na zbiorze walidacyjnym;
  • ocenę wybranego modelu na zbiorze testowym;
  • wnioski;
  • dobór wykorzystanych zbiorów danych jest dowolny;
  • maksymalna liczba stron raportu to 20 stron (każda dodatkowa strona oznacza jeden ujemny punkt).

Laboratorium IX (Klasyczne modele uczenia maszynowego: sieci neuronowe)

  • kod do zajęć [R]
  • dane o cemencie [csv]
  • dane o winie [csv]

Laboratorium VIII (Klasyczne modele uczenia maszynowego: drzewa decyzyjne)

  • kod do zajęć [R]
  • dane do zajęć [txt]

 

Laboratorium VI (Metody wyboru postaci modelu prognostycznego)

  • kod do zajęć [R]
  • dane do zajęć [txt]

 

Laboratorium V (Proces wytwórczy modelu predykcyjnego)

  • dane do case'a [zip]


Nazwa drużyny Zysk Punkty
Wizard   3740350 -
WINNERS2012 3010730 5
Drużyna RR 3006230 4
untitled 3005450 4
Mniejnizlosowy 2904130 2
Wysyłka do wszystkich 2645250 -
Wiosna 1879900 1
Brak wysyłki 718600 -
Gumisie 585030 1

 

Laboratorium IV (Zaawansowane algorytmy budowy stabilnych modeli predykcyjnych)

  • kod do zajęć [R]

Laboratorium III (Metody oceny jakości modeli klasyfikacyjnych)

  • kod do zajęć [R]
  • R cheat sheet [pdf]

Laboratorium II (Podstawy modelowania predykcyjnego)

  • kod do zajęć [R]

Laboratorium I (Wprowadzenie do uczenia statystycznego, wprowadzenie do systemu R)

  • kod do zajęć [R]
  • Hal Varian: "Dream Job of the next decade" [youtube]
  • "R You Ready?" [html]
  • dane do zajęć [csv]
  • wykres kolorów w R [pdf]
  • wymagane pakiety (w toku semestru): car, cluster, DAAG, datasets, e1017, Ecdat, glmnet, graphics, lars, lasso2, leaps, locfit, MASS, maxLik, mgcv, neuralNet, nnet, nortest, party, randomForest, RColorBrewer, reshape, ROCR, RODBC, rpart, RWeka, tseries, UsingR, Weka, XLConnect, quantreg, tcltk.

Zasady zaliczenia przedmiotu

  • zasady zaliczenia [zip]