Avtor: Timotej Vesel
Repozitorij z gradivi pri predmetu APPR v študijskem letu 2017/18
V projektu bom analiziral statistiko podajalcev (quarterback) v ligi NFL, ki so bili na naboru izbrani v zadnjih 30 letih. Analiziral bo opravljena na podlagi naslednjih podatkov: uspešnost podaj, število pridobljenih jardov s podajami, število podaj za zadetek (touchdown), število izborov v prvo ekipo lige in število izborov na Pro Bowl.
Zanima me, kakšna je povezava med izborom na draftu in uspešnostjo kariere. Analizirati želim tudi, katere ekipe so imele največ izborov v prvem krogu in pa, katere ekipe so izbrale največ podajalcev, ki so jim uspele vrhunske kariere.
Podatke bom črpal iz naslednji spletnih strani:
- http://www.nfl.com/draft/history/fulldraft?type=position
- https://www.pro-football-reference.com/ (CSV)
TABELA 1:
- Ime in priimek igralca
- Leto izbora
- Runda in pick
- Število odigranih tekem
- First team all- pro
- Število izborov na Pro Bowl
- Število odigranih tekem
- Uspešnost podaj
- Podaje za Touchdown
- Jardi pridobljeni s podajami
- Jardi na tekmo
TABELA 2:
- Igralec
- College
- Ekipa, ki ga je izbrala
Glavni program in poročilo se nahajata v datoteki projekt.Rmd
. Ko ga prevedemo,
se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:
- obdelava, uvoz in čiščenje podatkov:
uvoz/uvoz.r
- analiza in vizualizacija podatkov:
vizualizacija/vizualizacija.r
- napredna analiza podatkov:
analiza/analiza.r
Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/
. Podatkovni
viri so v mapi podatki/
. Zemljevidi v obliki SHP, ki jih program pobere, se
shranijo v mapo ../zemljevidi/
(torej izven mape projekta).
Za zagon tega vzorca je potrebno namestiti sledeče pakete za R:
knitr
- za izdelovanje poročilarmarkdown
- za prevajanje poročila v obliki RMarkdownshiny
- za prikaz spletnega vmesnikaDT
- za prikaz interaktivne tabelemaptools
- za uvoz zemljevidovsp
- za delo z zemljevididigest
- za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)readr
- za branje podatkovrvest
- za pobiranje spletnih stranireshape2
- za preoblikovanje podatkov v obliko tidy datadplyr
- za delo s podatkigsubfn
- za delo z nizi (čiščenje podatkov)ggplot2
- za izrisovanje grafovextrafont
- za pravilen prikaz šumnikov (neobvezno)