Pereiti prie turinio

Verised

Nariai
  • Pranešimai

    2
  • Užsiregistravo

  • Lankėsi

  • Atsiliepimai

    0%

Reputacijos išklotinė

  1. Patinka
    Verised sureagavo į LukasKuc Sporto analitikas   
    Na, apie tokią bendruomenę neteko girdėti. Galbūt Lietuvoje tuo nelabai kas užsiima (arba nesiskelbia tiesiog). Išvis tokios pozicijos kaip "analitikas" ar "big data analitikas" tik neseniai išpopuliarėjo, anksčiau mažai tokių žmonių reikėjo, o dabar darbo skelbimuose daug tokių ieško.
     
    Tik tiek, kad big data reikalauja didelių kompiuterio resursų, todėl ne kiekvienas gali tuo užsiimti - pagrindinės programos, kuriomis naudojasi Big Data analitikai, reikalauja minimum 16 GB ram (įprastai - 32). Kompiuteriai su tiek ram (arba atskirai ram plokštės) kainuoja pakankamai brangiai, todėl dažną galbūt atbaido mokytis savarankiškai.
     
    Ir big data yra kur kas didesni duomenų skaičiai nei įprastai naudojami sporto analitikoje (daugybę sykių). Kažkas arčiausiai to būtų SportVU sistema, kuri dėl daugybės tiksliai išdėstytų kamerų seka kiekvieną judesį koordinačių pagrindu ir sukuria didelius kiekius informacijos. Visgi ji yra laaabai brangi ir paprastiems mirtingiesiems neprieinama (neskaitant to, ką matome NBA.com tinklalapyje).
     
    Jei kažkas domina, gali paklausti. Jei nori analizuoti populiariausias JAV sporto lygas (NBA, NFL, NHL, etc), galiu duoti nuorodą, per kurią gautum gerą priėjimą su push/pull request'ais pagal pasirinkimą. Tai būna labai patogu.
     
    Gali ir šiaip klausti, kas įdomu - kiek mano žinios siekia, tiek papasakosiu. Iš esmės daugiausiai su krepšiniu esu susidūręs ir tarp visos tos krepšinio analitikos yra tokia jau kiek prigijusi statistikos dalis (ne ta, kuri yra box-score) bei visokie naujadarai, kurių patikimumas praktikoje dar nėra įrodytas.
     
    Analizuoti NBA statistiką ir parodyti kažką naujo būtų sudėtinga, nes prie to dirba gausybė profesionalų, baigusių atitinkamus mokslus geriausiuose universitetuose. Kitas sprendimas - bandyti mokytis ir tobulėti su kitomis sporto šakomis ar lygomis.
     
    Štai http://overbasket.com/ užsiima Eurolyga/Europos taure. Buvo ir daugiau panašių projektų, bet juos visus galima pranokti, nes dar daug kas neišpildyta.
     
    Pats anksčiau turėjau idėją padaryti analogą LKL'ui, tačiau apie javascript'ą tuo metu žinojau mažokai ir pasirodė, kad duomenų nuskaityti nepavyks (? nebent kažkaip sudėtingai ir su sunkumais). Vien žiūrint į tinklalapio source code, jokios statistikos nebuvo, viskas vyko per baskethotel. Tiesa, dabar jau source code box-score statistika yra matoma, tad tikriausiai pavyktų kažką padaryti.
     
    Didelė dalis analitikos - esamų duomenų perpanaudojimas ir interpretacija. Daug svarbių kategorijų kaip yra paremtos būtent box-score pagrindu.
     
    Jei padarytum kažkokią analizę, galiu garantuoti, kad bent kažkuris iš to sporto tinklalapių ja pasidalintų pas save - tai ir galėtų būti puiki pradžia.
     
    Na, o jei nuspręstum bandyti kažką su populiariausiomis lygomis, tuomet siūliau pranaršyti GitHub - yra žiauriai daug visko, kas sutaupytų laiko ir padėtų mokytis.
     
    EDIT: ką pamiršau paminėti - labai rekomenduoju skaityti Sloan Conference medžiagą: http://www.sloansportsconference.com/
  2. Patinka
    Verised sureagavo į LukasKuc Sporto analitikas   
    Na, aš pats tuo domiuosi ir mėgėjiškai bandau užsiimti, tai galiu pasakyti, kad pagrindas visa ko yra python'as. Žinoma, R irgi naudinga, bet R galimybės kiek kitokios yra ir pats kodas visai kitoks rašymas (man po pažinčių su kitomis kalbomis buvo neįprasta).
     
    Šiaip GitHubas pilnas NBA statistikos API dirbti su pythonu, viskas paruošta, tik kibk į darbus. Jei nori analizuoti su R, tai žinau, kur galima gauti didžiausių JAV sporto lygų statistiką csv formatu.
     
    Jei nori rimtai tuo užsiimti, tai pasipraktikuok, kažką sužinok ir tada bandyk apply'inti į Fansided.com, gal priimtų prisidėti prie Nylon Calculus (vėlgi, nežinau, kokia sporto šaka domiesi, nes sporto analitikoje svarbu suprasti savo analizuojamą sporto šaką).
     
    Dauguma analizių nėra priskiriama big data kategorijai, o šiaip pythonas dėl savo universalumo turėtų atrodyti patraukliausiai.
     
    Šiuo metu didžiausia problema, kad nėra daug nemokamų resursų sporto duomenų analitikai, o pačiam nu'scrape'inti visko nepavyks.
     
    Taip pat siūlau tuo pačiu pramokti naudotis ir Tableau programa, kuri naudinga vizualizacijoms - ne tik sporto, bet ir kitose data analytics srityse ši programa yra dažnai naudojama.
     
    Matlabo nesiūlyčiau tikrai, nes jis labiau finansuose naudojamas ir neturi tokios bendruomenės. R labai sparčiai auga. Python irgi. Tai vienos sparčiausiai populiarėjančių kalbų. Tikiuosi po tokių padrikų minčių pasidarė kažkas bent kiek aiškiau. :)
×
×
  • Pasirinkite naujai kuriamo turinio tipą...