Pereiti prie turinio

  

2 nariai balsavo

  1. 1. Nuo ko pradėti?

    • Python
      2
    • Scala
      0
    • MATLAB
      0
    • Julia
      0
    • R
      0
    • Kita (pakomentuokit)
      0


Rekomenduojami pranešimai

Sveiki,

 

Nusprendžiau kuo noriu būti ateityje, kas man patinka ir ties kuo susikoncentruosiu nuo šiol. Tai, manau, gana svarbus ir didelis pirmas žingsnis link tikslo, bet yra ir daugybė klausimų, į kuriuos tikiuosi rasti atsakymų (o gal net labiau patarimų) čia.

 

Turiu aš nedidelės patirties programavime - mokykloje teko mokytis HTML/CSS ir Python šiek tiek (ko gero reiktų mokytis iš naujo jau). Įstojau į su IT susijusią profesiją, bet programavimo beveik nebuvo - paimti C/C++ baziniai dalykai, šiek tiek MySQL, ir tiek žinių. Buvo labiau profesija susijusi su dizainu, nes dirbta su įvairiomis programomis - Balsamiq, Axure, InVision, kurtos svetainės su Prestashop bei Wordpress. Dar velnias žino kiek programų pamiršau, bet buvo daug. Ir ta patirtis leido man suprasti, kad tai ne man. Todėl pasiėmiau akademines atostogas ir galvoju per šiuos metus investuoti didžiąją dalį laisvo laiko mokymuisi.

 

Kiek pats domėjausi iki šiol, tai sporto analitika priklauso Big Data kategorijai, ar kaip čia teisingai išsireikšti. Žodžiu, turbūt dirbama bus su Big Data (jeigu kas turi kitų žinių, būtų super išgirsti). Tai realiai aš dabar kryžkelėje nuo ko pradėti? Kokią kalbą pasirinkti kaip startą? Žinau, kad Python'as būtų kone paprasčiausias pasirinkimas, bet ar tai būtų teisingas mano karjerai? Kitos alternatyvos yra:

 


  •  
  • Scala
  • Julia
  • MATLAB (mokama, meh?)
  • R

 

Pastaroji kone svarbiausia programavimo kalba duomenų analitikoje ir statistikoje (kiek domėjausi vėlgi), bet ji ir viena sudėtingiausių iš šių (?).

 

Ar turėtumėt kokių nors patarimų man? Turiu laisvai bent po 5 valandas programavimui. Turiu jau šiek tiek knygų atsisiuntęs Python/R kalbomis, pradžiai, bet visada priimsiu rekomendacijas kaip, kur ir iš ko mokytis :)

 

Sport-Analytics.jpg

Redagavo Verised
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Na, aš pats tuo domiuosi ir mėgėjiškai bandau užsiimti, tai galiu pasakyti, kad pagrindas visa ko yra python'as. Žinoma, R irgi naudinga, bet R galimybės kiek kitokios yra ir pats kodas visai kitoks rašymas (man po pažinčių su kitomis kalbomis buvo neįprasta).

 

Šiaip GitHubas pilnas NBA statistikos API dirbti su pythonu, viskas paruošta, tik kibk į darbus. Jei nori analizuoti su R, tai žinau, kur galima gauti didžiausių JAV sporto lygų statistiką csv formatu.

 

Jei nori rimtai tuo užsiimti, tai pasipraktikuok, kažką sužinok ir tada bandyk apply'inti į Fansided.com, gal priimtų prisidėti prie Nylon Calculus (vėlgi, nežinau, kokia sporto šaka domiesi, nes sporto analitikoje svarbu suprasti savo analizuojamą sporto šaką).

 

Dauguma analizių nėra priskiriama big data kategorijai, o šiaip pythonas dėl savo universalumo turėtų atrodyti patraukliausiai.

 

Šiuo metu didžiausia problema, kad nėra daug nemokamų resursų sporto duomenų analitikai, o pačiam nu'scrape'inti visko nepavyks.

 

Taip pat siūlau tuo pačiu pramokti naudotis ir Tableau programa, kuri naudinga vizualizacijoms - ne tik sporto, bet ir kitose data analytics srityse ši programa yra dažnai naudojama.

 

Matlabo nesiūlyčiau tikrai, nes jis labiau finansuose naudojamas ir neturi tokios bendruomenės. R labai sparčiai auga. Python irgi. Tai vienos sparčiausiai populiarėjančių kalbų. Tikiuosi po tokių padrikų minčių pasidarė kažkas bent kiek aiškiau. :)

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Na, aš pats tuo domiuosi ir mėgėjiškai bandau užsiimti, tai galiu pasakyti, kad pagrindas visa ko yra python'as. Žinoma, R irgi naudinga, bet R galimybės kiek kitokios yra ir pats kodas visai kitoks rašymas (man po pažinčių su kitomis kalbomis buvo neįprasta).

 

Šiaip GitHubas pilnas NBA statistikos API dirbti su pythonu, viskas paruošta, tik kibk į darbus. Jei nori analizuoti su R, tai žinau, kur galima gauti didžiausių JAV sporto lygų statistiką csv formatu.

 

Jei nori rimtai tuo užsiimti, tai pasipraktikuok, kažką sužinok ir tada bandyk apply'inti į Fansided.com, gal priimtų prisidėti prie Nylon Calculus (vėlgi, nežinau, kokia sporto šaka domiesi, nes sporto analitikoje svarbu suprasti savo analizuojamą sporto šaką).

 

Dauguma analizių nėra priskiriama big data kategorijai, o šiaip pythonas dėl savo universalumo turėtų atrodyti patraukliausiai.

 

Šiuo metu didžiausia problema, kad nėra daug nemokamų resursų sporto duomenų analitikai, o pačiam nu'scrape'inti visko nepavyks.

 

Taip pat siūlau tuo pačiu pramokti naudotis ir Tableau programa, kuri naudinga vizualizacijoms - ne tik sporto, bet ir kitose data analytics srityse ši programa yra dažnai naudojama.

 

Matlabo nesiūlyčiau tikrai, nes jis labiau finansuose naudojamas ir neturi tokios bendruomenės. R labai sparčiai auga. Python irgi. Tai vienos sparčiausiai populiarėjančių kalbų. Tikiuosi po tokių padrikų minčių pasidarė kažkas bent kiek aiškiau. :)

Tikrai labiau atvėrė akis apie sporto analitiką ši žinutė. Ačiū! Beje, gal kartais yra lietuvių bendruomenė kokia (sporto analitika besidominčių, fb ar kur kitur)?

 

Manau dar reiktų mentoriaus, bet kartu ir įsivaizduoju, kad šansai labai menki tokį rasti, kadangi gana specifinė sritis :unsure: Startui toks žmogus būtų žiauriai didelė pagalba ir tikrai neatsisakyčiau pagelbėti su darbais, jeigu tik galėčiau iš to žmogaus mokytis ir gauti patarimų.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Na, apie tokią bendruomenę neteko girdėti. Galbūt Lietuvoje tuo nelabai kas užsiima (arba nesiskelbia tiesiog). Išvis tokios pozicijos kaip "analitikas" ar "big data analitikas" tik neseniai išpopuliarėjo, anksčiau mažai tokių žmonių reikėjo, o dabar darbo skelbimuose daug tokių ieško.

 

Tik tiek, kad big data reikalauja didelių kompiuterio resursų, todėl ne kiekvienas gali tuo užsiimti - pagrindinės programos, kuriomis naudojasi Big Data analitikai, reikalauja minimum 16 GB ram (įprastai - 32). Kompiuteriai su tiek ram (arba atskirai ram plokštės) kainuoja pakankamai brangiai, todėl dažną galbūt atbaido mokytis savarankiškai.

 

Ir big data yra kur kas didesni duomenų skaičiai nei įprastai naudojami sporto analitikoje (daugybę sykių). Kažkas arčiausiai to būtų SportVU sistema, kuri dėl daugybės tiksliai išdėstytų kamerų seka kiekvieną judesį koordinačių pagrindu ir sukuria didelius kiekius informacijos. Visgi ji yra laaabai brangi ir paprastiems mirtingiesiems neprieinama (neskaitant to, ką matome NBA.com tinklalapyje).

 

Jei kažkas domina, gali paklausti. Jei nori analizuoti populiariausias JAV sporto lygas (NBA, NFL, NHL, etc), galiu duoti nuorodą, per kurią gautum gerą priėjimą su push/pull request'ais pagal pasirinkimą. Tai būna labai patogu.

 

Gali ir šiaip klausti, kas įdomu - kiek mano žinios siekia, tiek papasakosiu. Iš esmės daugiausiai su krepšiniu esu susidūręs ir tarp visos tos krepšinio analitikos yra tokia jau kiek prigijusi statistikos dalis (ne ta, kuri yra box-score) bei visokie naujadarai, kurių patikimumas praktikoje dar nėra įrodytas.

 

Analizuoti NBA statistiką ir parodyti kažką naujo būtų sudėtinga, nes prie to dirba gausybė profesionalų, baigusių atitinkamus mokslus geriausiuose universitetuose. Kitas sprendimas - bandyti mokytis ir tobulėti su kitomis sporto šakomis ar lygomis.

 

Štai http://overbasket.com/ užsiima Eurolyga/Europos taure. Buvo ir daugiau panašių projektų, bet juos visus galima pranokti, nes dar daug kas neišpildyta.

 

Pats anksčiau turėjau idėją padaryti analogą LKL'ui, tačiau apie javascript'ą tuo metu žinojau mažokai ir pasirodė, kad duomenų nuskaityti nepavyks (? nebent kažkaip sudėtingai ir su sunkumais). Vien žiūrint į tinklalapio source code, jokios statistikos nebuvo, viskas vyko per baskethotel. Tiesa, dabar jau source code box-score statistika yra matoma, tad tikriausiai pavyktų kažką padaryti.

 

Didelė dalis analitikos - esamų duomenų perpanaudojimas ir interpretacija. Daug svarbių kategorijų kaip yra paremtos būtent box-score pagrindu.

 

Jei padarytum kažkokią analizę, galiu garantuoti, kad bent kažkuris iš to sporto tinklalapių ja pasidalintų pas save - tai ir galėtų būti puiki pradžia.

 

Na, o jei nuspręstum bandyti kažką su populiariausiomis lygomis, tuomet siūliau pranaršyti GitHub - yra žiauriai daug visko, kas sutaupytų laiko ir padėtų mokytis.

 

EDIT: ką pamiršau paminėti - labai rekomenduoju skaityti Sloan Conference medžiagą: http://www.sloansportsconference.com/

Redagavo LukasKuc
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

  • Prisijunk prie bendruomenės dabar!

    Uždarbis.lt nariai domisi verslo, IT ir asmeninio tobulėjimo temomis, kartu sprendžia problemas, dalinasi žiniomis ir idėjomis, sutinka būsimus verslo partnerius ir dalyvauja gyvuose susitikimuose.

    Užsiregistruok dabar ir galėsi:

    ✔️ Dalyvauti diskusijose;

    ✔️ Kurti naujas temas;

    ✔️ Rašyti atsakymus;

    ✔️ Vertinti kitų žmonių pranešimus;

    ✔️ Susisiekti su bet kuriuo nariu asmeniškai;

    ✔️ Naudotis tamsia dizaino versija;

    ir dar daugiau.

    Registracija trunka ~30 sek. ir yra visiškai nemokama.

  • Naujausios temos

  • Karštos temos

×
×
  • Pasirinkite naujai kuriamo turinio tipą...