Pereiti prie turinio

PHP > Obuolys.lt Filmu informacija


Rekomenduojami pranešimai

Kodėl..?

 

Čia, greičiausiai, juokaujama. Norisi tikėti.

 

Reikia kad skriptas eitu i paieska obuolys.lt ir pagal gautus rezultatus issirinktu reikiama filma ir atvaizduotu filmo informacija

 

Pasitvirtink tapatybę + 100 litų ir padarysiu :) Laukiu PM.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Pasitvirtink tapatybę + 100 litų ir padarysiu :) Laukiu PM.

 

Ispradziu tikrai pajuokavau, bet poto susimasciau, o jeigu... Ir surasiau nedideli testuka.

 

$execution_time = array();
$data = file_get_contents('http://www.obuolys.lt/paieska/?q=knocking');

$time_start = microtime(true);

preg_match_all('/<p class="search-result">(.*?)<\/p>/si', $data, $films);

$time_end = microtime(true);
$execution_time[1] = ($time_end - $time_start) / 60;

echo '<b>Time(1):</b> '.$execution_time[1].'<br>';

$time_start = microtime(true); 

$dom = new DomDocument();
@$dom->load($data);
$finder = new DomXPath($dom);
$nodes = $finder->query("//*[contains(concat(' ', normalize-space(@class), ' '), ' search-result ')]");

$time_end = microtime(true);
$execution_time[2] = ($time_end - $time_start) / 60;

echo '<b>Time(2):</b> '.$execution_time[2].'<br>';

echo '<b>Best:</b> ' . array_search(min($execution_time), $execution_time) . '<br>';
asort($execution_time);
echo '<b>All</b>: ';
print_r($execution_time);

Redagavo apieviska
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Regex neretu atveju, traukiant nedaug informacijos yra greičiau – nenuginčijamas reikalas.

 

BET. HTML parseris dažniau yra "the right way". Kuo sudėtingiau norėsi traukti informaciją, tuo labiau matysi, kad regexai arba lėtėja, arba išvis nepajėgia surasti to, ko reikia (jų galimybės – ribotos).

 

Na, žodžiu, regexai greitam hakui veikia, bet jei nori daug ir sudėtingai – reikia normalaus, „teisingo“ HTML parserio.

 

Žymusis Stack Overflow klausimas apie tai, kodėl regexu pilnai HTML neišparsinsi.

 

Nu ir šiaip – reik nepamiršt, kad greitis, ir pan., priklauso dar ir nuo implementacijos. Drįstu spėti, kad Simple HTML DOM implementuotas grynu PHP'u, o regexams tuo tarpu naudojama PCRE biblioteka, parašyta C.

Redagavo Silke
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Regex neretu atveju, traukiant nedaug informacijos yra greičiau – nenuginčijamas reikalas.

 

BET. HTML parseris dažniau yra "the right way". Kuo sudėtingiau norėsi traukti informaciją, tuo labiau matysi, kad regexai arba lėtėja, arba išvis nepajėgia surasti to, ko reikia (jų galimybės – ribotos).

 

Na, žodžiu, regexai greitam hakui veikia, bet jei nori daug ir sudėtingai – reikia normalaus, „teisingo“ HTML parserio.

 

Žymusis Stack Overflow klausimas apie tai, kodėl regexu pilnai HTML neišparsinsi.

 

Nu ir šiaip – reik nepamiršt, kad greitis, ir pan., priklauso dar ir nuo implementacijos. Drįstu spėti, kad Simple HTML DOM implementuotas grynu PHP'u, o regexams tuo tarpu naudojama PCRE biblioteka, parašyta C.

Pilnai sutinku, taciau reikia tureti omeni, kad gautas tekstas gali buti nevalidus HTML. Pvz pateiktam auksciau pvz mano domparseris 100500 notice ismeta, o as is tu, kurie notice ne glusina, bet tvarko. Krc cia 50/50, bet as dariciau sita su regexu vien del to, kad reikia istraukti 1-2 dalikus is viso HTML. Ner reikalo ji visa parsinti.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

  • Prisijunk prie bendruomenės dabar!

    Uždarbis.lt nariai domisi verslo, IT ir asmeninio tobulėjimo temomis, kartu sprendžia problemas, dalinasi žiniomis ir idėjomis, sutinka būsimus verslo partnerius ir dalyvauja gyvuose susitikimuose.

    Užsiregistruok dabar ir galėsi:

    ✔️ Dalyvauti diskusijose;

    ✔️ Kurti naujas temas;

    ✔️ Rašyti atsakymus;

    ✔️ Vertinti kitų žmonių pranešimus;

    ✔️ Susisiekti su bet kuriuo nariu asmeniškai;

    ✔️ Naudotis tamsia dizaino versija;

    ir dar daugiau.

    Registracija trunka ~30 sek. ir yra visiškai nemokama.

  • Naujausios temos

  • Karštos temos

×
×
  • Pasirinkite naujai kuriamo turinio tipą...