Pereiti prie turinio

PHP Crawleris masei nuorodų


Rekomenduojami pranešimai

Gan ilgą laiką bandžiau padaryt veikiantį crawlerį per PHP Dom parserį, kad galėtu skanuot daug nuorodų ( www.web.com/artc_id=$id&article.

 

Bet galiausiai nieko neišėjo. Gal turite pasiūlyt kokia gerą biblioteką arba scriptą, kad galima būtų crawlint daug tokių pačių nuorodų su skirtingais ID ? Arba jei kas esat susidūrę su php dom parseriu, gal žinot kaip padaryt, kad crawlintu nuorodas.

 

Apačioj pavyzdis ką bandžiau daryt, bet esmė, kad kai ėmi webs.htm failą, tai jis į $html įrašo puslapius kaip tekstą ir nieko nesigauna, tuo tarpu jei tiesiai nuoroda rašai, tai gali searchint div ir t.t.

 

<?php
include_once('simple_html_dom.php');
$html = new simple_html_dom();
$html = file_get_html('http://delfi.lt'); or $html = file_get_html('webs.htm');

echo $html;

?>

Redagavo bi0dileet
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

×
×
  • Pasirinkite naujai kuriamo turinio tipą...