Pereiti prie turinio

Web scrapping naudojant PHP


Rekomenduojami pranešimai

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

Redagavo mrInsanity
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

 

 

Jei imdb yra uzdraustas scrappingas tai negalim tau padeti(nelabai legalu)

http://stackoverflow.com/questions/1966503/does-imdb-provide-an-api

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

 

Manau tu rastum gatavą IMDB parser'į, kuris tau viską ištrauktų. Paieškok - tikrai rasi :)

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

Tyngiu nagrinet, bet del posterio greiciausiai bus linkas kaltas. Paziurek koki img kelia isveda.

Nuoroda į pranešimą
Dalintis kituose puslapiuose
  • po 1 mėnesio...

<?php
       //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;

       echo $ratio;
?>

 

Štai ir veikia, tereikia biški programuoti mokėti

 

Dabar gal pasirodys juokinga, bet man kažkas nesigauna su tokiu paprastu pavyzdžiu:

 

Nesuprantu kodėl reikia include'inti simple_html_dom.php ar aš turiu specialiai tokį failą taip pat susikurti? Ar jame reikia kažką įrašyti ar jis kaip kažkokia duomenų saugykla bus naudojamas?

 

Dar man meta klaidą 9 eilutėje, kur yra

$html = file_get_html($url);

 

Ką aš čia ne taip suprantu ir kodėl pas mane kreivai gaunasi?

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

×
×
  • Pasirinkite naujai kuriamo turinio tipą...