Pereiti prie turinio

Web scrapping naudojant PHP


Rekomenduojami pranešimai

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

Redagavo mrInsanity
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

 

 

Jei imdb yra uzdraustas scrappingas tai negalim tau padeti(nelabai legalu)

http://stackoverflow.com/questions/1966503/does-imdb-provide-an-api

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

 

Manau tu rastum gatavą IMDB parser'į, kuris tau viską ištrauktų. Paieškok - tikrai rasi :)

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Ikirtau šiek tiek kampą

 

    //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;
       $name = $html -> find('h1[itemprop="name"]', 0)->plaintext;
	$director = $html -> find('a[itemprop="director"]', 0)->plaintext;
	$description = $html -> find ('p[itemprop="description"]', 0)->plaintext;
	$actors = $html -> find ('a[itemprop="actors"]', 0)->plaintext;
	$poster = $html -> find ('img[itemprop="image"]', 0)->plaintext;

	echo $name;
	echo "<br />";
       echo $ratio;
	echo "<br />";
	echo $description;
	echo "<br />";
	echo $director;
	echo "<br />";
	echo $poster;

Niekaip tik neina išimt posterio paveikslėlio

Tyngiu nagrinet, bet del posterio greiciausiai bus linkas kaltas. Paziurek koki img kelia isveda.

Nuoroda į pranešimą
Dalintis kituose puslapiuose
  • po 1 mėnesio...

<?php
       //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;

       echo $ratio;
?>

 

Štai ir veikia, tereikia biški programuoti mokėti

 

Dabar gal pasirodys juokinga, bet man kažkas nesigauna su tokiu paprastu pavyzdžiu:

 

Nesuprantu kodėl reikia include'inti simple_html_dom.php ar aš turiu specialiai tokį failą taip pat susikurti? Ar jame reikia kažką įrašyti ar jis kaip kažkokia duomenų saugykla bus naudojamas?

 

Dar man meta klaidą 9 eilutėje, kur yra

$html = file_get_html($url);

 

Ką aš čia ne taip suprantu ir kodėl pas mane kreivai gaunasi?

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

  • Prisijunk prie bendruomenės dabar!

    Uždarbis.lt nariai domisi verslo, IT ir asmeninio tobulėjimo temomis, kartu sprendžia problemas, dalinasi žiniomis ir idėjomis, sutinka būsimus verslo partnerius ir dalyvauja gyvuose susitikimuose.

    Užsiregistruok dabar ir galėsi:

    ✔️ Dalyvauti diskusijose;

    ✔️ Kurti naujas temas;

    ✔️ Rašyti atsakymus;

    ✔️ Vertinti kitų žmonių pranešimus;

    ✔️ Susisiekti su bet kuriuo nariu asmeniškai;

    ✔️ Naudotis tamsia dizaino versija;

    ir dar daugiau.

    Registracija trunka ~30 sek. ir yra visiškai nemokama.

  • Naujausios temos

  • Karštos temos

×
×
  • Pasirinkite naujai kuriamo turinio tipą...