Pereiti prie turinio

Web scrapping naudojant PHP


Rekomenduojami pranešimai

Manau supranti, kad žmonės užimti yra ir savo rūpesčių, bei vargų turi. Jeigu galėsiu ir bus noro - atsiųsiu tau kodo pavyzdį parašęs į PM. ;)

 

p.s. tau reikia paskutinės nuorodos (anchor) esančiame div'e su id "divas"?

1.<div id="divas">
2.<b>Reikia šios eilutės</b>
3.<a href="#">Nereikia šios eilutės</b>
4.<b>Nereikia šios eilutės</b>
5.<a href="#">Reikia šios eilutės</b>
6.</div>

Reikia antros ir ketvirtos

Nuoroda į pranešimą
Dalintis kituose puslapiuose

1.<div id="divas">
2.<b>Reikia šios eilutės</b>
3.<a href="#">Nereikia šios eilutės</b>
4.<b>Nereikia šios eilutės</b>
5.<a href="#">Reikia šios eilutės</b>
6.</div>

Reikia antros ir ketvirtos

 

Spėju, kad nemoki skaityti dokumentacijos Simple HTML DOM.

 

<?php
//gausi antrą nuorodą 
echo $html->find("#divas", 0)->children(2);

//gausi paskutinę nuorodą
echo $html->find("#divas", 0)->last_child(); 

 

O šiaip skaityk, mokykis, nes niekas kitas už tave visko nepadarys (: ten dokumentacija labai aiški...

Redagavo Lapinskis
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Spėju, kad nemoki skaityti dokumentacijos Simple HTML DOM.

 

<?php
//gausi antrą nuorodą 
echo $html->find("#divas", 0)->children(2);

//gausi paskutinę nuorodą
echo $html->find("#divas", 0)->last_child(); 

 

O šiaip skaityk, mokykis, nes niekas kitas už tave visko nepadarys (: ten dokumentacija labai aiški...

Ačiū

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Kiek bandau, tai su lietuviskom raidem yra problemu :) t.y. kai nuscrappina, vietoj ąčęėįšųūž - rodo klaustukus (???��) :) kaip apeiti?

 

Čia tavo script'o problema, įdėk UTF-8 koduotės header'į ir dar gal su html meta tag'ais sužaisk.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

<?php

$url = 'http://www.hey.lt'; // Cia rodo ���

$url = 'http://www.delfi.lt'; // Cia viskas grazu

$output = file_get_contents($url);

echo $output;

?>

 

includinu tai, kas pas juos yra :) taigi kame beda gali but? meta tag`ai bei koduotes seniai isbandytos - nieko nepadejo.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

<?php

$url = 'http://www.hey.lt'; // Cia rodo ���

$url = 'http://www.delfi.lt'; // Cia viskas grazu

$output = file_get_contents($url);

echo $output;

?>

 

includinu tai, kas pas juos yra :) taigi kame beda gali but? meta tag`ai bei koduotes seniai isbandytos - nieko nepadejo.

 

Pabandyk nustatyti abiem atvejais koduotę su šituo http://php.net/manual/en/function.mb-detect-encoding.php ir žiūrėk atitinkamai kame bėda.

Nuoroda į pranešimą
Dalintis kituose puslapiuose
  • po 2 mėnesių...

Nekuriu naujos temos bet užduodu klausimus čia:

 

1. Kaip padaryti, kad gautą rezultatą pvz: $50.00 padaugintų iš dviejų ir nuimtų $.

2. Sunku būtų padaryti kad tarkim susikurūs modifikacija arašius preskės ID ir būtų auto užpildyti laukai apie prekę.

Ttrumpiau iš e-shop į mano eshop.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Nekuriu naujos temos bet užduodu klausimus čia:

 

1. Kaip padaryti, kad gautą rezultatą pvz: $50.00 padaugintų iš dviejų ir nuimtų $.

2. Sunku būtų padaryti kad tarkim susikurūs modifikacija arašius preskės ID ir būtų auto užpildyti laukai apie prekę.

Ttrumpiau iš e-shop į mano eshop.

1) $usd = str_replace ('$', '', '$50.00');

$usd = $usd * 2;

2) Jeigu iš vieno shopo tai nėra nieko labai sunkaus.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Nekuriu naujos temos bet užduodu klausimus čia:

 

1. Kaip padaryti, kad gautą rezultatą pvz: $50.00 padaugintų iš dviejų ir nuimtų $.

2. Sunku būtų padaryti kad tarkim susikurūs modifikacija arašius preskės ID ir būtų auto užpildyti laukai apie prekę.

Ttrumpiau iš e-shop į mano eshop.

 

1. Išgauni string'ą '$50.00', su str_replace nuimi $ ženklą, su (int) arba (float) pakeiti tipą ir tada daugini iš dviejų. Simple.

 

 

2. Nesunku.

 

 

Nuoroda į pranešimą
Dalintis kituose puslapiuose

1) $usd = str_replace ('$', '', '$50.00');

$usd = $usd * 2;

2) Jeigu iš vieno shopo tai nėra nieko labai sunkaus.

 

Aciu, kad parodei kaip trumpiau, as kol atsake bandziau gavos bet ilgas kodas nors viskas tas pats. Taip viskas is vieno shopo gal galit kas pavyzdi?

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Aciu, kad parodei kaip trumpiau, as kol atsake bandziau gavos bet ilgas kodas nors viskas tas pats. Taip viskas is vieno shopo gal galit kas pavyzdi?

Nematant eshopo nieko nepadarysi, daugumos web skiriasi kodas, kiekienam webui reikia pritaikyt atskirai kodą. Bendrinių pavyzdžių internete ieškok, nieko konkretaus šituo klausimu negaliu pasakyti dabar.

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Nematant eshopo nieko nepadarysi, daugumos web skiriasi kodas, kiekienam webui reikia pritaikyt atskirai kodą. Bendrinių pavyzdžių internete ieškok, nieko konkretaus šituo klausimu negaliu pasakyti dabar.

 

Gal gali ant kokio kinietisko shop focalprice.com, dealextreme.com, [Nuoroda pašalinta: SPAM.]

 

Bet siaip noreciau sportsdirect.com, healthdesign.com

Nuoroda į pranešimą
Dalintis kituose puslapiuose
  • po 4 savaičių...
  • po 7 mėnesių...

Sudomino mane šis būdas

<?php
       //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span.rating-rating', 0)->plaintext;

       echo $ratio;
?>

Šeip šis kodas neveikia, išmeta naršyklėje "0/10" nors kitoks reitingas yra..Bet mane domina kaip tai veikia, niekaip neįkertu, kokiu budų gaunamas tas filmo reitingas??

Ar čia reikia lysti į svetainės course?

 

Nuoroda į pranešimą
Dalintis kituose puslapiuose

Sudomino mane šis būdas

<?php
       //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span.rating-rating', 0)->plaintext;

       echo $ratio;
?>

Šeip šis kodas neveikia, išmeta naršyklėje "0/10" nors kitoks reitingas yra..Bet mane domina kaip tai veikia, niekaip neįkertu, kokiu budų gaunamas tas filmo reitingas??

Ar čia reikia lysti į svetainės course?

 

<?php
       //simple html dom biblioteka
       include('simple_html_dom.php');

       //filmo url
       $url = 'http://www.imdb.com/title/tt0485947/';

       //gauname svetainės html
       $html = file_get_html($url);

       //gauname filmo reitingą
       $ratio = $html->find('span[itemprop="ratingValue"]', 0)->plaintext;

       echo $ratio;
?>

 

Štai ir veikia, tereikia biški programuoti mokėti

Redagavo Sventasis
Nuoroda į pranešimą
Dalintis kituose puslapiuose

Prisijunkite prie diskusijos

Jūs galite rašyti dabar, o registruotis vėliau. Jeigu turite paskyrą, prisijunkite dabar, kad rašytumėte iš savo paskyros.

Svečias
Parašykite atsakymą...

×   Įdėta kaip raiškusis tekstas.   Atkurti formatavimą

  Only 75 emoji are allowed.

×   Nuorodos turinys įdėtas automatiškai.   Rodyti kaip įprastą nuorodą

×   Jūsų anksčiau įrašytas turinys buvo atkurtas.   Išvalyti redaktorių

×   You cannot paste images directly. Upload or insert images from URL.

Įkraunama...
  • Dabar naršo   0 narių

    Nei vienas registruotas narys šiuo metu nežiūri šio puslapio.

×
×
  • Pasirinkite naujai kuriamo turinio tipą...