Postingan lainnya
Php check if page contains some link
adakah yang tau gmn cara saya me-return true dan false, pada saat mengecheck bahwa page yg diinput itu terdapat sebuah link yang di tentukan contoh programnya seperti ini.
<?php
$contents = file_get_contents("http://some.site/page.html");
$search = <<<EOF
<script type="text/javascript">
alert('They must have this!');
</script>
EOF;
if (strpos($contents, $search) === FALSE) {
echo "Naughty webpage!";
}
?>
nah code diatas itu sudah bisa berjalan namun saya coba emang berat banget untuk load site selalu melebihi maximum connection limit, kiranya ada yang lebih simple dan gak berat selain dengan itu ? contohnya dengan curl, tapi perlu di looping karena link yang akan di taruh di file get content tersebut adalah link yang di looping artinya banyak link yang di foreach untuk dilakukan pengecekan
1 Jawaban:
Hi @maszgalang,
Sebenernya mau check isi content atau cuma url aja?
Kalo mau check url doang kan tinggal compare biasa.
Kalo mau check isi content dari sebuah HTML emang berat, apa lagi pake file_get_contents. Coba ubah jangan pake file_get_contents tapi pake curl aja buat get contentnya.
Semoga membantu.
Regards.
Tanggapan
saya ubah menggunakan curl sama saja gan, tetep tersendat limit, karena yang di proses linknya mencapai ribuan ada saran gak ya biar bisa background proses
mungkin bisa pake DOM parser, search aja semua element <a>
kalo macam scraping gini pake nodejs lebih enak sepertinya.
nah iy gan saya juga mau coba pake nodejs ini cuman ada saran gak, soalnya kata temen sih scraping bisa pake fetch cuman saya butuh contoh biar mudah dipahami, barangkali akan berbaik hati untuk membantu saya hehehe. ada contact gak gan ? email atau no wa, mungkin nanti saya bakalan banyak tanya