Kezdőoldal » Számítástechnika » Programozás » PHP Web Scraping, nem jó a regex?

PHP Web Scraping, nem jó a regex?

Figyelt kérdés

Kód: [link]


A célom az lenne, hogy az adott oldalon az összes időt eltároljam. Ötlet valakinek?



#php #HTML #web #web scrape
2016. febr. 21. 12:58
 1/8 A kérdező kommentje:
De valami nem jó mert amikor darabszámot ki szeretnék írni a végén akkor az eredmény 0 .
2016. febr. 21. 13:00
 2/8 anonim ***** válasza:

Egyrészt a post[1] elvileg az 1-es indexű csoportot adná vissza, de te nem adtál meg csoportot a regex-ben. Zárójelekkel kéne körülhatárolni a .*? -ot, gondolom azt akarod kiszedni.


Az idézőjel is fura körülötte, esetleg valami regex tester oldalon rakd össze a mintádat, a konkrét HTML kódon tesztelve, amit a PHP is megkap.


Másrészt szerintem sokkal egyszerűbb lenne valami HTML parszert használni regex-ek helyett, pl.

[link]

2016. febr. 21. 13:09
Hasznos számodra ez a válasz?
 3/8 A kérdező kommentje:

Itt egy részlet:


<div class="min"> 20:45 </div>



Ebből nekem csak a 20:45 -re lenne szükségem. Hogy kéne megcsinálnom a regexet.

2016. febr. 21. 13:20
 4/8 A kérdező kommentje:

Ok megvan a hiba. Nem kell idézőjelbe tenni a .*? -t

Köszi!

2016. febr. 21. 13:37
 5/8 anonim ***** válasza:
Gyanítom, hogy te tetted fel a live score-os kérdést is. Amennyiben nem, akkor a válaszom többi része tárgytalan. Ha mégis te vagy az, akkor neked nemcsak az időre lesz szükséged, hanem a meccs többi adatára is. Ebben az esetben viszont szerintem nem szerencsés szabványos kifejezések használata, hanem az egész xml struktúrát kellene visszafejteni. Erre azért van szükség, mert ha külün szeded ki a meccs adatait, az időket és az eredményeket, akkor ha valami miatt valamelyik regexp nem illeszkedik, akkor nem tudod a visszatért adatokat párosítani. Ellenben ha html file-t xml-ként feldolgozod, akkor mindig biztosan tudni fogod, hogy milyen értékek tartoznak össze. Én nem parse-oltam xml-t php-vel, de biztosan van rá valamilyen bejáratott könyvtár.
2016. febr. 22. 10:41
Hasznos számodra ez a válasz?
 6/8 A kérdező kommentje:

Igen én vagyok :)

Régen PHP-ztam és jó lenne egy ilyen oldalt csinálni gyakorlásnak. Köszi, hogy utat mutatsz nekem még, kicsit még homályos a dolog, de szép lassan csak rájövök a dolgokra.

Nem igazán tudom, hogy fejthetném vissza az xml-t.

2016. febr. 23. 18:12
 7/8 anonim ***** válasza:

Ezket ajanlom figyelmedbe:

[link]

[link]

2016. febr. 24. 11:08
Hasznos számodra ez a válasz?
 8/8 A kérdező kommentje:
Az utóbbira én is rátaláltam, de az első jobb leírásnak tűnik, köszi!
2016. febr. 24. 18:37

Kapcsolódó kérdések:





Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!