Agregacija PHP/XML
3 naročniki
3 naročniki
Zdravo,
S kolegom sva naredila spletno stran akcijske-ponudbe.si , ki je agregator vseh (skoraj vseh) ponudnikov kuponov v Sloveniji. Trenutno stvar dela na simplehtmldom (curl funkcijah) in postaja vse bolj zapletena in robustna, saj je potrebno vedno pogledati, če je kdo kaj na strani posodobil kar se tiče html-ja (spremenil ime diva, class, id ...). Je tudi zelo slabo optimirana, saj preden strežnik prebere vseh 20 strani traja ogromno, zato lahko uporabnik tudi naleti na stran ravno takrat ko le ta bere vsebino (1x na uro).
Sedaj me pa zanima, če se da morda kako ugotoviti ali kje na strani ponudnika obstaja kakšna xml datoteka iz katere bi to parsanje postalo hitrejše. Obenem bi seveda imeli neomejene možnosti kar se tiče sortiranja, filtriranja, ... poleg tega pa bi se vpisovalo v pregledno bazo, ne pa v neko datoteko, kot to počneva sedaj.
Poskušal sem kontaktirati ponudnike, vendar mi jih je odgovorila le peščica.
Npr iz takšne datoteke bi bila stvar hitra in enostavna:
http://privoscite.si/ceneje.xml
Poizkusila sva nekaj avtomatskih parserjev, vendar zaenkrat delujejo curl funkcije najhitreje in najbolje.
hvala in lp