[dev] [commit] r1005 - phplib wwwbase/Crawler

Cătălin Frâncu cata at francu.com
Tue Oct 1 04:49:06 EEST 2013


De acord.

Te referi la URL-uri fără http:// la început? Dacă da, perfect. Dacă nu, atunci nu înțeleg ce problemă încercai să rezolvi. :-D

Cătălin

On 09/24/2013 11:49 PM, automailer at dexonline.ro wrote:
> Author: alinu
> Date: Wed Sep 25 09:49:22 2013
> New Revision: 1005
>
> Log:
> Am gasit o functie implementata foarte frumos pe internet, parse_utf8_url() pe care am adaugat-o la sfarsitul phplib/util.php. Folosind aceasta functie in crawler, am rezolvat problema parsarii linkurilor de forma en.wikipedia.org, inainte en.wikipedia.org era 'path' (parse_url), acum este 'host'.
>
> Modified:
>     phplib/util.php
>     wwwbase/Crawler/AbstractCrawler.php
>     wwwbase/Crawler/Crawler.php


More information about the Dev mailing list