среда, 18 марта 2009 г.

Count Duplicate URLs, fastest method possible

http://stackoverflow.com/questions/264930/count-duplicate-urls-fastest-method-possible

http://mail.python.org/pipermail/python-list/2005-April/316464.html
url=unicode(r"((http|ftp)://)?(((([\d]+\.)+){3}[\d]+(/[\w./]+)?)|([a-z]\w*((\.\w+)+){2,})([/][\w.~]*)*)")
for m in re.finditer(url, html) :
print m.group()

Комментариев нет:

Авторы