26 комментариев
Страница 1 из 1
    seoonly.ru

    доступно. спасибо.

    Кирилл

    Очень интересно, на выходных обязательно разберу материал. И ссылочки на regexr и php sandbox тоже полезные. Пиши чаще, шикарный и доступный материал. Кстати с наступившим тебя др-ом ))

    Дима

    Спасибо, Гарри, за классную статью! А как вот такое регулярное выражение «$s = str_replace(«@», «https://www.instagram.com/», $s); » написать в твой парсер? Как его превратить в такой вид «(.+?)[|]»? Для этого существуют какие-нибудь конвертеры?

    Дима

    Да, я хотел заменять собачку в теле статьи body. То есть, чтобы: было @aftamat4ik, а стало https://www.instagram.com/aftamat4ik. В парсере по селекторам $res = str_replace(‘[email protected]~’, «https://www.instagram.com/», $res); не работает, может нужно это выражение написать в таком виде, как например (.+?)[|], чтобы заработало?

    Дима

    Спасибо вам большое!

    Gadzho

    Дело в том, что даже ссылку получить не получается, потому как все что после вопросительного знака отсекается

    Олег

    никак регулярку не напишу
    нужно искать ссылки по примеру:
    http://somesite.ru/somecategorywithsimbols-_/sometopicwithsimbols_-.html
    \bhttp\:.*\.html\b такой срабатывает редко

    (https?:\/\/)?(www\.)?([-а-яa-z0-9_\.]{2,}\.(рф|[a-z]{2,6}))((\/[-а-яa-z0-9_]{1,}\/)|(\/[-а-яa-z0-9_]{1,}\/)([-а-яa-z0-9_]{2,}\.(рф|[a-z]{2,6})))?((\?[a-z0-9_]{2,}=[-0-9]{1,})?((\&[a-z0-9_]{2,}=[-0-9]{1,}){1,})?)?
    такой выбирает только до категории

    Олег

    Спасибо, очень доступно и наглядно. Кстати, после редизайна Хабра исходный код html-страниц изменился и ваш код, соответственно, уже не работает. Нужно писать другие регулярки.

    Gadzgo

    Здраствуйте. Скажите пожалуйста, умеет ли парсер работать с подобными ссылками href=»http://site.ru/?p=7240 ? Пробовал вот так href=[\'»]([^*]+?p=[0-9]+?)[\»‘] не получается

Добавить Комментарий