356 комментариев
    Дмитрий

    Здравствуйте, спасибо за парсер! А как можно сделать, чтобы контент который парсится делился не только на заголовок и содержимое, а еще и в произвольные поля вордперсса закидывать?

    Валерия

    Добрый день, подскажете , если границы фрагментов не найти?
    повторяется 3 раза в тексте
    Как быть?

    Алекс

    Сколько будет стоить настроить парсинг новостей из рсс с определенного сайта в определенную категорию и с указанием ссылки на источник?

    Алекс

    текст статьи . ссылка

    Алекс

    Вот исходный rss http://inshahovskoe.ru/rss необходимо чтоб из него текст статьи и ссылка брались правильно. Заголовок и картинка берутся правильно, а вот текст и ссылка ну не как. В категорию тоже у меня правильно падает. Проблема только с текстом и ссылкой.

    Алекс

    Прошу прощения, но судя по описанию фаила версия тут от 6 марта. http://aftamat4ik.ru/?download=1&kccpid=220&kcccount=http://aftamat4ik.ru/files/aftparser.zip http://aftamat4ik.ru/portfolio/aftparser/

    Алекс

    Большое спасибо. Осталось с картинкой решить вопрос. Осталось решить проблему с картинкой в шапку статьи, но сверху вроде уже писали решение попробую. Спасибо за хороший плагин!

    Den

    Привет. Подскажи пож-ста как пользоваться $res .= $this->get_translation($res, $fromlg, $tolg, $key);, если можно конкретный пример для профана в php

    Юрий Емельянов

    Привет. Хороший плагин, спасибо! У меня вопрос. Я спарсил материал по ссылке, мне что то не понравилось я материал удалил а повторно, эту же ссылку если распарсить, парсер пишет, что материал добавлен, но статьи нет. Она не добавляется в админке вордпресса. Что такое может быть? Не подскажете.

    Олег

    спасибо за отличный плагин. подскажите, можно ли у полученных постов установить дату поста ту же, что и в источнике? заранее спасибо.

    Алексей

    Добрый день! Благодарю за отличный парсер. Но у меня после заголовка вылазит еще один кусок кода «topic topic-type-photoset js-topic»>». Не подскажете как его убрать? Заранее благодарю!

    Boulevard

    Благодарю за отличный парсер! Новости из RSS-ленты опубликовал с первого раза без каких-либо доп.настроек даже на локалке))

    Андрей

    Парсер очень крут. Регулярно им пользуюсь. Спасибо огромное!
    Но недавно перестали загружаться картинки, как раньше (типа /wp-content/uploads/img78mr10mzmn.jpg).
    Хотя в коде ничего не менял. Вот: http://joxi.ru/brRLBwVSJ4RP32
    Может вы видите причину этого или подскажите, что делать? Буду очень признателен.

      Андрей

      Сама картинка должна подтягиваться отсюда:

      Я так понимаю, это не предусмотрено плагином. Тут и HTTPS и символы =, $ в пути и названии изображения. Само расширение написано большими буквами. Видно все непросто…

    2l1k

    Доброго времени! Классный парсер!
    Возник вопрос, можно ли сохранить картинки из «background» как тут показано ну или из такого вот тега ?
    И еще каким образом можно сохранят определенные данные в meta tag-и в произвольные поля, на WP я знаю что к чему но с Ваши парсером пока еще не разобрался, если поможете небольшим кодом, буду благодарен!
    СПАСИБО БОЛЬШОЕ!

    Антон

    Весьма неплохой парсер — создатель однозначно крут.
    Но есть ли возможность настроить так, чтоб парсил RSS ленту, в которой отдаются только анонсы, брал с анонса ссылку на полную новость и уже потом парсил и публиковал полный материал. Или что-то в этом плане. Было б очень даже круто.

    Виктор

    Здравствуйте, а как сделать что бы парсер обрабатывал не по 1 материалу в секунду, а быстрее?

    Виктор

    И у меня еще один вопрос, иногда бывает что парсер не хочет обрабатывать большие страницы (712000 символов), что в этом случае делать? Если ли возможность как-то в настройках указать что бы убрать ограничения, если это они конечно.

    Виктор

    Еще возникла проблема, сегодня поставил парсить сайт, а спарсило в 100 раз меньше чем поставил, потом решил протестить выскочило следующее:
    [————- проход_0—————]
    [title]Access forbidden![/title]
    [————- /проход_0—————]

    Подскажите как исправить это.

    Виктор

    wget на компьютере установлен, с помощью командной строки скачивал сайт, а вот в OpenServer не пойму как правильно вписать команду в планировщик задач, заранее спасибо за помощь)

      Виктор

      Вот такой командой получилось запустить:
      %progdir%\modules\wget\bin\wget.exe -q —no-cache http://abc?aftcron=5t4lj3v
      но возникла другая проблема, в отложенный запуск много ссылок не хотят сохранятся, когда сохраняю 2 тысячи ссылок, то все нормально ,а когда 3000 то выскакивает ошибка которую писал недавно.

    Александр

    не парсится с этого сайта https://www.goal.ru/news/ , почему не могу понять? выставляю все по интрукции, помогите пожалуйста,какие конкретно тут селекторы ставить?

    Виктор

    Помогите пожалуйста составить регулярное выражение для того что бы из «Текст» осталось только «Текст». Вот так не получается ]+?>([^<]+?)[|]$1

      Виктор

      Код пропал, вот переписываю:
      Помогите пожалуйста составить регулярное выражение для того что бы из <a name=»_Toc244495232″>Текст </a> осталось только «Текст». Вот так не получается <a name[^>]+?>([^<]+?)<\/a>[|]$1

    Алексей

    Сразу скажу спасибо за хороший и нужный плагин! Единственное возникает проблема с моими настройками:
    /*
    * Приведение кодировки
    * $blog_enc — кодировка страниц блога
    * $src_enc — автоматически определенное значение кодировки. Берется из тега страницы.
    * Если значение $src_enc определяется не верно — укажите его самостоятельно.
    */
    if($blog_enc != $src_enc) $html = mb_convert_encoding($html, $blog_enc, $src_enc);
    $res .= $this->set_title($this->get_border(«fragment_1»,$html));

    $catname = $this->get_border(«fragment_4″,$html);
    $res .= $this->set_catname(mb_substr($catname, 10, 1,»utf-8»));

    $res .= «Первый заголовок»;

    $res .= $this->get_border(«fragment_2»,$html);
    $res = $this->clear_tags_from_trash($res);

    $res .= «Второй заголовок»;

    $res .= $this->get_border(«fragment_5″,$html);
    $res = $this->clear_tags_from_trash($res);

    $res = $this->remove_a_href($res);
    $res = str_replace(‘ ‘, », $res);

    Название: fragment_1
    верх:
    низ:
    Название: fragment_2
    верх:
    низ:
    Название: fragment_4
    верх: Текст
    низ:
    Название: fragment_5
    верх:
    низ:

    При таких настройках тест проходит, выводит все что необходимо. Но как только запускаю парсинг, пишет что добавлено, а запись не появляется. Причем отложенный парсинг тоже не работает. Пробовал несколько версий плагина. Не подскажите что делаю не так?

    Макс

    Спасибо за крутой парсер! Работает классно, но автоматически не выставляются картинки с плагином Auto Post Thumbnail к спарсенным материалам. Этот и подобные плагины как-будто не видят картинку в посте. Скорее всего, картинка не прикреплена к записи из-за особенности загрузки картинок на сервер вашим парсером. Миниатюра устанавливается, если только вручную добавить произвольное поле thumbnail с адресом картинки. Есть способ, чтобы произвольное поле записи thumbnail автоматически принимало значение адреса картинки, наподобие вашим произвольным полям ap_link и ap_mark=Это пост был добавлен через AftParser?

    Денис

    Есть ли возможность грабить ссылки определив границы блока?

    Екатерина

    Как вставить в макрос (далее), ну чтобы добавлялись не полные статьи на главной а анонс?

    портал

    СПасибо за парсер, осталось разобраться в настройках))))

    Олег

    Подскажите, как изменить ссылки на скачиваемые картинки?
    Например ссылка:
    https://s9v7j7a4.ssl.cdn.net/galleries/new_small/5c/2f/fc/5c2ffc3eec3ac2fc8d4299eadbccbff4/6.jpg
    превращалась в:
    https://s9v7j7a4.ssl.cdn.net/galleries/full/5c/2f/fc/5c2ffc3eec3ac2fc8d4299eadbccbff4/6.jpg

    Олег

    сколько ссылок можно максимально добавить в список?
    При добавлении 16тысяч ссылок не дает сохранять настройки

    Или это зависит от настроек мускуля?

    Олег

    Бинго! Спасибо!)

    Олег

    Подскажите, почему перестает работать планировщик?
    всмысле сам крон отрабатывает, в логах записи есть. Вручную открываю ссылку по крону, пишет что «Запуск парсера ссылок site_parser2 готово Обработка завершена» но новых материалов не добавлено.
    В таблице «триггер» указана ссылка из списка. При попытке запустить парсер вручную путем нажатия кнопки «Изменить» — > «Начать парсинг» перекидывает вверх страницы к списку ссылок, url панели меняется с «/wp-admin/admin.php?page=aft_parser_plinks_parser&action=edit&parser_id=12» на «/wp-admin/admin.php?page=aft_parser_plinks_parser&action=edit&parser_id=12#»
    В логах ошибки вида:
    PHP Warning: Invalid argument supplied for foreach() in /public_html/wp-content/plugins/aftparser/pages/site_parser_page.php on line 65, referer: /wp-admin/admin.php?page=aft_parser%2Findex

    Олег

    disable_functions =
    disable_classes =
    вроде как всё разрешено.
    php 7 версии

    Дядько

    Привет, траблы с переводом( уже два часа весит http://prntscr.com/fpjywm
    Сразу вопрос, под каким ір плагин посылает запросы (сайта или браузера)?

    Дядько

    Попробовал этот код: $res = str_replace(«»,»»,$res); // заменяет строку на пустое место
    $res = str_replace(«»,»»,$res);
    Вырезает теги но оставляет то что внутри(

    Арни

    Слушай, такая вот фигня http://prntscr.com/fvkujz
    Меня заблокировали? Попробовал изменить ір сайта, то же самое.
    Парсер оставляет следы?

    Арни

    все есть http://prntscr.com/fvod8g

    Дмитрий

    Здравствуйте, подскажите у можно удалить блок с середиты статьи
    пример:

    ЧИТАЙТЕ ТАКЖЕ

    Новость

      Дмитрий

      http://prntscr.com/g2l4ge пример на скрене

    Алексндр

    Добрый день! Подскажите, пожалуйста, на сайте с которого парсится информация все изображения находятся в тегах . Можно ли вытягивать src на картинки при парсинге и заменять массивный код простой конструкцией с img src?

    Желаемый результат:

    Код изображений на сайте:

      Алексндр

      Изобржения находятся в тегах picture + source media

    Кирилл

    Здравствуйте. Два вопроса: 1)После всех записей появляются: The post «Название записи» appeared first on «Источник записи».
    Как это убрать?
    2) Как сделать так, что бы картинка тоже парселась с того сайта?
    https://prnt.sc/g3js72 https://prnt.sc/g3juay

    Дмитрий

    В середине странице есть блок в тегах текст и ссылка , как можно его исключить? спасибо

      Дмитрий

      в тегах

    Сергей

    Добрый день, у меня после парсинга страницы в тексте которой на которой нет фото, автоматически парсится какая то левая картинка, непонятно откуда взятая, таких на странице нет. Подскажите пожалуйста, как можно исправить? Может быть возможно как указать картинку по умолчанию в случае если нет фото.

    Сергей

    Как оказалось мой вебмани кошелек не очень активен, обещают восстановить доступ в течении 10 дней, как только получу к нему доступ, сразу же перечислю! Еще раз спасибо большое за разработку!

    crack

    500 ошибка при установке

    2l1k

    Доброго времени суток, я наверное поднимаю уже решенную проблему, но в комментах нужного ответа не нашел, я о наболевшей проблеме все пишут о миниатюре записей и я решил написать. Так вот я для начал спарсил 2 сайта, с одного все норм проходит посты с миниатюрками, а вот со вторым сайтом косяки какие то, дублируются картинки при сохранении и миниатюрки у всех постов одни и те же (http://prntscr.com/gjtj24), как это исправить? Я так подумал может у вас там массив какой то или же переменная с одними и теми же картинками, просто при добавлении нового поста не сбрасываются (не очищаются) и в следующие посты парсятся те же самые картинки что и с предыдущей, но мб я ошибаюсь, мб сайт не тот выбрал для парсинга)
    Спасибо!

      2l1k

      http://prntscr.com/gju1ki ссылку на источник вставил, походу там такой переменной нет, при тестировании только тег br и видел больше ничего.

    Денис

    Спасибо Вам огромное за такую работу! Но есть у меня проблема, не могу разобраться как парсить именно новые статьи с источника. В разделе Дополнительно выставил обновление раз в минуту, а в этом блоке http://take.ms/PvCnw мне нужно прописать какую именно ссылку? На страницу категорий сайта-донора если я хочу парсить статьи именно этой категории?
    И так же прочитал вашу статью по регулярным выражениям, но не получается прописать маску по которой нужно искать ссылки могли бы вы привести пример скажем на этой ссылке *** (я так понимаю мне нужно как то выцепить из ссылок именно параметр «cid=9», так как статьи с этим параметром в ссылках относятся к той категории что мне нужна?)
    Заранее спасибо!

    Alex

    Как получить в макросе url страницы, которая парсится? Переменная $link не доступна.

Реплика на stately13 Отменить Реплику