235 комментариев
    Дмитрий

    Здравствуйте, спасибо за парсер! А как можно сделать, чтобы контент который парсится делился не только на заголовок и содержимое, а еще и в произвольные поля вордперсса закидывать?

    Валерия

    Добрый день, подскажете , если границы фрагментов не найти?
    повторяется 3 раза в тексте
    Как быть?

    Алекс

    Сколько будет стоить настроить парсинг новостей из рсс с определенного сайта в определенную категорию и с указанием ссылки на источник?

    Алекс

    текст статьи . ссылка

    Алекс

    Вот исходный rss http://inshahovskoe.ru/rss необходимо чтоб из него текст статьи и ссылка брались правильно. Заголовок и картинка берутся правильно, а вот текст и ссылка ну не как. В категорию тоже у меня правильно падает. Проблема только с текстом и ссылкой.

    Алекс

    Прошу прощения, но судя по описанию фаила версия тут от 6 марта. http://aftamat4ik.ru/?download=1&kccpid=220&kcccount=http://aftamat4ik.ru/files/aftparser.zip http://aftamat4ik.ru/portfolio/aftparser/

    Алекс

    Большое спасибо. Осталось с картинкой решить вопрос. Осталось решить проблему с картинкой в шапку статьи, но сверху вроде уже писали решение попробую. Спасибо за хороший плагин!

    Den

    Привет. Подскажи пож-ста как пользоваться $res .= $this->get_translation($res, $fromlg, $tolg, $key);, если можно конкретный пример для профана в php

    Юрий Емельянов

    Привет. Хороший плагин, спасибо! У меня вопрос. Я спарсил материал по ссылке, мне что то не понравилось я материал удалил а повторно, эту же ссылку если распарсить, парсер пишет, что материал добавлен, но статьи нет. Она не добавляется в админке вордпресса. Что такое может быть? Не подскажете.

    Олег

    спасибо за отличный плагин. подскажите, можно ли у полученных постов установить дату поста ту же, что и в источнике? заранее спасибо.

    Алексей

    Добрый день! Благодарю за отличный парсер. Но у меня после заголовка вылазит еще один кусок кода «topic topic-type-photoset js-topic»>». Не подскажете как его убрать? Заранее благодарю!

    Boulevard

    Благодарю за отличный парсер! Новости из RSS-ленты опубликовал с первого раза без каких-либо доп.настроек даже на локалке))

    Андрей

    Парсер очень крут. Регулярно им пользуюсь. Спасибо огромное!
    Но недавно перестали загружаться картинки, как раньше (типа /wp-content/uploads/img78mr10mzmn.jpg).
    Хотя в коде ничего не менял. Вот: http://joxi.ru/brRLBwVSJ4RP32
    Может вы видите причину этого или подскажите, что делать? Буду очень признателен.

      Андрей

      Сама картинка должна подтягиваться отсюда:

      Я так понимаю, это не предусмотрено плагином. Тут и HTTPS и символы =, $ в пути и названии изображения. Само расширение написано большими буквами. Видно все непросто…

    2l1k

    Доброго времени! Классный парсер!
    Возник вопрос, можно ли сохранить картинки из «background» как тут показано ну или из такого вот тега ?
    И еще каким образом можно сохранят определенные данные в meta tag-и в произвольные поля, на WP я знаю что к чему но с Ваши парсером пока еще не разобрался, если поможете небольшим кодом, буду благодарен!
    СПАСИБО БОЛЬШОЕ!

    Антон

    Весьма неплохой парсер — создатель однозначно крут.
    Но есть ли возможность настроить так, чтоб парсил RSS ленту, в которой отдаются только анонсы, брал с анонса ссылку на полную новость и уже потом парсил и публиковал полный материал. Или что-то в этом плане. Было б очень даже круто.

    Виктор

    Здравствуйте, а как сделать что бы парсер обрабатывал не по 1 материалу в секунду, а быстрее?

    Виктор

    И у меня еще один вопрос, иногда бывает что парсер не хочет обрабатывать большие страницы (712000 символов), что в этом случае делать? Если ли возможность как-то в настройках указать что бы убрать ограничения, если это они конечно.

    Виктор

    Еще возникла проблема, сегодня поставил парсить сайт, а спарсило в 100 раз меньше чем поставил, потом решил протестить выскочило следующее:
    [————- проход_0—————]
    [title]Access forbidden![/title]
    [————- /проход_0—————]

    Подскажите как исправить это.

    Виктор

    wget на компьютере установлен, с помощью командной строки скачивал сайт, а вот в OpenServer не пойму как правильно вписать команду в планировщик задач, заранее спасибо за помощь)

      Виктор

      Вот такой командой получилось запустить:
      %progdir%\modules\wget\bin\wget.exe -q —no-cache http://abc?aftcron=5t4lj3v
      но возникла другая проблема, в отложенный запуск много ссылок не хотят сохранятся, когда сохраняю 2 тысячи ссылок, то все нормально ,а когда 3000 то выскакивает ошибка которую писал недавно.

    Александр

    не парсится с этого сайта https://www.goal.ru/news/ , почему не могу понять? выставляю все по интрукции, помогите пожалуйста,какие конкретно тут селекторы ставить?

    Виктор

    Помогите пожалуйста составить регулярное выражение для того что бы из «Текст» осталось только «Текст». Вот так не получается ]+?>([^<]+?)[|]$1

      Виктор

      Код пропал, вот переписываю:
      Помогите пожалуйста составить регулярное выражение для того что бы из <a name=»_Toc244495232″>Текст </a> осталось только «Текст». Вот так не получается <a name[^>]+?>([^<]+?)<\/a>[|]$1

    Алексей

    Сразу скажу спасибо за хороший и нужный плагин! Единственное возникает проблема с моими настройками:
    /*
    * Приведение кодировки
    * $blog_enc — кодировка страниц блога
    * $src_enc — автоматически определенное значение кодировки. Берется из тега страницы.
    * Если значение $src_enc определяется не верно — укажите его самостоятельно.
    */
    if($blog_enc != $src_enc) $html = mb_convert_encoding($html, $blog_enc, $src_enc);
    $res .= $this->set_title($this->get_border(«fragment_1»,$html));

    $catname = $this->get_border(«fragment_4″,$html);
    $res .= $this->set_catname(mb_substr($catname, 10, 1,»utf-8»));

    $res .= «Первый заголовок»;

    $res .= $this->get_border(«fragment_2»,$html);
    $res = $this->clear_tags_from_trash($res);

    $res .= «Второй заголовок»;

    $res .= $this->get_border(«fragment_5″,$html);
    $res = $this->clear_tags_from_trash($res);

    $res = $this->remove_a_href($res);
    $res = str_replace(‘ ‘, », $res);

    Название: fragment_1
    верх:
    низ:
    Название: fragment_2
    верх:
    низ:
    Название: fragment_4
    верх: Текст
    низ:
    Название: fragment_5
    верх:
    низ:

    При таких настройках тест проходит, выводит все что необходимо. Но как только запускаю парсинг, пишет что добавлено, а запись не появляется. Причем отложенный парсинг тоже не работает. Пробовал несколько версий плагина. Не подскажите что делаю не так?

Добавить Комментарий