MMGP logo
Присоединяйтесь к нашему инвестиционному форуму, на котором уже 650,461 пользователей. Чтобы получить доступ ко многим закрытым разделам и начать общение - зарегистрируйтесь прямо сейчас.
Сервисы и программы для работы с SEO (Поисковой Оптимизацией)
Первый пост Опции темы
Старый 04.12.2018, 08:23
#41
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник рецептов #27: парсинг HH, сбор списка user-agent и парсинг Авито с записью в MySQL
27-й сборник рецептов. В нем собраны рецепты для парсинга списка соискателей на hh.ru, сбора списка юзерагентов и парсинга Авито с записью результатов в MySQL базу данных. Также показан пример отправки файлов в POST запросе. Поехали!

Сбор списка соискателей на HeadHunter
HeadHunter - это один из самых популярных ресурсов для поиска работы. Соответственно, сбор списка соискателей может быть интересен рекрутерам для более эффективного анализа потенциальных кандидатов. Готовое решение для парсинга доступно по ссылке выше.


Получение списка user-agent
Сейчас существует много различных браузеров, которые работают на разных платформах. Многие сайты ограничивают работу со старыми браузерами, а некоторые не отдают контент даже при запросе с юзерагентом относительно нового браузера. В A-Parser можно задавать user-agent для запросов, также существует специальный инструмент, который позволяет при каждом запросе выбирать рандомный из заранее подготовленного списка. Пресет для парсинга таких списков, с возможностью фильтрации по различным параметрам, доступен по ссылке выше.


Парсер Avito с записью в MySQL
Предыдущий пресет для парсинга Авито пользуется большой популярностью. Также наши пользователи часто спрашивают о возможности записи собранных результатов напрямую в базу данных. Поэтому мы подготовили JS парсер, который решает эту задачу. Как обычно, он доступен по ссылке выше.


Кроме этого:Еще больше различных рецептов в нашем Каталоге!

Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 14.12.2018, 15:32
#42
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Видео урок: Разбираем методы для работы с API используя Postman
В данном видео будет сделан краткий обзор некоторых методов API.
YouTube YouTube В этом уроке рассмотрены:
  • обзор методов
  • составление JSON для методов ping,info и oneRequest
  • работа с API используя Postman
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
A-Parser Support вне форума
Старый 26.12.2018, 15:29
#43
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
1.2.360 - поддержка https/tls в Node.js модулях, парсинг мобильной выдачи Яндекса, 2 новых парсера

В уходящем году одним из приоритетных направлений стало развитие JavaScript парсеров и функционала по работе с Node.js. Одним из финальных этапов стал данный релиз, в котором была реализована долгожданная поддержка https/tls в Node.js модулях. Также усилия были сосредоточены на повышении стабильности и производительности. В результате этого было сделано множество наработок, которые уже в первой половине 2019 года планируется выпустить в виде нового A-Parser 2.0, где будет много новых и крутых возможностей.
Команда A-Parser поздравляет всех с Новым годом и Рождеством! Мы желаем вам успехов в делах, прибыльных проектов и ярких идей. Пускай Новый 2019 год будет годом новых возможностей, все задуманное сбывается, а работа приносит удовольствие!
Спасибо что Вы с нами!!!
В новогоднем релизе, кроме снеговика, было сделано следующее:
Улучшения
  • Добавлена поддержка https/tls в Node.js модулях, что позволяет использовать все модули, которые работают с API по https, а также по TLSSocket (smtp и т.п.)
  • Полностью переписан и обновлен SE::Yandex, добавлена возможность парсить мобильную выдачу, а также значительно увеличена производительность
  • Добавлен парсер позиций в Bing: SE::Bing::Position
  • Добавлен парсер Util::YandexRecognize, позволяющий разгадывать каптчи без использования сторонних сервисов
  • Улучшен сбор почт в HTML::EmailExtractor
  • Улучшена работа опции Dynamic threads limit
  • В SE::Yandex использование прокси для загрузки картинки каптчи теперь определяется параметром Use proxy парсера Яндекса
  • В связи с неактуальностью удалены SE::Bing::AddURL, Rank::OpenSiteExplorer и Rank::OpenSiteExplorer::Extended
Исправления в связи с изменениями в выдачеИсправления
  • Исправлен Safe search в SE:: DuckDuckGo::Images
  • Исправлены падения при работе с SE:: DuckDuckGo::Images
  • Исправлена ошибка при работе с модулем mysql2 версии более 1.5.3
  • Исправлен парсинг количества результатов в SE::Yandex
A-Parser Support вне форума
Старый 05.01.2019, 15:04
#44
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник статей #6: работа с API, сохранение в YML и мануал по подключению Node.js модулей
Это 6-й сборник статей, и в нем мы разберемся, как подключать к парсеру Node.js модули, научимся сохранять собранные данные в формате YML, а также изучим работу с API на реальном примере с созданием простого приложения. Поехали!
Работаем с API, часть 1
В этой статье на реальном примере будет показана работа с A-Parser через API. В результате будет создано простое приложение, которое будет получать позицию сайта по ключу в Гугл или Яндекс. Все подробности - по ссылке выше.


Выгрузка товаров для Я.Маркета в формате YML
YML (Yandex Market Language) - это стандарт представления данных, который используется для загрузки/выгрузки информации о товарах в Яндекс.Маркете. Используя А-Парсер, можно спарсить товары с различных сайтов и сохранить их в данном формате для дальнейшего импорта в Маркет. О том, как это сделать, можно почитать в статье по ссылке выше.


Подключение пакетов Node.js в A-Parser
Как известно, в A-Parser можно использовать Node.js модули для более эффективного парсинга. Поэтому, по ссылке выше мы опубликовали небольшой мануал по их установке и использованию.


Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Предыдущие сборники статей
A-Parser Support вне форума
Старый 15.01.2019, 16:23
#45
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник рецептов #28: скидки в Google Play, автоматизация парсинга WordStat и типы Яндекс подсказок
28-й сборник рецептов. В нем будет показан способ автоматизации парсинга данных из Wordstat, пример парсинга информации о приложениях со скидками в Google Play, а также готовое решение для сбора подсказок из Яндекс вместе с их типами. Поехали!

Парсинг приложений со скидками в Google Play
Периодически в Google Play разработчики предлагают скидки на приложения, иногда на короткий срок платные становятся полностью бесплатными. С помощью A-Parser можно искать подобные предложения. Кроме этого, в этом парсере собирается множество дополнительных данных и используется сохранение в sqlite базу данных, поэтому его можно рассматривать как еще один пример работы с базами данных в А-Парсере. Готовое решение доступно в каталоге по ссылке выше.


Парсер поисковых подсказок Яндекс
В A-Parser есть стандартный парсер Яндекс подсказок, который по заданным ключевым словам собирает подсказки. Но Яндекс классифицирует подсказки по различным типам, которые в свою очередь позволяют использовать их более рационально, применяя соответствующие фильтры. Стандартный парсер подсказок не возвращает типы, поэтому по ссылке выше опубликован JS парсер для сбора подсказок вместе с их типами.


Автоматизация парсинга Wordstat
В этом парсере реализован автоматический сбор данных из WordStat. При этом, парсер проверяет наличие необходимых для данной задачи аккаунтов, и если требуется - то автоматически регистрирует их. Такое решение может быть полезно для организации периодического парсинга WordStat в автоматическом режиме. Готовое решение - по ссылке выше.


Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 25.01.2019, 11:21
#46
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
1.2.387 - улучшенный Просмотр логов, новый парсер Яндекс SafeBrowsing, улучшения в JS парсерах

Улучшения
  • Улучшение Просмотра логов:
    • Фильтр по неудачным/выполняющимся задачам
    • Сортировка по времени выполнения
    • Поддержка пагинации и поиска по логам
    • Отображение парсера и запроса
  • Добавлен новый инструмент tools.memory - key/value хранилище в памяти
  • Добавлен новый парсер SE::Yandex::SafeBrowsing, который позволяет проверить сайт в блэклисте Яндекса
  • В SE::Google::Trends реализована возможность сравнивать данные по ключевым словам
  • Улучшения в логике Shop::Amazon
  • Улучшена стабильность JavaScript парсеров (движка v8)
  • JS парсеры: добавлен метод .addElement, который позволяет заполнять массивы в results более удобным способом
  • JS парсеры: добавлена опция resultArraysWithObjects для this.parser.request, которая позволяет возвращать массив объектов в результатах при вызове другого парсера
  • JS парсеры: добавлено кэширование DNS ответов
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена обработка пустых запросов в JavaScript парсерах
  • Исправлен вывод картинок в лог, проблема появилась в одной из предыдущих версий
  • Исправлена работа с некоторыми видами прокси
  • Исправлена работа опции Stop when found в SE::Yandex::Position
  • В SE::Yandex при получении ошибки от антигейта не менялись прокси
  • Исправлен парсинг ссылок на потенциально опасные сайты в SE::Yandex
  • JS парсеры: исправлена работа check_content с регулярными выражениями, в которых содержится кириллица
  • JS парсеры: исправлено зависание потоков при использование tls
  • JS парсеры: множественные исправления в работе сокетов
A-Parser Support вне форума
Старый 05.02.2019, 15:47
#47
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник рецептов #29: язык ключевых слов, нормализация запросов и сбор тайтлов в глубину
29-й сборник рецептов, в котором опубликован JS парсер для определения языка ключевых слов, предложен вариант решения для нормализации запросов, а также показано, как парсить карту сайту и одновременно собирать тайтлы страниц. Поехали!

Определение языка ключевого слова через Яндекс Переводчик
В A-Parser есть несколько встроенных парсеров для определения языка страницы. Но иногда возникают задачи отфильтровать список ключевых слов по одному или нескольким языкам. Определять язык текстовой строки довольно неплохо умеют различные переводчики, поэтому для решения задачи был выбран Яндекс Переводчик, и по ссылке выше доступен JavaScript парсер, реализующий определение языка ключевого слова.


Нормализатор запросов
При сборе семантического ядра часто возникает вопрос - какая форма запроса является наиболее частотной, например: "купить диван" или "диван купить". Если запрос 3-х или 4-хсловный, то вариантов становится еще больше. Решение такой задачи на базе парсера WordStat доступно в нашем Каталоге по ссылке выше.


Карта сайта и заголовки
Сбор карты сайта - это довольно простая задача для А-Парсера, которая решается встроенным парсером ссылок. Но иногда, кроме простого сбора ссылок, нужно еще и собрать тайтлы. И это можно делать параллельно с проходом по ссылкам в глубину. Готовый пресет доступен по ссылке выше.


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 15.02.2019, 14:44
#48
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Видео урок: Создание JS парсеров. Использование Node.js модулей
Продолжение цикла уроков по созданию JavaScript парсеров. В этом уроке показано как использовать Node.js модули при написании собственных парсеров.
YouTube YouTube В уроке рассмотрено:
  • Работа с Node.js и Node package manager (npm)
  • Первый запуск npm, установка модулей (пакетов)
  • Использование модулей при создании JS парсера
  • Ресурсы для работы с npm
Ссылки:Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
A-Parser Support вне форума
Старый 26.02.2019, 17:32
#49
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник рецептов #30: оценка страниц, форматирование дат и парсинг дропов
30-й сборник рецептов, в котором опубликован пресет для оценки сайтов с помощью open source инструмента Lighthouse, рассмотрен способ форматирования дат в парсере SE::Google::Trends SE::Google::Trends, а также показан способ поиска удаленных доменов. Поехали!

Оценка страниц с использованием Lighthouse
Еще один сервис по оценке сайтов, на этот раз от Google. С его помощью можно оценить веб-страницу по 4-м критериям: Performance, Accessibility, Best Practices и SEO. Пресет доступен в нашем Каталоге по ссылке выше.


Форматирование даты в парсере SE::Google::Trends
В A-Parser есть парсер, который позволяет собирать данные из Google Trends. Но даты в этом парсере возвращаются в формате Unixtime, что немного усложняет анализ получаемых данных. По ссылке выше показан простой способ преобразования дат к более удобному виду.


Парсер expired domains
Пресет для поиска и сбора дропов, а также их характеристик с сайта expireddomains.net. В качестве запросов нужно указывать ключевые слова, которые должны быть в доменном имени.


Еще больше различных рецептов в нашем Каталоге!
Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 28.02.2019, 12:01
#50
 
Регистрация: 17.02.2019
Сообщений: 144
Благодарностей: 10
Мне вот реально интересно, кто-нибудь сейчас пользуется парсерами для продвижения обычного сайта?
WetCloud вне форума
Старый 08.03.2019, 14:59
#51
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
1.2.434 - множество улучшений и новых возможностей в парсерах, оптимизация работы, поддержка SOCKS4

Улучшения
  • В SE::Yandex добавлен парсинг значков
  • В SE::Google::Modern добавлена опция Disable autocorrect, которая позволяет отключить автоисправление Гугла и парсить выдачу именно по указанному запросу
  • В SE::Yahoo добавлен выбор страны, языка и Safe Search, обновлен список доменов
  • В Net:: DNS добавлена возможность выводить записи любого типа
  • В Rank::MajesticSEO добавлена проверка контента и поддержка сессий
  • Значительно улучшенSE::Google::Suggest, добавлены новые возможности
  • В SE::IxQuickдобавлен параметр Family filter, позволяет выбрать уровень фильтрации
  • В Shop::Amazon добавлена возможность парсить количество продавцов для каждого товара
  • Теперь в SE::Yandex при получении 404 кода ответа парсер будет повторять попытку, также улучшена проверка контента
  • Теперь вRank::SEMrush при получении 403 кода ответа прокси будет баниться
  • Добавлена поддержка SOCKS4 прокси
  • Оптимизирована загрузка и сохранение конфига и файлов заданий
  • Улучшена скорость загрузки JS парсеров
  • Уменьшено использование памяти в JS парсерах
  • Улучшение производительности при использовании сокетов в JS парсерах
Исправления в связи с изменениями в выдачеИсправления
  • В SE::Google::Modern исправлена проблема, при которой запрос считается неудачным при использовании Parse not found
  • Исправлена обработка пустой выдачи в SE::Yandex
  • Исправлена проблема, когда SE:: DuckDuckGo не парсил запросы в которых больше 1 слова
  • JS парсеры: исправлена работа setTimeout на Windows
  • Исправлен ряд ошибок, которые появились в процессе оптимизации парсера
A-Parser Support вне форума
Старый 19.03.2019, 16:56
#52
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник статей #7: сохранение в xlsx, работа с API и обзор методов автоматизации
7-й сборник статей. В нем мы научимся сохранять результаты в виде Excel файлов, продолжим изучение работы через API, а также ознакомимся с 5-ю способами автоматизации последовательного выполнения нескольких заданий. Поехали!

Сохранение результатов в формате Excel (.xlsx)
Вывод результатов в виде xlsx файлов (стандартный формат Excel) - это очень популярный вопрос среди пользователей A-Parser. Ранее такой возможности не было, но с добавлением поддержки Node.js модулей это стало возможным. Поэтому мы публикуем статью, в которой показан реальный пример парсинга с сохранением в Excel. Ознакомиться со всеми подробностями можно по ссылке выше.


Работаем с API, часть 2
Это вторая часть из цикла статей по работе с A-Parser через API. В ней на примере парсинга e-mail будет рассмотрен метод addTask. Все детали - по ссылке выше.


Обзор вариантов последовательного выполнения нескольких заданий
Очень часто возникают задачи, решение которых требует использования возможностей сразу нескольких разных парсеров и при этом результаты работы одного нужно передавать в следующий. А-Парсер - это очень гибкий инструмент, поэтому существует сразу несколько способов, как автоматизировать последовательное выполнение нескольких заданий, при этом максимально автоматизируя работу и повышая производительность. Описание всех возможных методов читайте в обзоре по ссылке выше.

Если вы хотите, чтобы мы более подробно раскрыли какой-то функционал парсера, у вас есть идеи для новых статей или вы желаете поделиться собственным опытом использования A-Parser (за небольшие плюшки ) - отписывайтесь здесь.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 29.03.2019, 13:39
#53
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Видео урок: Работа с API, часть 2
Вторая часть из цикла уроков о работе с API A-Parser. В видео на реальных примерах показана работа с методами addTask, getTaskState, getTaskConf и getTaskResultsFile.
YouTube YouTube В этом уроке рассмотрены:
  • методы API для постановки длительных задач, а также для просмотра информации о задании
  • составление JSON для используемых API запросов
  • функция Получить API запрос
  • демонстрация работы с API, используя Postman
Документация по API: https://a-parser.com/wiki/user-api/

Также рекомендуем статью с несколькими интересными кейсами использования A-Parser от руководителя оптимизаторов в «Ашманов и партнёры» Никиты Тарасова: https://vc.ru/seo/61162-pravilno-sob...izheniya-sayta

Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
A-Parser Support вне форума
Старый 09.04.2019, 18:04
#54
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
1.2.455 - поддержка puppeteer, все методы в Net::HTTP, обновление Bypass Cloudflare

Начиная с версии 1.2.455 мы начинаем официальную поддержку Node.JS модуля puppeteer - средства автоматизации работы с браузером Chrome(Chromium), благодаря чему возможен полноценный рендеринг DOM с поддержкой JS. В качестве примера мы выкладываем парсер, который делает скриншоты сайтов в формате PNG, доступен выбор размера скриншота. Chromium может быть запущен как на Windows, так и на Linux серверах без GUI.Улучшения
  • SE::Bing::Images полностью переписан, добавлен сбор дополнительных данных, а также в настройках добавлен выбор региона и языка интерфейса
  • В Net::HTTP добавлены все методы в настройки, а также реализована возможность переопределения через заголовок Method
  • Добавлена возможность форматирования всех цифр в интерфейсе
  • JS парсеры: в this.parser.request для override добавлена опция needData, которая определяет передавать или нет в ответе data/pages[], может использоваться для оптимизации
  • JS парсеры: добавлена поддержка модулей url и ws
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена работа функции Bypass Cloudflare в Net::HTTP
  • Исправлена ошибка, из-за которой при определенных настройках не писался Начальный текст
  • Исправлена работа некоторых socks4 прокси
  • Исправлена ошибка в $tools.base64.encode() при работе с кириллическими символами
  • В Shop::Amazon исправлена ошибка, при которой игнорировался домен
  • JS парсеры: исправлена редкая ошибка в работе сокетов в Node.js
A-Parser Support вне форума
Старый 19.04.2019, 15:18
#55
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Сборник рецептов #31: скидка -50% на XEvil, скриншоты страниц, подсказки Я.Маркета и правописание
31-й сборник рецептов. В нем будет показан способ создания скриншотов веб-страниц, парсинг подсказок Яндекс Маркета, а также проверка правописания в Google. Кроме этого, только до конца апреля доступна возможность купить XEvil со скидкой. Далее обо всем по порядку.

Скидка -50% на покупку XEvil для существующих и новых пользователей A-Parser
Для всех существующих и новых пользователей A-Parser действует скидка на покупку XEvil -50%!
XEvil - это простая, быстрая и удобная программа для полностью автоматического распознавания и обхода подавляющего числа капч и рекапч, без необходимости подключения каких-либо сторонних сервисов. Использование XEvil в связке с A-Parser позволяет значительно удешевить парсинг ресурсов, где необходимо разгадывать капчи/рекапчи, при этом практически не теряя в скорости.
Акция действует до конца апреля. Количество промокодов ограничено, поэтому не упустите возможность воспользоваться скидкой!
Для получения промокода на покупку XEvil пишите в тикеты.


JS::Chrome::ScreenshotsMaker
Возможность загружать страницы с полной обработкой всех скриптов, аналогично браузеру - это один из самых популярных фичреквестов для A-Parser. Поэтому буквально недавно была добавлена поддержка Node.js модуля puppeteer, с помощью которого теперь можно получать полностью отрендеренные страницы. И мы публикуем первый пример по работе с ним - парсер для создания скриншотов веб-страниц. Больше информации, пример работы и готовый парсер - все это доступно по ссылке выше.


Парсер подсказок Яндекс.Маркет
Еще один парсер подсказок, на этот раз из Яндекс Маркета. Собираются подсказки, их популярность (частота), тип, а также, опционально, категория (включая полный путь родительских категорий). Готовый парсер, как обычно, доступен в нашем Каталоге по ссылке выше.


Проверка правописания в Google
Данный парсер позволяет проверить ключевые слова через поиск Google на предмет опечаток и получить исправленные варианты. Готовый пресет доступен по ссылке выше.


Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.
A-Parser Support вне форума
Старый 30.04.2019, 17:51
#56
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Видео урок: Работа с MySQL
Видеоурок по работе с MySQL в A-Parser. В нем на реальном примере показано как работать с базами данных MySQL, используя Node.js модуль mysql2.

YouTube YouTube
В этом уроке рассмотрены:
  • Установка и подключение модулей
  • Некоторые основы языка запросов SQL
  • Создание базы данных MySQL
  • Получение и запись данных в БД, используя JS-парсеры
Полезные ссылки:Оставляйте комментарии и подписывайтесь на наш канал на YouTube!
A-Parser Support вне форума
Старый 28.03.2020, 11:53
#57
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Автор темы Re: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров

Сборник рецептов #39: бот-опросник, парсер hotline.ua и copart.com

Представляем вашему вниманию 39-й сборник рецептов, в который вошли:
  • телеграмм бот опросник
  • парсер агрегатора цен hotline.ua
  • парсер аукционов транспортных средств copart.com
Телеграмм бот опросник

Данный бот позволяет организовать ежедневный опрос сотрудников, при этом список вопросов можно гибко менять. Все настройки берутся из Google таблицы, а также туда пишутся ответы по каждому сотруднику.
Также, этот пример демонстрирует возможность создания телеграмм бота на базе A-Parser и работу с Google таблицами.


Парсер hotline.ua

hotline.ua - это самый большой агрегатор цен в Украине. С его помощью можно мониторить и анализировать цены на товары у конкурентов или искать наиболее выгодные предложения среди большого количества интернет-магазинов.



Парсер copart.com

Copart является одним из крупнейших интернет аукционов, специализирующихся на продаже новых и б/у автомобилей. По официальной информации каждый день на аукционе выставляется на продажу более 150 000 транспортных средств.



Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники рецептов

A-Parser Support вне форума
Старый 08.04.2020, 10:09
#58
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Автор темы Re: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров

Видео урок: Именование файлов результатов

Мы начинаем публикацию серии коротких видеоуроков, каждый из которых будет посвящен какому-то одному функционалу.
И в этом уроке будут рассмотрены варианты формирования имени файла результата.


В видео рассмотрено:
  • Нумерация файла результата в соответствии с запросами
  • Нумерация файла результата + часть имени запроса
  • Именование файла результата по запросу, если запрос линк

Полезные ссылки:
Оставляйте комментарии и подписывайтесь на наш канал на YouTube!

A-Parser Support вне форума
Старый 17.04.2020, 14:22
#59
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Автор темы Re: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров

1.2.852 - новый парсер для Google Keyword Planner, Native NodeJS, множество исправлений и улучшений


Улучшения
  • Добавлен парсер SE::Google::KeywordPlanner
    • собираются списки подсказок и варианты ключевых слов
    • для каждого варианта парсится среднее кол-во запросов в месяц, конкуренция, объемы поиска, а также минимальная и максимальная ставки
    • присутствует возможность указывать несколько ключевых слов в запросе
  • В SE::Yandex::ByImage добавлена функция Get full links to page, которая позволяет получать реальные ссылки на страницы
  • В SE::Yandex::SQI добавлены переменные сбор количества отзывов и оценок, а также рейтинга
  • Улучшена проверка правильности разгадывания каптчи в парсерах Яндекса
  • Автоматическое увеличение лимитов на ОС Linux
  • Улучшена работа с регулярными выражениями
  • При бане прокси в лог задания теперь выводится более детальная информация
  • Native NodeJS переведена из стадии альфы в бету, проведено множество оптимизаций, за счет чего в большинстве сценариев это дает повышение максимальной скорости в 1.5-2 раза, а также уменьшение потребление памяти в 2-4 раза
    • Начиная с 1.2.822 все бета версии имеют включенный Native NodeJS, стабильные версии выходят с включенным oldnode
  • Native NodeJS: добавлена экспериментальная поддержка HTTP/2
  • Native NodeJS: обновление Node.js до актуальной версии
  • JS парсеры: добавлена опция allow_dangerous_node_modules, подробнее тут
Исправления в связи с изменениями в выдачеИсправления
  • Исправлена работа Net::Whois с доменами 3го уровня, а также улучшена проверка получаемого ответа
  • Исправлена работа Extra query string в SE::Bing
  • Исправлена работа Rank::SEMrush и Rank::SerpStat::Keyword при получении ответа без данных
  • Исправлен баг с типами переменных
  • Исправлена ошибка, при которой запросы ошибочно считались неудачными при постановке задания на паузу
  • Исправлена работа Bypass Cloudflare
  • Исправлен динамический лимит потоков
  • Исправлена ошибка при использовании Request delay
  • Исправлено предупреждение о превышении лимита в Поле запросов
  • Исправлена работа $tools.task.id в имени файла результата
  • JS парсеры: исправлены получение сессий и работа http2 (баг появился в одной из предыдущих версий)
  • JS парсеры: исправлено определение кодировки страницы
  • Native NodeJS: исправлено поведение при некоторых ошибках
  • Native NodeJS: исправлена проблема при обновлении A-Parser на OS Windows
  • Native NodeJS: исправлена работа save_to_file, а также еще ряд ошибок
  • Native NodeJS: исправлена работа SOCKS5 с авторизацией
  • Native NodeJS: исправлена подстановка данных после Конструктора запросов
A-Parser Support вне форума
Старый 27.04.2020, 15:37
#60
Любитель
 
Регистрация: 10.01.2017
Сообщений: 173
Благодарностей: 0
Автор темы Re: A-Parser 1.1 - продвинутый парсер ПС, кейвордов, контента, показателей, 70+ парсеров

Сборник рецептов #40: посещаемость организаций, SSL сертификаты, ikea и анализ доменов

Представляем вашему вниманию 40-й сборник рецептов, в который вошли:
  • парсер данных о посещаемости организаций
  • парсер данных о SSL сертификатах
  • парсер товаров на ikea.com
  • комплексный пресет для анализа доменов по ряду характеристик
  • способ извлечения доменов из ссылок без фактического захода на страницу

Посещаемость в Google Maps

В поисковой выдаче Google для определенных запросов отображается расширенный сниппет с информацией об организации из Google карт. В частности, обычно отображается информация о посещаемости в разрезе дней недели.
Представляем парсер, который собирает данные о посещаемости.



Данные по SSL сертификату

Данный парсер собирает информацию о SSL сертификате сайта. В качестве источника данных используется сторонний ресурс.



Парсер ikea.com

Парсер данных из ikea.com, который позволяет собирать различную информацию о товарах. Согласно данным из Википедии, ikea - это одна из крупнейших в мире торговых сетей по продаже мебели и товаров для дома.



Кроме этого:
Еще больше различных рецептов в нашем Каталоге!
Предлагайте ваши идеи для новых парсеров здесь, лучшие будут реализованы и опубликованы.

Подписывайтесь на наш канал на Youtube - там регулярно выкладываются видео с примерами использования A-Parser, а также следите за новостями в Twitter.

Все сборники рецептов

A-Parser Support вне форума
Войдите, чтобы оставить комментарий.
Быстрый переход