최고의 WordPress 스크레이퍼 플러그인 – 콘텐츠를 자동으로 스크랩하는 방법?

게시 됨: 2021-02-09

가격 비교 사이트나 직배송 매장을 만들고 싶다면 워드프레스 스크래퍼 플러그인이 매우 유용할 수 있습니다. 웹 스크래핑은 웹에서 정보를 수집하는 것으로 구성됩니다. 그런 다음 해당 정보를 구성하거나 가져옵니다.

어떤 사람들은 스크래핑을 비윤리적이거나 의심스러운 활동 으로 간주 합니다 . 실제로 웹 스크래핑은 변경 사항을 파악하는 데 도움이 될 수 있습니다. 가격 비교 사이트 는 스크랩한 데이터를 사용하여 방문자에게 가장 정확한 정보를 제공할 수 있습니다.

사용할 수 있는 WordPress 스크래핑 플러그인 이 많이 있습니다. 이 게시물에서는 필요에 맞는 도구를 선택할 수 있도록 최고의 WordPress 콘텐츠 크롤러 플러그인과 해당 기능에 대해 설명하겠습니다.

목차

최고의 WordPress 스크레이퍼 플러그인

다음은 사용할 수 있는 최고의 WordPress 콘텐츠 스크레이퍼 플러그인입니다. 유료 옵션이지만 모두 유용한 기능으로 가득 차 있습니다.

Octolook 스크랩

Octolook Scrapes는 지금까지 가장 진보된 콘텐츠 크롤러이자 WordPress 스크레이퍼 플러그인입니다. 시각적 선택기를 사용하여 모든 사이트의 콘텐츠를 자동으로 스크랩합니다. 작동하려면 시각적 선택기를 대상 페이지의 해당 WordPress 필드와 일치시켜야 합니다. 프로그래밍 지식이나 전문 지식이 필요하지 않습니다.

플러그인의 사용하기 쉬운 인터페이스 는 최상의 사용자 경험을 제공하기 위해 만들어졌습니다. 구성은 몇 가지 기본 단계만 수행하면 됩니다. 백그라운드에 남겨둘 수 있으며 정보는 소스 웹사이트에서 가져옵니다.

크롤링을 위한 새 작업을 생성하거나 기본 설정을 사용할 수 있습니다. 이 플러그인을 WordPress RSS 수집기 플러그인 으로 사용할 수도 있습니다.

Scrapes는 지원되는 모든 필드를 자동으로 채웁니다. Octolooks WordPress 스크레이퍼 플러그인은 다음 페이지, 추천 이미지, 콘텐츠 및 기타 중요한 정보를 소스 웹사이트의 해당 필드와 자동으로 일치시킵니다.

WordPress용 콘텐츠 크롤러 플러그인.

템플릿 옵션 을 사용하여 게시물 레이아웃을 개인화하고 스크랩한 정보가 웹사이트에 표시될 순서를 선택할 수 있습니다.

정규식 찾기 및 바꾸기 기능 은 스크랩한 텍스트에서 특정 단어나 구를 제거할 수 있습니다. 당신은 또한 그들을 대체하기 위해 자신의 단어를 사용할 수 있습니다. 실행할 수 있는 규칙 수에는 제한이 없습니다.

빼기, 더하기, 나누기, 곱하기 및 기타 수학 연산 을 실행할 수 있습니다. 이 WordPress 콘텐츠 크롤러 플러그인은 새로운 수식을 만들고 다른 사용자 정의 필드의 숫자를 결합할 수 있습니다.

Yandex Translate, DeepL Translate, Bing Microsoft Translate 또는 Google 번역은 스크랩한 콘텐츠를 자동으로 번역 할 수 있습니다. 또는 Weglot(Weglot 검토 확인) 및 WPML(WPML 검토 참조)과 같은 플러그인을 사용하여 WordPress 사이트를 자동으로 번역할 수 있습니다.

WordPress 자동 스피너 플러그인 중 하나를 사용하여 스크랩한 콘텐츠를 변경하거나 WordAi(WordAi 검토 참조) 및 Spin Rewriter(Spin Rewriter 검토 확인)와 같은 타사 스피너 서비스가 작업을 대신하도록 할 수 있습니다.

소스 웹사이트에서 스크랩한 정보는 설정된 규칙을 충족하도록 필터링 할 수 있습니다. 콘텐츠를 모니터링하여 필터에서 사이트로 성공적으로 전달되는지 확인합니다.

WooCommerce 스토어의 사용자 정의 필드 지원 및 사용자 정의 게시물 유형은 제품 형태의 콘텐츠를 스크랩하는 데 사용할 수 있습니다.

외부 수입업자 프로

External Importer Pro 플러그인을 사용하면 전자상거래 웹사이트에서 제품 데이터추출 하여 WooCommerce 사이트로 가져올 수 있습니다. API 액세스, CSV 피드 또는 XML이 필요하지 않습니다.

플러그인은 매장 사이트에서 직접 완전한 제품 데이터를 추출합니다. 특정 목록이나 제품 URL을 입력하기만 하면 됩니다. 처리해야 할 부피가 큰 CSV 파일이나 API 액세스없습니다 . 제품 가용성 및 가격은 자동으로 업데이트됩니다 . 가져온 정보의 모든 측면을 관리할 수 있습니다.

외부 수입업체 제품 목록 수입 예시.

기존 제휴 IDS는 제휴 링크를 생성할 때 자동으로 사용됩니다(설정 옵션을 통해 추가한 경우). 직송 목적으로 제품을 수입하려는 경우 직송 제품 마진을 설정할 수도 있습니다.

특징:

  • 자동 동기화 – 제품 가용성 및 가격 정보가 자동으로 업데이트됩니다. 현재 품절된 상품은 자동으로 제거될 수 있습니다. 업데이트는 다른 작업을 방해하지 않도록 백그라운드에서 예약됩니다.
  • 자동 가져오기 – 새 제품이 대상 사이트의 목록 페이지에 나타나면 자동으로 웹사이트로 가져옵니다 . 매장에는 항상 최신 업데이트 제품이 있습니다.
  • 제품 무제한 – 원하는 만큼 제품을 가져올 수 있습니다. 당신은 당신이 필요로 많은 온라인 상점 사이트에서 무제한 항목을 가져올 수 있습니다.
  • 차단 방지 – 플러그인은 쿠키 세션, 일일 쿼리 할당량, 임의 쿼리 간격, 실제 브라우저의 헤더, robots.txt 규칙, 사용자 에이전트 교체, 요청 제한 등을 읽고 준수하므로 막힌.
  • 제휴 네트워크 사용 – 딥 링크를 사용하거나 동적으로 변경하여 제휴 링크를 생성합니다.
  • Dropshipping 기능 – dropshipping 상점을 만들 수 있으며 항목을 "간단한" WooCommerce 제품으로 추가할 수 있습니다. 가격 인상에 대해 유연한 규칙을 설정할 수 있습니다.
  • 로컬 및 글로벌 속성 – 글로벌 속성(또는 분류)으로 할당된 제품 사양을 결정할 수 있습니다. 그런 다음 다양한 WooCommerce 카탈로그 필터 및 위젯을 구현할 수 있습니다.
  • URL별 외부 이미지 – 외부 이미지를 로컬 미디어 라이브러리에 저장하지 않고 표시하는 기능입니다. 외부 소스 사이트를 스크랩하여 사이트에 표시하려는 주요 갤러리 및 이미지를 가져올 수 있습니다. 이렇게 하면 서버의 하드 드라이브 저장 공간이 크게 줄어듭니다.
  • 동적 카테고리 – 추출된 카테고리 경로가 있는 제품은 자동으로 해당 카테고리로 가져옵니다.

이 WordPress용 콘텐츠 크롤러 플러그인에 대한 자세한 내용은 내 External Importer Pro 리뷰를 확인하세요.

WP 콘텐츠 크롤러

WP Content Crawler 플러그인은 거의 모든 사이트에서 자동으로 정보를 추출할 수 있습니다. CSS 선택기 를 사용하여 콘텐츠를 찾습니다. 대상 사이트에서 해당 요소를 클릭하여 CSS 선택기를 쉽게 찾는 Visual Inspector 도구를 사용합니다.

WordPress 콘텐츠 크롤러 플러그인.

특징:

  • Visual Inspector – 요소를 클릭하면 해당 요소에 대한 CSS 선택기가 식별됩니다. 사용할 수 있는 대체 CSS 선택기를 찾을 수도 있습니다. 이러한 작업을 수행하기 위해 관리자 패널을 떠날 필요가 없습니다.
  • 게시물 크롤링 (스크레이핑, 캡처 및 저장) – 게시물 URL이 정의되면 이 WordPress 콘텐츠 크롤러가 백그라운드에서 자동으로 해당 게시물을 크롤링합니다. 이것은 설정이 구성된 후에 발생합니다.
  • 게시물 재크롤링 (업데이트) – 게시물을 자동으로 재크롤링하여 최신 콘텐츠를 유지할 수 있습니다. 오래된 게시물을 무시하도록 선택하고 업데이트 간격을 선택하고 특정 게시물을 업데이트할 수 있는 횟수를 제한할 수 있습니다.
  • 콘텐츠 템플릿 – 단축 코드를 사용하여 갤러리, 목록 항목, 제목, 게시물 콘텐츠 및 발췌 템플릿을 만들 수 있습니다. 옵션 상자를 사용하여 모든 CSS 선택기 값에 대한 템플릿을 만들 수 있습니다.
  • 페이지를 매긴 게시물 – 페이지를 매긴 게시물도 저장할 수 있습니다. 더 이상 단일 페이지 게시물로 검색을 제한할 필요가 없습니다.
  • 각 웹사이트에 대한 사용자 정의 일반 설정 - 각 게시물에 대한 사용자 정의 일반 설정을 설정할 수 있습니다.
  • 모든 이미지 저장 – 게시물 내용의 모든 이미지를 저장할 수 있습니다.
  • 이미지를 갤러리로 저장 - 대상 페이지에서 찾은 이미지를 갤러리 로 저장할 수 있습니다.
  • 프록시 옵션 – IP가 특정 사이트에 액세스할 수 없는 경우 하나 이상의 프록시를 사용하여 대상 사이트에서 정보를 가져올 수 있습니다.
  • 자동 번역 – Amazon Translate API, Google Cloud Translation API, Microsoft Translator Text API 또는 Yandex Translate API를 사용하여 게시물을 자동으로 번역할 수 있습니다.
  • 자동 회전 – 회전은 크롤링된 콘텐츠를 자동으로 다시 작성할 수 있습니다. 이것은 검색 엔진 순위를 높이는 데 도움이 될 수 있습니다. 플러그인은 Turkce Spin API 및 Spin Rewriter API와 같은 유료 서비스와의 통합을 제공합니다.
  • WooCommerce 제품 저장 – 속성, 고급 옵션, 재고, 배송 및 제품 가격을 저장할 수 있습니다. 항목은 외부 또는 단순 제품으로 저장할 수 있습니다. 항목을 가상으로 정의하거나 다운로드 가능한 파일 옵션을 생성할 수도 있습니다.
  • 정규식 – 정규식은 "찾기-바꾸기" 옵션에서 지정할 수 있습니다. 이렇게 하면 무엇이든 쉽게 찾고 교체할 수 있습니다. 수정자와 구분 기호를 구현하여 검색을 더욱 세분화할 수도 있습니다.
  • "alt" 및 "title" 속성 저장 - 모든 "title" 및 "alt" 속성은 이미지를 저장할 때 대상 사이트에서 자동으로 검색됩니다. 그런 다음 해당 속성이 저장된 각 이미지에 할당됩니다. 검색 엔진 최적화 전략에 맞게 템플릿을 만들 수 있습니다.
  • 수동 크롤링 도구 – 수동 크롤링 유틸리티를 사용하여 한 번에 두 개 이상의 게시물을 저장하기 위해 다양한 URL을 입력할 수 있습니다. 도구에 카테고리 URL을 입력하여 적절한 게시물 URL을 얻을 수도 있습니다. 다른 게시물을 동시에 크롤링하도록 크롤러를 설정할 수 있습니다.

Scraper – WordPress용 콘텐츠 크롤러 플러그인

WordPress용 Scraper Content Crawler 플러그인은 모든 사이트의 콘텐츠와 게시물을 자동으로 복사하는 플러그인입니다. 고유한 기능과 기능으로 콘텐츠 제작을 한 단계 더 끌어 올립니다.

WordPress 콘텐츠 스크레이퍼 플러그인.

특징:

  • 모든 웹사이트를 스크랩할 수 있습니다. – Regex 및 Xpath 방법을 사용하면 원하는 사이트를 스크랩할 수 있습니다.
  • 속성긁을 수 있습니다. - Scraper는 요소 속성도 검색할 수 있습니다. 즉, 링크, 이미지 소스, 비디오 소스를 얻을 수 있습니다.
  • 추천 이미지 - 모든 이미지를 추출하여 추천 이미지로 설정할 수 있습니다.
  • 콘텐츠 스피너 – AI Spinner 플러그인이 완전히 지원됩니다. 이 플러그인을 사용하여 고유한 콘텐츠를 만들 수 있습니다.
  • 언어 번역 – 스크레이퍼는 콘텐츠를 자동으로 감지하여 원하는 언어로 번역할 수 있습니다.
  • 갤러리 이미지 – 모든 이미지를 구문 분석할 수 있습니다. 이러한 이미지를 사용하여 이미지 갤러리를 만들 수 있습니다.
  • WooCommerce 제품 – 모든 WooCommerce 태그도 지원됩니다. 이렇게 하면 상점에 WooCommerce 제품을 간단하게 추가할 수 있습니다.
  • 수학 계산 – 수학 함수는 숫자를 빼거나, 더하거나, 나누거나 곱할 수 있습니다. 이것은 가격 계산에 유용할 수 있습니다.
  • 작업 예약 – 다양한 간격으로 수행할 작업을 할당할 수 있습니다.
  • 링크 제거 – 원본 게시물 콘텐츠에서 링크를 제거합니다.
  • 프록시 지원 – 스크래핑 목적으로 프록시를 사용할 수 있습니다.

Crawlomatic 다중 사이트 스크레이퍼

Crawlomatic Multisite Scraper 플러그인은 웹사이트 크롤링 및 스크래핑 , 포스트 생성기 자동 블로깅 플러그인입니다. 콘텐츠를 스크랩하는 데 API가 필요하지 않습니다.

이 플러그인은 URL크롤링하고 (페이지의 모든 링크를 검색함), 크롤링된 각 URL을 방문하여 콘텐츠를 추출합니다. 크롤링 프로세스는 사용자 정의할 수 있습니다 . 크롤링 깊이, 크롤링 속도, 최대 크롤링 기사 수, 특정 클래스 또는 ID가 있는 링크만 크롤링 등을 설정합니다.

WordPress 웹 스크레이퍼 플러그인.

거의 모든 사이트에서 콘텐츠를 스크랩할 수 있습니다. JavaScript를 사용하여 콘텐츠를 로드하는 경우 플러그인을 PhantomJS와 결합하여 JavaScript 생성 콘텐츠를 스크랩할 수 있습니다.

특징:

  • 사이트맵 크롤링이 완전히 지원됩니다.
  • 시각적 콘텐츠 선택기 지원.
  • 사이트 크롤링에 페이지를 매길 수 있습니다. 기사 크롤링은 대상 사이트의 다음 페이지에서 다시 시작됩니다.
  • 크롤링된 모든 제품의 가격을 가져올 수 있습니다(WooCommerce 호환 사이트의 경우). Dropshipping 가격은 그에 따라 자동으로 조정됩니다.
  • 수입품의 가격을 미리 정해진 숫자만큼 올릴 수 있습니다. 또한 금액을 정해진 숫자로 곱할 수 있습니다. 이는 dropshippers에게 유용한 옵션입니다.
  • 크롤링에 프록시를 사용할 수 있습니다.
  • 직접 크롤링할 수 없는 경우(예: 차단된 경우) Google 캐시에서 언제든지 특정 페이지를 크롤링할 수 있습니다.
  • 구글 번역이 지원됩니다. 사이트의 기사를 표시할 언어를 선택할 수 있습니다.
  • 텍스트 스피너도 완벽하게 지원됩니다. 자동으로 생성되는 텍스트를 변경할 수 있습니다. 원하는 경우 동의어로 단어를 변경할 수 있습니다. SpinRewriter, Best Spinner, TurkceSpin, WordAI 등을 사용할 수 있습니다.
  • 스크랩한 페이지의 로봇 HTML 헤더와 스크랩된 사이트의 robots.txt 파일을 존중하도록 사이트 스크랩 및 크롤링을 구성할 수 있습니다.
  • 제품의 태그 및 게시물 카테고리는 자동으로 생성될 수 있습니다.
  • 웹사이트 크롤링 및 스크래핑을 사용하여 DailyMotion, Flickr, IGN, Ustream.tv, Vimeo 또는 YouTube 동영상을 삽입할 수 있습니다.

WP 스크레이퍼 프로

WP Scraper Pro 플러그인은 다른 웹사이트에서 콘텐츠를 추출하여 WordPress 게시물 및 페이지로 가져올 수 있습니다. 다중 스크랩 기능을 사용하면 수백 개의 사이트에서 동시에 콘텐츠를 스크랩할 수 있습니다. 이것은 시각적 인터페이스를 사용하여 WordPress 사이트에서 수행할 수 있습니다.

시각적 인터페이스 는 미리 결정된 설정 또는 단일 스크레이핑을 사용하여 데이터를 선택하는 데 도움이 됩니다. 콘텐츠를 선택하려면 가져올 정보를 강조 표시하고 선택하거나 선택 취소합니다. 이를 통해 관련이 없거나 불필요한 데이터 블록을 제거할 수 있습니다.

카테고리, 이미지, 태그 및 제목은 할당한 규칙 또는 사전 선택에 따라 반복적으로 자동화됩니다. 또한 선택한 대상 사이트에서 모든 URL을 검색합니다.

워드프레스 자동 플러그인

WordPress 자동 플러그인은 거의 모든 사이트에서 WordPress에 자동으로 게시 할 수 있는 편리한 도구입니다. 많은 수입품이 있습니다.

일반적인 기사 외에 다음 콘텐츠가져올 수 있습니다 . Amazon 및 Walmart 제품, YouTube, Vimeo 및 DailyMotion 비디오, Flickr 및 Instagram 이미지, eBay 경매, 소셜 미디어 게시물(트윗, 핀, Reddit 및 Facebook 게시물), 분류 Craigslist, iTunes 콘텐츠(예: 노래, 팟캐스트, 앱, eBook), SoundCloud 노래 및 Envato 항목까지.

Wordpress 자동 플러그인은 거의 모든 웹사이트에서 WordPress로 자동으로 게시합니다.

콘텐츠 소스를 선택하고 태그, 작성자, 카테고리별로 필터 옵션적용 할 수 있습니다. 이는 모든 대상 정보를 가져오는 것은 아님을 의미합니다.

플러그인이 가져올 이미지, 형식, 게시물 템플릿, 유형 및 상태를 선택하게 됩니다. 고급 번역 및 다시 쓰기 옵션도 있습니다. 사이트에 표시하고 싶지 않은 특정 단어를 자동으로 바꿀 수도 있습니다.

게시 상태를 게시됨 또는 초안으로 설정할 수 있습니다. 특정 구문이나 단어는 제외될 수 있습니다. 게시물을 게시하기 전에 모든 링크제거 할 수도 있습니다. 추천 이미지를 자동으로 설정할 수 있습니다.

설정을 변경할 수 있으므로 중복된 제목, 영어가 아닌 게시물, 이미지가 없는 게시물은 건너뜁니다. 사용자 정의 필드는 게시물에 자동으로 추가되며 다중 사이트가 지원됩니다.

WP 로봇

WP Robot은 자동 블로깅 및 콘텐츠 큐레이션 플러그인입니다. 다른 사이트의 콘텐츠를 스크랩하여 WordPress 블로그 게시물을 자동으로 만들 수 있습니다. 특정 전문 분야 또는 틈새 시장과 관련된 정보를 드립 피드합니다. 이렇게 하면 항상 최신 콘텐츠를 사용할 수 있습니다.

wp 로봇 소스 옵션
콘텐츠 소스를 활성화하면 해당 설정 탭이 위에 나타납니다.

30 개 이상의 콘텐츠 소스 가 지원되며 각 콘텐츠 소스는 자동화됩니다. 웹 사이트에 대한 양질의 콘텐츠를 찾기 위해 선호하는 조합으로 사용할 수 있습니다. 필요한 사항에 따라 이 도구가 도움이 될 수 있는 여러 가지 방법이 있습니다.

WP Robot은 Amazon, AliExpress, Etsy 등의 제품을 게시하려는 경우 전자 상거래 사이트에서 콘텐츠를 가져올 수 있습니다. 플러그인은 Flickr 및 Pixabay의 이미지, iTunes, YouTube, Vimeo 동영상의 노래 등을 가져올 수 있습니다.

Commission Junction 및 Linkshare 는 WP Robot이 지원하는 제휴 네트워크 중 일부이며 자동으로 제안을 게시할 수 있습니다. RSS 피드 콘텐츠도 사이트에 추가할 수 있습니다. 기존 모듈이 제공하는 것보다 더 많은 것을 원하면 추가 자유를 줄 수 있습니다. 자세한 내용은 내 WP 로봇 리뷰를 확인하십시오.

WordPress 스크레이퍼 플러그인 결론

웹 스크래핑(웹 수집, 웹 데이터 추출 및 화면 스크래핑이라고도 함)은 다양한 사이트에서 방대한 정보를 수집합니다. 이 데이터는 다른 웹사이트나 데이터베이스에 저장됩니다. 많은 웹 스크래핑 솔루션 에는 추가 지식이 필요하며 다소 복잡할 수 있습니다. 언급된 WordPress 스크래퍼 플러그인을 사용하면 콘텐츠 스크래핑이 매우 쉽습니다.

제휴 매장, 가격 비교 사이트, 거래 사이트 또는 직배송 매장을 만들려면 사이트에 제품을 추가해야 합니다. 제품을 수동으로 추가하는 대신 해당 프로세스자동화하는 더 좋은 방법입니다.

이를 위해서는 제품가져오기 위한 좋은 플러그인이 필요합니다. 사용 가능한 솔루션이 많이 있지만 대부분은 제품을 가져오는 데 사용할 피드 또는 API가 있어야 합니다.

하지만 사료가 없다면? 그럼? 피드에 액세스할 수 없는 경우 사이트로 제품을 가져오는 방법은 무엇입니까? 이 경우 WordPress 웹 스크레이퍼 플러그인이 필요합니다.