적은 자원으로 더 많은 작업 수행 : 자동화 된 고품질 콘텐츠 생성
게시 됨: 2020-12-12제한된 시간과 리소스로 어떻게 놀라운 결과를 계속 제공합니까?
교육하고 설득하는 양질의 콘텐츠를 작성하는 것은 여전히 트래픽 및 전환 목표를 달성하는 확실한 방법입니다.
그러나 프로세스는 확장되지 않는 고된 수동 작업입니다.
다행히도 자연어 이해 및 생성의 최신 발전은 유망하고 흥미로운 결과를 제공합니다.
SEJ eSummit 세션에서 Hamlet Batista는 기술 SEO 전문가가 자신의 비즈니스에 따라 적용 할 수있는 실용적인 예제 (및 코드)를 사용하여 지금 가능한 일에 대해 논의했습니다.
다음은 그의 프레젠테이션 요약입니다.
자동 완성 제안
이것을 몇 번이나 만났습니까?
Google 문서 및 Gmail 제안이 얼마나 구체적이고 관련성이 있는지에 때때로 두려워하는 유일한 사람입니까?
당신은 텍스트를 쓰고 있고 [이 부분 전체를 제안 할 수 있습니다].
대단합니다. 하지만 무섭습니다. 🤪😱
— Kristina Azarenko 📈 (@azarchick) 2020 년 5 월 11 일
Gmail에서 입력을 시작하면 Google이 자동으로 전체 부분을 완성하며 매우 정확합니다.
정말 매력적이지만 동시에 정말 무섭기도합니다.
자신도 모르는 사이에 이미 AI 기술을 작업에 사용하고있을 수 있습니다.
Google 문서 도구의 스마트 작성 기능, Gmail 또는 Microsoft Word 및 Outlook을 사용하고 있다면 이미이 기술을 활용하고있는 것입니다.
이것은 고객과 소통 할 때 마케팅 담당자로서의 하루의 일부입니다.
좋은 점은이 기술이 Google에서만 액세스 할 수 없다는 것입니다.
Write With Transformer 웹 사이트를 확인하고 입력을 시작한 다음 전체 문장 아이디어를 보려면 탭 키를 누르십시오.
Batista는 최근 SEJ 기사의 제목과 문장을 연결 한 후 시스템이 라인 생성을 시작하는 방법을 보여주었습니다. 자동 완성 명령을 누르기 만하면됩니다.
위에 강조 표시된 모든 텍스트는 컴퓨터에서 완전히 생성되었습니다.
이것에 대한 멋진 점은 이것을 가능하게하는 기술이 자유롭게 이용 가능하고 그것을 사용하고자하는 모든 사람이 접근 할 수 있다는 것입니다.
의도 기반 검색
SEO에서 지금 우리가보고있는 변화 중 하나는 의도 기반 검색으로의 전환입니다.
Mindy Weinstein이 그녀의 Search Engine Journal 기사 인 How to Go Deeper with Keyword Research :
"우리는 순수한 양보다 의도 기반 검색이 더 중요한 시대에 있습니다."
"고객이 묻는 질문과 문제를 설명하는 방법을 알아 보려면 추가 단계를 수행해야합니다."
"키워드에서 질문으로 이동"
이러한 변화는 우리가 콘텐츠를 작성할 때 우리에게 기회를 제공합니다.
기회
검색 엔진은 요즘 응답 엔진입니다.
독창적이고 인기있는 콘텐츠를 작성하는 효과적인 방법 중 하나는 타겟 고객의 가장 중요한 질문에 답하는 것입니다.
"python for seo"쿼리에 대한이 예제를 살펴보십시오.
첫 번째 결과는 FAQ 스키마를 사용하여 질문에 답하는 콘텐츠를 활용할 수 있음을 보여줍니다.
FAQ 검색 스 니펫은 SERP에서 더 많은 공간을 차지합니다.
그러나 만들려는 모든 콘텐츠에 대해이 작업을 수동으로 수행하는 것은 비용과 시간이 많이 소요될 수 있습니다.
하지만 AI와 기존 콘텐츠 자산을 활용하여 자동화 할 수 있다면 어떨까요?
기존 지식 활용
대부분의 기존 비즈니스는 고객과의 정상적인 상호 작용을 통해 시간이 지남에 따라 개발 한 귀중한 독점 지식 기반을 이미 가지고 있습니다.
많은 경우 아직 공개적으로 사용할 수 없습니다 (지원 이메일, 채팅, 내부 위키).
오픈 소스 AI + 독점 지식
“전이 학습”이라는 기술을 통해 독점 지식 기반과 공개 딥 러닝 모델 및 데이터 세트를 결합하여 독창적이고 양질의 콘텐츠를 생성 할 수 있습니다.
전통적인 기계 학습 (ML)과 딥 러닝 사이에는 차이점이 있습니다.
기존 ML에서는 주로 분류를 수행하고 기존 지식을 활용하여 예측을 도출합니다.
이제 딥 러닝을 통해 Google, Facebook, Microsoft 등과 같은 대기업에서 시간이 지남에 따라 구축 한 상식 지식을 활용할 수 있습니다.
세션 동안 Batista는이를 수행하는 방법을 시연했습니다.
콘텐츠 생성을 자동화하는 방법
다음은 자동 질문 및 답변 생성 접근 방식을 검토 할 때 취해야 할 단계입니다.
- 온라인 도구를 사용하여 인기있는 질문을 제공합니다.
- 두 가지 NLG 접근 방식을 사용하여 응답하십시오.
- 스팬 검색 접근 방식.
- "닫힌 책"접근 방식.
- FAQ 스키마를 추가하고 SDTT를 사용하여 검증합니다.
인기있는 질문 소싱
이를 위해 사용할 수있는 무료 도구가 있기 때문에 키워드를 기반으로 인기있는 질문을 찾는 것은 큰 도전이 아닙니다.
대중에게 응답
키워드를 입력하기 만하면 사용자가 묻는 많은 질문을 얻을 수 있습니다.
BuzzSumo의 질문 분석기
포럼 및 기타 장소에서 정보를 집계합니다. 더 많은 롱테일 유형의 질문을 찾을 수도 있습니다.
AlsoAsked.com
이 도구는 Google의 People Also Ask Questions를 스크랩합니다.
질문 및 답변 시스템
알고리즘
Papers With Codes는 질문 답변에 대한 최신 연구 자료를 제공합니다.
출판중인 최신 연구를 자유롭게 활용할 수 있습니다.
학자 및 연구원은 동료로부터 피드백을받을 수 있도록 연구를 게시합니다.
그들은 항상 더 나은 시스템을 만들기 위해 서로 도전하고 있습니다.
더 흥미로운 것은 우리와 같은 사람들도 질문에 답하는 데 필요한 코드에 액세스 할 수 있다는 것입니다.
이 작업에서는 T5 또는 Text-to-Text Transfer Transformer를 사용합니다.
데이터 세트
또한 시스템이 질문에 답하는 방법을 배우는 데 사용할 훈련 데이터가 필요합니다.
Stanford Question Answering Dataset 2.0 (SQuAD 2.0)은 가장 인기있는 독해 데이터 세트입니다.
이제 데이터 세트와 코드가 모두 준비되었으므로 사용할 수있는 두 가지 접근 방식에 대해 이야기하겠습니다.
- 개방형 질문 답변 : 답변이 어디에 있는지 알고 있습니다.
- 비공개 질문 답변 : 답변이 어디에 있는지 모릅니다.
접근법 # 1 : 범위 검색 접근법 (오픈 북)
간단한 세 줄의 코드로 시스템이 질문에 답할 수 있습니다.
이것은 Google Colab에서 할 수있는 일입니다.
Colab 노트북을 만들고 다음을 입력합니다.
!pip install transformers from transformers import pipeline
# Allocate a pipeline for question-answering nlp = pipeline('question-answering')
nlp({ 'question': 'What is the name of the repository ?', 'context': 'Pipeline have been included in the huggingface/transformers repository' })
명령을 입력하면 – 질문에 대한 답이 있다고 생각하는 컨텍스트뿐만 아니라 질문을 제공하면 시스템이 기본적으로 답이있는 문자열을 검색하는 것을 볼 수 있습니다.
{'answer': 'huggingface/transformers',
'end': 59,
'score': 0.5135626548884602,
'start': 35}
단계는 간단합니다.
- Transformers NLP 라이브러리를로드합니다.
- 질문 응답 파이프 라인을 할당합니다.
- 질문과 컨텍스트를 제공합니다 (답을 포함 할 가능성이 가장 높은 내용 / 텍스트).
그렇다면 맥락을 어떻게 알 수 있습니까?
몇 줄의 코드로.
!pip install requests-html from requests_html import HTMLSession session = HTMLSession() url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/" selector = "#post-328471 > div:nth-child(2) > div > div > div.sej-article-content.gototop-pos" with session.get(url) as r: post = r.html.find(selector, first=True) text = post.text
요청 HTML 라이브러리를 사용하여 URL (브라우저에서 URL로 이동하는 것과 동일)을 가져 와서 선택기 (페이지의 텍스트 블록 요소의 경로)를 제공 할 수 있습니다.
콘텐츠를 가져 와서 텍스트에 추가하기 만하면됩니다. 이것이 제 컨텍스트가됩니다.
이 예에서는 SEJ 기사에 포함 된 질문을 할 것입니다.
그것은 우리가 답이 어디에 있는지 안다는 것을 의미합니다. 답이있는 기사를 제공하고 있습니다.
하지만 어떤 기사에 답이 있는지 모른다면 어떻게해야할까요?
접근 방식 # 2 : T5 및 Turing-NLG (Closed Book)로 NLG의 한계 탐색
Google의 T5 (110 억 매개 변수 모델) 및 Microsoft의 TuringNG (170 억 매개 변수 모델)는 컨텍스트를 제공하지 않고도 질문에 답할 수 있습니다.
그들은 너무 방대해서 훈련 할 때 많은 것들을 기억할 수 있습니다.
Google의 T5 팀은 펍 퀴즈 챌린지에서 110 억 개의 매개 변수 모델과 맞붙어 패배했습니다.
임의의 질문에 답하도록 T5를 교육하는 것이 얼마나 간단한 지 살펴 보겠습니다.
이 예에서 Batista가 묻는 질문 중 하나는 "세계 최고의 SEO는 누구입니까?"입니다.
Google이 훈련 한 모델에 따르면 세계 최고의 SEO는 SEOmoz입니다.
T5 교육, 미세 조정 및 활용 방법
교육 T5
무료 Google Colab TPU를 사용하여 30 억 개의 매개 변수 모델을 학습 할 것입니다.
다음은 T5 사용을위한 기술 계획입니다.
- 예제 Colab 노트북을 Google 드라이브에 복사합니다.
- 런타임 환경을 Cloud TPU로 변경합니다.
- Google Cloud Storage 버킷을 만듭니다 (무료 $ 300 크레딧 사용).
- 노트북의 버킷 경로를 제공합니다.
- 30 억 개의 매개 변수 모델을 선택합니다.
- 나머지 셀을 예측 단계까지 실행합니다.
이제 실제로 질문에 답할 수있는 모델이 있습니다.
그러나 귀하의 웹 사이트에서 귀하의 도메인 또는 업계의 질문에 답할 수 있도록 귀하의 독점 지식을 어떻게 추가합니까?
새로운 독점 교육 데이터 세트 추가
여기에서 미세 조정 단계로 이동합니다.
모델에서 미세 조정 옵션을 클릭하기 만하면됩니다.
그리고 새로운 기능을 만드는 방법과 모델에 새로운 기능을 부여하는 방법에 대한 코드의 몇 가지 예가 있습니다.
기억해:
- 독점 지식 기반을 T5에서 작동 할 수있는 형식으로 사전 처리합니다.
- 이 목적을 위해 기존 코드를 수정합니다 (Natural Questions, TriviaQA).
기계 학습을위한 추출, 변환 및로드 프로세스를 배우려면 Batista의 검색 엔진 저널 기사, SEO 전문가를위한 기계 학습에 대한 실용적인 소개를 읽어보십시오.
FAQ 스키마 추가
이 단계는 간단합니다.
FAQ에 대한 Google 문서로 이동하기 만하면됩니다. 구조화 된 데이터로 FAQ를 마크 업하세요.
이를 위해 JSON-LD 구조를 추가하십시오.
자동으로 하시겠습니까?
Batista는 또한 이에 대한 기사를 작성했습니다. SEO를위한 최신 JavaScript 실습 소개.
JavaScript를 사용하면이 JSON-LD를 생성 할 수 있습니다.
자세히 알아보기위한 리소스 :
- SEO를위한 Python 소개
- SEO를위한 머신 러닝 소개
- 한 줄의 코드로 SOTA 모델 활용
- T5를 사용한 전이 학습 탐색
- 지식 전달의 힘으로 스테로이드에 대한 딥 러닝
- MarketMuse 초안
이 프레젠테이션보기
이제 6 월 2 일 SEJ eSummit에서 Batista의 전체 프레젠테이션을 볼 수 있습니다.
이미지 크레딧
추천 이미지 : Paulo Bobita
작성자가 찍은 모든 스크린 샷, 2020 년 7 월