ทำมากขึ้นโดยใช้น้อยลง: การสร้างเนื้อหาคุณภาพสูงโดยอัตโนมัติ

เผยแพร่แล้ว: 2020-12-12

คุณจะทำอย่างไรเพื่อให้ได้ผลลัพธ์ที่น่าทึ่งด้วยเวลาและทรัพยากรที่ จำกัด ?

การเขียนเนื้อหาคุณภาพที่ให้ความรู้และโน้มน้าวใจยังคงเป็นวิธีที่แน่นอนในการบรรลุเป้าหมายการเข้าชมและ Conversion ของคุณ

แต่กระบวนการนี้เป็นงานที่ยากและต้องทำด้วยตนเองซึ่งไม่ได้ปรับขนาด

โชคดีที่ความก้าวหน้าล่าสุดในการทำความเข้าใจและสร้างภาษาธรรมชาติให้ผลลัพธ์ที่น่าสนใจและน่าตื่นเต้น

สำหรับเซสชัน SEJ eSummit ของเขา Hamlet Batista ได้พูดคุยถึงสิ่งที่เป็นไปได้ในตอนนี้โดยใช้ตัวอย่างที่ใช้ได้จริง (และโค้ด) ที่ผู้เชี่ยวชาญด้านเทคนิค SEO สามารถติดตามและปรับให้เหมาะกับธุรกิจ

นี่คือสรุปการนำเสนอของเขา

การสร้างเนื้อหาคุณภาพสูงโดยอัตโนมัติ

คำแนะนำในการเติมข้อความอัตโนมัติ

เจอแบบนี้กี่ครั้ง

คุณเริ่มพิมพ์บน Gmail และ Google จะกรอกข้อมูลทั้งหมดโดยอัตโนมัติและแม่นยำมาก

คุณรู้ไหมว่ามันน่าสนใจจริงๆ แต่ในขณะเดียวกันมันก็น่ากลัวจริงๆ

คุณอาจใช้เทคโนโลยี AI ในงานของคุณอยู่แล้วโดยที่คุณไม่รู้ตัว

เติมข้อความอัตโนมัติของ Gmail

หากคุณใช้คุณลักษณะการเขียนอัจฉริยะของ Google เอกสาร, Gmail หรือแม้แต่ Microsoft Word และ Outlook แสดงว่าคุณใช้ประโยชน์จากเทคโนโลยีนี้แล้ว

โฆษณา
อ่านต่อด้านล่าง

นี่เป็นส่วนหนึ่งของวันของคุณในฐานะนักการตลาดเมื่อคุณสื่อสารกับลูกค้า

สิ่งที่ยอดเยี่ยมคือเทคโนโลยีนี้ไม่เพียง แต่สามารถเข้าถึงได้จาก Google เท่านั้น

ตรวจสอบเว็บไซต์ Write With Transformer เริ่มพิมพ์และกดปุ่มแท็บเพื่อดูแนวคิดประโยคทั้งหมด

บาติสตาแสดงให้เห็นว่าหลังจากเสียบชื่อเรื่องและประโยคจากบทความ SEJ ล่าสุดเครื่องสามารถเริ่มสร้างบรรทัดได้คุณเพียงแค่กดคำสั่งเติมข้อความอัตโนมัติ

เขียนด้วย Transformer

ข้อความที่ไฮไลต์ทั้งหมดข้างต้นสร้างขึ้นโดยคอมพิวเตอร์ทั้งหมด

โฆษณา
อ่านต่อด้านล่าง

สิ่งที่ยอดเยี่ยมเกี่ยวกับเรื่องนี้คือเทคโนโลยีที่ทำให้สิ่งนี้เป็นไปได้นั้นสามารถใช้ได้อย่างอิสระและทุกคนที่ต้องการใช้มันสามารถเข้าถึงได้

การค้นหาตามเจตนา

การเปลี่ยนแปลงอย่างหนึ่งที่เราเห็นใน SEO ตอนนี้คือการเปลี่ยนไปใช้การค้นหาตามความตั้งใจ

ดังที่ Mindy Weinstein ใส่ไว้ในบทความ Search Engine Journal ของเธอวิธีเจาะลึกด้วย Keyword Research:

“ เราอยู่ในยุคที่การค้นหาตามความตั้งใจมีความสำคัญสำหรับเรามากกว่าปริมาณที่แท้จริง”

“ คุณควรทำตามขั้นตอนเพิ่มเติมเพื่อเรียนรู้คำถามที่ลูกค้าถามและอธิบายปัญหาของพวกเขาอย่างไร”

“ เปลี่ยนจากคำหลักเป็นคำถาม”

การเปลี่ยนแปลงนี้ทำให้เกิดโอกาสสำหรับเราเมื่อเรากำลังเขียนเนื้อหา

โอกาส

เครื่องมือค้นหากำลังตอบรับเครื่องมือในปัจจุบัน

วิธีหนึ่งที่มีประสิทธิภาพในการเขียนเนื้อหาที่เป็นต้นฉบับและเป็นที่นิยมคือการตอบคำถามที่สำคัญที่สุดของกลุ่มเป้าหมายของคุณ

ลองดูตัวอย่างนี้สำหรับคำค้นหา“ python for seo”

ผลลัพธ์แรกแสดงให้เห็นว่าเราสามารถใช้ประโยชน์จากเนื้อหาที่ตอบคำถามในกรณีนี้โดยใช้สคีมาคำถามที่พบบ่อย

โฆษณา
อ่านต่อด้านล่าง

ตัวอย่างข้อมูลการค้นหาคำถามที่พบบ่อยทำให้มีอสังหาริมทรัพย์มากขึ้นใน SERPs

หลามสำหรับ seo

อย่างไรก็ตามการทำสิ่งนี้ด้วยตนเองสำหรับเนื้อหาทุกชิ้นที่คุณกำลังจะสร้างอาจมีราคาแพงและใช้เวลานาน

แต่จะเกิดอะไรขึ้นถ้าเราสามารถทำให้เป็นอัตโนมัติโดยใช้ประโยชน์จาก AI และเนื้อหาเนื้อหาที่มีอยู่?

การใช้ประโยชน์จากความรู้ที่มีอยู่

ธุรกิจที่จัดตั้งขึ้นส่วนใหญ่มีฐานความรู้ที่มีคุณค่าและเป็นกรรมสิทธิ์ซึ่งพวกเขาได้พัฒนาขึ้นเมื่อเวลาผ่านไปเพียงแค่ปฏิสัมพันธ์กับลูกค้าตามปกติ

โฆษณา
อ่านต่อด้านล่าง

หลายครั้งสิ่งเหล่านี้ยังไม่เปิดเผยต่อสาธารณะ (อีเมลสนับสนุนการแชทวิกิภายใน)

โอเพ่นซอร์ส AI + ความรู้ที่เป็นกรรมสิทธิ์

ด้วยเทคนิคที่เรียกว่า“ Transfer Learning” เราสามารถสร้างเนื้อหาที่เป็นต้นฉบับและมีคุณภาพโดยการรวมฐานความรู้ที่เป็นกรรมสิทธิ์และแบบจำลองการเรียนรู้เชิงลึกสาธารณะและชุดข้อมูล

ถ่ายทอดการเรียนรู้

มีความแตกต่างระหว่างแมชชีนเลิร์นนิงแบบดั้งเดิม (ML) และการเรียนรู้เชิงลึก

ใน ML แบบดั้งเดิมคุณจะทำการจำแนกประเภทและใช้ประโยชน์จากความรู้ที่มีอยู่เป็นหลักเพื่อสร้างการคาดการณ์

โฆษณา
อ่านต่อด้านล่าง

ขณะนี้ด้วยการเรียนรู้เชิงลึกคุณสามารถใช้ความรู้สามัญสำนึกที่สร้างขึ้นโดย บริษัท ใหญ่ ๆ เช่น Google, Facebook, Microsoft และอื่น ๆ

ในระหว่างเซสชั่น Batista แสดงให้เห็นว่าสามารถทำได้อย่างไร

วิธีสร้างเนื้อหาอัตโนมัติ

ด้านล่างนี้เป็นขั้นตอนที่ต้องดำเนินการเมื่อตรวจสอบวิธีการสร้างคำถามและคำตอบอัตโนมัติ

  • หาคำถามยอดนิยมโดยใช้เครื่องมือออนไลน์
  • ตอบพวกเขาโดยใช้สองวิธี NLG:
    • วิธีการค้นหาแบบขยาย
    • แนวทาง "หนังสือปิด"
  • เพิ่มสคีมาคำถามที่พบบ่อยและตรวจสอบความถูกต้องโดยใช้ SDTT

การจัดหาคำถามยอดนิยม

การค้นหาคำถามยอดนิยมโดยพิจารณาจากคำหลักของคุณไม่ใช่เรื่องยากเนื่องจากมีเครื่องมือฟรีที่คุณสามารถใช้เพื่อทำสิ่งนี้ได้

โฆษณา
อ่านต่อด้านล่าง

ตอบโจทย์ประชาชน

เพียงพิมพ์คำหลักและคุณจะได้รับคำถามมากมายที่ผู้ใช้กำลังถาม

ตอบโจทย์ประชาชน

เครื่องวิเคราะห์คำถามโดย BuzzSumo

พวกเขารวบรวมข้อมูลจากฟอรัมและที่อื่น ๆ คุณยังสามารถค้นหาคำถามประเภทหางยาวเพิ่มเติมได้

เครื่องวิเคราะห์คำถามโดย BuzzSumo

alsoAsked.com

เครื่องมือนี้คัดลอกผู้คนยังถามคำถามจาก Google

alsoAsked.com

ระบบคำถามและคำตอบ

อัลกอริทึม

เอกสารที่มีรหัสเป็นแหล่งค้นคว้าชั้นนำเกี่ยวกับการตอบคำถาม

โฆษณา
อ่านต่อด้านล่าง

ช่วยให้คุณสามารถเข้าถึงงานวิจัยล่าสุดที่กำลังเผยแพร่ได้อย่างอิสระ

นักวิชาการและนักวิจัยโพสต์งานวิจัยเพื่อรับข้อเสนอแนะจากเพื่อน ๆ

พวกเขามักจะท้าทายซึ่งกันและกันเพื่อสร้างระบบที่ดีขึ้น

สิ่งที่น่าสนใจกว่านั้นคือแม้แต่คนอย่างเราก็สามารถเข้าถึงรหัสที่เราจะต้องใช้เพื่อตอบคำถามได้

สำหรับงานนี้เราจะใช้ T5 หรือ Text-to-Text Transfer Transformer

ชุดข้อมูล

เรายังต้องการข้อมูลการฝึกอบรมที่ระบบกำลังจะใช้เพื่อเรียนรู้ที่จะตอบคำถาม

ชุดข้อมูลการตอบคำถามของสแตนฟอร์ด 2.0 (SQuAD 2.0) เป็นชุดข้อมูลเพื่อความเข้าใจในการอ่านที่ได้รับความนิยมมากที่สุด

SQuAD 2.0

ตอนนี้เรามีทั้งชุดข้อมูลและรหัสแล้วเรามาพูดถึงสองวิธีที่เราสามารถใช้ได้

โฆษณา
อ่านต่อด้านล่าง
  • การตอบคำถามแบบเปิดหนังสือ : คุณรู้ว่าคำตอบอยู่ที่ไหน
  • การตอบคำถามแบบปิด : คุณไม่รู้ว่าคำตอบอยู่ที่ไหน

แนวทาง # 1: วิธีการค้นหาช่วง (เปิดหนังสือ)

ด้วยรหัสง่ายๆสามบรรทัดเราสามารถให้ระบบตอบคำถามของเราได้

นี่คือสิ่งที่คุณทำได้ใน Google Colab

สร้างสมุดบันทึก Colab และพิมพ์ข้อมูลต่อไปนี้:

 !pip install transformers from transformers import pipeline
 # Allocate a pipeline for question-answering nlp = pipeline('question-answering')
 nlp({    'question': 'What is the name of the repository ?',    'context': 'Pipeline have been included in the huggingface/transformers repository' })

เมื่อคุณพิมพ์คำสั่ง - ระบุคำถามตลอดจนบริบทที่คุณคิดว่ามีคำตอบสำหรับคำถามคุณจะเห็นว่าระบบทำการค้นหาสตริงที่มีคำตอบโดยทั่วไป

{'answer': 'huggingface/transformers',
'end': 59,
'score': 0.5135626548884602,
'start': 35}

ขั้นตอนง่ายๆ:

  • โหลดไลบรารี Transformers NLP
  • จัดสรรไปป์ไลน์การตอบคำถาม
  • ระบุคำถามและบริบท (เนื้อหา / ข้อความมักจะมีคำตอบ)
โฆษณา
อ่านต่อด้านล่าง

แล้วคุณจะได้บริบทอย่างไร?

ด้วยรหัสไม่กี่บรรทัด

 !pip install requests-html from requests_html import HTMLSession session = HTMLSession() url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/" selector = "#post-328471 > div:nth-child(2) > div > div > div.sej-article-content.gototop-pos" with session.get(url) as r: post = r.html.find(selector, first=True) text = post.text

การใช้ไลบรารี HTML คำขอคุณสามารถดึง URL - ซึ่งเทียบเท่ากับการนำทางเบราว์เซอร์ไปยัง URL - และระบุตัวเลือก (ซึ่งเป็นเส้นทางขององค์ประกอบของบล็อกข้อความบนหน้า)

ฉันควรโทรเพื่อดึงเนื้อหาและเพิ่มลงในข้อความ - และนั่นก็กลายเป็นบริบทของฉัน

ในกรณีนี้เราจะถามคำถามที่รวมอยู่ในบทความ SEJ

นั่นหมายความว่าเรารู้ว่าคำตอบอยู่ที่ไหน เรากำลังให้บริการบทความที่มีคำตอบ

แต่ถ้าเราไม่รู้ว่าบทความใดมีคำตอบเราจะพยายามถาม?

แนวทาง # 2: การสำรวจขีด จำกัด ของ NLG ด้วย T5 และ Turing-NLG (หนังสือปิด)

T5 ของ Google (แบบจำลองพารามิเตอร์ 11 พันล้าน) และ TuringNG ของ Microsoft (โมเดลพารามิเตอร์ 17 พันล้าน) สามารถตอบคำถามได้โดยไม่ต้องระบุบริบทใด ๆ

โฆษณา
อ่านต่อด้านล่าง

พวกเขามีขนาดใหญ่มากจนสามารถเก็บความทรงจำเกี่ยวกับสิ่งต่างๆมากมายเมื่อพวกเขากำลังฝึกซ้อม

ทีม T5 ของ Google เผชิญหน้ากับโมเดลพารามิเตอร์ 11 พันล้านตัวในการท้าทายเรื่องไม่สำคัญในผับและแพ้

มาดูวิธีง่ายๆในการฝึก T5 เพื่อตอบคำถามตามอำเภอใจของเราเอง

ในตัวอย่างนี้คำถามหนึ่งที่บาติสตาถามคือ "ใครคือ SEO ที่ดีที่สุดในโลก"

T5 ตอบคำถาม T5 ตอบคำถามโดยพลการ

SEO ที่ดีที่สุดในโลกตามแบบจำลองที่ได้รับการฝึกฝนโดย Google คือ SEOmoz

SEOmoz - SEO ที่ดีที่สุดตาม T5

โฆษณา
อ่านต่อด้านล่าง

วิธีการฝึกปรับแต่งและใช้ประโยชน์จาก T5

การฝึกอบรม T5

เรากำลังจะฝึกโมเดลพารามิเตอร์ 3 พันล้านรายการโดยใช้ Google Colab TPU ฟรี

นี่คือแผนทางเทคนิคสำหรับการใช้ T5:

  • คัดลอกสมุดบันทึก Colab ตัวอย่างไปยัง Google Drive ของคุณ

คัดลอก Colab Notebook ไปยัง Google Drive ของคุณ

  • เปลี่ยนสภาพแวดล้อมรันไทม์เป็น Cloud TPU

เปลี่ยนสภาพแวดล้อมรันไทม์เป็น Cloud TPU

เปลี่ยนสภาพแวดล้อมรันไทม์เป็น Cloud TPU

  • สร้างที่เก็บข้อมูล Google Cloud Storage (ใช้เครดิตฟรี $ 300)

สร้างที่เก็บข้อมูล Google Cloud Storage

  • ระบุเส้นทางที่เก็บข้อมูลไปยังโน้ตบุ๊ก

ระบุเส้นทางที่เก็บข้อมูลไปยังโน้ตบุ๊ก

  • เลือกโมเดลพารามิเตอร์ 3 พันล้าน

เลือกโมเดลพารามิเตอร์ 3 พันล้าน

  • เรียกใช้เซลล์ที่เหลือจนถึงขั้นตอนการคาดคะเน

เรียกใช้เซลล์ที่เหลือจนถึงขั้นตอนการทำนาย

และตอนนี้คุณมีโมเดลที่ตอบคำถามได้จริง

แต่เราจะเพิ่มความรู้ที่เป็นกรรมสิทธิ์ของคุณเพื่อให้สามารถตอบคำถามในโดเมนหรืออุตสาหกรรมของคุณจากเว็บไซต์ของคุณได้อย่างไร

โฆษณา
อ่านต่อด้านล่าง

การเพิ่มชุดข้อมูลการฝึกอบรมที่เป็นกรรมสิทธิ์ใหม่

นี่คือที่ที่เราจะเข้าสู่ขั้นตอนการปรับแต่งอย่างละเอียด

เพียงคลิกที่ตัวเลือก ปรับแต่ง ในแบบจำลอง

ปรับแต่ง

และมีตัวอย่างบางส่วนในโค้ดของวิธีการสร้างฟังก์ชันใหม่และวิธีการเพิ่มความสามารถใหม่ให้กับโมเดล

อย่าลืม:

  • ประมวลผลฐานความรู้ที่เป็นกรรมสิทธิ์ของคุณล่วงหน้าในรูปแบบที่สามารถทำงานกับ T5 ได้
  • ปรับรหัสที่มีอยู่เพื่อจุดประสงค์นี้ (คำถามธรรมชาติ TriviaQA)

หากต้องการเรียนรู้กระบวนการแยกการแปลงและการโหลดสำหรับการเรียนรู้ของเครื่องโปรดอ่านบทความ Search Engine Journal ของ Batista คำแนะนำเชิงปฏิบัติเกี่ยวกับ Machine Learning สำหรับผู้เชี่ยวชาญด้าน SEO

โฆษณา
อ่านต่อด้านล่าง

การเพิ่มสคีมาคำถามที่พบบ่อย

ขั้นตอนนี้ตรงไปตรงมา

เพียงไปที่เอกสารของ Google สำหรับคำถามที่พบบ่อย: มาร์กอัปคำถามที่พบบ่อยด้วยข้อมูลที่มีโครงสร้าง

Google Developers - มาร์กอัปคำถามที่พบบ่อย

เพิ่มโครงสร้าง JSON-LD สำหรับสิ่งนั้น

คำถามที่พบบ่อยเกี่ยวกับ JSON-LD

คุณต้องการทำโดยอัตโนมัติหรือไม่?

บาติสตายังเขียนบทความเกี่ยวกับเรื่องนี้: บทนำสู่ JavaScript สมัยใหม่สำหรับ SEO

ด้วย JavaScript คุณควรจะสร้าง JSON-LD นี้ได้

แหล่งข้อมูลเพื่อเรียนรู้เพิ่มเติม:

  • ข้อมูลเบื้องต้นเกี่ยวกับ Python สำหรับ SEO
  • ข้อมูลเบื้องต้นเกี่ยวกับ Machine Learning สำหรับ SEO
  • ใช้ประโยชน์จากโมเดล SOTA ด้วยรหัสหนึ่งบรรทัด
  • สำรวจ Transfer Learning ด้วย T5
  • การเรียนรู้เชิงลึกเกี่ยวกับเตียรอยด์ด้วยพลังแห่งการถ่ายทอดความรู้
  • MarketMuse ร่างแรก
โฆษณา
อ่านต่อด้านล่าง

ดูการนำเสนอนี้

คุณสามารถรับชมการนำเสนอแบบเต็มของ Batista ได้จาก SEJ eSummit ในวันที่ 2 มิถุนายน


เครดิตรูปภาพ

ภาพเด่น: Paulo Bobita
ภาพหน้าจอทั้งหมดถ่ายโดยผู้แต่งกรกฎาคม 2020