ทำมากขึ้นโดยใช้น้อยลง: การสร้างเนื้อหาคุณภาพสูงโดยอัตโนมัติ
เผยแพร่แล้ว: 2020-12-12คุณจะทำอย่างไรเพื่อให้ได้ผลลัพธ์ที่น่าทึ่งด้วยเวลาและทรัพยากรที่ จำกัด ?
การเขียนเนื้อหาคุณภาพที่ให้ความรู้และโน้มน้าวใจยังคงเป็นวิธีที่แน่นอนในการบรรลุเป้าหมายการเข้าชมและ Conversion ของคุณ
แต่กระบวนการนี้เป็นงานที่ยากและต้องทำด้วยตนเองซึ่งไม่ได้ปรับขนาด
โชคดีที่ความก้าวหน้าล่าสุดในการทำความเข้าใจและสร้างภาษาธรรมชาติให้ผลลัพธ์ที่น่าสนใจและน่าตื่นเต้น
สำหรับเซสชัน SEJ eSummit ของเขา Hamlet Batista ได้พูดคุยถึงสิ่งที่เป็นไปได้ในตอนนี้โดยใช้ตัวอย่างที่ใช้ได้จริง (และโค้ด) ที่ผู้เชี่ยวชาญด้านเทคนิค SEO สามารถติดตามและปรับให้เหมาะกับธุรกิจ
นี่คือสรุปการนำเสนอของเขา
คำแนะนำในการเติมข้อความอัตโนมัติ
เจอแบบนี้กี่ครั้ง
ฉันเป็นคนเดียวที่บางครั้งรู้สึกกลัวกับคำแนะนำของ Google doc และ Gmail ที่เฉพาะเจาะจงและเกี่ยวข้องหรือไม่
คุณกำลังเขียนข้อความและ [แนะนำทั้งส่วนนี้ได้]
ฉันหมายความว่ามันยอดเยี่ยมมาก แต่มันน่ากลัว. 🤪😱
- Kristina Azarenko 📈 (@azarchick) 11 พฤษภาคม 2020
คุณเริ่มพิมพ์บน Gmail และ Google จะกรอกข้อมูลทั้งหมดโดยอัตโนมัติและแม่นยำมาก
คุณรู้ไหมว่ามันน่าสนใจจริงๆ แต่ในขณะเดียวกันมันก็น่ากลัวจริงๆ
คุณอาจใช้เทคโนโลยี AI ในงานของคุณอยู่แล้วโดยที่คุณไม่รู้ตัว
หากคุณใช้คุณลักษณะการเขียนอัจฉริยะของ Google เอกสาร, Gmail หรือแม้แต่ Microsoft Word และ Outlook แสดงว่าคุณใช้ประโยชน์จากเทคโนโลยีนี้แล้ว
นี่เป็นส่วนหนึ่งของวันของคุณในฐานะนักการตลาดเมื่อคุณสื่อสารกับลูกค้า
สิ่งที่ยอดเยี่ยมคือเทคโนโลยีนี้ไม่เพียง แต่สามารถเข้าถึงได้จาก Google เท่านั้น
ตรวจสอบเว็บไซต์ Write With Transformer เริ่มพิมพ์และกดปุ่มแท็บเพื่อดูแนวคิดประโยคทั้งหมด
บาติสตาแสดงให้เห็นว่าหลังจากเสียบชื่อเรื่องและประโยคจากบทความ SEJ ล่าสุดเครื่องสามารถเริ่มสร้างบรรทัดได้คุณเพียงแค่กดคำสั่งเติมข้อความอัตโนมัติ
ข้อความที่ไฮไลต์ทั้งหมดข้างต้นสร้างขึ้นโดยคอมพิวเตอร์ทั้งหมด
สิ่งที่ยอดเยี่ยมเกี่ยวกับเรื่องนี้คือเทคโนโลยีที่ทำให้สิ่งนี้เป็นไปได้นั้นสามารถใช้ได้อย่างอิสระและทุกคนที่ต้องการใช้มันสามารถเข้าถึงได้
การค้นหาตามเจตนา
การเปลี่ยนแปลงอย่างหนึ่งที่เราเห็นใน SEO ตอนนี้คือการเปลี่ยนไปใช้การค้นหาตามความตั้งใจ
ดังที่ Mindy Weinstein ใส่ไว้ในบทความ Search Engine Journal ของเธอวิธีเจาะลึกด้วย Keyword Research:
“ เราอยู่ในยุคที่การค้นหาตามความตั้งใจมีความสำคัญสำหรับเรามากกว่าปริมาณที่แท้จริง”
“ คุณควรทำตามขั้นตอนเพิ่มเติมเพื่อเรียนรู้คำถามที่ลูกค้าถามและอธิบายปัญหาของพวกเขาอย่างไร”
“ เปลี่ยนจากคำหลักเป็นคำถาม”
การเปลี่ยนแปลงนี้ทำให้เกิดโอกาสสำหรับเราเมื่อเรากำลังเขียนเนื้อหา
โอกาส
เครื่องมือค้นหากำลังตอบรับเครื่องมือในปัจจุบัน
วิธีหนึ่งที่มีประสิทธิภาพในการเขียนเนื้อหาที่เป็นต้นฉบับและเป็นที่นิยมคือการตอบคำถามที่สำคัญที่สุดของกลุ่มเป้าหมายของคุณ
ลองดูตัวอย่างนี้สำหรับคำค้นหา“ python for seo”
ผลลัพธ์แรกแสดงให้เห็นว่าเราสามารถใช้ประโยชน์จากเนื้อหาที่ตอบคำถามในกรณีนี้โดยใช้สคีมาคำถามที่พบบ่อย
ตัวอย่างข้อมูลการค้นหาคำถามที่พบบ่อยทำให้มีอสังหาริมทรัพย์มากขึ้นใน SERPs
อย่างไรก็ตามการทำสิ่งนี้ด้วยตนเองสำหรับเนื้อหาทุกชิ้นที่คุณกำลังจะสร้างอาจมีราคาแพงและใช้เวลานาน
แต่จะเกิดอะไรขึ้นถ้าเราสามารถทำให้เป็นอัตโนมัติโดยใช้ประโยชน์จาก AI และเนื้อหาเนื้อหาที่มีอยู่?
การใช้ประโยชน์จากความรู้ที่มีอยู่
ธุรกิจที่จัดตั้งขึ้นส่วนใหญ่มีฐานความรู้ที่มีคุณค่าและเป็นกรรมสิทธิ์ซึ่งพวกเขาได้พัฒนาขึ้นเมื่อเวลาผ่านไปเพียงแค่ปฏิสัมพันธ์กับลูกค้าตามปกติ
หลายครั้งสิ่งเหล่านี้ยังไม่เปิดเผยต่อสาธารณะ (อีเมลสนับสนุนการแชทวิกิภายใน)
โอเพ่นซอร์ส AI + ความรู้ที่เป็นกรรมสิทธิ์
ด้วยเทคนิคที่เรียกว่า“ Transfer Learning” เราสามารถสร้างเนื้อหาที่เป็นต้นฉบับและมีคุณภาพโดยการรวมฐานความรู้ที่เป็นกรรมสิทธิ์และแบบจำลองการเรียนรู้เชิงลึกสาธารณะและชุดข้อมูล
มีความแตกต่างระหว่างแมชชีนเลิร์นนิงแบบดั้งเดิม (ML) และการเรียนรู้เชิงลึก
ใน ML แบบดั้งเดิมคุณจะทำการจำแนกประเภทและใช้ประโยชน์จากความรู้ที่มีอยู่เป็นหลักเพื่อสร้างการคาดการณ์
ขณะนี้ด้วยการเรียนรู้เชิงลึกคุณสามารถใช้ความรู้สามัญสำนึกที่สร้างขึ้นโดย บริษัท ใหญ่ ๆ เช่น Google, Facebook, Microsoft และอื่น ๆ
ในระหว่างเซสชั่น Batista แสดงให้เห็นว่าสามารถทำได้อย่างไร
วิธีสร้างเนื้อหาอัตโนมัติ
ด้านล่างนี้เป็นขั้นตอนที่ต้องดำเนินการเมื่อตรวจสอบวิธีการสร้างคำถามและคำตอบอัตโนมัติ
- หาคำถามยอดนิยมโดยใช้เครื่องมือออนไลน์
- ตอบพวกเขาโดยใช้สองวิธี NLG:
- วิธีการค้นหาแบบขยาย
- แนวทาง "หนังสือปิด"
- เพิ่มสคีมาคำถามที่พบบ่อยและตรวจสอบความถูกต้องโดยใช้ SDTT
การจัดหาคำถามยอดนิยม
การค้นหาคำถามยอดนิยมโดยพิจารณาจากคำหลักของคุณไม่ใช่เรื่องยากเนื่องจากมีเครื่องมือฟรีที่คุณสามารถใช้เพื่อทำสิ่งนี้ได้
ตอบโจทย์ประชาชน
เพียงพิมพ์คำหลักและคุณจะได้รับคำถามมากมายที่ผู้ใช้กำลังถาม
เครื่องวิเคราะห์คำถามโดย BuzzSumo
พวกเขารวบรวมข้อมูลจากฟอรัมและที่อื่น ๆ คุณยังสามารถค้นหาคำถามประเภทหางยาวเพิ่มเติมได้
alsoAsked.com
เครื่องมือนี้คัดลอกผู้คนยังถามคำถามจาก Google
ระบบคำถามและคำตอบ
อัลกอริทึม
เอกสารที่มีรหัสเป็นแหล่งค้นคว้าชั้นนำเกี่ยวกับการตอบคำถาม
ช่วยให้คุณสามารถเข้าถึงงานวิจัยล่าสุดที่กำลังเผยแพร่ได้อย่างอิสระ
นักวิชาการและนักวิจัยโพสต์งานวิจัยเพื่อรับข้อเสนอแนะจากเพื่อน ๆ
พวกเขามักจะท้าทายซึ่งกันและกันเพื่อสร้างระบบที่ดีขึ้น
สิ่งที่น่าสนใจกว่านั้นคือแม้แต่คนอย่างเราก็สามารถเข้าถึงรหัสที่เราจะต้องใช้เพื่อตอบคำถามได้
สำหรับงานนี้เราจะใช้ T5 หรือ Text-to-Text Transfer Transformer
ชุดข้อมูล
เรายังต้องการข้อมูลการฝึกอบรมที่ระบบกำลังจะใช้เพื่อเรียนรู้ที่จะตอบคำถาม
ชุดข้อมูลการตอบคำถามของสแตนฟอร์ด 2.0 (SQuAD 2.0) เป็นชุดข้อมูลเพื่อความเข้าใจในการอ่านที่ได้รับความนิยมมากที่สุด
ตอนนี้เรามีทั้งชุดข้อมูลและรหัสแล้วเรามาพูดถึงสองวิธีที่เราสามารถใช้ได้
- การตอบคำถามแบบเปิดหนังสือ : คุณรู้ว่าคำตอบอยู่ที่ไหน
- การตอบคำถามแบบปิด : คุณไม่รู้ว่าคำตอบอยู่ที่ไหน
แนวทาง # 1: วิธีการค้นหาช่วง (เปิดหนังสือ)
ด้วยรหัสง่ายๆสามบรรทัดเราสามารถให้ระบบตอบคำถามของเราได้
นี่คือสิ่งที่คุณทำได้ใน Google Colab
สร้างสมุดบันทึก Colab และพิมพ์ข้อมูลต่อไปนี้:
!pip install transformers from transformers import pipeline
# Allocate a pipeline for question-answering nlp = pipeline('question-answering')
nlp({ 'question': 'What is the name of the repository ?', 'context': 'Pipeline have been included in the huggingface/transformers repository' })
เมื่อคุณพิมพ์คำสั่ง - ระบุคำถามตลอดจนบริบทที่คุณคิดว่ามีคำตอบสำหรับคำถามคุณจะเห็นว่าระบบทำการค้นหาสตริงที่มีคำตอบโดยทั่วไป
{'answer': 'huggingface/transformers',
'end': 59,
'score': 0.5135626548884602,
'start': 35}
ขั้นตอนง่ายๆ:
- โหลดไลบรารี Transformers NLP
- จัดสรรไปป์ไลน์การตอบคำถาม
- ระบุคำถามและบริบท (เนื้อหา / ข้อความมักจะมีคำตอบ)
แล้วคุณจะได้บริบทอย่างไร?
ด้วยรหัสไม่กี่บรรทัด
!pip install requests-html from requests_html import HTMLSession session = HTMLSession() url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/" selector = "#post-328471 > div:nth-child(2) > div > div > div.sej-article-content.gototop-pos" with session.get(url) as r: post = r.html.find(selector, first=True) text = post.text
การใช้ไลบรารี HTML คำขอคุณสามารถดึง URL - ซึ่งเทียบเท่ากับการนำทางเบราว์เซอร์ไปยัง URL - และระบุตัวเลือก (ซึ่งเป็นเส้นทางขององค์ประกอบของบล็อกข้อความบนหน้า)
ฉันควรโทรเพื่อดึงเนื้อหาและเพิ่มลงในข้อความ - และนั่นก็กลายเป็นบริบทของฉัน
ในกรณีนี้เราจะถามคำถามที่รวมอยู่ในบทความ SEJ
นั่นหมายความว่าเรารู้ว่าคำตอบอยู่ที่ไหน เรากำลังให้บริการบทความที่มีคำตอบ
แต่ถ้าเราไม่รู้ว่าบทความใดมีคำตอบเราจะพยายามถาม?
แนวทาง # 2: การสำรวจขีด จำกัด ของ NLG ด้วย T5 และ Turing-NLG (หนังสือปิด)
T5 ของ Google (แบบจำลองพารามิเตอร์ 11 พันล้าน) และ TuringNG ของ Microsoft (โมเดลพารามิเตอร์ 17 พันล้าน) สามารถตอบคำถามได้โดยไม่ต้องระบุบริบทใด ๆ
พวกเขามีขนาดใหญ่มากจนสามารถเก็บความทรงจำเกี่ยวกับสิ่งต่างๆมากมายเมื่อพวกเขากำลังฝึกซ้อม
ทีม T5 ของ Google เผชิญหน้ากับโมเดลพารามิเตอร์ 11 พันล้านตัวในการท้าทายเรื่องไม่สำคัญในผับและแพ้
มาดูวิธีง่ายๆในการฝึก T5 เพื่อตอบคำถามตามอำเภอใจของเราเอง
ในตัวอย่างนี้คำถามหนึ่งที่บาติสตาถามคือ "ใครคือ SEO ที่ดีที่สุดในโลก"
SEO ที่ดีที่สุดในโลกตามแบบจำลองที่ได้รับการฝึกฝนโดย Google คือ SEOmoz
วิธีการฝึกปรับแต่งและใช้ประโยชน์จาก T5
การฝึกอบรม T5
เรากำลังจะฝึกโมเดลพารามิเตอร์ 3 พันล้านรายการโดยใช้ Google Colab TPU ฟรี
นี่คือแผนทางเทคนิคสำหรับการใช้ T5:
- คัดลอกสมุดบันทึก Colab ตัวอย่างไปยัง Google Drive ของคุณ
- เปลี่ยนสภาพแวดล้อมรันไทม์เป็น Cloud TPU
- สร้างที่เก็บข้อมูล Google Cloud Storage (ใช้เครดิตฟรี $ 300)
- ระบุเส้นทางที่เก็บข้อมูลไปยังโน้ตบุ๊ก
- เลือกโมเดลพารามิเตอร์ 3 พันล้าน
- เรียกใช้เซลล์ที่เหลือจนถึงขั้นตอนการคาดคะเน
และตอนนี้คุณมีโมเดลที่ตอบคำถามได้จริง
แต่เราจะเพิ่มความรู้ที่เป็นกรรมสิทธิ์ของคุณเพื่อให้สามารถตอบคำถามในโดเมนหรืออุตสาหกรรมของคุณจากเว็บไซต์ของคุณได้อย่างไร
การเพิ่มชุดข้อมูลการฝึกอบรมที่เป็นกรรมสิทธิ์ใหม่
นี่คือที่ที่เราจะเข้าสู่ขั้นตอนการปรับแต่งอย่างละเอียด
เพียงคลิกที่ตัวเลือก ปรับแต่ง ในแบบจำลอง
และมีตัวอย่างบางส่วนในโค้ดของวิธีการสร้างฟังก์ชันใหม่และวิธีการเพิ่มความสามารถใหม่ให้กับโมเดล
อย่าลืม:
- ประมวลผลฐานความรู้ที่เป็นกรรมสิทธิ์ของคุณล่วงหน้าในรูปแบบที่สามารถทำงานกับ T5 ได้
- ปรับรหัสที่มีอยู่เพื่อจุดประสงค์นี้ (คำถามธรรมชาติ TriviaQA)
หากต้องการเรียนรู้กระบวนการแยกการแปลงและการโหลดสำหรับการเรียนรู้ของเครื่องโปรดอ่านบทความ Search Engine Journal ของ Batista คำแนะนำเชิงปฏิบัติเกี่ยวกับ Machine Learning สำหรับผู้เชี่ยวชาญด้าน SEO
การเพิ่มสคีมาคำถามที่พบบ่อย
ขั้นตอนนี้ตรงไปตรงมา
เพียงไปที่เอกสารของ Google สำหรับคำถามที่พบบ่อย: มาร์กอัปคำถามที่พบบ่อยด้วยข้อมูลที่มีโครงสร้าง
เพิ่มโครงสร้าง JSON-LD สำหรับสิ่งนั้น
คุณต้องการทำโดยอัตโนมัติหรือไม่?
บาติสตายังเขียนบทความเกี่ยวกับเรื่องนี้: บทนำสู่ JavaScript สมัยใหม่สำหรับ SEO
ด้วย JavaScript คุณควรจะสร้าง JSON-LD นี้ได้
แหล่งข้อมูลเพื่อเรียนรู้เพิ่มเติม:
- ข้อมูลเบื้องต้นเกี่ยวกับ Python สำหรับ SEO
- ข้อมูลเบื้องต้นเกี่ยวกับ Machine Learning สำหรับ SEO
- ใช้ประโยชน์จากโมเดล SOTA ด้วยรหัสหนึ่งบรรทัด
- สำรวจ Transfer Learning ด้วย T5
- การเรียนรู้เชิงลึกเกี่ยวกับเตียรอยด์ด้วยพลังแห่งการถ่ายทอดความรู้
- MarketMuse ร่างแรก
ดูการนำเสนอนี้
คุณสามารถรับชมการนำเสนอแบบเต็มของ Batista ได้จาก SEJ eSummit ในวันที่ 2 มิถุนายน
เครดิตรูปภาพ
ภาพเด่น: Paulo Bobita
ภาพหน้าจอทั้งหมดถ่ายโดยผู้แต่งกรกฎาคม 2020