Mit weniger mehr erreichen: Automatisierte, qualitativ hochwertige Inhaltserstellung
Veröffentlicht: 2020-12-12Wie können Sie mit begrenzter Zeit und begrenzten Ressourcen weiterhin erstaunliche Ergebnisse erzielen?
Das Schreiben von qualitativ hochwertigen Inhalten, die aufklären und überzeugen, ist immer noch ein todsicherer Weg, um Ihre Traffic- und Conversion-Ziele zu erreichen.
Aber der Prozess ist ein mühsamer, manueller Job, der nicht skalierbar ist.
Glücklicherweise bieten die neuesten Fortschritte beim Verständnis und der Generierung natürlicher Sprachen vielversprechende und aufregende Ergebnisse.
In seiner SEJ eSummit-Sitzung diskutierte Hamlet Batista anhand praktischer Beispiele (und Codes), denen technische SEO-Experten folgen und sich an ihr Geschäft anpassen können, was derzeit möglich ist.
Hier ist eine Zusammenfassung seiner Präsentation.
Vorschläge zur automatischen Vervollständigung
Wie oft sind Sie darauf gestoßen?
Bin ich der einzige, der manchmal Angst hat, wie spezifisch und relevant Google Doc- und Google Mail-Vorschläge sind?
Sie schreiben einen Text und [dieser ganze Teil kann vorgeschlagen werden].
Ich meine, es ist großartig. Aber es ist beängstigend. 🤪😱
- Kristina Azarenko @ (@azarchick) 11. Mai 2020
Sie beginnen mit der Eingabe in Google Mail und Google vervollständigt automatisch den gesamten Teil und er ist sehr genau.
Weißt du, es ist wirklich faszinierend, aber gleichzeitig kann es wirklich beängstigend sein.
Möglicherweise verwenden Sie bereits KI-Technologie in Ihrer Arbeit, ohne dass Sie es überhaupt bemerken.
Wenn Sie die Smart Compose-Funktion von Google Text & Tabellen, Google Mail oder sogar Microsoft Word und Outlook verwenden, nutzen Sie diese Technologie bereits.
Dies ist Teil Ihres Tages als Vermarkter, wenn Sie mit Kunden kommunizieren.
Das Tolle ist, dass diese Technologie nicht nur für Google zugänglich ist.
Schauen Sie sich die Write With Transformer-Website an, beginnen Sie mit der Eingabe und drücken Sie die Tabulatortaste, um vollständige Satzideen zu erhalten.
Batista demonstrierte, wie die Maschine nach dem Einfügen des Titels und eines Satzes aus einem kürzlich erschienenen SEJ-Artikel mit dem Generieren von Zeilen beginnen kann - Sie müssen nur den Befehl zur automatischen Vervollständigung drücken.
Der gesamte oben hervorgehobene Text wurde vollständig von einem Computer generiert.
Das Coole daran ist, dass die Technologie, die dies ermöglicht, frei verfügbar und für jeden zugänglich ist, der sie nutzen möchte.
Absichtsbasierte Suche
Eine der Veränderungen, die wir derzeit in der Suchmaschinenoptimierung sehen, ist der Übergang zu absichtsbasierten Suchanfragen.
Wie Mindy Weinstein es in ihrem Artikel im Search Engine Journal ausdrückt: Wie man mit Keyword-Recherchen tiefer geht:
"Wir befinden uns in einer Zeit, in der absichtsbasierte Suche für uns wichtiger ist als reines Volumen."
"Sie sollten den zusätzlichen Schritt unternehmen, um zu erfahren, welche Fragen Kunden stellen und wie sie ihre Probleme beschreiben."
"Gehen Sie von Schlüsselwörtern zu Fragen"
Diese Änderung bietet uns eine Gelegenheit, wenn wir Inhalte schreiben.
Die Gelegenheit
Suchmaschinen antworten heutzutage.
Eine effektive Möglichkeit, originelle und beliebte Inhalte zu schreiben, besteht darin, die wichtigsten Fragen Ihrer Zielgruppe zu beantworten.
Schauen Sie sich dieses Beispiel für die Abfrage "Python for SEO" an.
Das erste Ergebnis zeigt, dass wir Inhalte nutzen können, die Fragen beantworten, in diesem Fall mithilfe des FAQ-Schemas.
FAQ-Suchausschnitte nehmen mehr Platz in den SERPs.
Dies manuell für jeden Inhalt zu tun, den Sie erstellen möchten, kann jedoch teuer und zeitaufwändig sein.
Aber was ist, wenn wir es automatisieren können, indem wir KI und vorhandene Inhaltsressourcen nutzen?
Vorhandenes Wissen nutzen
Die meisten etablierten Unternehmen verfügen bereits über wertvolle, proprietäre Wissensdatenbanken, die sie im Laufe der Zeit nur durch normale Interaktionen mit Kunden entwickelt haben.
Oft sind diese noch nicht öffentlich verfügbar (Support-E-Mails, Chats, interne Wikis).
Open Source AI + proprietäres Wissen
Durch eine Technik namens „Transfer Learning“ können wir originelle, qualitativ hochwertige Inhalte erstellen, indem wir proprietäre Wissensdatenbanken und öffentliche Deep-Learning-Modelle und -Datensätze kombinieren.
Es gibt Unterschiede zwischen traditionellem maschinellem Lernen (ML) und tiefem Lernen.
In der traditionellen ML führen Sie in erster Linie Klassifizierungen durch und nutzen vorhandenes Wissen, um Vorhersagen zu treffen.
Mit Deep Learning können Sie jetzt auf das Wissen des gesunden Menschenverstandes zurückgreifen, das im Laufe der Zeit von großen Unternehmen wie Google, Facebook, Microsoft und anderen aufgebaut wurde.
Während der Sitzung zeigte Batista, wie dies getan werden kann.
So automatisieren Sie die Inhaltserstellung
Im Folgenden finden Sie die Schritte, die bei der Überprüfung automatisierter Ansätze zur Generierung von Fragen und Antworten ausgeführt werden müssen.
- Stellen Sie beliebte Fragen mithilfe von Online-Tools.
- Beantworten Sie sie mit zwei NLG-Ansätzen:
- Ein Span-Suchansatz.
- Ein "geschlossenes Buch" -Ansatz.
- Fügen Sie ein FAQ-Schema hinzu und validieren Sie es mit dem SDTT.
Beschaffung beliebter Fragen
Das Finden beliebter Fragen anhand Ihrer Keywords ist keine große Herausforderung, da Sie hierfür kostenlose Tools verwenden können.
Antworte der Öffentlichkeit
Geben Sie einfach ein Schlüsselwort ein und Sie erhalten viele Fragen, die Benutzer stellen.
Question Analyzer von BuzzSumo
Sie sammeln Informationen aus Foren und anderen Orten. Sie können auch mehr Long-Tail-Fragen finden.
AlsoAsked.com
Dieses Tool kratzt die Personen, die auch Fragen von Google stellen.
Frage & Antwortsystem
Der Algorithmus
Papers With Codes ist eine großartige Quelle für Spitzenforschung zum Thema Beantwortung von Fragen.
Damit können Sie frei auf die neuesten Forschungsergebnisse zugreifen, die veröffentlicht werden.
Wissenschaftler und Forscher veröffentlichen ihre Forschungsergebnisse, damit sie Feedback von ihren Kollegen erhalten können.
Sie fordern sich immer gegenseitig heraus, ein besseres System zu entwickeln.
Interessanter ist, dass sogar Leute wie wir auf den Code zugreifen können, den wir zur Beantwortung der Fragen benötigen.
Für diese Aufgabe verwenden wir T5 oder Text-to-Text Transfer Transformer.
Der Datensatz
Wir benötigen auch die Trainingsdaten, die das System verwenden wird, um das Beantworten von Fragen zu lernen.
Der Stanford Question Answering Dataset 2.0 (SQuAD 2.0) ist der beliebteste Datensatz zum Leseverständnis.
Nachdem wir nun sowohl den Datensatz als auch den Code haben, sprechen wir über die beiden Ansätze, die wir verwenden können.
- Beantwortung offener Fragen : Sie wissen, wo die Antwort liegt.
- Beantwortung von Fragen mit geschlossenem Buch : Sie wissen nicht, wo die Antwort liegt.
Ansatz Nr. 1: Ein Span-Suchansatz (offenes Buch)
Mit drei einfachen Codezeilen können wir das System dazu bringen, unsere Fragen zu beantworten.

Dies können Sie in Google Colab tun.
Erstellen Sie ein Colab-Notizbuch und geben Sie Folgendes ein:
!pip install transformers from transformers import pipeline
# Allocate a pipeline for question-answering nlp = pipeline('question-answering')
nlp({ 'question': 'What is the name of the repository ?', 'context': 'Pipeline have been included in the huggingface/transformers repository' })
Wenn Sie den Befehl eingeben und eine Frage sowie den Kontext angeben, von dem Sie glauben, dass er die Antwort auf die Frage enthält, wird das System im Grunde genommen nach der Zeichenfolge suchen, die die Antwort enthält.
{'answer': 'huggingface/transformers',
'end': 59,
'score': 0.5135626548884602,
'start': 35}
Die Schritte sind einfach:
- Laden Sie die Transformers NLP-Bibliothek.
- Ordnen Sie eine Pipeline zur Beantwortung von Fragen zu.
- Geben Sie die Frage und den Kontext an (Inhalt / Text, der am wahrscheinlichsten die Antwort enthält).
Wie bekommen Sie den Kontext?
Mit ein paar Codezeilen.
!pip install requests-html from requests_html import HTMLSession session = HTMLSession() url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/" selector = "#post-328471 > div:nth-child(2) > div > div > div.sej-article-content.gototop-pos" with session.get(url) as r: post = r.html.find(selector, first=True) text = post.text
Mithilfe der Anforderungs-HTML-Bibliothek können Sie die URL abrufen, die dem Navigieren des Browsers zur URL entspricht, und einen Selektor bereitstellen (dies ist der Pfad des Elements des Textblocks auf der Seite.)
Ich sollte einfach einen Anruf tätigen, um den Inhalt abzurufen und zum Text hinzuzufügen - und das wird mein Kontext.
In diesem Fall stellen wir eine Frage, die in einem SEJ-Artikel enthalten ist.
Das heißt, wir wissen, wo die Antwort liegt. Wir liefern den Artikel, der die Antwort hat.
Aber was ist, wenn wir nicht wissen, welcher Artikel die Antwort enthält, dann versuchen wir zu fragen?
Ansatz 2: Erkundung der Grenzen von NLG mit T5 & Turing-NLG (Closed Book)
Googles T5 (11-Milliarden-Parametermodell) und Microsofts TuringNG (17-Milliarden-Parametermodell) können Fragen beantworten, ohne einen Kontext anzugeben.
Sie sind so massiv, dass sie sich während des Trainings an viele Dinge erinnern können.
Das T5-Team von Google hat sich bei einer Pub-Trivia-Herausforderung mit dem 11-Milliarden-Parameter-Modell auseinandergesetzt und verloren.
Mal sehen, wie einfach es ist, T5 zu trainieren, um unsere eigenen willkürlichen Fragen zu beantworten.
In diesem Beispiel lautet eine der Fragen, die Batista gestellt hat: "Wer ist die beste Suchmaschinenoptimierung der Welt?"

Die beste Suchmaschinenoptimierung der Welt ist nach einem von Google geschulten Modell SEOmoz.
Trainieren, Feinabstimmen und Nutzen von T5
Training T5
Wir werden das 3-Milliarden-Parameter-Modell mit einem kostenlosen Google Colab TPU trainieren.
Hier ist der technische Plan für die Verwendung von T5:
- Kopieren Sie das Beispiel-Colab-Notizbuch auf Ihr Google Drive.
- Ändern Sie die Laufzeitumgebung in Cloud TPU.
- Erstellen Sie einen Google Cloud Storage-Bucket (verwenden Sie die kostenlosen 300-Dollar-Guthaben).
- Geben Sie den Bucket-Pfad zum Notebook an.
- Wählen Sie das 3-Milliarden-Parameter-Modell.
- Führen Sie die verbleibenden Zellen bis zum Vorhersageschritt aus.
Und jetzt haben Sie ein Modell, das tatsächlich Fragen beantworten kann.
Aber wie fügen wir Ihr proprietäres Wissen hinzu, damit es Fragen in Ihrer Domain oder Branche von Ihrer Website aus beantworten kann?
Hinzufügen neuer proprietärer Schulungsdatensätze
Hier gehen wir in den Feinabstimmungsschritt.
Klicken Sie einfach im Modell auf die Option Feinabstimmung .
Der Code enthält einige Beispiele dafür, wie neue Funktionen erstellt und dem Modell neue Funktionen zugewiesen werden.
Erinnere dich an:
- Verarbeiten Sie Ihre proprietäre Wissensdatenbank in einem Format, das mit T5 funktioniert.
- Passen Sie den vorhandenen Code für diesen Zweck an (Natural Questions, TriviaQA).
Um den Extraktions-, Transformations- und Ladeprozess für maschinelles Lernen zu lernen, lesen Sie Batistas Artikel im Search Engine Journal, Eine praktische Einführung in maschinelles Lernen für SEO-Profis.
FAQ-Schema hinzufügen
Dieser Schritt ist unkompliziert.
Die FAQ finden Sie in der Google-Dokumentation: Markieren Sie Ihre FAQs mit strukturierten Daten.
Fügen Sie dazu die JSON-LD-Struktur hinzu.
Möchten Sie es automatisch tun?
Batista schrieb auch einen Artikel darüber: Eine praktische Einführung in modernes JavaScript für SEOs.
Mit JavaScript sollten Sie in der Lage sein, diese JSON-LD zu generieren.
Ressourcen, um mehr zu erfahren:
- Einführung in Python für SEOs
- Einführung in das maschinelle Lernen für SEOs
- Nutzen Sie SOTA-Modelle mit einer Codezeile
- Erkunden des Transferlernens mit T5
- Tiefes Lernen über Steroide mit der Kraft des Wissenstransfers
- MarketMuse Erster Entwurf
Sehen Sie sich diese Präsentation an
Sie können jetzt Batistas vollständige Präsentation von SEJ eSummit am 2. Juni sehen.
Bildnachweis
Ausgewähltes Bild: Paulo Bobita
Alle Screenshots vom Autor, Juli 2020