Melakukan Lebih Banyak dengan Lebih Sedikit: Pembuatan Konten Otomatis dan Berkualitas Tinggi
Diterbitkan: 2020-12-12Bagaimana Anda terus memberikan hasil yang luar biasa dengan waktu dan sumber daya yang terbatas?
Menulis konten berkualitas yang mendidik dan membujuk masih merupakan cara yang pasti untuk mencapai tujuan lalu lintas dan konversi Anda.
Tetapi prosesnya merupakan pekerjaan manual yang sulit yang tidak berskala.
Untungnya, kemajuan terbaru dalam Natural Language Understanding and Generation menawarkan beberapa hasil yang menjanjikan dan menarik.
Untuk sesi SEJ eSummit, Hamlet Batista membahas apa yang mungkin dilakukan saat ini dengan menggunakan contoh praktis (dan kode) yang dapat diikuti dan diadaptasi oleh para profesional SEO teknis untuk bisnis mereka.
Berikut rekap presentasinya.
Saran Pelengkapan Otomatis
Berapa kali Anda mengalami ini?
Apakah saya satu-satunya yang terkadang takut dengan seberapa spesifik dan relevannya dokumen Google dan saran Gmail?
Anda sedang menulis teks dan [keseluruhan bagian ini dapat disarankan].
Maksud saya, ini bagus. Tapi itu menakutkan. 🤪😱
- Kristina Azarenko 📈 (@azarchick) 11 Mei 2020
Anda mulai mengetik di Gmail dan Google secara otomatis menyelesaikan seluruh bagian dan itu sangat akurat.
Anda tahu, ini sangat menarik, tetapi di saat yang sama, bisa sangat menakutkan.
Anda mungkin sudah menggunakan teknologi AI dalam pekerjaan Anda tanpa Anda sadari.
Jika Anda menggunakan fitur Penulisan pintar Google Docs, Gmail, atau bahkan Microsoft Word dan Outlook, Anda telah memanfaatkan teknologi ini.
Ini adalah bagian dari hari Anda sebagai pemasar saat Anda berkomunikasi dengan klien.
Hebatnya, teknologi ini tidak hanya dapat diakses oleh Google.
Kunjungi situs Write With Transformer, mulailah mengetik, dan tekan tombol tab untuk ide kalimat lengkap.
Batista mendemonstrasikan bagaimana setelah memasukkan judul dan kalimat dari artikel SEJ baru-baru ini, mesin dapat mulai membuat baris - Anda hanya perlu menekan perintah pelengkapan otomatis.
Semua teks yang disorot di atas sepenuhnya dibuat oleh komputer.
Hal yang keren tentang ini adalah bahwa teknologi yang memungkinkan hal ini tersedia secara gratis dan dapat diakses oleh siapa saja yang ingin menggunakannya.
Pencarian Berbasis Maksud
Salah satu perubahan yang kami lihat saat ini di SEO adalah transisi ke penelusuran berbasis niat.
Seperti yang dijelaskan oleh Mindy Weinstein dalam artikel Jurnal Mesin Pencari, Cara Mendalam dengan Riset Kata Kunci:
“Kita berada di era di mana penelusuran berbasis niat lebih penting bagi kami daripada volume murni.”
"Anda harus mengambil langkah ekstra untuk mempelajari pertanyaan yang diajukan pelanggan dan bagaimana mereka menggambarkan masalah mereka."
"Beralih dari kata kunci ke pertanyaan"
Perubahan ini memberikan peluang bagi kami saat kami menulis konten.
Kesempatan
Mesin pencari adalah mesin penjawab hari ini.
Dan salah satu cara efektif untuk menulis konten orisinal dan populer adalah menjawab pertanyaan terpenting audiens target Anda.
Lihat contoh ini untuk kueri "python for seo".
Hasil pertama menunjukkan kita dapat memanfaatkan konten yang menjawab pertanyaan, dalam hal ini menggunakan skema FAQ.
Cuplikan pencarian FAQ mengambil lebih banyak real estat di SERPs.
Namun, melakukan ini secara manual untuk setiap konten yang akan Anda buat bisa mahal dan memakan waktu.
Tetapi bagaimana jika kita dapat mengotomatiskannya dengan memanfaatkan AI dan aset konten yang ada?
Memanfaatkan Pengetahuan yang Ada
Sebagian besar bisnis mapan sudah memiliki basis pengetahuan kepemilikan yang berharga yang telah mereka kembangkan dari waktu ke waktu hanya melalui interaksi normal dengan pelanggan.
Seringkali ini belum tersedia untuk umum (email dukungan, obrolan, wiki internal).
AI + Pengetahuan Kepemilikan Sumber Terbuka
Melalui teknik yang disebut "Transfer Learning", kami dapat menghasilkan konten asli dan berkualitas dengan menggabungkan basis pengetahuan eksklusif dan model serta kumpulan data deep learning publik.
Ada perbedaan antara pembelajaran mesin tradisional (ML) dan pembelajaran mendalam ,.
Dalam ML tradisional, Anda terutama melakukan klasifikasi dan memanfaatkan pengetahuan yang ada untuk menghasilkan prediksi.
Sekarang dengan pembelajaran mendalam, Anda dapat memanfaatkan pengetahuan akal sehat yang telah dibangun dari waktu ke waktu oleh perusahaan besar seperti Google, Facebook, Microsoft, dan lainnya.
Dalam sesi tersebut, Batista mendemonstrasikan bagaimana ini bisa dilakukan.
Bagaimana Mengotomatiskan Pembuatan Konten
Berikut adalah langkah-langkah yang harus diambil ketika meninjau pendekatan pembuatan pertanyaan dan jawaban otomatis.
- Temukan pertanyaan populer menggunakan alat online.
- Jawab mereka menggunakan dua pendekatan NLG:
- Pendekatan pencarian rentang.
- Pendekatan "buku tertutup".
- Tambahkan skema FAQ dan validasi menggunakan SDTT.
Sumber Pertanyaan Populer
Menemukan pertanyaan populer berdasarkan kata kunci Anda bukanlah tantangan besar karena ada alat gratis yang dapat Anda gunakan untuk melakukan ini.
Jawab Umum
Cukup ketik kata kunci dan Anda bisa mendapatkan banyak pertanyaan yang diajukan pengguna.
Penganalisis Pertanyaan oleh BuzzSumo
Mereka mengumpulkan informasi dari forum dan tempat lain. Anda juga dapat menemukan jenis pertanyaan yang lebih panjang.
JugaAsked.com
Alat ini menghapus pertanyaan Orang Juga Bertanya dari Google.
Sistem Tanya & Jawab
Algoritma
Makalah Dengan Kode adalah sumber besar penelitian mutakhir tentang Menjawab Pertanyaan.
Ini memungkinkan Anda untuk dengan bebas memanfaatkan penelitian terbaru yang sedang diterbitkan.
Akademisi dan peneliti memposting penelitian mereka sehingga mereka bisa mendapatkan umpan balik dari rekan-rekan mereka.
Mereka selalu menantang satu sama lain untuk menghasilkan sistem yang lebih baik.
Yang lebih menarik adalah bahkan orang seperti kita dapat mengakses kode yang kita perlukan untuk menjawab pertanyaan.
Untuk tugas ini, kita akan menggunakan T5, atau Text-to-Text Transfer Transformer.
Kumpulan Data
Kami juga membutuhkan data pelatihan yang akan digunakan sistem untuk belajar menjawab pertanyaan.
Set Data Jawaban Pertanyaan Stanford 2.0 (SQuAD 2.0) adalah kumpulan data pemahaman bacaan yang paling populer.
Sekarang setelah kita memiliki kumpulan data dan kodenya, mari kita bicara tentang dua pendekatan yang dapat kita gunakan.
- Menjawab pertanyaan buku terbuka : Anda tahu di mana jawabannya.
- Menjawab pertanyaan buku tertutup : Anda tidak tahu di mana jawabannya.
Pendekatan # 1: Pendekatan Pencarian Rentang (Buku Terbuka)
Dengan tiga baris kode sederhana, kita bisa mendapatkan sistem untuk menjawab pertanyaan kita.
Ini adalah sesuatu yang dapat Anda lakukan di Google Colab.
Buat buku catatan Colab dan ketikkan yang berikut ini:
!pip install transformers from transformers import pipeline
# Allocate a pipeline for question-answering nlp = pipeline('question-answering')
nlp({ 'question': 'What is the name of the repository ?', 'context': 'Pipeline have been included in the huggingface/transformers repository' })
Saat Anda mengetik perintah - memberikan pertanyaan, serta konteks yang menurut Anda memiliki jawaban atas pertanyaan tersebut - Anda akan melihat sistem pada dasarnya melakukan pencarian untuk string yang memiliki jawabannya.
{'answer': 'huggingface/transformers',
'end': 59,
'score': 0.5135626548884602,
'start': 35}
Langkah-langkahnya sederhana:
- Muat pustaka Transformers NLP.
- Alokasikan pipa Penjawab Pertanyaan.
- Berikan pertanyaan dan konteks (konten / teks yang kemungkinan besar menyertakan jawabannya).
Jadi, bagaimana Anda akan mendapatkan konteksnya?
Dengan beberapa baris kode.
!pip install requests-html from requests_html import HTMLSession session = HTMLSession() url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/" selector = "#post-328471 > div:nth-child(2) > div > div > div.sej-article-content.gototop-pos" with session.get(url) as r: post = r.html.find(selector, first=True) text = post.text
Dengan menggunakan pustaka HTML permintaan, Anda dapat menarik URL - yang setara dengan menavigasi browser ke URL - dan menyediakan selektor (yang merupakan jalur elemen blok teks pada halaman.)
Saya hanya perlu membuat panggilan untuk menarik konten dan menambahkannya ke teks - dan itu menjadi konteks saya.
Dalam contoh ini, kami akan mengajukan pertanyaan yang termasuk dalam artikel SEJ.
Artinya kita tahu dimana jawabannya. Kami menyediakan artikel yang memiliki jawabannya.
Tetapi bagaimana jika kita tidak tahu artikel apa yang berisi jawabannya maka kita coba bertanya?
Pendekatan # 2: Menjelajahi Batasan NLG dengan T5 & Turing-NLG (Buku Tertutup)
T5 Google (model parameter 11 miliar) dan Microsoft TuringNG (model parameter 17 miliar) dapat menjawab pertanyaan tanpa memberikan konteks apa pun.
Mereka sangat besar sehingga mereka mampu mengingat banyak hal saat mereka berlatih.
Tim T5 Google berhadapan langsung dengan model parameter 11 miliar dalam tantangan pub trivia dan kalah.
Mari kita lihat betapa sederhananya melatih T5 untuk menjawab pertanyaan sewenang-wenang kita sendiri.
Dalam contoh ini, salah satu pertanyaan yang diajukan Batista adalah "Siapa SEO terbaik di dunia?"
SEO terbaik di dunia, menurut model yang dilatih oleh Google adalah SEOmoz.
Cara Melatih, Menyempurnakan & Memanfaatkan T5
Pelatihan T5
Kami akan melatih model parameter 3 miliar menggunakan TPU Google Colab gratis.
Berikut adalah rencana teknis penggunaan T5:
- Salin contoh notebook Colab ke Google Drive Anda.
- Ubah lingkungan runtime ke Cloud TPU.
- Buat keranjang Google Cloud Storage (gunakan kredit $ 300 gratis).
- Berikan jalur keranjang ke notebook.
- Pilih model 3 miliar parameter.
- Jalankan sel yang tersisa hingga langkah prediksi.
Dan sekarang Anda memiliki model yang benar-benar dapat menjawab pertanyaan.
Tetapi bagaimana kami menambahkan pengetahuan kepemilikan Anda sehingga dapat menjawab pertanyaan di domain atau industri Anda dari situs web Anda?
Menambahkan Set Data Pelatihan Kepemilikan Baru
Di sinilah kita masuk ke langkah fine-tuning.
Cukup klik opsi Sempurnakan di model.
Dan ada beberapa contoh dalam kode bagaimana membuat fungsionalitas baru dan bagaimana memberikan kemampuan baru pada model.
Ingatlah untuk:
- Memproses ulang basis pengetahuan Anda menjadi format yang dapat bekerja dengan T5.
- Sesuaikan kode yang ada untuk tujuan ini (Pertanyaan Alami, TriviaQA).
Untuk mempelajari proses ekstrak, transformasi, dan pemuatan pembelajaran mesin, baca artikel Jurnal Mesin Pencari Batista, Pengantar Praktis Pembelajaran Mesin untuk Profesional SEO.
Menambahkan Skema FAQ
Langkah ini lurus ke depan.
Cukup buka dokumentasi Google untuk FAQ: Markup FAQ Anda dengan data terstruktur.
Tambahkan struktur JSON-LD untuk itu.
Apakah Anda ingin melakukannya secara otomatis?
Batista juga menulis artikel tentang itu: Pengenalan Langsung ke JavaScript Modern untuk SEO.
Dengan JavaScript, Anda seharusnya dapat membuat JSON-LD ini.
Sumber Daya untuk Mempelajari Lebih Lanjut:
- Pengantar Python untuk SEO
- Pengantar Machine Learning untuk SEO
- Manfaatkan model SOTA dengan satu baris kode
- Menjelajahi Pembelajaran Transfer dengan T5
- Pembelajaran Mendalam tentang Steroid dengan Kekuatan Transfer Pengetahuan
- Konsep Pertama MarketMuse
Tonton Presentasi ini
Presentasi lengkap Batista dari SEJ eSummit kini bisa Anda saksikan pada 2 Juni mendatang.
Kredit Gambar
Gambar Unggulan: Paulo Bobita
Semua tangkapan layar diambil oleh penulis, Juli 2020