不少讀者留言咨詢工具怎么下載,我貼個下載鏈接如下:
工具下載地址:
鏈接接:/s/-iQ
提取碼:6666
從去年國慶第一次看到知乎的那篇文章:如何在百萬級的數據里找到別人正在賺錢的項目(參考資料1),認識到了君言,再順藤摸瓜看完君言在知乎的幾篇文章,對于一直在摸索嘗試用技術從事自媒體寫作的一個技術人,終于感覺找到了用技術做點東西的思路。今年4月18號加入了生財有術后,花了2個多月的碎片時間刷完生財28篇SEO的精華,外加幾篇關鍵詞引流與知乎好物的精華,再回頭來重新把君言的所有文章讀了幾遍,斷斷續續把這些文章涉及的功能做成了一個小工具集合:生財工具,生財工具的腦圖介紹如下:
關鍵詞工具
關鍵詞工具一、關鍵詞工具
1.關鍵詞內容挖掘工具
無論是通過SEO獲取免費流量,還是通過SEM做競價投放,我們都會先研究一下關鍵詞目前在搜索引擎的收錄情況,為了方便的收集一批關鍵詞在搜索引擎的收錄情況,就需要工具自動輸入關鍵詞然后收集搜索引擎返回的內容,我們通過收集這些鏈接,提取標題,還可以通過提取域名快速找到目前做到比較好的同行網站有哪些,研究同行網站的關鍵詞布局與內容向來是做互聯網項目的必備技能。
關鍵詞內容挖掘工具的操作視頻:
關鍵詞內容挖掘工具的相關截圖:
關鍵詞工具
關鍵詞內容工具的使用很簡單:輸入你想挖掘的詞根,比如:抖音,選擇包含詞根的長尾詞文件,關鍵詞內容挖掘工具會自動使用長尾詞帶入百度搜索挖掘出排名在首頁的文章鏈接。
關鍵詞挖掘工具爬取一段時間后我們得到如下的文件:
包括域名、域名描述、鏈接標題、鏈接地址以及在百度的排名權重,如下所示:
關鍵詞工具
提取鏈接的域名,再根據百度的排名權重將域名進行排名統計,我們可以很
方便的得到一份相關領域的行業域名庫,如下所示:
關鍵詞工具
2.關鍵詞內容下載
通過上面的關鍵詞內容挖掘工具,我們已經找到一批搜索引擎收錄的排名靠前的鏈接,為了更好的研究這些內容,我們通常希望將這些內容直接下載到本地電腦保存起來,這樣一是為了方便查看,另外也可以快速的進行模仿再創作,所以還是需要一個工具批量下載這些鏈接的內容工具,關鍵詞內容下載工具就是用來自動下載這些鏈接內容,并支持多種格式,如html,純文本與word格式等。
關鍵詞內容下載工具視頻如下:
關鍵詞內容下載工具截圖如下:
關鍵詞內容下載工具的使用也很簡單:
下載一段時間后,我們就得到三種文件格式的內容,分別保存在三個文件夾中,如下:
3.關鍵詞基于海量內容挖詞
從事搜索引擎營銷都知道,做好SEO和SEM最重要的事情就是關鍵詞挖掘,挖的詞越多,就越有可能發現更多的流量機會。關鍵詞挖掘有很多種方法,這里介紹的是基于海量內容挖詞方法,也是目前搜索引擎提取關鍵詞的一種常用方法,專業的技術說法是:通過TF-IDF算法提取文章關鍵詞。這個工具的思路也是來自君言的文章(文末的參考資料:6),這里我們利用一批新聞語料庫和目標行業文章來保證收集的關鍵詞的行業準確性,新聞語料庫可以直接從一些自然語言處理網站下載現成的,另外就是需要收集你需要提取的關鍵詞目標行業的文章,這些文章從哪里下載?很簡單,上面的關鍵詞內容下載工具就可以用來下載這些行業文章,另外也可以直接通過知乎來收集。
關鍵詞基于海量內容挖詞工具的的使用視頻:
關鍵詞基于海量內容挖詞工具的的使用截圖:
目標內容就是我們準備提取的關鍵詞內容,目前支持主流的文件格式:html、txt、word和pdf格式。
為了認為控制提取詞的準確度,我們一般提取TF-IDF得分排名前20%的關鍵詞,具體可以根據提取的效果調整這個比值。
語料庫需要預先準備,一般以新聞語料庫為主。
為了加快語料庫的加載速度,我們可以加載每份語料庫的一部分,具體使用可以根據提取關鍵詞的準確度調整這個比值。
算法不是萬能的,當某些詞很頻繁的出現在很多語料庫中時,我們認為通過這個閾值過濾掉這些關鍵詞,保證提取的準確度。
這里我以小曾的一些文章作為目標內容,挖掘君言部分文章得到的關鍵詞如下:
4.關鍵詞相關搜索
如果你已經明確準備研究一個領域的需求,有什么方式可以把這個領域所涉及的需求盡可能都提取出來,無論用戶是怎么表達的?君言的一篇付費文章(參考資料:5)給出了一種非常巧妙可操作性強的方法:搜索引擎的相關詞搜索。
挖掘百度搜索引擎的相關詞有一個難點:如何保證相關詞的相關性?如果不做相關性校驗,直接爬取的關鍵詞會很快偏離我們的要求,比如:引流,這個詞根很容易爬取到很多醫學類關鍵詞,所以必須控制關鍵詞的相關性。
君言在付費文章提出了一種方法解決了這個問題:使用相關詞搜索結果的鏈接域名判斷,具體細節這里不作展開,感興趣的可以直接看那篇付費文章,非常值得一看,如果你是生財有術星球的會員可以直接在星球找到這篇文章免費查看。
使用這個工具還有一個小困難點:怎么收集一個領域的行業域名庫?很簡單,上面的關鍵詞內容挖掘工具就可以解決這個問題,工具在收集內容的同時自動提取鏈接的域名并按照搜索引擎的排名對域名進行排序,我們就得到了一份行業域名庫了。
關鍵詞相關詞搜索工具的操作視頻:
關鍵詞相關詞搜索的工具的使用截屏如下:
就是我們需要爬取的關鍵詞詞根,比如:引流。
如果開啟域名相關性校驗,我們會使用百度收錄關鍵詞鏈接的域名判斷該關鍵詞是否與要搜索的詞根相關。
行業域名庫文件保證關鍵詞的鏈接域名包含在這份域名庫文件中,這個域名庫文件可以通過前面的關鍵詞內容挖掘工具整理得到,如下:
排除域名庫文件是為了排除很多大的域名基本覆蓋了任何行業的搜索結果:比如百度、百度知道、知乎、新浪等。這個手動整理一次就可以了,再根據爬取結果調整這份域名庫文件,如下所示:
我們在判斷詞詞不是相關詞的同時,記錄下這些我們判斷為非相關詞的鏈接的域名與域名的描述,從這份域名文件我們可以判斷出哪些域名是我們收集行業域名庫漏掉的,我們可以加進去提高判斷關鍵詞是否相關的準確性,不斷豐富關鍵詞行業域名庫,如下:
為什么要將這部分關鍵詞單獨提取出來一個文件?因為這些包含空格的關鍵詞都包含用戶強烈的搜索需求,想一想自己的搜索習慣,當搜不到自己需要的結果時哪個軟件可以挖掘關鍵詞,是不是下意識的加些空格希望搜索引擎更準確的給出搜索結果,一些示例關鍵詞如下:
我們將關鍵詞在百度的搜索結果也記錄下來,便于二次分析,比如我們調整了行業域名庫,就可以直接分析上次的爬取結果,不用在重新爬取了,如下:
5.關鍵詞分詞
通過關鍵詞找項目的重點在于挖掘海量用戶的需求,再去做自動化歸類,數據量越大,歸類越智能,找到的需求就越清晰,而分詞是關鍵詞挖掘項目的必備操作。
一個簡單的分詞舉例如下:
怎么下載抖音的視頻 --> 怎么、下載、抖音、的、視頻。
當我們拿到一批長尾詞,通常需要對長尾詞進行分詞,統計詞根詞頻,關鍵詞往往符合2/8定律,結合分詞統計的詞根覆蓋率就能把能覆蓋80%詞量的20%詞根重新進行拓展,基本就能收集到有代表性的詞庫。
關鍵詞分詞工具的操作視頻:
關鍵詞分詞工具的相關截圖:
詞根比如:抖音,這個詞根就是準備分詞的長尾詞文件的詞根。
目前支持中文與英文,英文的分詞效果不太好,后面會專門抽出時間來優化這個英文分詞功能。
這次準備分詞的長尾詞文件,不限于長尾詞也可以是一批短文本,比如鏈接標題、文章標題等短文本都可以。
把你不想要的關鍵詞詞根,比如一些黑詞的詞根,還有我們明確知道不想要的詞根,比如我們從5118上導出了一批“引流“長尾詞,想對這些長尾詞進行分析,我們已經知道比如一些醫學詞根比如:導管、試管、手術這些明顯是不相關的詞根,我們可以用一個文件把這些不相關的詞放在一起排除掉,這樣分類結果就不會有這些詞了。
不可分割詞是為了保證一些詞不要被拆開,因為分詞工具也不是萬能的,比如:今日頭條、視頻號這兩個詞不要被拆開成:今日、頭條,視頻、號。我們將這些不想被拆開的詞也整理成一個文件放到一起,這樣就可以提高分詞的準確性。
這里我們還是以"抖音"給出一份分詞后的效果截屏:
我們簡單解釋一下上面excel的含義:
比如,第4行:視頻,就是“視頻”這個詞根在這份“抖音”長尾詞中出現的次數。
比如,第4行:視頻,該詞根的詞頻占“抖音”長尾詞數量的比例。有了詞頻覆蓋率的參考,便能一眼看出該詞根的比重,快速了解該詞根的重要程度。
有了詞頻覆蓋率,為什么還要一個詞頻累計覆蓋率指標了?因為關鍵詞往往符合2/8定律,為了方便的統計一份長尾詞庫中覆蓋了80%長尾詞的詞根,我們在生成這個文件的同時從上到下累計每個詞根的覆蓋率就得到了詞頻累計覆蓋率,然后直接觀察“詞頻統計覆蓋率”這一列,從上到下拖到80%這個值就表示之前的所有行就是代表整個長尾詞庫80%的詞根了。
我們還可以用詞根:把能覆蓋80%詞量的20%詞根都去拓展與一些描述詞進行重新組合繼續拓展更多的長尾詞詞,這樣基本就能收集到有代表性的詞庫了。
6.關鍵詞分類
在搜索引擎上,找到 50 萬個屬于某個行業長尾詞詞庫絕對是一種很強的能力,現在我們已經可以通過一些第三詞庫網站拿到50萬甚至更多的詞庫,但是如果對50萬乃至百萬級長尾詞進行自動化分類,這是有點技術難度的,通過excel基本無法做到,我們其實通過機器學習的文本分類技術是能夠在幾十分鐘內完成百萬級長尾詞的分類。
其實通過上面的一系列工具,我們已經準備了一批長尾詞,下面將使用關鍵詞分類工具對關鍵詞進行分類,在分類的過程中會對關鍵詞去重、去短、去長,還可以自定義排除詞文件將非目標詞移除等處理:
關鍵詞分類工具的操作視頻如下:
關鍵詞分類工具的相關截屏如下:
我們還是以一份50萬的抖音長尾詞為例,給出分類的效果截屏:
從上面的excel文件我們可以很方便的將一份幾十萬長尾詞按照分類數量整理到一份excel中,每一列就是分成一類的長尾詞,列的標題是這一列長尾詞除了詞根(抖音)之外出現最頻繁的2個詞根,還統計了這一類長尾詞有多少個以及在整個長尾詞庫的占比。
另外,關鍵詞分類工具同時將每一列單獨生成一個文件方便查看,如下:
至于,如何我們應該如何使用分類后的文件,這里給出君言文章的一些片段說明:
這樣一份Excel,已經自動幫我們歸類好相似的關鍵詞,不同類的詞會間隔開,好處在于:
1:某些詞可能只是小部分字眼不同,但實際表述的都是一件事,程序能幫你歸類出來
2:聚集在一起的一批詞,我們一眼就可以看出這是一個什么樣的需求,越多越清晰
3:相關的已經歸類在一起了,后面不會再出現類似需求,不會反復干擾
在生財有術的精華文章里,也有一篇關于“口水”小病種的淘寶藍海選品的文章值得一讀(參考資料9的第4個鏈接)。
另外,經過歸類的長尾詞庫也是一份非常好的自媒體寫作思路來源,特別是那些帶有疑問詞的長尾詞哪個軟件可以挖掘關鍵詞,比如:抖音怎么類的長尾詞,這對于從事抖音相關自媒體培訓創作的作者來說,在你沒有寫作思路的時候不妨從這些長尾詞中找些靈感,畢竟這些長尾詞都是用戶真實的搜索需求。
7.關鍵詞思維導圖生成
通過關鍵詞歸類工具歸類后的長尾詞是沒有結構的,一份詞庫生成之后,你只能從上往下看,看到什么是什么。
其實我們可以使用我們日常工作經常用的腦圖工具來可視化呈現關鍵詞的分類效果,關鍵字分類工具就是采用君言介紹的關鍵詞根提取法“的方式來歸類,使歸類好的關鍵詞自動按照思維導圖的結構展示出來。
關鍵詞思維導圖工具的操作視頻:
關鍵詞思維導圖工具的相關截圖:
還是以抖音為例,生成一份關鍵詞思維導圖工具如下:
另外,根據多個用戶的反饋,長尾詞達到百萬級以后生成的思維導圖太大很難打開,所以參考了知乎問天文章(最近發現該文章已被刪除)的做法做了多文件夾顯示長尾詞:
二、參考資料
由于平臺限制,相關鏈接沒有給出,可以自行搜索。
1.如何在百萬級的數據里找到別人正在賺錢的項目
2.如何輕松找到抖音里不起眼的賺錢項目
3.學會這幾點,就可以在百萬數據里找到能賺錢的項目
4.零粉絲,運用錯位競爭,運營「好物推薦」
5.用逆向思維收集大量被忽略的"聲音"
6.百度競價廣告:窮盡藍海流量-收集篇
7.SEO采集海量文章,用倒排索引找出"類似的標題"
8.我在阿里巴巴的流量方法論
9.生財有術SEO精華
10.TF-IDF的應用:自動提取關鍵詞
11.通過挖掘細分市場的一個案例
最后以小曾的一段話來結束這篇文章:
研究好關鍵詞就成功了?半! 那其實我們還有聽過?句話:解決核?問題就解決了80%的問題。 對于這些領域,關鍵詞就是核?問題 所以以我過往的經驗來看:何??半!。
不少讀者留言咨詢工具怎么下載,我貼個下載鏈接如下:
工具下載地址:
鏈接接:/s/-iQ
提取碼:6666
如果你覺得這個工具對你啟發或有疑問歡迎留言討論,寫代碼不易,也請支持一下這篇文章~