如同程序員,有那些培訓(xùn)機(jī)構(gòu)教出來且不再精進(jìn),總是百度一下來復(fù)制粘貼現(xiàn)成代碼,連英文文檔都不會(huì)去看的;也有在世界最前沿領(lǐng)域攻克人工智能難題,可能會(huì)引領(lǐng)時(shí)代的。許多行業(yè)的上下限差距極大,同樣,不該以可以粗略了解到的SEO從業(yè)者平均水平,來設(shè)法度量這個(gè)領(lǐng)域所可能達(dá)到的上限。下面具體詳解從最初的學(xué)習(xí)到后續(xù)研究所會(huì)經(jīng)歷的階段。
基礎(chǔ)夯實(shí)的主要步驟
百度及Google官方網(wǎng)站指南 -> 搜索引擎原理 推薦《走進(jìn)搜索引擎》與《這就是搜索引擎》 -> 百度專利 早期申請(qǐng)人為李彥宏或姚旭等人的基礎(chǔ)架構(gòu)部分,以及近期的
無論官網(wǎng)指南還是專利這般生澀文檔,一切由翻閱現(xiàn)成資料可獲得的知識(shí),似乎都只應(yīng)歸入新手入門的學(xué)習(xí)階段——行業(yè)頭部不少人大約在十多年已經(jīng)完成這些進(jìn)度。即便早年我與人合著過《SEO深度解析》,但回頭看來,唯有從搜索引擎?zhèn)热胧謱W(xué)習(xí)才是值得推薦的方向。
進(jìn)階探索的主要步驟
程序技術(shù) 非程序員寫代碼最常使用Python -> 數(shù)據(jù)分析 統(tǒng)計(jì)學(xué)為主
國(guó)外SEOMOZ在十年前組織用Pearson相關(guān)系數(shù)(后轉(zhuǎn)為使用Spearman)在已知可能有效的排序規(guī)則之中,設(shè)法量化出各項(xiàng)的重要性,便是典型一例。
后續(xù)研究的主要步驟
機(jī)器學(xué)習(xí) 深度學(xué)習(xí)為主 -> 抓取全網(wǎng)數(shù)據(jù) -> 溯因推理 基礎(chǔ)的如穆勒五法
因?yàn)槿缃袼阉饕娴拇蠖嘁?guī)則都由深度學(xué)習(xí)等手段而得出,若沒親身寫過相關(guān)代碼,就沒法切實(shí)了解到特征抽取、樣本歸納、過擬合等的關(guān)鍵原理,以及因果倒置、特征穿越等機(jī)器學(xué)習(xí)的天生缺陷。若缺乏這些知識(shí),就無從想象哪些網(wǎng)頁(yè)特征(有一部分特征表面看來非常奇怪)可能會(huì)大幅影響排名表現(xiàn)。
由海量的已知排名「結(jié)果」,批量去反向推導(dǎo)出其「原因」也即已知/潛在的排序因素,并盡可能進(jìn)行因果推斷,有時(shí)需要些邏輯學(xué)基礎(chǔ)來支撐。
邏輯規(guī)則放諸四海都是不變的,因此有個(gè)別足夠聰明的人,無需專業(yè)學(xué)習(xí)也一樣能得到類似的成效,有時(shí)同樣做好得到巨大的流量效果。但顯然系統(tǒng)的學(xué)習(xí),對(duì)于不同人具有普適性,并且成效會(huì)更穩(wěn)定。
再更進(jìn)一步的,由于搜索引擎規(guī)則過于繁雜,逐步推理的手段只能解決一小部分重要問題,卻難以廣泛覆蓋到所有情境。目前百度的策略已經(jīng)非常依賴于其自行訓(xùn)練的語(yǔ)言模型,想搞明白一個(gè)AI模型具體做了什么的最佳方法,就是訓(xùn)練另一個(gè)專門反解它的AI模型,諸如OpenAI就用GPT4去搞清楚GPT2的內(nèi)部特定神經(jīng)元到底做了什么。
盡管非專業(yè)做技術(shù),但在十余年的時(shí)間中,我保持著幾乎每天寫代碼來獲取、分析、監(jiān)控各式數(shù)據(jù)的習(xí)慣,有充足的代碼經(jīng)驗(yàn)積累,以此再花了額外約三個(gè)月的時(shí)間訓(xùn)練了一些AI模型。即便它們不可能解決所有的SEO問題,但仍在個(gè)別特定的排名規(guī)則研究上,得到了遠(yuǎn)遠(yuǎn)超越我過去多年研究的成果。
除了AI生成文章內(nèi)容以外,像是根據(jù)對(duì)百度模型的排序規(guī)則的精細(xì)理解,結(jié)合具體正文內(nèi)容,來針對(duì)修改網(wǎng)站原有文章的標(biāo)題等等方式,可以利用起一部分網(wǎng)站原有的多年深厚基礎(chǔ),這類操作的效果其實(shí)才是真正容易讓流量一下暴漲的。像是提到的改title,誰(shuí)都知道只要title上面沒寫關(guān)鍵詞就幾乎沒法有排名,其實(shí)它也正是提升空間最大的地方之一,只改它往往就能在一個(gè)大型站點(diǎn)直接帶來許多人不可想象的幾倍日均UV增長(zhǎng)。在頁(yè)面所引用的知乎上發(fā)布的文章中有提到一些早年稍微相關(guān)的案例。
這些就是我在十余年的時(shí)間里面做過的詳細(xì)探索的原理方向,其實(shí)際成效便體現(xiàn)在了本站官網(wǎng)以及其它無數(shù)令同行可望不可及的案例之中。然而,業(yè)內(nèi)有許多人至今都未完成上述的第一個(gè)學(xué)習(xí)階段,一共做出過的流量提升實(shí)效可能也就幾千幾萬的日均IP,卻常斷言「SEO是一個(gè)簡(jiǎn)單的事情,不存在什么深?yuàn)W操作」,久而久之導(dǎo)致其它業(yè)內(nèi)業(yè)外人士也往往都這么想,就相當(dāng)不合適。