百度新排名算法解密,百度前同事離職告訴我的
他喵的,我現(xiàn)在做站能想到的就是抓數(shù)據(jù)、買友鏈、發(fā)外鏈,其他的感覺無能為力了....
太復(fù)雜了,其實(shí)就為了一件事,滿足用戶需求
24年大約十月份,一個以前的同事從百度離職了,正式開始創(chuàng)業(yè)了,他有優(yōu)勢,以前在百度搜索算法邊緣崗任職。今天跟這朋友聊的核心主要下邊幾個:
百度算法到底有沒有邏輯性,有多大?
他說,當(dāng)然有邏輯性,他們部門雖說是算法邊緣位置,但是他多少也了解一些,他們的算法中心很大,具體多少人不清楚,每個部分都是只干自己的事情,互相不干涉,結(jié)構(gòu)也很復(fù)雜,很多工種只是寫文檔,從搜索用戶需求出發(fā),寫文檔,寫完文檔開研討會,如果文檔有進(jìn)一步的可能,那就會進(jìn)入下一個需求池子,具體下一個池子是哪個部門、哪個人負(fù)責(zé)根本不知道。
百度算法的邏輯相當(dāng)復(fù)雜,這也是問什么百度大更新時站長們都肝顫的原因,因?yàn)檎l都不清楚到哪個環(huán)節(jié)、哪個流程就會咔掉一大堆站,然后算法到某個評估環(huán)節(jié)后又蹭蹭的漲。
跟朋友聊完后,我大概整理了一下,我也只能整理一個邏輯,因?yàn)榫唧w的算法 我這個朋友都摸不清楚。
抓取算法大概流程(主要以新站說)
新站上線后,百度獲取新站的方法
1.主動提交給百度
2.通過所謂的蜘蛛、機(jī)器人爬取(友鏈方式)
3.有人搜索了這個域名
4.BA信息
5.域名實(shí)名信息
核心就這幾種獲取新站的方式,但是有1點(diǎn)很重要,即便百度知道有你這個新站上線了也不會立即就主動去抓取,后邊的內(nèi)容會講原因,我這哥們說光跑這些業(yè)務(wù)的機(jī)器就有幾千臺。
對于咱們新站尤其是國內(nèi)的新站來說主動提交、友鏈、BA 這幾個動作都很重要、非常重要,這就是抓取環(huán)節(jié)的邏輯性。
怎么提高百度抓取的可能性?有沒有捷徑?
答案:有,但是我這朋友也只能說個大概,因?yàn)樗吘壛恕#ㄒ灿锌赡苋思抑啦桓嬖V我)
新站評估的方式很多,這哥們接觸到的有以下幾個邏輯點(diǎn)
1.社會關(guān)系復(fù)雜的優(yōu)先抓取(例如新站上線就有很多友鏈)(又或者上線后就有幾十萬、上百萬的搜索需求的)
2.上流社會的優(yōu)先收錄(例如上線后就有百度、淘寶、京東等等各大平臺的友鏈)
3.內(nèi)容為王,就是內(nèi)容多,更新速度越快給予的蜘蛛份額越足。(但是一直提供垃圾、重復(fù)內(nèi)容,蜘蛛一般都會斷崖式下滑,直至為0)
4.是否有價(jià)值,就是說即便你內(nèi)容很多、更新也很頻繁,對于百度來說沒價(jià)值,也不會給你好臉色,18年以前百度的算法是不能很好的識別內(nèi)容的,后來搜索算法融入了ai,這個痛點(diǎn)至少解決了80%,也就是說現(xiàn)在百度能精準(zhǔn)的識別出是不是垃圾、重復(fù)內(nèi)容。
5.最核心的來了,例如有一篇文章,百度能精準(zhǔn)的識別出這個標(biāo)題、內(nèi)容是不是解決了用戶搜索的需求,會對每一個網(wǎng)頁進(jìn)行精準(zhǔn)的評分
例如用戶搜索的需求是:今天吃什么
擺在百度面前的有幾千幾萬幾百萬的網(wǎng)頁在等著篩選,A網(wǎng)頁給出的內(nèi)容是十道菜的做法,B網(wǎng)頁給出的是50道菜的做法,C網(wǎng)頁給出的是5道菜的做法并且還給出了這5道菜的訂餐方法,
那這時候百度還會根據(jù)這個搜索的人歷史行為進(jìn)行判斷,例如這個人在百度的維度里是一個寶媽,平時經(jīng)常會做飯,所以百度有70%的概率會給她推A跟B,還有30%的概率會給她推C,因?yàn)榘俣鹊乃惴ɡ锛尤肓薃I,會根據(jù)各種維度去判斷這個寶媽是不是不想做飯了,是不是該訂餐吃一頓了。
我靠,當(dāng)時跟我哥們聊到這里的時候,我都震驚了,TMD百度會琢磨人心了........... 有點(diǎn)恐怖............
這段總結(jié)你們自己來吧.....
上邊內(nèi)容都是說的抓取,并沒有說收錄哦! !!! 意思就是說咱們搞了個新站,人家百度前期還真不一定鳥你的內(nèi)容......
怎么才能提高收錄?有沒有快速收錄的方法?
答案:有
想要提被百度收錄必須要滿足以下幾點(diǎn):
1.滿足上邊說的,讓百度知道你,比如(提交網(wǎng)址、友鏈等)
2.內(nèi)容至少要有搜索需求(大概意思就是說,比如有人會搜索:iphone手機(jī)最新款,而你的內(nèi)容就是介紹iphone手機(jī)最新款的)
3.你的內(nèi)容與別人的內(nèi)容有優(yōu)勢,例如:搜索“iphone手機(jī)最新款”排第一的是一個中關(guān)村在線,中關(guān)村在線已經(jīng)有很深厚的背景及豐富的內(nèi)容了,他的內(nèi)容打8分,而你的內(nèi)容通過各種規(guī)則算法評估后有9分,這時候你肯定被收錄,如果有4分則會先被索引,然后在經(jīng)過一段時間各個維度的算法評估有可能被放出來,有可能永遠(yuǎn)不被放出來
4.這個網(wǎng)頁MD居然會經(jīng)常更新,收錄他。這就是說的好多人做垂直站,例如人家首頁的標(biāo)題就是“iphone手機(jī)最新款”,人家的核心內(nèi)容就是介紹手機(jī)的,這就是往往垂直站排名會占優(yōu)勢的原因
5.即便你的內(nèi)容很差,但是我還是會時不時的翻一翻你的牌子,因?yàn)閷Π俣葋碚f翻你的牌子沒多大成本,如果不翻你的牌子導(dǎo)致你斷更了,至少對百度來說是個損失。百度時不時的翻我們的牌子還有一個原因,就是累計(jì)咱們?nèi)粘Kf的權(quán)重積分,舉個通俗易懂的例子吧,搜索某個詞出來的第一位可能不是啥正牌網(wǎng)站,而你是個正牌網(wǎng)站,但是我大百度誰知道你啊,但是通過友鏈(很多官方網(wǎng)站都指向你)、BA等各種原因我后期經(jīng)過數(shù)據(jù)分析,慢慢發(fā)現(xiàn)好像你這個沙雕才是正牌網(wǎng)站,原來排第一的那個2B是個冒牌的,這時候百度就慢慢把你給提上來了,收錄的內(nèi)容也就越來越多了。
怎么才能有排名?有沒有快速的方法?
答案:有
上邊說了很多,多少也講到了一些排名的規(guī)則,下邊是我這個朋友說的:
要想有排名,首先得有收錄,上邊也說了像提交網(wǎng)址、友鏈、BA等。
在百度內(nèi)部,其實(shí)排名算法更龐大,龐大到經(jīng)常TMD出現(xiàn)BUG,比如一個老站、有內(nèi)容、有歷史、有身份,TMD照樣給你干崩潰,但是百度的排名算法有后手。
例如排名規(guī)則有1000條線或規(guī)則去評估,我這次更新的是第50-99條規(guī)則,我他喵的新規(guī)則上線第二天后直接把京東給干沒影了......別著急,我后邊第500-550條規(guī)則是補(bǔ)救措施,我這500-550條規(guī)則的內(nèi)容是把(京東、頭條、小A、小B)等等關(guān)系戶準(zhǔn)備的,到第五天就給他們恢復(fù)。
當(dāng)我新規(guī)則上線后直接把一群小站長干沒了,別著急,我第900-950條規(guī)則是補(bǔ)救的,我會在這50條規(guī)則里對你們重新進(jìn)行判斷,看看有沒有必要給你們恢復(fù)。當(dāng)百度調(diào)整的是后邊的規(guī)則例如950-1000條規(guī)則,那好,把你干沒了,那你就真沒了.... ....
上邊就是大概百度每次大更新的大概流程,那怎么來提高排名呢?
【快速排名】找到需求,并且對于百度來說是空白的,這個東西在TMD百度內(nèi)部居然有人干過,好像直接被他喵的關(guān)小黑屋了,意思就是百度內(nèi)部有這個數(shù)據(jù),但是一般人拿不到,不過我估計(jì)很多數(shù)據(jù)分析的平臺也能分析出來。
【積分制】例如有一個站是做iphone手機(jī)分析的(我們稱這個站叫A),而你也新做了一個iphone手機(jī)分析網(wǎng)站(你的站是B),A站做了十年了,內(nèi)容有百萬條。
加入十年是10分,百萬內(nèi)容是100分,一共滿足了10個人的搜索需求算10分(我們就只拿最基本的規(guī)則舉例,像內(nèi)容評分這些我們就不說了,因?yàn)檫@哥們都他喵的講不明白),我們就當(dāng)這個網(wǎng)站在百度的總分?jǐn)?shù)是120分,你的站是新站,站齡0分,內(nèi)容有1萬條算10分,從未滿足過用戶搜索需求0分,那么你這個B站就絕對沒排名。
但是如果你一直很穩(wěn)定并且A站一個外鏈都沒有(假設(shè)),而你有十條非常穩(wěn)定的友鏈,那百度就會每天給你加0.01的友鏈分,當(dāng)有一個用戶搜索了一個iphone相關(guān)的內(nèi)容,你這B站有答案而A站沒答案,這時候這個搜索需求就是你的了,當(dāng)你這B站慢慢從各個維度超過了A站的時候,從內(nèi)容更新、滿足需求、友鏈等等各個維度你都超越了A站,那你這個B就絕對比那個A權(quán)重高了。
跟這個哥們聊了不少內(nèi)容,大概就是這么個意思,我曹聊完后我都他喵的灰暗了,這他媽的做站越來越難了,我感覺咱們4414的站長捆在一起也干不過百度啊!!!!!
樓主能分享出來就十分感謝了。這一看就是干貨。
其實(shí),說這么多就一個核心問題--做好內(nèi)容,解決用戶需求。
我們作為普通站長,當(dāng)下只要做好內(nèi)容就可以了。比當(dāng)前競爭網(wǎng)站強(qiáng)一些就可以了。但如何做好內(nèi)容,每個人理解的就不同了。
《我想網(wǎng)》總結(jié):別在一棵樹上吊死,何況這棵樹自己都快倒了。