百度新排名算法解密,百度前同事離職告訴我的
他喵的,我現在做站能想到的就是抓數據、買友鏈、發外鏈,其他的感覺無能為力了....
太復雜了,其實就為了一件事,滿足用戶需求
24年大約十月份,一個以前的同事從百度離職了,正式開始創業了,他有優勢,以前在百度搜索算法邊緣崗任職。今天跟這朋友聊的核心主要下邊幾個:
百度算法到底有沒有邏輯性,有多大?
他說,當然有邏輯性,他們部門雖說是算法邊緣位置,但是他多少也了解一些,他們的算法中心很大,具體多少人不清楚,每個部分都是只干自己的事情,互相不干涉,結構也很復雜,很多工種只是寫文檔,從搜索用戶需求出發,寫文檔,寫完文檔開研討會,如果文檔有進一步的可能,那就會進入下一個需求池子,具體下一個池子是哪個部門、哪個人負責根本不知道。
百度算法的邏輯相當復雜,這也是問什么百度大更新時站長們都肝顫的原因,因為誰都不清楚到哪個環節、哪個流程就會咔掉一大堆站,然后算法到某個評估環節后又蹭蹭的漲。
跟朋友聊完后,我大概整理了一下,我也只能整理一個邏輯,因為具體的算法 我這個朋友都摸不清楚。
抓取算法大概流程(主要以新站說)
新站上線后,百度獲取新站的方法
1.主動提交給百度
2.通過所謂的蜘蛛、機器人爬取(友鏈方式)
3.有人搜索了這個域名
4.BA信息
5.域名實名信息
核心就這幾種獲取新站的方式,但是有1點很重要,即便百度知道有你這個新站上線了也不會立即就主動去抓取,后邊的內容會講原因,我這哥們說光跑這些業務的機器就有幾千臺。
對于咱們新站尤其是國內的新站來說主動提交、友鏈、BA 這幾個動作都很重要、非常重要,這就是抓取環節的邏輯性。
怎么提高百度抓取的可能性?有沒有捷徑?
答案:有,但是我這朋友也只能說個大概,因為他太邊緣了。(也有可能人家知道不告訴我)
新站評估的方式很多,這哥們接觸到的有以下幾個邏輯點
1.社會關系復雜的優先抓取(例如新站上線就有很多友鏈)(又或者上線后就有幾十萬、上百萬的搜索需求的)
2.上流社會的優先收錄(例如上線后就有百度、淘寶、京東等等各大平臺的友鏈)
3.內容為王,就是內容多,更新速度越快給予的蜘蛛份額越足。(但是一直提供垃圾、重復內容,蜘蛛一般都會斷崖式下滑,直至為0)
4.是否有價值,就是說即便你內容很多、更新也很頻繁,對于百度來說沒價值,也不會給你好臉色,18年以前百度的算法是不能很好的識別內容的,后來搜索算法融入了ai,這個痛點至少解決了80%,也就是說現在百度能精準的識別出是不是垃圾、重復內容。
5.最核心的來了,例如有一篇文章,百度能精準的識別出這個標題、內容是不是解決了用戶搜索的需求,會對每一個網頁進行精準的評分
例如用戶搜索的需求是:今天吃什么
擺在百度面前的有幾千幾萬幾百萬的網頁在等著篩選,A網頁給出的內容是十道菜的做法,B網頁給出的是50道菜的做法,C網頁給出的是5道菜的做法并且還給出了這5道菜的訂餐方法,
那這時候百度還會根據這個搜索的人歷史行為進行判斷,例如這個人在百度的維度里是一個寶媽,平時經常會做飯,所以百度有70%的概率會給她推A跟B,還有30%的概率會給她推C,因為百度的算法里加入了AI,會根據各種維度去判斷這個寶媽是不是不想做飯了,是不是該訂餐吃一頓了。
我靠,當時跟我哥們聊到這里的時候,我都震驚了,TMD百度會琢磨人心了........... 有點恐怖............
這段總結你們自己來吧.....
上邊內容都是說的抓取,并沒有說收錄哦! !!! 意思就是說咱們搞了個新站,人家百度前期還真不一定鳥你的內容......
怎么才能提高收錄?有沒有快速收錄的方法?
答案:有
想要提被百度收錄必須要滿足以下幾點:
1.滿足上邊說的,讓百度知道你,比如(提交網址、友鏈等)
2.內容至少要有搜索需求(大概意思就是說,比如有人會搜索:iphone手機最新款,而你的內容就是介紹iphone手機最新款的)
3.你的內容與別人的內容有優勢,例如:搜索“iphone手機最新款”排第一的是一個中關村在線,中關村在線已經有很深厚的背景及豐富的內容了,他的內容打8分,而你的內容通過各種規則算法評估后有9分,這時候你肯定被收錄,如果有4分則會先被索引,然后在經過一段時間各個維度的算法評估有可能被放出來,有可能永遠不被放出來
4.這個網頁MD居然會經常更新,收錄他。這就是說的好多人做垂直站,例如人家首頁的標題就是“iphone手機最新款”,人家的核心內容就是介紹手機的,這就是往往垂直站排名會占優勢的原因
5.即便你的內容很差,但是我還是會時不時的翻一翻你的牌子,因為對百度來說翻你的牌子沒多大成本,如果不翻你的牌子導致你斷更了,至少對百度來說是個損失。百度時不時的翻我們的牌子還有一個原因,就是累計咱們日常所說的權重積分,舉個通俗易懂的例子吧,搜索某個詞出來的第一位可能不是啥正牌網站,而你是個正牌網站,但是我大百度誰知道你啊,但是通過友鏈(很多官方網站都指向你)、BA等各種原因我后期經過數據分析,慢慢發現好像你這個沙雕才是正牌網站,原來排第一的那個2B是個冒牌的,這時候百度就慢慢把你給提上來了,收錄的內容也就越來越多了。
怎么才能有排名?有沒有快速的方法?
答案:有
上邊說了很多,多少也講到了一些排名的規則,下邊是我這個朋友說的:
要想有排名,首先得有收錄,上邊也說了像提交網址、友鏈、BA等。
在百度內部,其實排名算法更龐大,龐大到經常TMD出現BUG,比如一個老站、有內容、有歷史、有身份,TMD照樣給你干崩潰,但是百度的排名算法有后手。
例如排名規則有1000條線或規則去評估,我這次更新的是第50-99條規則,我他喵的新規則上線第二天后直接把京東給干沒影了......別著急,我后邊第500-550條規則是補救措施,我這500-550條規則的內容是把(京東、頭條、小A、小B)等等關系戶準備的,到第五天就給他們恢復。
當我新規則上線后直接把一群小站長干沒了,別著急,我第900-950條規則是補救的,我會在這50條規則里對你們重新進行判斷,看看有沒有必要給你們恢復。當百度調整的是后邊的規則例如950-1000條規則,那好,把你干沒了,那你就真沒了.... ....
上邊就是大概百度每次大更新的大概流程,那怎么來提高排名呢?
【快速排名】找到需求,并且對于百度來說是空白的,這個東西在TMD百度內部居然有人干過,好像直接被他喵的關小黑屋了,意思就是百度內部有這個數據,但是一般人拿不到,不過我估計很多數據分析的平臺也能分析出來。
【積分制】例如有一個站是做iphone手機分析的(我們稱這個站叫A),而你也新做了一個iphone手機分析網站(你的站是B),A站做了十年了,內容有百萬條。
加入十年是10分,百萬內容是100分,一共滿足了10個人的搜索需求算10分(我們就只拿最基本的規則舉例,像內容評分這些我們就不說了,因為這哥們都他喵的講不明白),我們就當這個網站在百度的總分數是120分,你的站是新站,站齡0分,內容有1萬條算10分,從未滿足過用戶搜索需求0分,那么你這個B站就絕對沒排名。
但是如果你一直很穩定并且A站一個外鏈都沒有(假設),而你有十條非常穩定的友鏈,那百度就會每天給你加0.01的友鏈分,當有一個用戶搜索了一個iphone相關的內容,你這B站有答案而A站沒答案,這時候這個搜索需求就是你的了,當你這B站慢慢從各個維度超過了A站的時候,從內容更新、滿足需求、友鏈等等各個維度你都超越了A站,那你這個B就絕對比那個A權重高了。
跟這個哥們聊了不少內容,大概就是這么個意思,我曹聊完后我都他喵的灰暗了,這他媽的做站越來越難了,我感覺咱們4414的站長捆在一起也干不過百度啊!!!!!
樓主能分享出來就十分感謝了。這一看就是干貨。
其實,說這么多就一個核心問題--做好內容,解決用戶需求。
我們作為普通站長,當下只要做好內容就可以了。比當前競爭網站強一些就可以了。但如何做好內容,每個人理解的就不同了。
《我想網》總結:別在一棵樹上吊死,何況這棵樹自己都快倒了。