2013-07-26
隨著互聯(lián)網(wǎng)的快速發(fā)展,越來越多的年輕人開始了網(wǎng)絡創(chuàng)業(yè),每天都有數(shù)以萬計的新網(wǎng)站上線,同時也有數(shù)以千萬計甚至億計的新網(wǎng)頁產(chǎn)生。隨著網(wǎng)絡的普及,互聯(lián)網(wǎng)進入家庭,越來越多的人開始通過互聯(lián)網(wǎng)獲得信息,潛在客戶通過互聯(lián)網(wǎng)尋找自己需要的產(chǎn)品信息,商家通過互聯(lián)網(wǎng)接觸到潛在客戶達成交易。面對龐大的網(wǎng)頁信息數(shù)據(jù),搜索引擎要處理這樣一個數(shù)量級的網(wǎng)頁信息,進行搜索排序,可謂是歷盡艱辛。
很多商家和個人站長為了通過網(wǎng)站獲得客戶和收益,也就需要提高自身網(wǎng)站在搜索結(jié)果里面的排名,從而提高網(wǎng)站與潛在客戶接觸的機會,于是研究如何才能快速提高網(wǎng)站在搜索結(jié)果的排名就成了一些人必須要做的事,SEO行業(yè)產(chǎn)生了。
在中國,百度是人們最常使用的搜索引擎,研究百度排名算法,成了眾多SEOer工作者必須要做的事情,隨著這兩年百度算法的不斷調(diào)整,越來越多做SEO的人感覺到SEO越來越難做了,以前做SEO很簡單,多增加一些網(wǎng)站內(nèi)容,多交換些友情鏈接,發(fā)些外鏈,網(wǎng)站排名就上去了,而現(xiàn)在百度算法的每一次調(diào)整,都會有一大批的網(wǎng)站在搜索結(jié)果中消失,甚至搜索網(wǎng)站全稱都找不到。有經(jīng)驗的站長就發(fā)現(xiàn),百度現(xiàn)在對網(wǎng)站內(nèi)容的原創(chuàng)性越來越重視。
之前也有人總結(jié)過百度判斷網(wǎng)站內(nèi)容原創(chuàng)性的標準,不過都不完善,今天有幸在百度站長平臺看到百度官方公布的百度判斷網(wǎng)站內(nèi)容原創(chuàng)的一個算法——原創(chuàng)識別“起源”算法,原文如下:
互聯(lián)網(wǎng)動輒上百億、上千億的網(wǎng)頁,從中挖掘原創(chuàng)內(nèi)容,可以說是大海撈針,千頭萬緒。我們的原創(chuàng)識別系統(tǒng),在百度大數(shù)據(jù)的云計算平臺上開展,能夠快速實現(xiàn)對全部中文互聯(lián)網(wǎng)網(wǎng)頁的重復聚合和鏈接指向關(guān)系分析。首先,通過內(nèi)容相似程度來聚合采集和原創(chuàng),將相似網(wǎng)頁聚合在一起作為原創(chuàng)識別的候選集合;其次,對原創(chuàng)候選集合,通過作者、發(fā)布時間、鏈接指向、用戶評論、作者和站點的歷史原創(chuàng)情況、轉(zhuǎn)發(fā)軌跡等上百種因素來識別判斷出原創(chuàng)網(wǎng)頁;最后,通過價值分析系統(tǒng)判斷該原創(chuàng)內(nèi)容的價值高低進而適當?shù)闹笇ё罱K排序。
目前,通過我們的實驗以及真實線上數(shù)據(jù),“起源”算法已經(jīng)取得了一定的進展,在新聞、資訊等領域解決了絕大部分問題。當然,其他領域還有更多的原創(chuàng)問題等待“起源”去解決,我們堅定的走著。
以上是百度識別原創(chuàng)內(nèi)容的“起源”算法的描述,與這些內(nèi)容相關(guān)的還有一些描述,關(guān)于優(yōu)質(zhì)原創(chuàng)內(nèi)容的說法,利用自動文章生成器等工具,“獨創(chuàng)”一篇文章,然后安一個吸引眼球的title,現(xiàn)在的成本也低得很,而且一定具有獨創(chuàng)性。然而,原創(chuàng)是要具有社會共識價值的,而不是胡亂制造一篇根本不通的垃圾就能算做有價值的優(yōu)質(zhì)原創(chuàng)內(nèi)容。內(nèi)容雖然獨特,但是不具社會共識價值,此類偽原創(chuàng)是搜索引擎需要重點識別出來并予以打擊的。
雖然只有短短的幾行字,但足以給我們這些SEOer很大的啟發(fā),給了我們原創(chuàng)的方向,做SEO做的就是細節(jié),不僅僅為了獲得排名,為用戶提供有價值的東西才是SEOer真正應該努力的方向。搜索引擎不排斥SEO,但也不接受為了獲得排名鉆排名算法漏洞的SEO做法。
下面來總結(jié)一下百度判斷原創(chuàng)的幾個基本標準:
1、內(nèi)容的獨特性
2、作者
3、發(fā)布時間
4、鏈接指向
5、用戶評論
6、作者和站點的歷史原創(chuàng)情況
7、轉(zhuǎn)發(fā)軌跡
8、社會價值
以上這些只是在這次文章中例舉出來的,還有很多判斷細節(jié)的標準有待研究,希望對廣大站長有用,也希望站長們多研究,研究出更多百度判斷原創(chuàng)的標準,以幫助提升SEO的效率。