1、如果頁(yè)面未被收錄,可能是robots.txt設(shè)置不當(dāng),阻止了爬蟲訪問(wèn);或者頁(yè)面本身不可見,如noindex標(biāo)簽未移除。確保robots.txt允許搜索引擎自由探索你的網(wǎng)站。 元素檢查- noindex標(biāo)簽:移除或重新定向,讓搜索引擎抓取你的內(nèi)容。
2、網(wǎng)站內(nèi)容質(zhì)量 如果網(wǎng)站存在大量采集內(nèi)容,會(huì)造成百度不收錄,同時(shí)百度最近加強(qiáng)了對(duì)采集站點(diǎn)的審查力度。搜索引擎傾向于高質(zhì)量的原創(chuàng)內(nèi)容,高質(zhì)量的原創(chuàng)文章更容易滿足用戶的需求,也可以提高網(wǎng)站的用戶體驗(yàn)度。
3、網(wǎng)站優(yōu)化,在一般的情況下面,即使他做的再爛,搜索引擎也不會(huì)一點(diǎn)都不收錄。網(wǎng)站上線的時(shí)間很長(zhǎng)了但是搜索引擎仍舊沒(méi)有收錄的話,只有以下這幾個(gè)原因。
鏈接未被搜索引擎蜘蛛抓取 有的時(shí)候你發(fā)布出去想吸引蜘蛛程序的鏈接未必會(huì)被抓取到,原因是你發(fā)布外鏈的地方蜘蛛程序極少或甚至不去光顧,就像你把一家奶茶店開在撒哈拉沙漠上一樣。
程式碼冗余。據(jù)筆者所知很多的網(wǎng)站程式都是從網(wǎng)路上下載的,自己不處理一下多余的程式碼,如JS程式碼封裝、FLASH檔案去除、ROBOTS設(shè)定等,都是造成不被收錄的原因。 網(wǎng)站結(jié)構(gòu)不利于蜘蛛爬行。
域名問(wèn)題:在建站的時(shí)候,可能是對(duì)seo知識(shí)的欠缺,隨便找個(gè)域名就綁定到網(wǎng)站上了,也許這個(gè)域名有被K的歷史記錄,所以造成了網(wǎng)站一直不被收錄,解決的辦法就是去換一個(gè)域名。
空間不穩(wěn)定。這是老生常談的話題了,不過(guò)筆者也要把它列出來(lái),因?yàn)榭臻g對(duì)新站是否快速收錄是最重要的,空間不穩(wěn)定,蜘蛛無(wú)法爬行,自然就不會(huì)收錄頁(yè)面。代碼冗余。
新站點(diǎn),一個(gè)月了還沒(méi)有收錄 首先需要排除服務(wù)器訪問(wèn)慢、被人攻擊的情況,其次排除網(wǎng)站上有灰色、違規(guī)內(nèi)容,再者排除網(wǎng)站源代碼DIV+CSS的問(wèn)題。
網(wǎng)站內(nèi)容沒(méi)有收錄,可能是因?yàn)槭切戮W(wǎng)站。目前百度蜘蛛抓取的方式有兩種,第一種是主動(dòng)抓取,第二種是從百度站長(zhǎng)平臺(tái)的鏈接提交工具獲取數(shù)據(jù)。
所以出現(xiàn)網(wǎng)站不收錄的情況可以先檢查一下robots文件的設(shè)置是否正確。還有些是因?yàn)閞obots.txt中的大小寫搞錯(cuò)而導(dǎo)致出錯(cuò),以及各種奇葩情況層出不窮。
百度無(wú)法抓取網(wǎng)站,因?yàn)槠鋜obots.txt文件屏蔽了百度。方法:修改robots文件并取消對(duì)該頁(yè)面的阻止。機(jī)器人的標(biāo)準(zhǔn)寫法詳見百度百科:網(wǎng)頁(yè)鏈接。更新百度站長(zhǎng)平臺(tái)(更名為百度資源平臺(tái))上的網(wǎng)站機(jī)器人。
可能的原因如下 一:您還沒(méi)有向Baidu登錄您的網(wǎng)站 二:您雖然登錄了網(wǎng)站,但由于時(shí)間短,百度還未能收錄 三:百度會(huì)經(jīng)常自動(dòng)檢測(cè)您網(wǎng)站的連接狀況,如果百度檢測(cè)時(shí)您的網(wǎng)站遇到無(wú)法連接的情況,就可能從 百度中被刪除。
第一種原因,瀏覽器里輸入的web地址即url,在web服務(wù)器文件系統(tǒng)里并不存在對(duì)應(yīng)的資源文件。理論上瀏覽器不可能打開一個(gè)并不存在的網(wǎng)頁(yè)。
網(wǎng)站沒(méi)有被百度收錄的原因有很多,可以參考如下幾點(diǎn):內(nèi)容重復(fù) 內(nèi)容得利包含兩個(gè)方面,一是模板重復(fù),二是文章重復(fù)。
你的網(wǎng)站沒(méi)有被百度、谷歌和必應(yīng)等搜索引擎抓取和索引,可能有多種原因。技術(shù)問(wèn)題:網(wǎng)站結(jié)構(gòu)不當(dāng),使用非搜索引擎友好的技術(shù)(如JavaScript路由),網(wǎng)站加載速度慢,等等。
有可能是網(wǎng)站的內(nèi)容出現(xiàn)一些比較敏感的詞語(yǔ)。百度搜索引擎對(duì)網(wǎng)站內(nèi)容的抓取有很高的規(guī)范。尤其是在色情、暴力方面的內(nèi)容,不再進(jìn)行抓取,也不會(huì)收錄。
1、在百度無(wú)法搜索到的話,多半是沒(méi)有收錄造成的。檢查有沒(méi)有收錄最好的辦法是直接輸入網(wǎng)址查看,如果查看到內(nèi)容則表示收錄了,只是百度認(rèn)為沒(méi)有必要展示,所以無(wú)法搜索到。
2、究其原因,是因?yàn)槲词珍浀哪莻€(gè)站優(yōu)化的痕跡比較明顯,關(guān)鍵詞密度比較大,而且,標(biāo)題title中也都是長(zhǎng)尾關(guān)鍵詞,文章中出現(xiàn)關(guān)鍵詞的地方都做了錨文本,所以百度拒絕收錄。百度加大了對(duì)SEO的打擊力度。
3、收錄的詞條沒(méi)有被刪,只是排名靠后:這種情況是由于百度搜索引擎算法的升級(jí)調(diào)整,導(dǎo)致詞條排名下滑,以至于下滑的太大,而沒(méi)有能夠找到。
4、您好,網(wǎng)站不收錄有以下原因,請(qǐng)參考:域名自身原因 但凡做seo的都知道老域名本身是帶有一定權(quán)重的,所以很多時(shí)候會(huì)在做新站的時(shí)候?qū)⒁粋€(gè)老域名解析上去,這樣可以更好的幫助自己的網(wǎng)站增加權(quán)重導(dǎo)入。
5、網(wǎng)站能正常打開,但HTTPS工具檢測(cè)到安全級(jí)別太低,原因是證書與域名不匹配。檢測(cè)結(jié)果:原因:為什么域名與證書不匹配?之前也成功改造過(guò)幾個(gè)網(wǎng)站,都沒(méi)有問(wèn)題??紤]可能一個(gè)服務(wù)器多個(gè)網(wǎng)站多個(gè)證書造成的。
這種在網(wǎng)頁(yè)中刻意的插入關(guān)鍵詞,導(dǎo)致語(yǔ)句不能正常讀通順的文章肯定是會(huì)被淘汰的,更加不用說(shuō)會(huì)收錄你了。
還有外鏈被刪除或外鏈源網(wǎng)站出現(xiàn)重大變動(dòng)等原因,都會(huì)引起搜索引擎不收錄,解決的方案通常就是提高網(wǎng)站建設(shè)的內(nèi)容質(zhì)量,合規(guī)的操作優(yōu)化行為,同時(shí)加強(qiáng)外鏈建設(shè),以盡快恢復(fù)搜索引擎對(duì)網(wǎng)站內(nèi)容的收錄。
標(biāo)題頻繁改動(dòng) 如果你的站點(diǎn)標(biāo)題頻繁改動(dòng),搜索引擎就會(huì)不知道你的網(wǎng)站內(nèi)容表達(dá)的是什么,網(wǎng)站的內(nèi)容和標(biāo)題就會(huì)形成不匹配,影響頁(yè)面收錄時(shí)間。
自我分析網(wǎng)站內(nèi)容是否質(zhì)量沒(méi)有問(wèn)題。確保,可以被抓取,url結(jié)構(gòu),內(nèi)容質(zhì)量沒(méi)有問(wèn)題,建議保持更新,同時(shí)做好鏈接的提交工作,另外也可以使用搜外友鏈的蜘蛛池 來(lái)幫助鏈接被搜索引擎更好的抓取到。增加收錄概率。