程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> .NET網頁編程 >> ASP.NET >> ASP.NET基礎 >> .net 解決spider多次和重復抓取的方案

.net 解決spider多次和重復抓取的方案

編輯:ASP.NET基礎

原因:

早期由於搜索引擎蜘蛛的不完善,蜘蛛在爬行動態的url的時候很容易由於網站程序的不合理等原因造成蜘蛛迷路死循環。

所以蜘蛛為了避免之前現象就不讀取動態的url,特別是帶?的url

解決方案:

1):配置路由

復制代碼 代碼如下:
routes.MapRoute("RentofficeList",
               "rentofficelist/{AredId}-{PriceId}-{AcreageId}-{SortId}-{SortNum}.html",
               new { controller = "Home", action = "RentOfficeList" },
               new[] { "Mobile.Controllers" });

第一個參數是路由名稱
第二個參數是路由的Url模式,參數之間用{}-{}方式分隔
第三個參數是一個包含默認路由的對象
第四個參數是應用程序的一組命名空間

2):設置連接

<a href="@Url.Action("RentofficeList",new RouteValueDictionary { { "AredId",0},{"PriceId",0},{"AcreageId",0},{"SortId",0},{"SortNum",0}})">默認排序</a>

對照上面的Url模式,依次寫入參數賦值
3):獲取參數

復制代碼 代碼如下:
int areaId = GetRouteInt("AredId");//獲取參數
/// <summary>
/// 獲得路由中的值
/// </summary>
/// <param name="key">鍵</param>
/// <param name="defaultValue">默認值</param>
/// <returns></returns>
protected int GetRouteInt(string key, int defaultValue)
{
return Convert.ToInt32(RouteData.Values[key], defaultValue);
}
/// <summary>
/// 獲得路由中的值
/// </summary>
/// <param name="key">鍵</param>
/// <returns></returns>
protected int GetRouteInt(string key)
{
return GetRouteInt(key, 0);
}

根據上面3個步驟操作,顯示的url地址為:

http://localhost:3841/rentofficelist/3-0-0-0-0.html
這樣就可以避免靜態頁面上使用動態參數,顯示的頁面都為靜態頁面

  1. 上一頁:
  2. 下一頁:
Copyright © 程式師世界 All Rights Reserved