雖然查詢速度慢的原因很多,但是如果通過一定的優化,也可以使查詢問題得到一定程度的解決
查詢速度慢的原因很多,常見如下幾種:
1.沒有索引或者沒有用到索引(這是查詢慢最常見的問題,是程序設計的缺陷)
2.I/O吞吐量小,形成了瓶頸效應。
3.沒有創建計算列導致查詢不優化。
4.內存不足
5.網絡速度慢
6.查詢出的數據量過大(可以采用多次查詢,其他的方法降低數據量)
7.鎖或者死鎖(這也是查詢慢最常見的問題,是程序設計的缺陷)
8.sp_lock, sp_who, 活動的用戶查看,原因是讀寫競爭資源。
9.返回了不必要的行和列
10.查詢語句不好,沒有優化
可以通過如下方法來優化查詢 :
1.把數據、日志、索引放到不同的I/O設備上,增加讀取速度,以前可以將Tempdb應放在RAID0上,SQL2000不再支持。數據量(尺寸)越大,提高I/O越重要。
2.縱向、橫向分割表,減少表的尺寸(sp_spaceuse)
3.升級硬件
4.根據查詢條件,建立索引、優化索引、優化訪問方式,限制結果集的數據量。注意填充因子要適當(最好是使用默認值0)。索引應該盡量小,使用字節數小的列建索引好(參照索引的創建),不要對有限的幾個值的字段建單一索引如性別字段
5.提高網速
6.擴大服務器的內存,Windows 2000和SQL server 2000能支持4-8G的內存。配置虛擬內存:虛擬內存大小應基於計算機上並發運行的服務進行配置。運行 Microsoft SQL Server 2000 時,可考慮將虛擬內存大小設置為計算機中安裝的物理內存的 1.5 倍。如果另外安裝了全文檢索功能,並打算運行 Microsoft 搜索服務以便執行全文索引和查詢,可考慮:將虛擬內存大小配置為至少是計算機中安裝的物理內存的 3 倍。將 SQL Server max server memory 服務器配置選項配置為物理內存的 1.5 倍(虛擬內存大小設置的一半)。
7.增加服務器CPU個數,但是必須明白並行處理比串行處理更需要資源例如內存。使用並行還是串行程是MsSQL自動評估選擇的。單個任務分解成多個任務,就可以在處理器上運行。例如耽擱查詢的排序、連接、掃描和GROUP BY字句同時執行,SQL SERVER根據系統的負載情況決定最優的並行等級,復雜的需要消耗大量的CPU的查詢最適合並行處理。但是更新操作UPDATE,INSERT,DELETE還不能並行處理。
8.如果是使用like進行查詢的話,簡單的使用index是不行的,但是全文索引耗空間。 like 'a%' 使用索引,like '%a' 不使用索引。用 like '%a%' 查詢時,查詢耗時和字段值總長度成正比,所以不能用CHAR類型,而是VARCHAR。對於字段的值很長的建全文索引。
9.DB Server 和 Application Server 分離; OLTP和OLAP分離
10.分布式分區視圖可用於實現數據庫服務器聯合體。聯合體是一組分開管理的服務器,但它們相互協作分擔系統的處理負荷。這種通過分區數據形成數據庫服務器聯合體的機制能夠擴大一組服務器,以支持大型的多層 Web 站點的處理需要。
1.在實現分區視圖之前,必須先水平分區表
2.在創建成員表後,在每個成員服務器上定義一個分布式分區視圖,並且每個視圖具有相同的名稱。這樣,引用分布式分區視圖名的查詢可以在任何一個成員服務器上運行。系統操作如同每個成員服務器上都有一個原始表的復本一樣,但其實每個服務器上只有一個成員表和一個分布式分區視圖。數據的位置對應用程序是透明的。
11.重建索引DBCC REINDEX, DBCC INDEXDEFRAG, 收縮數據和日志DBCC SHRINKDB, DBCC SHRINKFILE. 設置自動收縮日志。對於大的數據庫不要設置數據庫自動增長,它會降低服務器的性能。 在T-SQL的寫法上有很大的講究,下面列出常見的要點:
首先,DBMS處理查詢計劃的過程是這樣的:
1. 查詢語句的詞法、語法檢查
2. 將語句提交給DBMS的查詢優化器
3. 優化器做代數優化和存取路徑的優化
4. 由預編譯模塊生成查詢規劃
5. 然後在合適的時間提交給系統處理執行
6. 最後將執行結果返回給用戶其次,看一下SQL SERVER的數據存放的結構:一個頁面的大小為8K(8060)字節,8個頁面為一個盤區,按照B樹存放。
12.Commit和rollback的區別。Rollback:回滾所有的事務;Commit:提交當前的事務。沒有必要在動態SQL裡寫事務,如果要寫請寫在外面,如: begin tran exec(@s) commit trans 或者將動態SQL 寫成函數或者存儲過程。
13.在查詢Select語句中用Where字句限制返回的行數,避免表掃描,如果返回不必要的數據,浪費了服務器的I/O資源,加重了網絡的負擔降低性能。如果表很大,在表掃描的期間將表鎖住,禁止其他的聯接訪問表,否則後果嚴重。
14.SQL的注釋申明對執行沒有任何影響。
15.盡可能不使用光標,它占用大量的資源。如果需要row-by-row地執行,盡量采用非光標技術,如:在客戶端循環,用臨時表,Table變量,用子查詢,用Case語句等等。
游標可以按照它所支持的提取選項進行分類:
1.只進必須按照從第一行到最後一行的順序提取行。FETCH NEXT 是唯一允許的提取操作,也是默認方式。
2.可滾動性可以在游標中任何地方隨機提取任意行。
3.游標的技術在SQL2000下變得功能很強大,他的目的是支持循環。有四個並發選項:
1.READ_ONLY:不允許通過游標定位更新(Update),且在組成結果集的行中沒有鎖。
2.OPTIMISTIC WITH valueS: 樂觀並發控制是事務控制理論的一個標准部分。樂觀並發控制用於這樣的情形,即在打開游標及更新行的間隔中,只有很小的機會讓第二個用戶更新某一行。當某個游標以此選項打開時,沒有鎖控制其中的行,這將有助於最大化其處理能力。如果用戶試圖修改某一行,則此行的當前值會與最後一次提取此行時獲取的值進行比較。如果任何值發生改變,則服務器就會知道其他人已更新了此行,並會返回一個錯誤。如果值是一樣的,服務器就執行修改,選擇這個並發選項.
3.OPTIMISTIC WITH ROW VERSIONING: 此樂觀並發控制選項基於行版本控制。使用行版本控制,其中的表必須具有某種版本標識符,服務器可用它來確定該行在讀入游標後是否有所更改。在 SQL Server 中,這個性能由 timestamp 數據類型提供,它是一個二進制數字,表示數據庫中更改的相對順序。每個數據庫都有一個全局當前時間戳值:@@DBTS。每次以任何方式更改帶有 timestamp 列的行時,SQL Server 先在時間戳列中存儲當前的 @@DBTS 值,然後增加 @@DBTS 的值。如果某個表具有 timestamp 列,則時間戳會被記到行級。服務器就可以比較某行的當前時間戳值和上次提取時所存儲的時間戳值,從而確定該行是否已更新。服務器不必比較所有列的值,只需比較 timestamp 列即可。如果應用程序對沒有 timestamp 列的表要求基於行版本控制的樂觀並發,則游標默認為基於數值的樂觀並發控制。
4.SCROLL LOCKS這個選項實現悲觀並發控制。在悲觀並發控制中,在把數據庫的行讀入游標結果集時,應用程序將試圖鎖定數據庫行。在使用服務器游標時,將行讀入游標時會在其上放置一個更新鎖。如果在事務內打開游標,則該事務更新鎖將一直保持到事務被提交或回滾;當提取下一行時,將除去游標鎖。如果在事務外打開游標,則提取下一行時,鎖就被丟棄。因此,每當用戶需要完全的悲觀並發控制時,游標都應在事務內打開。更新鎖將阻止任何其它任務獲取更新鎖或排它鎖,從而阻止其它任務更新該行。然而,更新鎖並不阻止共享鎖,所以它不會阻止其它任務讀取行,除非第二個任務也在要求帶更新鎖的讀取。滾動鎖根據在游標定義的 SELECT 語句中指定的鎖提示,這些游標並發選項可以生成滾動鎖。滾動鎖在提取時在每行上獲取,並保持到下次提取或者游標關閉,以先發生者為准。下次提取時,服務器為新提取中的行獲取滾動鎖,並釋放上次提取中行的滾動鎖。滾動鎖獨立於事務鎖,並可以保持到一個提交或回滾操作之後。如果提交時關閉游標的選項為關,則 COMMIT 語句並不關閉任何打開的游標,而且滾動鎖被保留到提交之後,以維護對所提取數據的隔離。所獲取滾動鎖的類型取決於游標並發選項和游標。
16.用Profiler來跟蹤查詢,得到查詢所需的時間,找出SQL的問題所在;用索引優化器優化索引.
17.注意UNion和UNion all 的區別:UNION ALL好
18.注意使用DISTINCT,在沒有必要時不要用,它同UNION一樣會使查詢變慢。重復的記錄在查詢裡是沒有問題的
19.查詢時不要返回不需要的行、列
20.用sp_configure 'query governor cost limit'或者SET QUERY_GOVERNOR_COST_LIMIT來限制查詢消耗的資源。當評估查詢消耗的資源超出限制時,服務器自動取消查詢,在查詢之前就扼殺掉。SET LOCKTIME設置鎖的時間
21.用select top 100 / 10 Percent 來限制用戶返回的行數或者SET ROWCOUNT來限制操作的行
22.在SQL 2000以前,一般不要用如下的字句: "IS NULL", "", "!=", "!", "!", "NOT", "NOT EXISTS", "NOT IN", "NOT LIKE", and "LIKE '%500'",因為他們不走索引全是表掃描。也不要在where字句中的列名加函數,如convert,substring等,如果必須用函數的時候,創建計算列再創建索引來替代。還可以變通寫法:WHERE SUBSTRING(firstname,1,1) = 'm' 改為 WHERE firstname like 'm%'(索引掃描),一定要將函數和列名分開。並且索引不能建得太多和太大。NOT IN會多次掃描表,使用EXISTS, NOT EXISTS, IN, LEFT OUTER JOIN 來替代,特別是左連接,而Exists比IN