為一個數據挖掘模型定型後,可以通過使用 sql server Management Studio 或 Business Intelligence Development Studio 中提供的自定義查看器來浏覽此模型。但是,如果您希望進行預測或者從模型中獲取更深入的或更具體的信息,則必須依據此數據挖掘模型創建一個查詢。在以下情況下,查詢可幫助您更好地理解和處理模型中的信息:
進行單個預測和批預測。
了解有關模型發現的模式的更多信息。
查看有關模型的特定模式或子集的詳細信息或定型事例。
在挖掘模型中鑽取到事例的詳細信息。
提取有關全部或部分模型和數據的公式、規則或統計信息。
SQL Server Analysis Services 提供用於創建查詢的圖形設計界面,以及一種稱為數據挖掘擴展插件 (DMX) 的查詢語言,這種語言對於創建自定義預測和復雜查詢很有用。若要生成 DMX 預測查詢,可以使用 SQL Server Management Studio 和 Business Intelligence Development Studio 中均提供的查詢生成器。SQL Server Management Studio 中還提供了一組 DMX 查詢模板。
有關如何使用查詢生成器的詳細信息,請參閱使用預測查詢生成器創建 DMX 預測查詢。
有關如何使用 DMX 查詢模板的詳細信息,請參閱在 SQL Server Management Studio 中創建 DMX 查詢或如何在 SQL Server Management Studio 中使用模板。
預測查詢
許多數據挖掘項目的主要目標是使用挖掘模型來進行預測。例如,您可能要在十二月期間預測公司明年銷售的產品數量,或者可能要預測在某個廣告活動後潛在客戶是否會購買產品。
創建預測時,通常會提供一些新數據,並要求模型基於新數據生成一個預測。可以通過在“預測聯接”中將模型映射到一個外部數據源來以批方式進行預測。或者,可以通過創建一個“單獨”查詢一次提供一個值。
單獨預測查詢和批預測查詢都使用 PREDICTION JOIN 語法來定義新數據:不同之處在於預測聯接輸入端的指定方式。在單獨查詢中,數據是作為查詢的一部分內聯提供的。在批查詢中,數據來自使用 OPENQUERY 語法指定的外部數據源。有關詳細信息,請參閱 OPENQUERY (DMX)。
此外,使用時序模型可以僅僅基於模型來進行預測,即不需要提供任何新數據,而僅僅基於現有序列來請求預測。
下面提供有關如何創建上述每一類查詢的信息:
查詢類型 查詢選項
單獨預測查詢
針對在查詢中鍵入的單個新事例或者多個新事例進行預測。
批預測
將外部數據源中的新事例映射到模型並進行預測。
時序預測
基於現有模型預測指定數目的將來步驟。
通過添加新數據來擴展現有模型,並基於組合序列來進行預測。
通過使用 REPLACE_MODEL_CASES 選項向新數據序列應用現有模型。
除了預測特定值,例如,下個月的銷售額,或者要向客戶建議的產品,您還可以自定義預測查詢,以返回與預測有關的各種類型的信息。例如,知道預測正確的概率可能很有幫助,這樣您就可以決定是否向用戶提出建議。
若要自定義預測查詢所返回的信息,應向查詢中添加“預測函數”。每個模型或查詢類型都支持特定的函數。例如,聚類分析模型支持特殊預測函數,這些函數提供有關模型創建的分組的額外詳細信息。時序模型支持計算隨時間的變化的預測函數。還有可處理幾乎所有模型類型的通用預測函數。有關不同查詢類型支持的預測函數的列表,請參閱將函數映射到查詢類型 (DMX)。有關預測函數的完整列表,請參閱數據挖掘擴展插件 (DMX) 函數參考。
單獨查詢
如果要實時創建簡單預測,則單獨查詢很有用。例如,您可能通過使用網站從客戶那裡獲取信息,然後使用這些數據返回預測,這些預測以特定於該客戶的建議信息的形式呈現。或者,您也可能分析電子郵件的內容,然後使用現有分類模型來對電子郵件進行分類,並相應地傳送郵件。
單獨查詢不需要包含輸入的單獨表。只需將一行數據傳遞給模型,便會實時地返回一個預測。您還可以將單獨查詢擴展為進行多個預測,方法是鍵入包含單個事例的 SELECT 語句,再添加 UNION 運算符,然後鍵入另一個 SELECT 語句以指定另一個事例。
可以通過以下方式基於現有模型創建單獨查詢:
使用數據挖掘設計器。
使用單獨查詢模板。
以編程方式或者在另一個 Analysis Services 客戶端中創建 DMX 語句。
創建單獨查詢時,必須以 PREDICTION JOIN 的形式向模型提供新數據。這意味著即使不映射到實際表,也必須確保新數據與挖掘模型中的現有列匹配。如果新數據列與新數據完全匹配,則 Analysis Services 將自動映射列。這稱為“NATURAL PREDICTION JOIN”。但是,如果列不匹配,或者新數據在類型和量上與模型所包含的數據並不相同,則必須指定模型映射中的哪些列映射到新數據,或者指定缺少的值。
關鍵詞: