400-050-6600

空調機組報價預測——基于線性回歸的數據分析案例

來源:CPDA數據分析師 貴州 鄭雨 / 作者: / 時間:2019-12-18

導論:

建設項目的工程費用中,占比最大的費用通常是主材設備費,主材設備價格的合理性直接決定了工程費用的合理性。在日常工程造價工作中如何改善主材設備價格管理水平,是提高工作效率和質量的重要環節。

 

背景





從工程成本管理角度講,直接費作為直接構成工程實體項目的現金流出,是建安工程費的重要組成部分,其中直接工程費又是直接費中的核心內容。

材料費,視具體工程項目情況,在工程費用中占比約為45%~70%,尤其在安裝工程費用占比大的項目,這個比例更高。材料費的取定,除了定額基價中已經確定的材料價格外,很大一部分需要結合市場和項目需求自主定價。
 
為了取得較為準確的材料價格信息,造價咨詢方需要向廠家、經銷商詢價。這部分工作,尤其是涉及到安裝工程的主材設備詢價,工作量常常是巨大的。

例如一個含有強弱電、消防、空調、通風、給排水等常規系統的建筑工程項目,僅安裝部分不同類型的主材設備數量就可能在600種以上;一個星級酒店,安裝部分不同類型的主材設備數量可能超過3000種。詢價、接受和辨別主材設備報價,是一個繁瑣而細致的工作。
   
如何更好的開展這項具體工作,使我們采用的主材設備價更為準確、合理,并能在廠商報價基礎數據資料上發掘新的信息,是一個有價值的問題。

思考

筆者主要從事安裝造價工作,在清單攔標價編制和全過程造價控制工作中,經常面對數以百計的主材設備需要確價。除了很少一部分能在造價信息上找到較有權威性的參考價格之外,其他絕大多數主材設備,都需要通過詢價自主定價。
   
在明確項目定位和業主意圖的基礎上,主要的定價方式如下:

  • 參考企業近期類似工程材料價格
  • 參考互聯網第三方網站材料信息
  • 發布詢價函,提請廠家或供貨商針對項目報價

由于工程項目具有單件性特點,針對具體項目的廠商詢價一般較為準確,且更具有說服力。

然而實際工作中,往往由于工作任務時間急迫,無法逐一針對眼前項目的主材設備進行全面詢價,必須充分利用以往的詢價成果對新出現的主材設備進行推斷預測。

 

實踐探索

1)推斷預測方法的確定

根據設計原理及工作經驗,組合空調機組的價格,主要與風量、制冷量、電機功率三個自變量呈線性相關關系。

想要通過上述三個自變量推斷價格這個一因變量,無疑應該用多元線性回歸分析。

 

2)基礎數據收集

某項目需要采購組合式空調機組一臺,參數要求如表一:


表一:待詢價設備參數要求

 

近期已詢價項目,該品牌報價如表二:


表二:已報價設備信息

 

近期已報價設備信息作為訓練集,試構建模型,并推斷待詢價設備含稅報價

 

3)查看變量關系

采用多元線性規劃有一個前提,就是驗證自變量間是否有相關性。

如果自變量間存在較強的相關性,則會產生多重共線性問題,容易導致回歸結果混亂,不能合理解釋變量間邏輯關系等問題,影響推斷預測的準確性。

如果自變量間沒有明顯的相關性,則可以進行多元線性回歸分析。

風量制冷量電機功率三個自變量及含稅報價因變量,計算相關矩陣系數結果如圖一:



圖一:三變量相關性熱力圖

 

由圖可知:自變量電機功率與因變量“含稅報價”相關性不明顯,可以剔除此自變量。以風量制冷量、兩個個自變量及含稅報價因變量,并計算相關矩陣系數結果如表三:



表三:兩自變量相關性矩陣

 

由表可知:自變量風量制冷量間,存在較強的相關性,為防止產生多重共線性問題,接納與因變量含稅報價相關性強的自變量風量,將制冷量剔除。

 

4)構建回歸模型

風量為自變量、含稅報價為因變量,構建一元線性回歸模型,結果如下:



表四:單變量一元線性回歸模型結果

 

由表四可知:

自變量風量系數2.131278422,常數項系數8353.165893

自變量風量與常數項P值(t檢驗)均<0.05,通過檢驗;模型R0.9847,擬合效果好,模型可以采納應用。

已此模型預測價格與實際報價比較,誤差均<±10%,對設備價格推斷預測具有一定價值,如下表五:



表五:模型預測誤差率統計表


 

5)推斷預測

將待報價設備(見表一)作為預測集,引入上述回歸模型進行設備價格預測,結果如表六:



表六:模型預測結果

 

由表可知:待報價設備預測價格為72291.52元。

為驗證報價水平,再次向廠商詢價此設備,報價為69954.00元,模型預測誤差率為3.34%

 

結論

運用線性回歸分析處理單一變量或多變量的主材設備價格推斷預測問題,在合理選擇變量、預先排除多重共線性影響的前提下,可以得到較好的預測效果,從而提高詢價報價效率,保證報價質量水平。

 

應用條件

需要注意的是,用此種方法雖然可以快速得到所需主材設備的近似報價,但也有一定先決條件。

  • 同品牌同類型主材推斷
    主材設備除規格外的材質、類型、型號要求必須一致;
  • 合理的時效性
    由于建筑材料均具有一定的時效性,推斷主材設備報價時,要特別注意基礎數據采集的時間與推斷時刻間材料價格在市場上是否有波動;
  • 合理的自變量范圍
    由于在實際的生產制作中,風口規格不是沒有上限的,極端大小的風口規格可能和一般常見規格尺寸存在較大的價格差異,有的產品甚至需要單獨開模制作,廠商報價不一定都是呈現明顯線性變化的。這就導致我們不能忽略用來推斷的方程中,構造方程自變量X的取值范圍。因為更大或更小的規格尺寸,并不知道該廠商是否能夠生產,且不知道廠商報價是否還是在同一水平上。
  • 相應的采購規模
    由于訂貨規模對廠商的報價也是一個敏感性因素,有必要記錄構造函數時的報價批量信息。如果采購數量與以往偏差較大,也要考慮使用模型函數進行推斷的準確性。應用時,宜在推斷基礎上加以適當調整。

 

啟發與備注:

數據分析不是外行看似望而生畏的建模技術,不是一味追求高級算法的炫技表演,而是要在產業環境下、業務場景中,運用數據思維發現工作中的“真北問題”(真正的痛點并且具有指向性可量化的問題),并用可以量化的“數據語言”提出問題,采用最簡單最合適的方法解決問題,進而產生效益。

 

關于本文尚需備注以下信息:

1)訓練集設備報價時間為2019724日,來源為建材在線網站信息價

2)文中提及的預測誤差率=(預測價-報價)/報價*100%

3)采用Datehoop2.0數據分析平臺提供計算支持

Prev article

電力負荷預測方法的分析與比較

Next article

高致病性禽流感H5N1病毒在職業人群感染的數據研究

課程服務

認證服務

在線咨詢

色惰日本视频网站