軟件預測能比人工預測準多少?
這是我們在與同行業(yè)溝通探討時經常會被問道的一個問題,其實這里面存在一個誤區(qū),準確度的高低并不是由系統(tǒng)或者人工來決定的,而是由選取的歷史數(shù)據、分析的方法以及特殊事宜的考慮而決定的,要做到精準的預測,往往與預測人員的工作經驗有著非常大的關系。
要做好準確的預測,目前普遍認為需要做到以下三點:
1、選取適當?shù)臍v史數(shù)據;
2、依靠經驗來撫平或剔除業(yè)務異常數(shù)據;
3、對業(yè)務未來活動、節(jié)假日等因素的預估。
選取適當?shù)臍v史數(shù)據
歷史數(shù)據是一切預測的基礎,后續(xù)的話量預測都會是在歷史數(shù)據的基礎上進行提升或下降的,那么按照統(tǒng)計學的原理來說是不是收集的樣本數(shù)越多就越可以反映出未來話量趨勢的走向呢?
其實不然。按理說數(shù)據應選取與未來業(yè)務變化一致的歷史數(shù)據進行預測,如下周或下個月業(yè)務將進行技能的調整或用戶群體的變化,那之前取的長時間的歷史話量參考性將會大幅下降,應該多參考近期業(yè)務的話量變化作為預測歷史數(shù)據,也就是說業(yè)務越不穩(wěn)定,我們選擇的歷史數(shù)據應當越短較好,因為短時間的數(shù)據可以反應出業(yè)務話量起伏變化的趨勢與規(guī)律,而長時間的歷史數(shù)據會將業(yè)務的話務起伏抹平”;
反之,如果業(yè)務較為穩(wěn)定且未來沒有重大的變化,我們就可以選擇較長的歷史數(shù)據進行預測,這樣會將短期內或少量的異常情況進行撫平”。
依靠經驗來撫平或剔除業(yè)務異常數(shù)據
在選取歷史數(shù)據中往往會選到節(jié)假日、活動日以及線路故障等日期數(shù)據,如果使用這部分數(shù)據對未來話量進行預測將會默認未來的一段時間內會同樣有節(jié)假日、活動日或故障,這顯然是不合適的,我們無法預測未來會出現(xiàn)故障問題,這就需要我們在業(yè)務運營時每日要記錄業(yè)務出現(xiàn)的臨時狀況如線路故障、天氣異常、國家政策等對于話務線路的沖擊,在將來進行預測的時候需要將這部分異常的日期數(shù)據進行拋出;
至于活動日和節(jié)假日,它們與故障不同,活動日和節(jié)假日無論是歷史數(shù)據還是未來都是有明確日期的,所以像這類特殊情況一般是將他們單獨提取出來單獨進行預測。
在上述的選取適當?shù)臍v史數(shù)據”與依靠經驗撫平或剔除業(yè)務異常數(shù)據”中可以看出基本上是依靠個人經驗或者是說直覺進行數(shù)據選取和話務剔除,有人會說這完全就是拍腦袋的決定,毫無科學依據”,但如果大家能夠真正能明白直覺”是什么時就會知道依靠直覺來進行判斷并不是毫無依據,歷史數(shù)據與數(shù)據剔除的影響因素有千千萬萬,我們必須承認如此海量的影響因素是無法全部收集的,既然無法收集全部的影響因素,那么即使運用科學的方法做出的預測又怎么會有科學依據呢?
反而直覺是依靠自己在平時工作、生活中的經驗而通過左右權衡得出的一個大體的數(shù)字,雖然這在很大程度上取決于操作者的時間經驗,但我們必須相信這種經驗并且頻繁地實施,之后我們才可以從經驗中得出數(shù)據上的結論,當然,這個結論可能只適用于某個業(yè)務。
對業(yè)務未來活動、節(jié)假日等因素的預估
對于這列特殊日期的預測需要用到特殊方法,不能像其他普通日期使用長時間歷史話量進行預測,而是提取特殊因子進行計算。
特殊因子存在于歷史發(fā)生過的活動日或節(jié)假日中,我們需要分析往年的活動或節(jié)假日對于線路的影響比例并將這種影響的比例進行計算后套用到今年的活動或節(jié)假日中,在基礎數(shù)據上進行折算,譬如對2017年國慶日的節(jié)假日預測,我們可以取2016年及2015年國慶日當周的話量以及前1-7天、8-14天、15-21天、22-28天來計算出國慶日當周的話量下降因子,例如把2016年國慶周的前22-28天話量當做是100%從而分析出前15-21天話量已經開始出現(xiàn)下降,假設話量下降了5%,那國慶前15-21天的話量只有國慶前22-28天話量的95%。
以此類推,一直展示到國慶當周的話量是百分之多少,這樣當我們預測出國慶前22-28天的話量時就可以套用話量下降或上升的百分比因子來計算出國慶當周的話量。
最終,我們將獲取一段時間業(yè)務穩(wěn)定的話務數(shù)據,之后進行了異常數(shù)據的剔除并在加入了未來活動、節(jié)假日的考慮后得到了想要的基礎數(shù)據。
1、 將這些基礎數(shù)據按周維度統(tǒng)計后可以看到業(yè)務的話量在周中是存在遞減或遞增的趨勢,同樣可以將遞增或遞減的趨勢與當周的話量進行計算來得到未來一周的話量。
2、將選取的歷史數(shù)據按照星期維度再進行統(tǒng)計可以得到一周內每天的話量比例,即星期占比,用預測出的未來一周的話量與星期占比相乘可以計算出未來一周每天的話務量。
3、將選擇的歷史數(shù)據以時段的形式進行統(tǒng)計,這樣可以得到星期一至星期日每個時段的話量數(shù)據,將每個時段的話量與全天總量相除就可以得到歷史星期一至星期日每個時段的時段話量占比。
4、最終將我們計算出的未來一周每日的話務量與每天的時段占比相乘,就可以得出最終預測的每天每時段的話量數(shù)據。
預測的終點其實并不是100%契合實際話量,話量是自然發(fā)生的事情,任何人都無法做到預測與實際完全一致,我們能做到的是不斷收集數(shù)據并分析問題,在未來的預測中盡可能全面地考慮未來的影響因素,這樣即使無法與實際相同,但也不至于出現(xiàn)重大的預測錯誤。
隨著我們工作經驗的增加和預測水平的提升,終會有一天,我們可以完全地掌握未來話務所發(fā)生的所有因素,到時候,預測的準確度自然會得到提升。