日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

  • 手機站
  • 小程序

    汽車測試網(wǎng)

  • 公眾號
    • 汽車測試網(wǎng)

    • 在線課堂

    • 電車測試

針對車載終端數(shù)據(jù)項異常值的檢測方法

2020-11-03 22:52:35·  來源:北京理工新源  
 
背景介紹隨著遠程排放監(jiān)控車載終端的發(fā)展和普及,重型貨車的關鍵信息流數(shù)據(jù)不斷數(shù)字化、持久化,為后續(xù)的監(jiān)管和分析工作奠定了較好的基礎。但為當前終端監(jiān)管的發(fā)
背景介紹
隨著遠程排放監(jiān)控車載終端的發(fā)展和普及,重型貨車的關鍵信息流數(shù)據(jù)不斷數(shù)字化、持久化,為后續(xù)的監(jiān)管和分析工作奠定了較好的基礎。但為當前終端監(jiān)管的發(fā)展水平處于初級階段所限,信息流數(shù)據(jù)的質(zhì)量層次不齊,限制了后續(xù)的監(jiān)管分析工作。所以加強信息流數(shù)據(jù)質(zhì)量監(jiān)控勢在必行。

現(xiàn)行的數(shù)據(jù)質(zhì)量要求總體上分為兩種:1.缺失率;2.無效率。由于本文探討的是針對數(shù)據(jù)異常值檢測的方法,所以上述兩種方法本文不再贅述。實際在車輛上傳的報文數(shù)據(jù)中,缺失和無效的問題能夠較好的進行識別,真正亟待解決的問題是如何判定數(shù)據(jù)是否異常。異常值通常會造成測量誤差或異常系統(tǒng)條件的結果,因此不具有描述底層系統(tǒng)的特征。實際上,最佳做法是在分析之前,就應該進行異常值去除處理。
這里的異常主要有兩層意思:一、數(shù)據(jù)在現(xiàn)實中是否符合邏輯,這方面的異常可以依賴業(yè)務邏輯進行判斷,符合規(guī)則的屬于正常,反之則是異常;二、數(shù)據(jù)分布中的噪聲點,這種異常獨立于業(yè)務邏輯,無法通過簡單的規(guī)則進行判斷,本文將著重介紹針對此種異常進行檢測的方法——四分位數(shù)法。

四分位數(shù)法介紹
四分位數(shù)法又叫Tukey’s test,是統(tǒng)計學中成熟、使用較為廣泛的異常值檢測方法。其計算的過程大概為:
1)把數(shù)據(jù)從小到大排列。
2)計算中位數(shù)。
3)計算下四分位數(shù),這里設置為Q1,表示總數(shù)據(jù)最小的25%的數(shù)據(jù)在這個點以下;計算上四分位數(shù),設置為Q3,表示最大的25%數(shù)據(jù)都在這個點以上。
4)找出數(shù)據(jù)的“內(nèi)圍”。第一步是把四分位差乘以參數(shù)k,k一般取值1.5。加上Q3 ,用Q1 減去這個和,得到內(nèi)圍。
5)找出數(shù)據(jù)外圍。和內(nèi)圍方法類似,不過這里要將四分位差乘的參數(shù)要大于內(nèi)圍的取值一般為3。
6)最終超過內(nèi)圍或者外圍的值為異常值。

傳統(tǒng)的異常值檢測方法例如:

式中:
T——一個車輛登入與車輛登出時間段內(nèi)的總秒數(shù),s;
win——窗口時間,s;
i——一個車輛登入與車輛登出時間段T被窗口時間win劃分的段數(shù);
AVG_i——第i段數(shù)據(jù)的算術平均值;
STD_i——第i段數(shù)據(jù)的標準差;
P——標準差參數(shù);
X_(i,k)——第i段數(shù)據(jù)的第k個值;
R——距離參數(shù)。
這種假設數(shù)據(jù)符合正態(tài)分布的正確性難以得到保證,而四分位數(shù)法較于其他異常值檢測的方法計算簡單,但能夠有效篩選數(shù)據(jù)中的離群點,適合大規(guī)模數(shù)據(jù)的計算;同時靈活的參數(shù)設置可以針對不同情況、不同字段進行調(diào)節(jié)使得四分位數(shù)法能夠有效的適應多變的車輛報文數(shù)據(jù)。
四分位數(shù)法不會是異常值檢測的終極解決方案,但是隨著遠程排放監(jiān)控車載終端的迭代更新,與之匹配對應的算法也將持續(xù)發(fā)展,不斷適應新的業(yè)務需求,為重型貨車的監(jiān)管夯實基礎。 
分享到:
 
反對 0 舉報 0 收藏 0 評論 0
滬ICP備11026917號-25