DQZHAN訊:智能配電網(wǎng)大數(shù)據(jù)應用需求和場景分析研究
中國電力科學研究院的研究人員劉科研、盛萬興等,在2015年第2期《中國電機工程學報》上撰文,智能配電網(wǎng)中存在大量異構多源的數(shù)據(jù),其中的數(shù)據(jù)規(guī)模和特點符合大數(shù)據(jù)的各項特征。首先總結(jié)配電網(wǎng)大數(shù)據(jù)的來源和特征,然后從智能配電網(wǎng)中的應用場景出發(fā),分別從配電網(wǎng)負荷預測、運行狀態(tài)評估與預警、電能質(zhì)量監(jiān)測和評估、基于配電網(wǎng)數(shù)據(jù)融合的停電優(yōu)化等方面進行分析。
從不同系統(tǒng)和不同數(shù)據(jù)結(jié)構角度,對多源數(shù)據(jù)融合中的**數(shù)據(jù)辨識進行重點分析,同時還歸納了配電網(wǎng)大數(shù)據(jù)關聯(lián)模型建模方法和配電網(wǎng)大數(shù)據(jù)分析手段。通過在配電網(wǎng)中運行大數(shù)據(jù)的分析技術,能夠為智能配電網(wǎng)開展分析提供強有力的計算和分析條件,大數(shù)據(jù)的分析結(jié)果可為配電網(wǎng)規(guī)劃和**運行提供數(shù)據(jù)支撐,也可有效提升配電網(wǎng)各類資產(chǎn)健康水平。
在信息技術中,大數(shù)據(jù)是指無法在一定時間內(nèi),用常規(guī)的工具軟件(如現(xiàn)有數(shù)據(jù)庫管理工具或數(shù)據(jù)處理應用)對其內(nèi)容進行抓取、管理、存儲、搜索、共享、分析和可視化處理的由數(shù)量巨大、結(jié)構復雜、類型眾多數(shù)據(jù)構成的大型復雜數(shù)據(jù)集合[1-2]。
相關閱讀:面向智能電網(wǎng)應用的電力大數(shù)據(jù)關鍵技術
大數(shù)據(jù)具有4V特點,即高容量(Volume)、快速性(Velocity)、多樣性(Variety)和價值密度低(Value)。大數(shù)據(jù)帶來的挑戰(zhàn)在于它的實時處理,而數(shù)據(jù)本身也從結(jié)構性數(shù)據(jù)轉(zhuǎn)向了非結(jié)構性數(shù)據(jù),因此使用關系數(shù)據(jù)庫對大數(shù)據(jù)進行處理是非常困難的。
配電網(wǎng)處于電力系統(tǒng)的末端,具有地域分布廣、電網(wǎng)規(guī)模大、設備種類多、網(wǎng)絡連接多樣、運行方式多變等鮮明特點。隨著城鎮(zhèn)化建設和用電需求的增長,配電網(wǎng)一直在不斷地改造和擴建,其規(guī)模也不斷擴大,國網(wǎng)公司系統(tǒng)內(nèi)大多數(shù)縣級以上配電網(wǎng)的規(guī)模都已達到百條饋線以上,一些中、大型城市的中壓饋線已達到或超過千條。
隨著配電自動化、用電信息采集等應用系統(tǒng)的推廣應用,對于有千條饋線的大規(guī)模配電網(wǎng),配電網(wǎng)中會產(chǎn)生指數(shù)級增長的海量異構、多態(tài)的數(shù)據(jù),數(shù)據(jù)集合的大小可達到當今信息學界所關注的大數(shù)據(jù)級別。
此外,大規(guī)模配電網(wǎng)還具有其特有的特征:1)數(shù)據(jù)采集多,每個采集點采集相對固定類別的數(shù)據(jù),且分布在各個電壓等級內(nèi);2)不同采集點的采樣尺度不同,數(shù)據(jù)斷面不同;3)數(shù)據(jù)不健全,數(shù)據(jù)采集存在誤差和漏傳;4)數(shù)據(jù)分布在不同的應用系統(tǒng)中。
含有包括光伏發(fā)電、風電、燃氣輪機等分布式電源(distributed generator,DG)的配電網(wǎng)即有源配電網(wǎng),分布式電源的不斷滲透給大規(guī)模配電網(wǎng)傳統(tǒng)的分析與計算帶來更大的挑戰(zhàn)。
分布式電源接入電網(wǎng)后,向電網(wǎng)調(diào)度機構提供的信息至少應當包括:1)電源并網(wǎng)狀態(tài)、有功和無功輸出、發(fā)電量;2)電源并網(wǎng)點母線電壓、頻率和注入電力系統(tǒng)的有功功率、無功功率;3)變壓器分接頭檔位、斷路器和隔離開關狀態(tài)。
因此,分布式電源接入后,在原已規(guī)模很大的配電網(wǎng)數(shù)據(jù)采集中新增了一組需采集的數(shù)據(jù)項,同時也會惡化配電網(wǎng)數(shù)據(jù)采集的非健全性和不確定性。
鑒于大數(shù)據(jù)在電力系統(tǒng)的應用場景越來越多,有必要對大數(shù)據(jù)在配電網(wǎng)的應用場景和目標進行分析與總結(jié),為大數(shù)據(jù)技術在智能電網(wǎng)中的應用提供有益的參考。
1 配電網(wǎng)大數(shù)據(jù)的來源和特征
智能配用電大數(shù)據(jù)應用具備豐富的數(shù)據(jù)源,現(xiàn)在大多數(shù)地市擁有多個配電管理系統(tǒng),包括配電自動化系統(tǒng)、調(diào)度自動化系統(tǒng)、電網(wǎng)氣象信息系統(tǒng)、電能質(zhì)量監(jiān)測管理系統(tǒng)、生產(chǎn)管理系統(tǒng)、地理信息系統(tǒng)、用電信息采集系統(tǒng)、配變負荷監(jiān)測系統(tǒng)、負荷控制系統(tǒng)、營銷業(yè)務管理系統(tǒng)、ERP系統(tǒng)、95598客服系統(tǒng)、經(jīng)濟社會類數(shù)據(jù)等數(shù)據(jù)源,這些數(shù)據(jù)源的總體狀況如表1所示。
表1 典型配電系統(tǒng)數(shù)據(jù)源
這些數(shù)據(jù)源涵蓋了調(diào)度、運檢、營銷等多個管理業(yè)務,以及絕大部分110kV及以下多電壓等級的電網(wǎng)監(jiān)控和采集信息。從數(shù)據(jù)源類型來講,智能配用電大數(shù)據(jù)應用的數(shù)據(jù)源類型豐富,覆蓋配變、配電變電站、配電開關站、電表、電能質(zhì)量等配用電自動化和信息化數(shù)據(jù)、用戶數(shù)據(jù)和社會經(jīng)濟等數(shù)據(jù)。
2 配電網(wǎng)典型大數(shù)據(jù)場景分析
2.1 面向有源配電網(wǎng)規(guī)劃的負荷預測
隨著配電網(wǎng)信息化的快速發(fā)展和電力需求影響因素的逐漸增多,用電預測的大數(shù)據(jù)特征日益凸顯,傳統(tǒng)的用電預測方法已經(jīng)不再適用。由于智能預測方法具備良好的非線性擬合能力,因此近年來用電預測領域出現(xiàn)了大量的研究成果,遺傳算法、粒子群算法、支持向量機和人工神經(jīng)網(wǎng)絡等智能預測算法開始廣泛地應用于用電預測中。
傳統(tǒng)的用電負荷預測,受限于較窄的數(shù)據(jù)采集渠道或較低的數(shù)據(jù)集成、存儲和處理能力,使得研究人員難以從其中挖掘出更有價值的信息。通過將體量更大、類型更多的電力大數(shù)據(jù)作為分析樣本可以實現(xiàn)對電力負荷的時間分布和空間分布預測,為規(guī)劃設計、電網(wǎng)運行調(diào)度提供依據(jù),提升決策的準確性和有效性。
2.2 配電網(wǎng)運行狀態(tài)評估與預警
基于大數(shù)據(jù)技術的配電網(wǎng)運行狀態(tài)評估與預
警研究內(nèi)容如圖1 所示,包括以下方面:
圖1 有源配電網(wǎng)運行狀態(tài)評估和風險預警
1)對配電網(wǎng)進行**性評價,如電力系統(tǒng)的頻率、節(jié)點電壓水平、主變和線路負載率等;
2)對配電網(wǎng)的供電能力進行評價,如容載比、線路間負荷轉(zhuǎn)移能力等。當供電能力不能滿足負荷需求時,根據(jù)負荷重要程度、產(chǎn)生的經(jīng)濟社會效益以及歷史電壓負荷情況,進行甩負荷;
3)對配電網(wǎng)可靠性和供電質(zhì)量進行評價,如負荷點故障率、系統(tǒng)平均停電頻率、系統(tǒng)平均停電時間、電壓合格率、電壓波動與閃變、三相不平衡度、波形畸變率、電壓偏移、頻率偏差等;
4)對配電網(wǎng)經(jīng)濟性進行評價,如線損率和設備利用效率等。
通過計算風險指標,判斷出所面臨風險的類型;預測從現(xiàn)在起未來一段時間內(nèi)配電網(wǎng)所面臨的風險情況;根據(jù)風險類型辨識結(jié)果,生成相應的預防控制方案,供調(diào)度決策人員參考;可以對突發(fā)性的風險和累積性風險進行準確辨識、定位、類型判斷、生成預防控制方案等;依據(jù)對多源異構的數(shù)據(jù)分析,將風險準確定位到局部,進一步對全網(wǎng)或局部電網(wǎng)的風險狀況進行集中判斷、定位以及預防控制。
2.3 有源配電網(wǎng)電能質(zhì)量監(jiān)測和評估
隨著分布式電源不斷地接入配電網(wǎng),逐步形成了小、中、大規(guī)模的有源配電網(wǎng)。伴隨著分布式電源的功率波動,配電網(wǎng)中的電能質(zhì)量經(jīng)受著較大的沖擊。通過收集配電網(wǎng)中的運行數(shù)據(jù)、負荷數(shù)據(jù)、分布式電源運行等數(shù)據(jù),能夠開展配電網(wǎng)中的電能質(zhì)量分析和評估研究,從而得出精細化的配電網(wǎng)網(wǎng)架和無功源的調(diào)節(jié)方案等。有源配電網(wǎng)電能質(zhì)量監(jiān)測和評估示意圖如圖2所示。
圖2 有源配電網(wǎng)電能質(zhì)量監(jiān)測和評估示意圖
基于大數(shù)據(jù)的有源配電網(wǎng)電能質(zhì)量監(jiān)測和評估包括以下方面。
1)有源配電網(wǎng)電能質(zhì)量分析與監(jiān)測。
電網(wǎng)規(guī)模的不斷擴大以及分布式電源的不斷接入,配電網(wǎng)中運行數(shù)據(jù)、負荷數(shù)據(jù)、分布式電源運行等數(shù)據(jù)逐漸增多,電能質(zhì)量分析的大數(shù)據(jù)特征日益明顯,傳統(tǒng)電能質(zhì)量分析方法在電能質(zhì)量的消噪、特征提取、擾動分類和參數(shù)估計等方面難以完全解決問題。面對出現(xiàn)的電能質(zhì)量問題,近年來產(chǎn)生了許多綜合分析法[3-4]。
但是,基于傳統(tǒng)電能質(zhì)量分析方法的電能質(zhì)量監(jiān)測裝置面臨性能差、精度低、智能化程度低等問題,需研究高性能的電能質(zhì)量分析方法,開發(fā)實時在線的電能質(zhì)量監(jiān)測系統(tǒng)。電能質(zhì)量監(jiān)測系統(tǒng)集通信、測量、分析和管理等諸多功能于一體,能為電力企業(yè)和用戶提供供電質(zhì)量的基本信息,實現(xiàn)有源配電網(wǎng)電能質(zhì)量**、準確、有效地監(jiān)測。同時考慮到經(jīng)濟性,有源配電網(wǎng)中監(jiān)測終端的*優(yōu)布點也是亟需解決的問題。
2)有源配電網(wǎng)電能質(zhì)量評估。
有源配電網(wǎng)電能質(zhì)量的評估是對有源配電網(wǎng)運行水平和電力供應能力的綜合評價,是約束、督促電力公司與電力用戶共同維護公共電網(wǎng)電能質(zhì)量環(huán)境的基礎,同時也是實施質(zhì)量治理與控制的依據(jù)、檢驗治理與控制效果的工具[5]。
隨著分布式電源越來越多的接入配電網(wǎng),用戶對電能質(zhì)量的要求越來越高,傳統(tǒng)的電能質(zhì)量評估方法面臨計算性能降低、耗時長、精度低等問題,如何使電能質(zhì)量的評估合理、客觀、準確是電力企業(yè)面臨的嚴峻考驗。
而且,大規(guī)模的結(jié)構化數(shù)據(jù)和非結(jié)構化數(shù)據(jù)的加入,將為電能質(zhì)量評估提供新的研究途徑,制定合理的有源配電網(wǎng)電能質(zhì)量評估指標,提高電能質(zhì)量評估的準確性,深度挖掘電能質(zhì)量監(jiān)測系統(tǒng)采集到的數(shù)據(jù)信息,揭示由于之前分析成本太高而忽略的信息,為電力企業(yè)以及用戶提供諸如網(wǎng)架結(jié)構分析、無功源配置方案合理性分析、敏感負荷安裝位置分析、監(jiān)測點配置方案等高附加值服務,這些服務將有利于電網(wǎng)的**、穩(wěn)定和經(jīng)濟運行。
3)有源配電網(wǎng)電能質(zhì)量診斷與治理。
為了滿足較高電能質(zhì)量的要求,及時正確地對影響電能質(zhì)量的各種異常運行狀態(tài)做出診斷,找出電能質(zhì)量干擾源,并預防或消除,從而避免故障的擴大,是有源配電網(wǎng)面臨的又一個難題。
鑒于分布式電源可以看作一種向配電饋線注入諧波的非線性負荷,而分布式電源的投切也會引起電壓波動,分布式電源的接入無疑會在一定程度上加重對電能質(zhì)量的擾動。傳統(tǒng)的電能質(zhì)量擾動定位方法都存在一定的適用環(huán)境與限制條件,且僅僅考慮一種定位方法得出的定位結(jié)果可信度往往不高。
通過將體量更大、類型更多的電力大數(shù)據(jù)作為分析樣本,為電能質(zhì)量擾動定位提供詳細的研究思路,提高電能質(zhì)量擾動定位的準確性,尋找出網(wǎng)架結(jié)構中的薄弱環(huán)節(jié),制定精細化的配電網(wǎng)網(wǎng)架和無功源調(diào)節(jié)方案,改善電能質(zhì)量,對電網(wǎng)的經(jīng)濟運行具有重要意義。
2.4 基于配電網(wǎng)數(shù)據(jù)融合的停電優(yōu)化
配電網(wǎng)停電優(yōu)化是建立在配電網(wǎng)調(diào)度自動化系統(tǒng)、配電自動化系統(tǒng)、用電信息采集系統(tǒng)、配網(wǎng)設備管理系統(tǒng)、配電設備檢修管理系統(tǒng)、電網(wǎng)圖形及地理圖形信息和營銷管理系統(tǒng)等的基礎上,綜合分析配電網(wǎng)運行的實時信息、設備檢修信息等,以找出*終的*優(yōu)停電方案。
計劃停電管理根據(jù)計劃停電(包括檢修和限電等)的要求,進行系統(tǒng)模擬,以*小的停電范圍、*短的停電時間、*小的停電損失、*小的停電用戶來確定停電設備,通過屏幕顯示停電區(qū)域,列出停電的用戶名單,打印用戶停電通知書等等。采用傳統(tǒng)技術在處理時存在計算速度慢、計算周期長、擴展性差等缺點。
為了更加準確地計算配網(wǎng)停電損失,降低停電影響需要利用多個業(yè)務系統(tǒng)的海量數(shù)據(jù)進行聯(lián)合分析和數(shù)據(jù)挖掘。
基于大數(shù)據(jù)技術的配電網(wǎng)停電優(yōu)化包括:1)停電信息分類,基于調(diào)度、營銷、配網(wǎng)貫通的海量數(shù)據(jù)對停電信息數(shù)據(jù)進行整理與分類;2)停電預警,對設備故障可能導致停電進行預警;3)配電網(wǎng)停電計劃制定,采用大數(shù)據(jù)技術制定合理的停電計劃,完善配網(wǎng)停電優(yōu)化分析系統(tǒng)。
3 配電網(wǎng)多源數(shù)據(jù)融合中的**數(shù)據(jù)辨識
3.1 **數(shù)據(jù)檢測與辨識方法
**數(shù)據(jù)檢測是指判斷某次量測采樣中是否存在**數(shù)據(jù)。**數(shù)據(jù)辨識是指在發(fā)現(xiàn)某次量測采樣中存在**數(shù)據(jù)后,確定哪個(或哪些)量測是**數(shù)據(jù)。**數(shù)據(jù)的處理已經(jīng)成為一個熱門課題,目前國內(nèi)外已經(jīng)提出多種**數(shù)據(jù)檢測與辨識的方法,大致分為以下2 類:
1)傳統(tǒng)的**數(shù)據(jù)檢測方法包括目標函數(shù)極值檢測法、加權殘差法、檢測法或標準化殘差檢測法、量測量突變檢測法等。傳統(tǒng)的**數(shù)據(jù)辨識方法主要有殘差搜索法、非二次準則法、零殘差法、估計辨識法等;
2)相對傳統(tǒng)的一些新理論和新方法主要有基于數(shù)據(jù)挖掘的模糊數(shù)學法、神經(jīng)網(wǎng)絡法、聚類分析法、間隙統(tǒng)計法等。這些方法大多針對傳統(tǒng)配電網(wǎng)比較簡單的小規(guī)模結(jié)構化數(shù)據(jù)。隨著智能配電網(wǎng)規(guī)模的不斷擴大、分布式電源的接入以及網(wǎng)絡技術在配電系統(tǒng)中的廣泛應用,對于配電網(wǎng)中達到大數(shù)據(jù)級別的**數(shù)據(jù)的檢測與辨識,傳統(tǒng)方法很難達到處理需求。
3.2 基于多源數(shù)據(jù)的**數(shù)據(jù)辨識方法
根據(jù)配電網(wǎng)大數(shù)據(jù)多源、多渠道的特點,可基于不同來源的數(shù)據(jù)進行互校核,實現(xiàn)**數(shù)據(jù)的檢測與辨識,包括電度量和量測量的互校核、不同數(shù)據(jù)系統(tǒng)間的互校核方法、不同結(jié)構數(shù)據(jù)的互校核等,如圖3所示。
圖3 基于多源數(shù)據(jù)融合的**數(shù)據(jù)辨識方法
1)基于電度量與量測量互校核的**數(shù)據(jù)檢測方法。(略)
2)基于不同系統(tǒng)間數(shù)據(jù)互校核的**數(shù)據(jù)檢測方法。
配電網(wǎng)多源數(shù)據(jù)按獲得來源分,可分為來自不同系統(tǒng)的數(shù)據(jù),來自不同系統(tǒng)間的數(shù)據(jù)可以進行互校核。如可結(jié)合配電網(wǎng)管理信息系統(tǒng)、生產(chǎn)管理系統(tǒng)的信息以及低壓臺區(qū)互聯(lián)信息,確定配變用電類型,按照不同行業(yè)需量系數(shù)和典型日負荷曲線可擬合出該配變負荷曲線。
3)基于不同結(jié)構數(shù)據(jù)互校核的**數(shù)據(jù)檢測方法。
配電網(wǎng)中含有結(jié)構化數(shù)據(jù)、非結(jié)構化數(shù)據(jù)、半結(jié)構化數(shù)據(jù),但是不同類型的數(shù)據(jù)可能包含相同的信息量,如某一線路的長度可由地理信息系統(tǒng)中的非結(jié)構化圖形數(shù)據(jù)獲得,也可從生產(chǎn)管理系統(tǒng)中的結(jié)構化數(shù)據(jù)獲得,通過不同類型的數(shù)據(jù)進行互校核,可實現(xiàn)**數(shù)據(jù)的辨識。
配電網(wǎng)中不同的數(shù)據(jù)源為配電網(wǎng)研究對象提供了多角度、多時間、多維度的數(shù)據(jù)描述,為了通過大數(shù)據(jù)分析充分挖掘有用信息,需要建立數(shù)據(jù)之間的關系數(shù)學模型。
4 配電網(wǎng)大數(shù)據(jù)關聯(lián)模型建模
4.1 配電網(wǎng)數(shù)據(jù)特征化
配電網(wǎng)中的研究對象一般使用類進行描述,這種描述可以通過數(shù)據(jù)特征化得到,數(shù)據(jù)特征化是目標類數(shù)據(jù)的一般特性或特征的匯總。特征是一個數(shù)據(jù)字段,表示數(shù)據(jù)對象的一個特征[6]。不同配電網(wǎng)研究對象有不同的屬性,不同的屬性有不同的數(shù)據(jù)類型,一個屬性的類型由該屬性可能具有的值的集合決定。
4.2 配電網(wǎng)數(shù)據(jù)鄰近性模型
數(shù)據(jù)的相似性和相異性都稱為鄰近性,配電網(wǎng)數(shù)據(jù)鄰近性模型具有廣泛的應用。例如,同一個負荷可能在不同的應用系統(tǒng)中有著不同的記錄,為了正確高效地進行數(shù)據(jù)分析,需要在數(shù)據(jù)集成時將多條記錄合并為一條記錄,因此需要對多條記錄的鄰近性進行計算分析。
再如,需要定量描述投運時間對設備性能的影響。同時,鄰近性模型還是進行分類、聚類分析、離群點分析等深入研究的數(shù)據(jù)基礎。
4.3 配電網(wǎng)數(shù)據(jù)關聯(lián)模型
關聯(lián)規(guī)則由Agrawal、Imielinski和Swami提出,是數(shù)據(jù)中一種簡單但很實用的規(guī)則[7]。配電網(wǎng)故障、狀態(tài)與原因之間存在關聯(lián)關系,發(fā)現(xiàn)故障屬性間的關聯(lián)特性可以更好地對設備進行故障監(jiān)測與診斷。
如分析配電網(wǎng)參數(shù)和暫態(tài)穩(wěn)定性之間的關聯(lián)性,判斷發(fā)生故障時系統(tǒng)失穩(wěn)的概率;如分析系統(tǒng)節(jié)點電壓變化特性與故障之間的關系,找出系統(tǒng)中*為敏感的節(jié)點;如尋找特定地點諧波電流與其他地點電壓之間的關聯(lián)度,確定諧波源位置、特征及處理方法。
也可在電力營銷和負荷管理中引入關聯(lián)分析,以指導供電公司制定合理的營銷策略,如在配網(wǎng)規(guī)劃中,分析城市用電量與GDP 增長率、**產(chǎn)業(yè)比重、中心性等級、行政級別、氣候類型等因素之間的關聯(lián)關系。
5 配電網(wǎng)大數(shù)據(jù)分析方法和手段
5.1 配電網(wǎng)數(shù)據(jù)特征聚類
聚類可用于將數(shù)據(jù)分割成多個類或子集,在聚類分析中類的數(shù)量是未知的。常見的聚類方法有劃分聚類法、層次聚類法、網(wǎng)格聚類法、基于模型的聚類法以及智能聚類法等。根據(jù)不同聚類方法的適用范圍及配電網(wǎng)大數(shù)據(jù)的特征,通過研究基于配電網(wǎng)時空特性的數(shù)據(jù)聚類方法,能夠提出處理配電網(wǎng)時空特性的數(shù)據(jù)聚類解決方案。
從配電網(wǎng)調(diào)度系統(tǒng)和負荷監(jiān)測中提取不同區(qū)域、不同類型的用戶負荷曲線,進行負荷特性聚類分析,為電力公司營銷和負荷管理提供依據(jù),是近幾年電力系統(tǒng)聚類分析的研究熱點[8-9]。通過對負荷曲線的聚類,可以作為負荷預測和電價預測的預處理過程;通過分析配電網(wǎng)線路和設備故障信息,形成具有相似變化的曲線簇,可更好地估計和抑制故障帶來的影響。
5.2 配電網(wǎng)數(shù)據(jù)特征分類
分類是通過訓練產(chǎn)生的分類函數(shù)或分類模型將數(shù)據(jù)對象映射到2 個或多個給定類別的方法[10-12]。從機器學習的觀點,分類分析是一種有指導的學習,即其訓練樣本的分類屬性(類標號)的值是已知的,通過學習過程形成數(shù)據(jù)對象與類標示間對應的知識,這類知識也可稱為分類規(guī)則。
分類通過已訓練好的模型或分類規(guī)則來預測、標記未知的數(shù)據(jù)類。分類方法包括決策樹歸納法、K*近鄰法、向量空間模型法、貝葉斯分類法、支持向量機模糊分類及神經(jīng)網(wǎng)絡法等。在配電網(wǎng)配電變壓器故障識別和診斷中,可以通過貝葉斯分類方法將變壓器故障分類為內(nèi)部或外部的接地和短路故障;也可以用神經(jīng)網(wǎng)絡來識別包括高溫、低能和高能狀態(tài)等故障類型。
5.3 配電網(wǎng)大數(shù)據(jù)快速分析技術路線
數(shù)據(jù)挖掘技術的選擇由相應需要解決的業(yè)務問題來決定。要解決一個業(yè)務問題,在一個數(shù)據(jù)挖掘的完整流程中,需要同時利用多種數(shù)據(jù)挖掘方法。例如在數(shù)據(jù)預處理階段,可以通過統(tǒng)計性描述方法對數(shù)據(jù)的本質(zhì)、質(zhì)量進行探索和分析,利用無量綱化的模型對數(shù)據(jù)進行標準化處理,也可以用聚類分析對臨群點進行探索等。
基于配電網(wǎng)大數(shù)據(jù)聚類與分類技術,研究面向大規(guī)模配電網(wǎng)大數(shù)據(jù)的快速數(shù)據(jù)分析與處理技術,其技術路線如圖4所示。
圖4 配電網(wǎng)時空特性的快速數(shù)據(jù)處理方法
5.4 數(shù)據(jù)密集型計算手段
目前分布式并行計算技術是數(shù)據(jù)密集型計算的主要手段。由于大數(shù)據(jù)的數(shù)據(jù)量和分布式的特點,使得傳統(tǒng)的數(shù)據(jù)管理技術難以勝任這種海量數(shù)據(jù)。很多企業(yè)開始想方設法把大數(shù)據(jù)存儲起來,不斷地嘗試新的大數(shù)據(jù)存儲架構、研究大數(shù)據(jù)分析方法技術。
目前,在分布式并行計算與存儲的很多研究和應用中,Hadoop的分布式并行處理應用的比較多,比如互聯(lián)網(wǎng)網(wǎng)頁分析和大數(shù)據(jù)統(tǒng)計挖掘等。電力系統(tǒng)的優(yōu)化分析方法大多是計算任務/數(shù)據(jù)密集型的,所以可依靠Hadoop較容易地開展分布式并行方面的計算和研究。
基于Hadoop的分布式并行計算技術在國內(nèi)電力行業(yè)中的應用研究還處于探索階段,研究內(nèi)容主要集中在系統(tǒng)構想、實現(xiàn)思路和前景展望等方面[13-17]。在國外,基于Hadoop的分布式并行計算應用目前已用于海量數(shù)據(jù)的存儲和簡單處理,已有實現(xiàn)并運行的實際系統(tǒng)[18-21]。
分布式并行計算技術能夠為大規(guī)模復雜配電網(wǎng)分析計算提供強大的支撐,并能為供電企業(yè)和用戶提供大量的高附加值服務,這些增值服務將有利于電網(wǎng)**監(jiān)測與控制(包括故障預警與處理、供電與電力調(diào)度決策支持和更準確的用電量預測)、客戶用電行為分析與客戶細分、電力企業(yè)精細化運營管理、更科學的需求側(cè)管理等。
6 結(jié)論與展望
隨著大數(shù)據(jù)時代的到來及大數(shù)據(jù)應用技術的發(fā)展,為充分利用現(xiàn)有電網(wǎng)運行數(shù)據(jù)和氣象環(huán)境數(shù)據(jù)進行設備故障預測成為可能。
通過集成各分散系統(tǒng)的信息,規(guī)范數(shù)據(jù)類型,形成豐富的、同質(zhì)的大數(shù)據(jù)樣本,對不同類型、不同型號、不同狀態(tài)的設備進行故障發(fā)生可能性預測,可為電網(wǎng)運檢采取針對性的防護措施提供支撐,為電網(wǎng)**運行、智能電網(wǎng)自愈提供保障。
電力信息化建設利用大數(shù)據(jù)技術,在企業(yè)數(shù)據(jù)共享的平臺下獲取電力企業(yè)生產(chǎn)數(shù)據(jù)、管理數(shù)據(jù)、地形地貌數(shù)據(jù)、水資源數(shù)據(jù)等有效數(shù)據(jù),能夠提煉準確的、有價值的數(shù)據(jù),能夠為管理效益、決策能力提升提供有效幫助。
特別是在運行檢修基礎數(shù)據(jù)不斷積累的前提下,利用大數(shù)據(jù)分析技術,能對檢修工作進行有效預測和數(shù)據(jù)支持,可進一步提升設備運行管理水平,為運行檢修科學決策提供可靠的數(shù)據(jù)依據(jù),具有巨大的經(jīng)濟價值和社會效益。