科技的進(jìn)步以及市場(chǎng)經(jīng)濟(jì)的發(fā)展將我們帶入了一個(gè)嶄新的信息時(shí)代。數(shù)據(jù)挖掘技術(shù)作為一門多學(xué)科交叉的新興技術(shù),應(yīng)用于商業(yè)、醫(yī)學(xué)、科研等多個(gè)領(lǐng)域。審計(jì)人員在工作過(guò)程中需要從企業(yè)海量的會(huì)計(jì)數(shù)據(jù)中獲取審計(jì)證據(jù),通過(guò)數(shù)據(jù)挖掘技術(shù)的運(yùn)用,可以有效地提高審計(jì)效率、降低審計(jì)風(fēng)險(xiǎn),從而最大程度地保證審計(jì)質(zhì)量。 什么是數(shù)據(jù)挖掘技術(shù)? 數(shù)據(jù)挖掘是指從大量的、不完全的、隨機(jī)的數(shù)據(jù)集合中抽取出隱藏在其中,先前沒(méi)有被人們發(fā)現(xiàn),但又是有用的信息和知識(shí)的過(guò)程。它可以幫助決策者發(fā)現(xiàn)歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)之間潛在的關(guān)系,預(yù)測(cè)未來(lái)可能發(fā)生的行為,從而達(dá)到幫助決策者做出正確決策的目的。 數(shù)據(jù)挖掘在審計(jì)中的主要應(yīng)用層面 1. 內(nèi)控制度的符合性測(cè)試 審計(jì)人員可以借助企業(yè)自身安裝的審計(jì)挖掘軟件對(duì)企業(yè)內(nèi)控測(cè)試的風(fēng)險(xiǎn)進(jìn)行評(píng)估。這些軟件可以幫助審計(jì)人員發(fā)現(xiàn)企業(yè)的高風(fēng)險(xiǎn)交易、編制例外事項(xiàng)報(bào)告等。通常這些軟件能夠記錄計(jì)算機(jī)的使用痕跡,從而測(cè)試一些控制環(huán)節(jié),幫助審計(jì)人員進(jìn)行內(nèi)部控制的評(píng)估,發(fā)現(xiàn)控制系統(tǒng)的不足,追根溯源,提出改進(jìn)意見(jiàn)。 2. 實(shí)質(zhì)性測(cè)試審計(jì) 通常情況下對(duì)被審計(jì)單位進(jìn)行全面審計(jì)是存在困難的,但是采用適當(dāng)方法選取樣本進(jìn)行審查會(huì)存在抽樣風(fēng)險(xiǎn),從而可能使審計(jì)人員得出錯(cuò)誤的結(jié)論。數(shù)據(jù)挖掘技術(shù)由于其強(qiáng)大的數(shù)據(jù)庫(kù)和算法功能,可以高效的幫助審計(jì)人員在較短的時(shí)間內(nèi)篩選出具有代表性的樣本,運(yùn)用多種數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,發(fā)現(xiàn)存在的問(wèn)題,降低審計(jì)風(fēng)險(xiǎn)。 數(shù)據(jù)挖掘?qū)徲?jì)的基本路徑 1. 數(shù)據(jù)采集 數(shù)據(jù)采集與準(zhǔn)備即建立數(shù)據(jù)挖掘庫(kù)。將各部門提交的統(tǒng)一格式的審計(jì)數(shù)據(jù)收集整理,將數(shù)據(jù)日志納入系統(tǒng)信息整合形成數(shù)據(jù)庫(kù)邏輯上的一個(gè)子集。獲取大量數(shù)據(jù)是數(shù)據(jù)挖掘技術(shù)的工作起點(diǎn),數(shù)據(jù)庫(kù)的建立關(guān)系著后續(xù)挖掘工作的順利進(jìn)行。 2. 預(yù)處理 由于收集到的數(shù)據(jù)可能有噪聲或者缺失,因而必要時(shí)需要對(duì)數(shù)據(jù)進(jìn)行調(diào)整和整理,包括格式轉(zhuǎn)換、數(shù)字凈化、提煉等等。審計(jì)人員應(yīng)當(dāng)在正式挖掘前剔除數(shù)據(jù)庫(kù)中的干擾數(shù)據(jù),將其轉(zhuǎn)換成可以識(shí)別的審計(jì)專用格式,以便提高數(shù)據(jù)挖掘的準(zhǔn)確性。 3. 發(fā)現(xiàn)規(guī)律與異常 選取合適的挖掘模型,運(yùn)用正確的數(shù)據(jù)算法,審計(jì)人員可以通過(guò)結(jié)合自身的從業(yè)經(jīng)驗(yàn),結(jié)合被審計(jì)單位的行業(yè)狀況、業(yè)務(wù)特點(diǎn)和數(shù)據(jù)模式,發(fā)現(xiàn)所獲取的數(shù)據(jù)中隱藏的規(guī)律,從而找到異常數(shù)據(jù)。 4. 結(jié)果分析 并非所有數(shù)據(jù)挖掘出來(lái)的結(jié)果都具有實(shí)際意義,因而實(shí)施數(shù)據(jù)挖掘的審計(jì)人員需要結(jié)合實(shí)際情況,將數(shù)據(jù)挖掘的結(jié)果整合到財(cái)務(wù)系統(tǒng)中去,通過(guò)分析將實(shí)際數(shù)據(jù)與模型進(jìn)行對(duì)比,調(diào)整模型?;蛘咧匦逻x擇數(shù)據(jù)重建模型直到找到最合適的模型為止。 常見(jiàn)數(shù)據(jù)挖掘軟件 1.weka Weka,全名為懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一款免費(fèi)非商業(yè)化的數(shù)據(jù)挖掘軟件,是基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)。用戶可以在官方網(wǎng)站下載它和它的源代碼。 2. Orange Orange是一個(gè)基于組件的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)軟件套裝,其具有快速且多功能的可視化編程前端,以便瀏覽數(shù)據(jù)分析和可視化。它包含了完整的一系列的組件以進(jìn)行數(shù)據(jù)預(yù)處理,并提供數(shù)據(jù)賬目、過(guò)渡、建模、模式評(píng)估和勘探等功能。 3. Rattle Rattle提供了一個(gè)圖形交互界面,將數(shù)據(jù)轉(zhuǎn)化成易于建模的形式。Rattle會(huì)有一個(gè)Log 記錄,任何在Rattle操作的行為所對(duì)應(yīng)的R Code都很明確的一步一步記錄下來(lái)。 |
|