大數(shù)據(jù)偵查之所以走向負(fù)面,是因?yàn)榇髷?shù)據(jù)的自然屬性制約了偵查的社會功能。首先,大數(shù)據(jù)具有“海量性”的特點(diǎn)?,F(xiàn)階段的大數(shù)據(jù)偵查是從海量的“大”數(shù)據(jù)輸出一個“較大”數(shù)據(jù),而不是偵查價值集中的“小”數(shù)據(jù)。其次,大數(shù)據(jù)有“混雜性”的特點(diǎn)。也就是說,有價值的偵查信息與大量的無關(guān)信息混雜在一起,當(dāng)辦案人員無法把有價值的偵查信息從混雜的大數(shù)據(jù)中提取出來,混雜性變成非常大的“干擾性”。再者,大數(shù)據(jù)的“相關(guān)性”特點(diǎn)也容易給辦案人員帶來困擾。如果無法把無關(guān)的信息剔除出去,大數(shù)據(jù)的“相關(guān)性”就會走向負(fù)面,即“無關(guān)性”。 從本質(zhì)上講,這種負(fù)面現(xiàn)象是由大數(shù)據(jù)與偵查的功能沖突所引起的。眾所周知,大數(shù)據(jù)的最大功能是預(yù)測未來。然而,偵查的社會功能并不是預(yù)測未來,而是查明過去。鑒于此,曾有人提出,偵查領(lǐng)域從來都沒有“大數(shù)據(jù)偵查”,而是“數(shù)據(jù)大偵查”,這也是有些道理的。 再者,偵查的社會功能又對大數(shù)據(jù)提出了新的要求。比如,偵查的時效性要求大數(shù)據(jù)偵查作為一種手段,必須要達(dá)到“又好又快”。如果大數(shù)據(jù)偵查花費(fèi)的時間非常大,那么它就有可能被人遺棄。 尤其是,在大數(shù)據(jù)偵查領(lǐng)域,作為辦案人員不關(guān)心相關(guān)事實(shí),而只關(guān)心行為事實(shí)。如果大數(shù)據(jù)平臺里的信息無法反映人的行為事實(shí),那都只能成為沒有偵查價值的“相關(guān)事實(shí)”。 比如說,當(dāng)下就有諸多互聯(lián)網(wǎng)企業(yè)面臨著一種新的大數(shù)據(jù)犯罪形態(tài)——刷量,如刷廣告、刷注冊、刷評價等等。在很多案件中,從數(shù)據(jù)的相關(guān)關(guān)系上看,確實(shí)存在著“刷量”行為。但是,從司法證明角度而言,由于司法證明要求證據(jù)與行為具有因果關(guān)系,僅相關(guān)性不能成為案件證據(jù)。這使得這些新型大數(shù)據(jù)犯罪在行為證明和定罪量刑方面帶來了巨大的挑戰(zhàn)。 在視頻偵查中,也存在著信息量非常大的問題。視頻偵查專家是怎么解決這個問題的呢?他們往往是通過“串聯(lián)法”和“關(guān)聯(lián)法”讓信息形成動態(tài)的過程,從而挖掘具有偵查價值的行為信息。顯然,不管是視頻偵查,還是大數(shù)據(jù)偵查,它們在方法原理上都是一脈相承的。在偵查活動中,辦案人員最關(guān)心的是行為的動態(tài)過程,而非人與人之間的靜態(tài)關(guān)系。換言之,突破大數(shù)據(jù)偵查的“瓶頸”,正是要把“靜態(tài)關(guān)系”變成“動態(tài)過程”。 那么,如何讓大數(shù)據(jù)偵查達(dá)到前述效果呢?這就涉及到建模問題。模型是大數(shù)據(jù)的生產(chǎn)線。 目前,大數(shù)據(jù)的主流建模方法主要有兩種:數(shù)據(jù)驅(qū)動的建模和需求驅(qū)動的建模。所謂的數(shù)據(jù)驅(qū)動的建模,通俗地講就是我不管你有什么具體的需求,我只告訴你通過大數(shù)據(jù)分析有什么樣的結(jié)論,至于這些結(jié)論是否滿足你現(xiàn)在的需求,另當(dāng)別論。數(shù)據(jù)驅(qū)動建模的主要功能是用于預(yù)測未來,顯然偵查中是不會用到數(shù)據(jù)驅(qū)動建模的,反倒是犯罪預(yù)防很可能需要使用這種建模方法。至于需求驅(qū)動的建模,它的需求就是:告訴我和這個人或者這個手機(jī)號有關(guān)的信息有哪些,目前偵查系統(tǒng)所謂的“一鍵搜”就是此例。 但是,“偵查”的需求和“一鍵搜”的需求,并不是一回事:“一鍵搜”的需求是明確的,那就是找到與指定人或指定手機(jī)號所有相關(guān)的信息。而偵查的需求是找到本案的作案人,這是一種抽象而不明確的需求。既然連需求都是不明確的,大數(shù)據(jù)偵查顯然不應(yīng)該也不可能采取需求建模的方法。可見,在其他領(lǐng)域大數(shù)據(jù)所經(jīng)常使用的數(shù)據(jù)驅(qū)動建模和需求驅(qū)動建模,在偵查領(lǐng)域都是行不通的。 依據(jù)網(wǎng)絡(luò)法理學(xué)的原理,法律與技術(shù)相結(jié)合,一定要以“行為”為中介。偵查作為法律活動的一種,也同樣適用該原理。偵查與技術(shù)相結(jié)合也需要通過行為中介。通過技術(shù)從海量數(shù)據(jù)里提取出與行為有關(guān)的信息,才能得出有效的偵查結(jié)論。 大數(shù)據(jù)偵查領(lǐng)域的建模必須是以行為特征為中介,這是由大數(shù)據(jù)偵查的本質(zhì),即以行為事實(shí)而非相關(guān)事實(shí)為追求目標(biāo)所決定的。繼而,提出行為建模的大數(shù)據(jù)建模方法也就水到渠成了。在偵查領(lǐng)域的行為建模有兩個層次的含義:一種是偵查學(xué)模型,它其實(shí)就是各種類型案件的“技戰(zhàn)法”。偵查學(xué)模型往往是被動的,只有等案情需要時,才會使用偵查學(xué)模型去“尋找”數(shù)據(jù)信息,它一般不能達(dá)到機(jī)器主動偵查的效果。另一種是犯罪學(xué)模型,也叫犯罪行為模型,它必須能反映某種類型犯罪的行為特征、行為方式、行為規(guī)律。有了犯罪學(xué)模型以后,大數(shù)據(jù)平臺才能主動并自動地去運(yùn)算和匹配,并得出具有偵查價值的“小數(shù)據(jù)”。顯然,從大數(shù)據(jù)偵查的角度,犯罪學(xué)模型比偵查學(xué)模型更有利于效率的提高。這是因?yàn)榉缸飳W(xué)模型更適宜開發(fā)成以主動偵查和自動偵查為特征的“智能偵查”。 當(dāng)然,犯罪學(xué)模型的構(gòu)建還非常注重行為要素的分解,并且具體的分解方法與案件類型悉悉相關(guān)。比如,對公安的以事“找”人案件,它應(yīng)該更注重行為時間要素和行為空間要素的分解。即,找到在案發(fā)時間、案發(fā)地點(diǎn)與被害人接觸的人。而對于貪污受賄案件,則應(yīng)更注重行為對象要素和行為結(jié)果要素的分解。即,找到官員的非法錢財及相關(guān)的行賄人。不論如何,要想從大量看似相關(guān)的數(shù)據(jù)中快速有效地發(fā)現(xiàn)具有因果關(guān)系的數(shù)據(jù),必須從偵查學(xué)模型進(jìn)化到犯罪學(xué)模型。 值得注意的是,大數(shù)據(jù)偵查領(lǐng)域的行為建模人才從來都不是、也不可能像其他大數(shù)據(jù)領(lǐng)域一樣成為被神話了的“算法師”。高手在基層、在民間。這是因?yàn)樽盍私夥缸镄袨樘卣骱头缸镄袨橐?guī)律的人,一是基層民警,二是部分具有犯罪“智慧”和“潛能”的民間群眾。 今天,人工智能并不是指一種技術(shù),而是指一種方法和思維。大數(shù)據(jù)偵查通過犯罪學(xué)行為建模的優(yōu)化,完全可以升級為主動偵查和智能偵查,并完成到人工智能的進(jìn)化。鑒于此,可以把這種偵查模式歸納為:基于大數(shù)據(jù)的人工智能偵查。 (作者謝君澤系中國人民大學(xué)網(wǎng)絡(luò)犯罪與安全研究中心秘書長,中國人民大學(xué)物證技術(shù)鑒定中心副主任) |
|