学术探讨:声纹证据存在的风险有哪些?

更新:2019-06-05, 浏览:55

1963年4月,在东京下谷发生了一起“吉展幼儿拐卖案”。在该案中,唯一的线索是犯罪嫌嫌疑人电话威胁的声音。声纹专家通过对声纹进行分析,推断出犯罪嫌疑人的年龄、职业和出生地,为发现犯罪嫌疑人提供了极有价值的线索。确定犯罪嫌疑人后,又将电话录音和犯罪嫌疑人的声纹进行比较,参加声纹鉴定的专家一致对该犯做出匹配的认定,据此侦破了这桩轰动一时的案件。该案是世界上最早利用声纹证据侦破的一起案件,为声纹识别技术在司法活动中的应用提供了宝贵的实践经验。

学术探讨:声纹证据存在的风险有哪些?

基于人体特征所具有特异性、稳定性而产生的生物识别技术在个体识别和同一认定中得到了广泛的应用,同时也为刑事侦查、司法鉴定等提供了可靠的科学依据,成为打击犯罪活动的一项利器。如指纹识别,是应用较为广泛以及历史最为悠久的一项个体识别技术,随着生物技术发展而兴起的DNA技术,从其应用至今就一直备受推崇且认可度极高。声纹技术相较于这些较为成熟的识别技术而言,是一项新兴的个体识别手段。在运用于司法实践中,可以为迅速发现犯罪,及时依法取证和查清犯罪嫌疑人等方面起着独特的辅助作用。因此,各国司法机关对加强对声纹鉴定在刑事司法中的证据效力的研究高度重视。声纹证据具有科学证据的普遍特征,即必须基于某一科学原理和科学知识,运用科学的手段或方法通过对具体的材料或对象进行分析得出意见或结论,因此,为了解声纹证据首先需要了解其所依据的科学原理和技术。

学术探讨:声纹证据存在的风险有哪些?

一、声纹和声纹鉴定

声纹图谱,是指借助有关科学仪器分析、现实出来的声音的图像,即声音的频谱图,在法庭科学领域称之为声纹,也有人把它看作一种特殊的痕迹——声痕。利用有关仪器可用不同的方式对声音信号进行分析,显示出不同的声纹图谱。声纹鉴定是指通过声谱仪对未知人语音材料(检材)与已知人语音材料(样本)的语音声学特征进行检测和综合分析,并做出同一性判断的过程。声纹鉴定不仅仅是对几个音节图谱的视觉检验,而且是以听觉和视觉、定性和定量相结合的方法,充分利用声纹所携带的所有言语信息,用于司法实践,为侦查破案服务。

然而,随着法制宣传的普及,一些犯罪方法以及破案技巧被别有用心之人所了解。因此,在高智商犯罪中,犯罪嫌疑人的反侦察意识极强,对于明知可能留下声纹证据的情况下,如果犯罪嫌疑人采用了变声器或其他技术手段对声音进行处理,声纹识别技术是否还具有证据效力及可采性?

学术探讨:声纹证据存在的风险有哪些?

二、声纹识别原理

为研究声纹证据的可采信,首先需要对声纹识别的基本原理进行了解。声音是由口、喉、声道等器官运动产生的。发音器官可以分为声门下系统、喉系统和声门上系统(共鸣腔)等三部分。其中,声道形状是最重要的生理因素,而韵律、口音、发声速度等构成后天行为因素。通过对声音的研究表明:年龄、语言习惯、发音器官等的差异都会导致人的声纹各不相同,且声纹从十几岁到五十多岁基本不变。据此,构成声纹识别的基础,即可以通过分析声纹的唯一性作为识别身份的一种手段。

声纹识别是基于生理学和行为特征的说话者嗓音、语言模式的运用。根据应用环境不同,分为说话人辨识和说话人确认。前者指识别说话人是否已注册,是哪个注册人,其辨识结果要好于说话人确认;后者指识别说话人的身份与其声明是否一致,刑侦工作中更具实际价值。声纹识别系统包括声纹特征提取和声纹模式匹配,前者提取唯一表现说话人身份的有效且稳定可靠的特征;后者对训练和识别时的特征模式做相似性匹配。

学术探讨:声纹证据存在的风险有哪些?

(一) 声纹特征提取

声纹特征提取即提取声音信号中表征人的基本特征,该特征能有效地区分不同的说话人,且对同一说话人的变化保持相对稳定。考虑到特征的可量化性、训练样本的数量和声纹识别系统性能的评价问题,目前主要对较低层次的声学特征进行识别。说话人特征大体归为以下几类:基音轮廓、共振峰频率带宽及其轨迹、谱包络参数、听觉特性参数、线性预测系数。此外,还可通过对不同特征参量的组合来提高识别系统性能。特别是组合参量间相关性不大时,由于它们分别反映声音信号不同特征,因而效果更好。

(二) 声纹模式匹配

声纹研究的重点是对各种声学参数线性、非线性处理及新的模式匹配方法。这些技术大致分为:矢量量化、概率统计、动态时间规整、人工神经网络、隐马尔可夫模型。[③]

三、影响声纹证据效力的因素探究

在了解声纹识别的基本原理后,我们可以将声纹识别技术理解为把人的声音特征进行分类,然后将每类特征经过特殊的量化,从而得到每一个体独有的一组声纹参数。正如人与生俱来的指纹一样,每一枚指纹的细部特征都对应到每一个体。然而,声纹能否像指纹一样,具有个体特异性、稳定性等重要的个体识别特征,还需要对可能对声纹证据效力产生影响的各种因素进行分析。

(一)声纹的同一认定价值

作为检测主体的声纹是否具备同一认定所需要的基本特征,即反映性、稳定性和特定性。最早提出“声纹”概念的科斯塔认为人的声音终身不变。但研究表明:人的声音随年龄而变化,且生活环境的改变对口音、说话方式也有影响。这就意味着声纹的稳定性是相对的,由此引起对声纹证据科学性的争议。例如,美国空军为加强基地安全性,使用一套极其先进的声纹识别系统进行身份确认,其成功率达99%。但是,恰恰就是这剩余的1%,使得声纹证据在司法部门应用的科学性受到质疑,表现为声纹证据在法庭使用率较低。

学术探讨:声纹证据存在的风险有哪些?

如果不能保证声纹的稳定性,那么其作为证据进行同一认定的价值将大打折扣。尽管在案件发生到侦破这一较短的时间段内,嫌疑人的声音变化可以忽略不计,但是当其存在变化的可能性时,这一衡量标准就存在了瑕疵。如果随着年龄变化,生活环境的改变都可能影响人声音,那么是否存在一种可能性,也即通过技术手段,改变如声带、共鸣腔等生理结构特征来实现改变个体声音的目的。因此,对于没有意识到所留声音材料将来会作为证据存在的当事人来说,采用声纹识别可以实现同一认定的目的,但对于有计划有预谋的,反侦察意识强的罪犯来讲,通过了解声纹鉴定并进行声音的伪装,变声等手段,达到混淆视听的目的,容易使侦察出现遗漏甚至是误判,因此,在这些情况下使用该项技术是存在一定风险的。

(二)鉴定人员对认定结果的影响

任何个体识别技术的使用都离不开鉴定人员的操作,虽不像文件检验那样完全依赖于鉴定人的丰富经验和职业操守,声纹识别也收到鉴定人员各方面素质的影响。


首先,从声纹鉴定的基本方法来看,可以概括为“听、看、测”三个字。(1)“听”,就是听辨检材样本的全部语音材料,对有关方言、语音速度、言语习惯、鼻音轻重、音高、变音、变调、节奏、声源谱特性、清晰度、流畅度、口头语、赘语、虚词、言语缺陷,如口吃、大舌头等,以及是否伪装等进行辨别。另外,还要听辨语义、词汇、语法及其表达方式的异同,最后得出相似或差异程度的评价。(2)“看”,就是视谱鉴别,观察、分析检材样本的相同语音材料,如语句、语词、音节、音素等声学模式,作出相似或差异程度的定性评价。这一检验过程非常复杂。因为声纹是言语的多种声学特征图谱,所以声纹的形态也是多种多样的,有带状谱、曲线谱、线状谱和连续谱等,声纹鉴定一般至少要对8种图谱进行观察和定量检测。(3)“测”,是在听辨和视谱的基础上,对检材和样本的相同语音材料的主要声学特征参量的数据值进行统计对比,得出是否同一的定量评价。

学术探讨:声纹证据存在的风险有哪些?

从这些基本方法可以看出,进行声纹鉴定对鉴定者的专业能力有着较高的要求,目前普遍采用的人工通过语音学鉴定方法,其主要的优点就在能区分出计算机难以认知的“高级声纹特征”,比如:方言口音、习惯用语、赘语、言语缺陷、韵律特征。我们熟人间分辨一个人的语音,首先就是通过这些特征。没错,人耳才是最精密的声纹鉴定仪器。尽管很多数据指标可以进行量化对比,但从“听”这一项中对方言,语言习惯等因素的分析就完全要依赖鉴定人丰富的经验和较高的专业素养。由此就会引发证据科学所面临的共同的问题,将事实判断从法官的职责中潜移默化又转移到了鉴定人的身上。然而,鉴定人尽管在专业方面是法官所无法比拟的,但仅凭其专业能力就来处理法律问题,这对于一个没有经过系统而全面的法律培训的鉴定人来讲是存在法律风险的。

(三)当事人对声纹证据的影响

声纹证据是对人进行的个体识别,之前提到随着人的年龄增长和生活环境等因素的变化,声音会有改变,因此,当事人对于声纹证据的影响也是非常重要的。

学术探讨:声纹证据存在的风险有哪些?

科技的发展总是一柄双刃剑,既存在着推动社会进步改善人类生活的一面,又有着被不法分子所利用进行违法犯罪活动的风险。因此,在声纹识别技术不断进步为刑侦和司法审判提供着有利帮助的同时,也有可能被犯罪分子所利用。例如,在我们日常生活中很容易接触到的变声器,人们很容易从网络或其他途径得到这样的软件,虽然这些变声软件是通过改变输入音频的音色、音调,并将变声后的音频输出,虽然改变了语音的物理属性,但是并非改变了所有鉴定意义上的声学特征,依然能够识别。对于这种简单的变声的确不会影响声纹鉴定准确性,然而,如果利用对声纹鉴定原理的充分理解,而开发出能够控制声音特征量的软件,如对目标声纹进行充分的采集,收集到的特征量足以完成对其声纹特征的模拟,并利用这种模拟改造任意个体的声音,使之具有目标声音的特质,从而达到任意模拟目标个体发音的目的。如果出于某种目的进行模仿,那么实施者必然对被模仿人具有一定的了解,甚至是非常熟悉,因此,对于方言、习惯用语等特征则相对容易解决。另外,如犯罪分子通过改变声带等对声纹能够产生影响的生理特征,声纹鉴定是否还能够具有准确的鉴定价值,在电话诈骗之类声音证据是唯一破案线索的情况下,便给侦察工作造成极大的干扰,如完全依赖声纹证据则很容易造成犯罪分子逃脱搜捕,严重的可能造成栽赃嫁祸。

科技进步的日新月异带来了相关领域技术的跨越式发展,随着人工智能对人类智慧挑战的不断成功,可以预见未来社会的大量工作将由科技所主导。然而,正如“要相信科学,但不能听命于科学;人(法官)要控制科学,而不是科学控制人(法官)”,声纹证据的存在意义更多的是突破犯罪嫌疑人的心理防线,正如“神驴测谎”一样,科学证据用其“科学性”代替了“神灵”,其手段均是通过揭示犯罪嫌疑人试图隐瞒真相所做出有悖于常规的行为,达到令其难以自圆其说、自相矛盾而后漏洞百出、陷入窘境,最终心理防线崩溃认罪伏法。因此,声纹证据同其他科学证据一样,其科学性不仅仅在于其所依赖的科学原理和技术,更重要的是运用者对其依法、合理的使用,尽可能的避免人为因素带来的干扰和风险。

作者:中国政法大学证据科学研究院白国华

新闻中心