更新时间:2023-07-29 17:00
音频指纹技术(Audio fingerprinting technology)是指通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来,用于识别海量的声音样本或跟踪定位样本在数据库中的位置。音频指纹作为内容自动识别技术的的核心算法,已广泛应用于音乐识别,版权内容监播,内容库去重和电视第二屏互动等领域。
音频指纹技术通过提取声音中的数据特征将需要被识别的内容与建立的音频指纹数据库进行比对完成的。识别过程不受音频本身的储存格式,编码方式,码率和压缩技术影响。音频指纹的匹配是高度精确的匹配,不依赖于文件meta信息,加水印和文件哈希值。
音频指纹技术最早应用于听歌识曲功能。当用户听到一段喜爱的旋律却不知道歌名的情况下,用户只需用手机录一段听到的歌曲片段,即可通过音频指纹检索的方式获知到歌曲的名称。基于音频指纹技术,全球著名歌曲识别应用有Shazam, Musixmatch,Soundhound等。其中Musixmatch作为全球最大的在线歌词库服务,不仅识别出歌手,歌名,还可以将歌曲播放当前进度的歌词实时展示给用户。 国内音乐服务和社交软件中,微信,QQ音乐,小米音乐,多米,酷狗,酷我也都将听歌识曲作为应用的重要组成部分。伴随智能汽车的火热,作为驾驶娱乐系统的重要组成部分,音乐识别歌曲成为新一代智能汽车的标配,如特斯拉,宝马,福特等高端汽车品牌都已提供听歌识曲的功能。
手机APP通过运用音频指纹技术的识别,仅需几秒钟的录音即可识别当前播放的频道和节目进度,从而方便应用开发者制作出与节目相关的互动和应用。国外社交,追剧,和电影衍生品应用比如Facebook,Shazam, Viggle, Thetake等均加入了电视识别的功能。国内微信摇电视,手机淘宝首页摇一摇,扫购神器,剧淘,扫购神器,悦赢等应用也均通过音频识别的方式提供电视互动和边看边买的T2O服务。
音频指纹技术可监测电台,电视台中使用的内容的播放时间,播放次数和播放时长。广泛的被音乐版权公司和广告商投放商应用于监测广告和音乐在媒体中播放的数据。如:歌手如果需要开演唱会,可通过全国电台电视台的监测数据,获知哪些电台和电视台在最近有播过他的哪些歌曲,进而确定演唱会的地点和歌曲。广告商投放者和代理商可通过音频指纹技术的监测来获知电视台电台是否在规定的时间播放其投放的广告,播放时长是否符合要求。同时也可以通过监测获知竞品的广告投放信息。
通过音频指纹的识别,可获知数字媒体文件中是否含有相同的内容。全球知名网站Youtube和Facebook都是通过音频指纹技术建立的Content ID系统将受版权保护的内容指纹与用户新上传的内容进行匹配,可快速检索是否含有侵权内容。广电媒资系统可通过音频指纹的匹配获知媒体库中哪些内容是重复和关联的。
基于音频指纹的收视调查已经作为电视收视率调研的一种新的方式应用于一些国家。美国公司Symphony和蒙古公司MIT通过基于音频指纹技术的sdk预制到手机应用中,通过手机的录音功能获知用户看电视的收视习惯。很多机顶盒和智能电视服务商如三星,LG和Vizio也将此技术预置于系统中,收集用户的收视习惯和广告推荐。
除一些公司如baidu,Facebook,Google,Shazam等使用自主研发的音频指纹技术外,大多数公司均采用第三方的技术服务如:
ACRCloud (音乐识别,广告识别,电视第二屏互动,收视调研)
Audiblemagic (文件识别,版权保护)
Gracenote (车载,音乐识别,电视识别)