【异常声采集】“救命啊,着火啦,抢劫啊….”

mic
mic
mic
123
文章
0
评论
2020年9月1日08:18:06 评论 15

【异常声采集】“救命啊,着火啦,抢劫啊....”

共8个词 八个地区口音 共计1000人  
  • 前期请务必认真、再认真熟悉规则要求,减少后期执行采集的误采,造成双方时间和资源的浪费!内容较细,请耐心研读...

  • 辛苦各位即使调整问题,如有疑问那一定是你没有好好看文档!再好好看一遍

【异常声采集】“救命啊,着火啦,抢劫啊....”
一、采集体量
采集总量:1000人
8个关键词录音:救命报警抢劫快跑杀人抓小偷着火
截止时间:2020年9月24日
8个地区口音:四川、贵州、广东、广西、福建、江苏、江西、浙江、
 
每个在录制前需要先用带口音的普通话把我们指定的文字念一遍,
文字会不定期随机更换。
 
一个人读10遍,
5遍大声呼喊(其中要包含1遍快语速),
5遍正常呼喊(其中要包含1遍快语速)
二、采集要求
1、采集场景要求

【异常声采集】“救命啊,着火啦,抢劫啊....”

2、采集人语种、口音要求、人数要求

【异常声采集】“救命啊,着火啦,抢劫啊....”

3、采集人性别、年龄要求
     男女比例1:1

【异常声采集】“救命啊,着火啦,抢劫啊....”

4.采集设备及布置方案

 

设备:高保真录音笔

室内:高度与speaker嘴巴的高度持平即可,speaker与录音笔的距离保持2米即可,speaker发出的声音传播方向与录音设备连线的夹角分别是45度,90度,135度,180度各录一遍8个词

 

室外:高度2.5-3米固定,speaker需要在距离设备1、2、3、4、5米的距离各录一遍8个词,角度随机变化即可,最终室外数据各角度平均分布即可。

 

5.语料(关键词)

救命,报警,抢劫,快跑,杀人,抓小偷,着火,啊。总共8个词

其中最后一个“啊”是尖叫,在紧急、恐惧的情境中尖叫。

每个词之间的间隔3s

6.音频格式

WAV,单声道,采样率16000Hz

7.存储和命名

存储时按照人进行存储,

【文件夹命名规则】:

姓名_性别_年龄_语种,文件夹下直接是WAV音频文件。

 

【音频文件命名格式】:

采集日期(8位)_姓名_性别_年龄_语种_采集地点(室内/室外_具体地点)_距离(数字中不能带小数点)_角度(用汉字“度”)_喊叫类型(大声/正常)_语速(快/正常)_语调(低/高)

例:20200817_张三_女_18_贵州话_室外_路边_4m_30度_正常呼喊_正常语速_低音调.wav

注意:文件名称中不能有空格、特殊数据符号

 

 

本项目项目经理:琚岁潮

微信号:jusuichao

【异常声采集】“救命啊,着火啦,抢劫啊....”

识别二维码,添加项目经理

更多项目问题请咨询本项目项目经理

【异常声采集】“救命啊,着火啦,抢劫啊....”

【猫狗采集】人和猫,人和狗数据采集 智天下

【猫狗采集】人和猫,人和狗数据采集

    前期请务必认真、再认真的熟悉规则和要求,减少后期执行采集的误采,造成双方时间和资源的浪费!内容较细,请耐心研读... 辛苦各位即使调整问题,如有疑问那一定是你没有好好看文档...
什么是数据采集、数据的采集有哪些? 智天下

什么是数据采集、数据的采集有哪些?

中国的人工智能会面临着前所未有的发展机遇,她也将会以真正解决人类钢需载入史册,我们也期待着在天津跟在座的各位合作伙伴共同努力,真正的用人工智能建设美好世界。 一、 什么是数据采集 确立一个算法模型需要...
【人脸识别】10万高清人脸采集-需求解读 智天下

【人脸识别】10万高清人脸采集-需求解读

能够识别或验证图像或视频中的主体的身份的技术   前期请务必认真、再认真的熟悉规则和要求,减少后期执行采集的误采,造成双方时间和资源的浪费!内容较细,请耐心研读... 辛苦各位即使调整问题,如有疑问那...
【口罩采集】丨 从遮挡中深化识别人脸! 智天下

【口罩采集】丨 从遮挡中深化识别人脸!

“戴口罩的人脸识别确实是趋势, 因为现在摘口罩去做识别,确实是一个危险的事情”。   为什么机场、火车站手持红外测温枪的人越来越少,更多的人坐在桌子后面?为什么过安检的时候非要摘一次口罩增加...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: