Cookies与隐私

大学使用本网站上的cookies提供最佳体验,包括在本网站、其他网站和社交媒体上提供个性化内容。通过继续使用本网站,您同意这一点,或者您可以访问我们的饼干的政策了解更多信息并管理您的设置。

数字音频处理

数字音频处理小组是一个多学科研究小组,工作领域包括音乐信息学、数字信号处理(DSP)和计算音乐学。

通过与行业合作以及与其他机构合作,我们获得了丰富的知识,因此我们处于从事尖端研究工作的理想位置。作为一名长期与创意公司合作的教师,我们使用创新的计算技术开发出一系列可供前瞻性企业使用的输出。

该集团位于伯明翰千禧角,是一个充满活力的音频技术研究中心。与伯明翰音乐学院的数字图像和视频处理研究团队以及音乐和表演中心有着密切的联系,该小组的所有研究都集中在使用一系列科学和数学技术,并强烈强调DSP。我们为希望攻读哲学硕士和博士学位的学生提供更多的机会。

当前的项目

低延迟高分辨率音频处理

本研究的重点是最小化和量化现场音乐处理系统链中的音频处理延迟,包括低延迟Sigma Delta ADC/DAC架构、低延迟多通道实时音频系统架构、低延迟音频处理DSP算法和基于样本的处理。

低延迟未来网络

这项研究是与杰里·福斯和约翰·格兰特合作完成的。研究重点是低延迟多通道多速率音频网络,包括一种新的二层媒体访问控制(MAC)体系结构,以确保时间确定的交互式音频/视频信号的传输。本研究还探讨了新的音频路由/交换架构和基于FPGA的原型。

感知模型在自动音乐混音中的应用

近年来,音乐信号处理领域的研究人员转向开发智能混音工具,自动完成基本的混音过程。本研究旨在开发一种基于计算听觉模型的新型音频系统,以应用于多声道音乐音频的混合。有了现成的复杂的听觉模型,我们就有机会利用它们来通知处理链,让其执行受掩蔽和响度感知影响很大的操作,如水平平衡、均衡和动态压缩。

表达性音乐表演的概率模型

利用隐马尔可夫模型(HMMs)和贝叶斯网络开发了音乐表演中模拟表达式的系统。这些系统使用人类表演数据进行训练,以合成具有真实发音模式的音乐序列。在这个项目中,我们开发了基于daws的仿真器,可以模拟专业鼓手,也可以模拟流行音乐歌手的歌声合成器。

音乐表演中的声学变异

这项研究探索了不同演奏者之间的差异,在那里他们的身体影响乐器演奏的声音。项目最初源于传统民间长笛演奏者的演奏,分析不同的个人演奏风格。音色,旋律变化和装饰的检测,以帮助理解和学习真正的民间音乐风格的过程。该项目还集中研究同一类型乐器之间的声学差异,以便向音乐家和乐器制造商提供信息。

智能音乐制作

在音乐制作中,有大量复杂的过程,如果没有多年的实践和经验,很难有效地使用。因此,让更广泛的受众更容易接触到这些过程,从而弥合音乐家和技术之间的差距是非常有用的。要做到这一点,我们认为可以使用语义术语来控制低级音乐生产参数的方式。我们使用许多技术来解决这个问题,包括自然语言处理算法、无监督机器学习和自适应音频处理。

学术人员

教授Cham Athwal-学校副校长(研究)
Cham是DMT学院的数字技术教授和研究主管。主要研究方向为三维建模,图像处理,视频处理,数字信号处理,网络技术与仿真。目前,Cham正在指导8个博士/哲学硕士项目,涵盖一系列主题,包括数字音频处理、数字图像处理和虚拟环境。电子邮件:cham.athwal@bcu.ac.uk电话:+44 (0)121 331 5458


Ryan博士马厩

Ryan是音频工程和声学的讲师,也是声音技术的学科带头人。他的研究兴趣广泛,从机器听力、音乐信息检索到音响化和人性化。他目前参与撰写拨款申请,并指导音乐语义学和信息源分离领域的博士生。电子邮件:瑞安。stables@bcu.ac.uk


Islah Ali-MacLachlan
Islah是DMT学院音响技术的高级讲师和学科带头人。他的研究领域是音乐声学、演奏者变异和传统音乐。电子邮件:islah.ali-maclachlan@bcu.ac.uk电话:+44 (0)121 331 7435


永好王
永浩是数字媒体技术学院的高级讲师。他最近的研究重点是低延迟高分辨率音频处理,sigma delta ADC/DAC,以及与John Grant和Jerry Foss合作的低延迟未来网络。电子邮件:yonghao.wang@bcu.ac.uk


杰森Hockman

杰森Hockman博士
贾森是一名音频工程讲师,对音乐信息检索和计算音乐学领域感兴趣。他进行了各种主题的研究,包括节拍和节拍分析,节奏描述,音频效果,和人机交互。他目前的研究与英国电子音乐和文化的自动化分析有关,包括流派的硬核,丛林,鼓和贝斯。电子邮件:杰森。hockman@bcu.ac.uk


研究学生

马修柴郡

马修正在攻读音乐语义学领域的博士学位。他目前正在开发一个系统,该系统将分析大量音乐制作数据,以便为数字音频效果提供高级控制。电邮:matthew.cheshire@mail.bcu.ac.uk

Xueyang王

学扬目前在信息源分离领域工作。她正在使用来自音乐信息检索(MIR)的技术来提高算法的准确性,如应用于音乐信号的非负矩阵分解(NMF)。电子邮件:xueyang.wang@mail.bcu.ac.uk

卡尔索思豪尔

卡尔是一名在音乐信息检索领域工作的博士生。他的主要兴趣领域是使用机器学习来改进自动音乐转录和自动音乐生成的任务。电子邮件:carl.southall@bcu.ac.uk

尼古拉斯·吉林斯

Nick是DMT实验室的全职博士生,研究智能音乐制作。他拥有伯明翰城市大学的声音工程和制作学士学位,以及伦敦大学玛丽女王学院的数字信号处理硕士学位。亚博电竞im娱乐他的博士研究重点是简化混合过程。这包括构建智能工具,利用语义描述符来支持自动混合技术,如自动跟踪分组或效果推荐。与此同时,正在开发新的数据收集软件,包括网络驱动的生产套件,以收集大量的生产数据,进一步了解混合过程。他还参与了伯明翰实时项目,以及与玛丽女王合作开发的Web音频评估工具箱的首席开发人员。

Maciek Tomczak

Maciek正在攻读音乐信息学博士学位,他的研究重点是利用机器学习技术进行节奏分析。

Spyridon淤滞

Spyros是一名研究语义均衡领域的博士生,研究音色形容词与声音工程师和音乐制作人的操作行动之间的关系。他使用的技术包括机器学习应用程序,特别是神经网络,用于数据分析目的,并为简化音频效果接口提供基础。

博士学位机会

我们有许多新兴的研究领域,包括但不限于:

  • 音乐感知的贝叶斯模型
  • 稀疏信号表示
  • 综合信号处理
  • 高级音乐语义
  • 音乐结构的象征表现
  • 基于情绪的音乐相似性
  • 大型数据集的可扩展算法
  • 音乐表达的新接口
  • 自适应信号处理
  • 语音演唱综合
  • 民间音乐分析
  • 机听
  • 算法合成
  • 自动音乐转录
  • 听觉知觉
  • 低延迟音频处理

想了解更多关于这些主题的信息或与我们一起学习,请联系我们教授Cham Athwal

最近的出版物

M. Köküer, P. Jančovič, I. A. MacLachlan, C. Athwal,(2014)“爱尔兰传统长笛演奏中单音和多音装饰音的自动检测”,第15届国际音乐信息检索大会(ISMIR),台湾台北,2014年10月27日至31日。

M.KöKüer,I.A.MacLachlan,P.Jančovič,C.Athwal,(2014)“爱尔兰传统长笛演奏中单音符装饰物的自动检测,”第四届国际民间音乐分析研讨会2014年6月6-7日,土耳其伊斯坦布尔。

Isacco Arnaldi,Wang Yonghao,“用于高分辨率音频转换的Sigma-Delta调制器的SIMULINK工具箱”,将出现在2014年洛杉矶第137届AES大会上。

Nicholas Jillings,王永浩,“CUDA加速音频数字信号处理的实时算法”,出现在第137届AES会议洛杉矶,2014。

Stables,R.,Enderby,S.,De Man,B.,Fazekas,G.,Reiss,J.《安全:提取和检索语义音频描述符的系统》。第15届国际音乐信息检索学会会议(ISMIR-2014),台湾台北,2014年。

stabables, R., Endo, S., Wing, a .使用多元马尔可夫模型的多玩家微计时人性化。17 Int。数字音频效果会议(DAFx-14),德国,2014。基于听觉反馈的红外光谱分化干细胞分类。20 Int。计算机科学与技术,2014,29(4):514 - 514。

R. stable,“使用制作人定义的描述符的语义音乐制作”,音频工程学会第53届语义音频会议,伦敦,2014。

Hockman, J.A. 2014。一个民族志和技术研究的breakbeats在硬核,丛林,鼓和贝斯。麦吉尔大学博士论文。

D. Ward, C. Athwal, M. Köküer,“一种有效的时变响度模型”,信号处理在音频和声学中的应用IEEE研讨会(WASPAA),美国纽约,2013年10月20-23日。

I.A.MacLachlan,M.KöKüer,P.Jančovič,I.Williams,C.Athwal,“量化传统爱尔兰长笛演奏中的音色变化”,第三届民间音乐分析国际研讨会,荷兰阿姆斯特丹,2013年6月6日至7日。

杨志强,“数字软裁剪算法的谐波不稳定性研究”,计算机科学与技术,2012年9月。

王勇,“用于高分辨率sigma delta模拟数字转换的抽取滤波器结构的时域性能”,第132届AES会议,匈牙利首都,2012年4月26-29日。

王颖,朱旭东,傅强,“一种低延迟多通道音频处理评估平台”,第132届AES会议,匈牙利布达佩斯,2012年4月26-29日。

Stables,R.Bullock,J.和Athwal,C.,“歌唱声音合成中的基频调制”,《计算机科学》课堂讲稿,Springer,2012年3月。

胡克曼和富永。2012。丛林中的一个:重拍探测硬核,丛林,鼓和贝斯。《国际音乐信息检索会议论文集》,葡萄牙波尔图,169-74。

Stables, R., Kokuer, M., Athwal, C.,《歌唱声音合成自然度的客观评价》。UKSpeech,英国伯明翰。2012.

Stables, R。Athwal, c。和Cade, R。“使用递归贝叶斯框架的打击乐人性化”。第133届音频工程学会大会,旧金山,美国。2012

Ward D, Athwal C和Reiss J,“使用响度和部分响度模型的多音轨混音”,音频工程学会(AES)第133届会议,旧金山,2012

Wang, J. Grant, and J. Foss,“Flexilink:用于多通道实时音频的统一低延迟网络架构”,将在2012年旧金山第133届AES会议上发表。

Trutzschler von Falkenstein J&Baracskai Z,“超级准直器音频单元的图形用户界面”,国际计算机音乐会议(ICMC-2011),哈德斯菲尔德,2011年7月

Hockman, j.a., D.M. Weigl, C. Guastavino, and I. Fujinaga. 2011。区分留声机播放系统。《美国纽约音响工程学会第131届公约》论文集。

stabers, R., Bullock, J.和Athwal, C.。“唱歌中f0漂移建模的随机过程的人性化”,FRSM/CMMR, Bhubaneswar,印度,2011。

Wang,Y.,工程简介:“音频Sigma-Delta模拟到数字和数字到模拟转换的延迟测量”,第131届AES大会,美国纽约,2011年10月20-23日。Stables,R.,Bullock,J.和Williams,I.“合成鼓模式中发音的感知相关模型”,第131届音频工程学会大会,美国纽约,2011年

stabers, R., Bullock, J.和Athwal, C.。“歌唱声音合成中音高漂移的人性化模型”,国际计算机音乐会议(ICMC 2011),英国哈德斯菲尔德。2011

Baracskai Z.,“算法构成的新趋势”,第七Int。计算机协会。“社会中的音乐”,萨拉热窝,2010年10月发表在《音乐》杂志上

Baracskai Z.和Stables,R.,“数字次谐波失真算法”,音频工程学会(AES)第128届大会,伦敦,2010年5月

Hockman J.A.和I. Fujinaga. 2010。快与慢:从用户数据中学习节奏的八度。国际音乐信息检索会议论文集,荷兰乌得勒支。231-6。

McKay, C., J.A. Burgoyne, J.A. Hockman, J. Smith, G. Vigliensoni, and I. Fujinaga. 2010。评价相对于声音、象征和文化特征的抒情特征的表现。《音乐信息检索国际会议论文集》,荷兰乌得勒支。213-8。

李志,向强,杨军,易永义,富永义。2010。治疗性步态训练的音乐搜索引擎。在ACM多媒体学报2010,佛罗伦萨,意大利。

Wang, Y., Stables, R. and Reiss, J.。“带板载声卡的桌面操作系统的音频延迟测量”第128届音频工程学会会议,伦敦,英国。2010.

Baracskai,Z.和Stables,R.“数字次谐波失真算法”,第128届音频工程学会大会,英国伦敦。2010

Baracskai Z.,“The Max for Live platform”,数字音乐研究网络,玛丽女王伦敦,2009年12月

“互动系统的展示”,表演技术研讨会,台北,2009年5月。

Hockman, j.a., M.M. Wanderley和I. Fujinaga, 2009。相位声码器操纵跑步者的步速。摘自《NIME会议论文集》,美国匹兹堡,90-3。