首页 > 科技 > “声纹识别”中文课上线:从理论到编程实战,谷歌声纹团队负责人主讲

“声纹识别”中文课上线:从理论到编程实战,谷歌声纹团队负责人主讲

对任意一个领域的学习,如果有人可以指导你完成从基本概念、实践方法到系统认知的构建,你的职业发展将事半功倍。

声纹识别领域,现在就有这样一门课程刚刚上线。

什么是声纹识别?

声纹识别(Speaker Recognition)是一门位于音频信号处理、生物信息学以及 AI 等领域交汇点的交叉学科。声纹识别技术既是声纹技术中最为核心的一项,也是生物特征识别技术的一种,该技术利用算法和神经网络模型,让机器从人们的语音信号中识别出说话人的身份信息。而随着 2014 年以来深度学习(DL)技术的发展,声纹识别技术进入全新阶段。

如何在深度学习时代系统深入的学习声纹识别技术与不断更新自己的知识储备,对领域的初学者提出了全新的要求。谷歌声纹识别与语种识别团队负责人王泉博士的最新课程《声纹识别:从理论到编程实战》可以带你完成知识体系的构建。

必要的课前准备

课程视频总时长超过 12 小时,并配有大量课后练习,包括课后测验、编程练习与大作业。所以首先希望大家可以规划好学习时间,安排一段较紧凑的学习计划完成课程学习。

其次,这门课是技术性很强的专业课程,对标大学本科高年级研讨课与研究生课程,并非科普视频,所以在学习过程中需要随时停下查阅资料、推导公式与消化思考,也欢迎大家在课程中提问。

最后,学习课程需要较基础的大学数学知识与一定的Python编程基础,因为课程采用「中文授课、英文课件」,所以还需要一点英文基础。

谁适合学习?

学生与科研人员:熟悉领域全貌,为毕业论文与科研方向提供参考。

企业从业人员:完善知识与实践体系,了解学术界的前沿进展,保持职场竞争力。

任何对声纹领域充满兴趣与热情的人:建立声纹领域包括学术与产业界的系统认识,扩展知识面,辅助相关决策。

课程讲授哪些内容?

课程将从声学、感知基础知识以及音频、信号处理等开始介绍,深入理解声纹的本质。所以,即使是没有任何语音方面基础和背景的同学,也可以轻松上手这门课程。

课程会涵盖从上世纪 60 年代一直到 2022 年出现的所有主流声纹识别技术,让大家既可以对整个声纹技术的发展史有一个全面的认知,又能熟悉学术界和工业界最前沿、最先进的技术,保持自己的知识储备领先于其他从业人员。

同时,本课程将着重介绍基于深度学习的声纹识别系统,包括卷积神经网络、循环神经网络、注意力机制、Transformer 等常用于声纹识别的神经网络结构,并对主流的深度学习声纹识别系统进行归纳总结,横向对比各种推理方法和损失函数之间的优劣,帮助大家理解所有系统的底层设计思路。

此外,课程还将讲解数据清洗、数据增强和数据融合等数据处理相关技术。

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_97320.html
上一篇年度第三大满月+流星雨 今晚星空有约!
下一篇机器人赛道风起|国产替代加速,龙头埃斯顿能否乘风而上?

为您推荐

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

谷歌推出文本到图像模型Muse:生成图片质量更高、推理时间更短

作者 | 冬梅自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)的诞生,人工智能研究的进展发生了革命性的变化。近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。我们提
陶哲轩等人用编程方法,推翻了60年几何难题“周期性平铺猜想”

陶哲轩等人用编程方法,推翻了60年几何难题“周期性平铺猜想”

机器之心报道机器之心编辑部数学家们曾预测,如果对形状如何平铺空间施加足够的限制,他们可能必然出现周期性模式,但事实证明不是这样。几何学中,最难攻克的问题往往是一些最古老、最简单的问题。自古以来,艺术家和几何学家们就想知道几何形状如何在没有间隙或重叠的情况下铺满整个平面。然而用罗切斯特大学数学家 Alex
谷歌街景独立 App 将于 2023 年停止运营

谷歌街景独立 App 将于 2023 年停止运营

IT之家 11 月 2 日消息,安卓和 iOS 版谷歌街景 App 将于明年初停止运营,并将在未来几周从应用商店中删除。一位 Google 发言人证实,该应用将从 2023 年 3 月起停用。这是安卓和 iPhone 上的专用街景应用程序,允许用户使用谷歌公司的服务来获得世界各地的 360 度视图。需要注意的是,该功能不会从标准的谷歌地图应用中删
苹果谷歌牵头制定追踪行业规范草案 防止功能遭滥用

苹果谷歌牵头制定追踪行业规范草案 防止功能遭滥用

【CNMO新闻】在2021年的春季发布会上,苹果推出了蓝牙追踪设备AirTag,该产品配合苹果设备的“查找”应用,可以追踪和查找重要物品。然而,也有用户发现这类设备可能会遭到滥用,例如将其放在他人不知情的地方,可以对个人进行跟踪。AirTag为了杜绝此类现象,苹果与谷歌宣布联合提交一份行业规范草案,帮助应对蓝牙定位追踪
劈柴哥预告Bard将迎重磅升级,谷歌“最强大脑”能否超车ChatGPT?

劈柴哥预告Bard将迎重磅升级,谷歌“最强大脑”能否超车ChatGPT?

财联社4月2日讯(编辑 赵昊)上周,美国科技巨头谷歌公司推出了聊天机器人“巴德”(Bard)的测试版本。由于用户使用体验远不如ChatGPT,Bard反响平平。当地时间周五(3月31日),谷歌首席执行官"劈柴哥"桑达尔·皮查伊(Sundar Pichai)在播客节目中表示,这种状况可能很快就会改变,因为Bard将在未来几天从目前基于的LaM
科技巨头欧洲裁员不易,谷歌亚马逊设法“吸引”员工离职

科技巨头欧洲裁员不易,谷歌亚马逊设法“吸引”员工离职

勒紧裤腰带“过冬”的美国科技巨头现在碰到新的难题,想在欧洲搞大裁员谈何容易,特别是要在国内劳动法对员工保护力度位居欧盟成员国前列的法国和德国,更是难上加难。在美国,企业宣布大裁员后就能在几个月内解雇数百甚至数千名员工,许多公司已经这样做。而在欧洲,媒体发现,科技企业的大裁员已经停滞,因为在一些欧洲国
谷歌Stadia发布新试玩系统:玩家解锁特定成就完成试玩

谷歌Stadia发布新试玩系统:玩家解锁特定成就完成试玩

【CNMO新闻】游戏试玩我们都曾有所接触,在过去游戏试玩版本通常是开发者在游戏上市之前发布的一个涵盖游戏部分内容的封包进行上传后,有意试玩的玩家进行下载测试,这样的方式已经延续了很久,其弊端就是玩家需要在游戏正式发布后在单独下载新的游戏包体,增加了重复下载的困扰。也有一些开发者选择游戏整包作为测试版本上
史上AI最高分!谷歌大模型创美国医师执照试题新纪录

史上AI最高分!谷歌大模型创美国医师执照试题新纪录

杨净 羿阁 发自 凹非寺量子位 | 公众号 QbitAI史上AI最高分,谷歌新模型刚刚通过美国医师执照试题验证!而且在科学常识、理解、检索和推理能力等任务中,直接与人类医生水平相匹敌。在一些临床问答表现中,最高超原SOTA模型17%以上。此进展一出,瞬间引爆学界热议,不少业内人士感叹:终于,它来了。广大网友在看完Med-PaL
谷歌计划打造全新搜索引擎应对必应等竞争 推AI功能升级现有引擎

谷歌计划打造全新搜索引擎应对必应等竞争 推AI功能升级现有引擎

【美媒:谷歌计划打造全新搜索引擎应对必应等竞争 将推出AI功能升级现有引擎】财联社4月17日电,据纽约时报消息,新必应等AI竞争者正成为25年来谷歌搜索业务的“最严重威胁”,作为回应,谷歌据悉正寻求打造一款由AI技术驱动的全新搜索引擎。查阅的内部文件显示,谷歌还在用AI功能升级现有引擎。据悉,谷歌正测试项目名为“
消息称谷歌正测试一款类似ChatGPT的聊天机器人

消息称谷歌正测试一款类似ChatGPT的聊天机器人

鞭牛士 2月2日消息,据外媒报道,据知情人士表示,谷歌正在测试新的人工智能驱动的聊天产品,可能会影响未来公共产品的发布。这些产品包括一个新的聊天机器人,以及一种将其整合到搜索引擎的潜在方式。
负责人离职,谷歌AR似乎是要复刻Android模式

负责人离职,谷歌AR似乎是要复刻Android模式

2022年年末ChatGPT的横空出世,让人工智能再次踏上了风口浪尖,甚至一众科技巨头也纷纷为之“倾倒”,仿佛错过它就错失了通往未来的船票。特别是在微软方面将ChatGPT与Bing搜索引擎结合、以挑战谷歌搜索之时,谷歌很快就成为了这些巨头中反应最激烈的一个,但与ChatGPT针锋相对的产品Bard,出道即遭遇了翻车。然而强如谷歌
返回顶部