首页 > 科技 > 清华大学在读博士刘世隆:基于动态锚框的DETR优化方法:AI新青年讲座

清华大学在读博士刘世隆:基于动态锚框的DETR优化方法:AI新青年讲座

「AI新青年讲座」将邀请世界顶尖AI研究机构和大学的科研新青年,主讲他们在计算机视觉、机器学习等人工智能领域的最新重要研究成果。

AI新青年是加速人工智能前沿研究的新生力量。AI新青年的视频讲解和直播答疑,将可以帮助大家增进对人工智能前沿研究的理解,相应领域的专业知识也能够得以积累加深。同时,通过与AI新青年的直接交流,大家在AI学习和应用AI的过程中遇到的问题,也能够尽快解决。

有兴趣分享学术成果的朋友,可以与智东西公开课教研团队进行邮件([email protected])联系。

Detection Transformer 2020年在ECCV被提出,作为一种新兴的目标检测方法,DETR以其简洁而优雅的框架获得了越来越多的关注。DETR能在常用的目标检测数据集上取得比Faster RCNN更好的性能,然而收敛速度却显著慢于基于CNN的检测器。

为了解决这个问题,后续有许多工作试图改进DETR,来实现更快的训练收敛和更好的性能。尽管取得了很多的成果,但query在DETR中的作用仍未被完全理解。

清华大学在读博士刘世隆等人研究了Transformer的解码器部分,认为解码器的交叉注意力模块是导致收敛缓慢的原因,并提出了一种新颖的解码器设计,即使用动态锚框建模query实现模型优化的方法,同时也对query的作用有了更深入的理解。DAB-DETR使用锚框的大小来调节交叉注意力,为池化特征提供更好的位置先验,加速DETR的训练收敛。

结果表明,在COCO对象检测基准的相同设置下,DAB-DETR在类似DETR模型中取得了当前最好的结果,当使用ResNet50作为骨干时,DAB-DETR在50 epoch结果达到48.7AP。

8月10日晚上7点,「AI新青年讲座」第144讲邀请到清华大学在读博士刘世隆参与,主讲《基于动态锚框的DETR优化方法》

讲 者

刘世隆,清华大学在读博士,粤港澳大湾区数字经济研究院(IDEA)实习生,研究兴趣为计算机视觉,尤其关注目标检测、多模态理解等工作,目前在ICLR,CVPR等会议发表多篇工作。

主 题

基于动态锚框的DETR优化方法

提 纲

1、Transformer目标检测(DETR)模型优化的研究

2、针对Transformer解码器的设计方法

3、利用动态锚框设计解码器实现DETR优化DAB-DETR

4、以ResNet50为骨干的DAB-DETR有效性验证

直播信息

直播时间:8月10日19:00

直播地点:智东西公开课知识店铺

成 果

DAB-DETR:《DAB-DETR: Dynamic Anchor Boxes are Better Queries for DETR》

论文链接:https://arxiv.org/pdf/2201.12329.pdf

开源代码:https://github.com/IDEA-opensource/DAB-DETR

本文来自网络,不代表趣头条立场,转载请注明出处:https://www.ngnnn.com/article/4_72435.html
上一篇马斯克最新21问!首次回应特斯拉接班人计划
下一篇仅售7999元!锐龙7 6800HS把轻薄本性能拉满了

为您推荐

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

盖茨盛赞ChatGPT:人工智能历史意义不亚于“PC或互联网诞生”

腾讯科技讯 2月3日消息,微软联合创始人比尔·盖茨表示,像ChatGPT这样的AI聊天机器人将变得与个人电脑或互联网同样重要。盖茨今日接受采访时表示:“AI将成为2023年最热门的话题。这是不可避免的。”他随后补充道:“ChatGPT将变得与个人电脑、互联网同样重要。”盖茨在20世纪80年代帮助开创了个人电脑时代。在微软和苹果等
专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

专访墨奇科技CEO邰骋:人工智能需要新的AI数据基础设施

“人工智能要发展到下一代,必然需要基础理论和基础设施的革新,特别是需要新的 AI 数据基础设施。”9月2日,新京报贝壳财经记者获悉,在近日举办的HICOOL2022全球创业者峰会上,AI(人工智能)基础技术和平台墨奇科技的项目团队获得“HICOOL 2022 全球创业大赛一等奖”。墨奇科技联合创始人、CEO 邰骋接受了新京报贝壳财
人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

人工智能大会将举办智慧体育高峰论坛,发布AI+体育蓝皮书

2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。  主办方供图AI+体育,将成为世界人工智能大会的全新命题和新亮点。2022年世界人工智能大会智慧体育高峰论坛将于9月2日开幕。论坛上将发布由上海人工智能研究院牵头,联合上海交通大学、上海体育学院、首都体育学院、同济大学等单位编制的国内首本《“AI+体育”蓝
大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

大脑还有多少秘密?世界人工智能大会首开脑机接口主题论坛

在2022世界人工智能大会上,天桥脑科学研究院(简称TCCI)转化中心联合中国科学院上海微系统与信息技术研究所、脑虎科技、中国神经科学学会、上海市神经科学学会共同举办“脑·机智能融合-让大脑连接未来”论坛,这也是脑机接口首次以主题论坛的形式登陆世界人工智能大会。英国皇家工程院院士、上海交大医疗机器人研究院院
我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

我国人工智能学科主要奠基人涂序彦逝世,享年 88 岁

IT之家 3 月 28 日消息,据北京科技大学消息,我国人工智能领域著名科学家、人工智能学科的主要奠基人、中国人工智能学会的主要创始人之一、第二和第三届中国人工智能学会理事长、北京科技大学计算机与通信工程学院教授涂序彦先生,因病医治无效,于 2023 年 1 月 1 日 0 时 10 分在北京逝世,享年 88 岁。IT之家附讣告原文
梁建章:人工智能如何影响经济和各行各业

梁建章:人工智能如何影响经济和各行各业

近日人工智能再次成为了热门话题。很多人好奇的是,人工智能未来到底会如何影响经济、人口和创新?今天,我跟大家分享个人的一些看法——谈谈人工智能对于经济以及各行各业的影响。自从深度神经网络出现以来,人工智能的发展速度超乎想象。ChatGPT的出现是个奇迹,超出了几乎所有计算机科学家的预料。一个简单的神经网络模
AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

AI炒股新纪元?头部量化私募幻方宣布全力探索人工智能应用

头部量化私募幻方宣布成立新的独立的研究组织,探索AGI(即通用人工智能,Artificial General Intelligence)的本质。4月14日,幻方发布公告显示,幻方将集中资源和力量,全力投身到服务于全人类共同利益的人工智能之中,成立新的独立的研究组织,探索AGI的本质,“我们将充分而持续地投入,不做中庸的事,用最长期的眼光去
卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

卷完模型卷芯片!为提升效率,微软准备推出专属人工智能芯片

在早期成功押注ChatGPT的研发公司OpenAI之后,市场发现,微软在其武器库中还拥有另一个秘密武器:自研人工智能芯片,这一芯片将为生成式AI背后的大型语言模型提供强大动力。4月18日周二,据媒体援引两位知情人士的话说,微软早在2019年就开始开发内部代号为Athena的AI芯片。其中一位知情人士称,一些微软和OpenAI的员工已经
真正的应用级量子人工智能距离我们还有多远?

真正的应用级量子人工智能距离我们还有多远?

·“量子科技是强国竞争的战略制高点,但不能一哄而上,低水平重复内卷,或片面追求发论文、抢专利,各自为战,闭门造车,而缺少真正的技术投入和系统配合。”·“当下量子系统的规模非常重要,而这很大程度上取决于芯片。”当前,发展量子计算和人工智能已成为世界各国的重要战略,两者交汇而生的量子人工智能更是发展迅速
返回顶部