青年科学家系列报道之研究开源图自动机器学习库

来源:电脑报
关键字:科研,成就,科学家
发布时间:2024-06-14 10:52

　　■ 明月

　　科研成就

　　王鑫提出了多媒体机器学习理论方法，致力于多媒体表征建模研究，从解耦表征与自动机器学习出发，提出多媒体表征建模理论方法，大幅提升了表征模型的泛化能力。

　　从实际应用价值上来说，能够实现单个模型的泛化使用能力的提升，例如用一个模型实现金融、网络安全、财务等实际领域的监测。

　　人物小传

　　人工智能大模型会击败人类么？王鑫的答案是否。

　　王鑫认为大模型能否击败人类这个问题，跟深度学习能否击败人类这个问题本质上是一样的。不可否认，大模型将来会在很多任务，尤其是自然语言相关的问答任务上输出比人类更准确的答案，然而就目前大语言模型的架构而言，它仍然属于一个“序列”到“序列”的预测模型，不可避免“黑箱”学习的这一问题，这跟当初深度学习网络Alexnet、Googlenet、Resnet 等模型一样，虽然在图像分类等领域能够比肩甚至超越人类，但仍然无法真正替代人类。

　　儿时的王鑫，希望自己成为像钱学森一样的大科学家，能为国家扛起脊梁。长大后的王鑫，却认为自己现在所做的事情，似乎说出来并不那么自豪。“我做的研究，常常是把一些抽象问题，通过数学建模形成具体目标，然后在计算机或高性能服务器上根据具体任务进行编程求解。可能听起来没有那么高大上，但确实也跟科学沾点边，毕竟计算机科学与技术还是包含科学的嘛。”在王鑫自谦的说法里，我们其实就能对他的科研了解一二。

　　从浙大计算机科学与技术专业本科毕业后，王鑫继续保研浙大，师从陈纯院士直接攻读博士学位，其间前往坐落于加拿大温哥华的西蒙弗雷泽大学深入学习计算科学，其间师从加拿大皇家科学院院士Martin Ester 教授获得了计算科学的博士学位，王鑫从浙大博士毕业后加入清华大学计算机科学与技术系，以国家特聘专家朱文武教授作为合作导师从事博士后研究，出站后留校任教至今。

　　王鑫的研究方向主要集中在多媒体机器学习的核心挑战上。针对多媒体表征模型面临“难解释”、“难泛化”的瓶颈挑战，王鑫致力于多媒体表征建模研究，从解耦表征学习与自动机器学习出发，提出了多媒体表征建模理论方法。通过建立多媒体解耦关联表征理论，实现了多种数据形态的时空解耦关联表征模型，大幅提升了多媒体数据在表征空间的可解释性；通过提出自动多媒体表征建模方法，突破了当前表征模型超参数与架构依赖手工设计难以泛化的桎梏，大幅提升了多媒体表征模型的泛化能力。

　　听起来似乎有些复杂，王鑫是这样通俗解释他的研究方向的，“以现在比较热门的AIGC 任务为例，给定一段文字，要求模型能够自动生成符合文字内容描述的视频；或者以视频时序定位为例，给定一段视频和一段文字，要求模型能够在这个视频里提取完全符合这段文字描述的视频内容。一方面，在隐空间对视频和文字进行表征建模时，不同概念会混淆耦合在一起导致表征难以解释。另一方面，文字里面有可能出现之前没有碰到的新概念，视频里也会出现新的主体，导致分布偏移现象使得模型难以泛化。因此，怎么样使得模型在完成任务时克服‘难解释’、'‘难泛化’的挑战是我的研究内容之一。此外，我的研究还可以在一些特定行业进行应用。例如对金融行业中的潜在交易进行分类，告诉大家哪些是有风险的，哪些是没问题的。

　　中国青年学者的声音

　　对于王鑫来说，他希望所研究的成果能够为祖国人工智能科研实力真正迈入国际前沿而尽一份绵薄之力。国际人工智能领域，中国学者40 多年前才发出第一篇人工智能顶级会议IJCAI 和顶级期刊IEEE TPAMI 论文，当时这个领域的研究完全被西方主导。

　　在我国青年一代人工智能学者的共同努力下，如今的中国，也能在国际人工智能领域大放异彩。“我觉得这本质上就是由量变到质变的过程，从0 到1是非常难的，甚至是最难的，而从1 到10 的工作，虽然相对容易，但我们更应该做的扎实，这样才能让中国在世界有足够响亮的声音。”

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容