Qualcomm博客

高通发明家Marta Karczewicz博士 让视频在线播放、即时分享和沟通成为可能

2021年8月5日

Qualcomm products mentioned within this post are offered by Qualcomm Technologies, Inc. and/or its subsidiaries.

欢迎阅读《高通的发明》系列专栏。在专栏中,我们将与一些拥有诸多发明的高通发明家一起分享他们的工作,由他们的发明带来的影响以及他们的灵感来源。 

给宠物拍视频,与同事进行Zoom通话,在线观看情景喜剧……如果没有高通公司技术副总裁Marta Karczewicz博士,这类体验将不复存在。

Marta在波兰出生,2006年加入高通公司,并开始变革视频压缩技术。她发明的突破性技术支撑了现代视频体验,包括视频在线播放、即时分享以及多用户视频会议。她的发明实现了对视频数据的压缩,甚至可以高达千分之一,可在终端用户毫不察觉图像质量变化的情况下,快速且准确地传输视频。

她表示,视频数据如果没有这些视频编解码器进行处理,可能根本无法发送。但现在,你看视频几乎无处不在。

对于如今我们所知和所爱的视频体验,Marta的贡献并不仅仅是单一的技术突破,更是一整套发明。确切地说,她参与了几乎所有视频编解码器的模块构建工作,拥有超过500项美国专利。她的工作成果倍受关注:2012Marta成为高通IP卓越奖Qualcomm IP excellence Award)三位获奖者之一,在2019年欧洲发明家大奖评选中,她也是终身成就奖“Lifetime Achievement)三位最终入围者之一。

在高通公司,Marta领导着一个由30人组成的团队,致力于推动多媒体研发,并随着视频进入到比以往更多的领域,取得了诸多突破性进展,这就包括远程教育和远程医疗以及扩展现实(XR)和机器与机器通信。为了更好地了解她的发明历程及其工作带来的影响,我们与Marta进行了深入交流。

你一直知道自己想要成为一名发明家吗?早期是什么启发了你,你又是如何不断寻找灵感的?

这是机缘巧合。从前我在学校里喜欢的学科几乎只有数学和物理,因为它们更多的是关于了解物质和解决问题,而非记忆信息。我喜欢抽象数学,它通常并不是只有一种正确的证明或答案。这真的非常吸引我,事实也证明我在这方面很有天赋。在高中的时候,我是波兰数学奥林匹克竞赛的获奖者之一。我很喜欢解决问题,发明是我工作的成果。目前,我的动力仍然来源于质疑一切并挑战自己,我总是问自己,我能比迄今为止业界达到的水平做得更好吗?

你从事视频编解码器研究工作的动力是什么?你想要解决什么问题?

我正在尝试变革视频压缩的设计。我记得当我开始这项工作时,有一次我看到一本教科书,书中基于研究人员对数据的假设,建议了一种最佳方法。我当时心想:真的是这样吗?让我看看。这些假设真的正确吗?然后我确定我可以做得更好。

每一代新的视频编解码器基本上都需要将视频再压缩40%以达到相同的视觉质量。但这绝不是通过修改编解码器的一个模块就能实现的,通常我们需要修改数十个甚至数百个模块。总体来讲,这是不断积累各种小的改变并通过各种单独的工具实现的。

你的发明之路上可曾有过任何令你恍然大悟的时刻?

没有。并没有这样一个恍然大悟的时刻,但期间却曾有过许多小的顿悟。通常,我的工作方式是首先分析问题,然后收集大量统计数据。之后,我会不断思考这些内容,甚至是在非工作时段。大多数发明的过程主要依赖于极其有条理地搜集数据、寻找趋势并对数据进行统计分析。然后,当我发现其中一些有趣的东西并思考如何使用它们时,可能会产生小的顿悟。我是一个做事情很系统的人,而且从不认为会有无法解决或者无法改善的问题。

总的来看,你的发明对整个行业和社会产生了怎样的影响?

得益于我们在视频压缩方面所做的改进,视频已成为人们日常生活中的一部分。当我在上世纪九十年代中期刚开始研究这个领域时,人们还只能通过电视看视频。那时,互联网在线播放也才刚刚兴起,移动终端上的视频更是还没有出现。

但是今天,视频已无处不在,并远超出娱乐范围。我们利用视频进行工作远程教育远程医疗,而这些在几年前都还不可能,因为那时视频质量太低,不能够满足这些应用。现在,视频还应用于XR云游戏,将来可能还有很多我们目前尚未意识到的应用。

例如,视频带宽中增长最快的细分领域是机器与机器通信,最终用户不是人,而是机器。想想我们经常听说的那些应用——例如智慧城市智能家居网联汽车和需要监控的其他行业与应用,比如对铁路、管道和电线的监控——目前的情况是,这些领域都需要用机器来进行视频拍摄。这些视频将被发送到另一台机器上,然后利用计算机视觉程序或神经网络对其进行分析、识别物体,并确认和预测事件。

总体而言,你看到的任何视频通常都会被压缩到数百分之一甚至数千分之一。没有其他人和我所做的工作,大家只能观看仅仅几个像素乘以几个像素的微小视频,帧率低至每秒只有几帧。

创新文化有多重要?

我认为尤其重要的是,高通公司理解研究需要时间。由于研究存在不确定性,你没办法总是为它设定好时间表。例如,每一代新的编解码器与上一代的时间差在五年以上。公司知道团队和我从事的工作有风险;换言之,半年后我们可能没有结果或者任何可展示的东西;或者我们可能尝试了多种事物,却没能取得任何有趣的成果。但高通公司愿意投资。公司愿意给我们时间来完成自己的工作,也能够容忍失败。我认为这一点很可贵,我不确定每家公司都愿意承担这样的风险。

你对其他发明者有何建议?

要有耐心。如果你像我一样喜欢解决问题,那就找到自己对什么领域或课题最感兴趣。当我最初决定自己专注于哪个领域时,有各种不同的可能性来运用我的技能组合。但我始终对视频感兴趣,即使在当时我也认为这就是未来的方向。人们都在谈论我提到的应用,但每个人都说它不可能实现。

所以,要去发现让自己有强烈感触的、自己笃信的问题,因为当你开始研究时,人们可能对它不感兴趣。你需要相信自己,相信自己正在做的事情,希望你是对的。去思考这个问题,然后发明会随之而来。

关注微博(Qualcomm中国)或扫描下方二维码关注微信公众号(ID:Qualcomm_China),了解更多Qualcomm资讯。

 

Opinions expressed in the content posted here are the personal opinions of the original authors, and do not necessarily reflect those of Qualcomm Incorporated or its subsidiaries ("Qualcomm"). The content is provided for informational purposes only and is not meant to be an endorsement or representation by Qualcomm or any other party. This site may also provide links or references to non-Qualcomm sites and resources. Qualcomm makes no representations, warranties, or other commitments whatsoever about any non-Qualcomm sites or third-party resources that may be referenced, accessible from, or linked to this site.

Qualcomm 员工

©2021 Qualcomm Technologies, Inc. and/or its affiliated companies.

沪公网安备 31011502004712 号

沪ICP备17015640号-4

References to "Qualcomm" may mean Qualcomm Incorporated, or subsidiaries or business units within the Qualcomm corporate structure, as applicable.

Qualcomm Incorporated includes Qualcomm's licensing business, QTL, and the vast majority of its patent portfolio. Qualcomm Technologies, Inc., a wholly-owned subsidiary of Qualcomm Incorporated, operates, along with its subsidiaries, substantially all of Qualcomm's engineering, research and development functions, and substantially all of its products and services businesses. Qualcomm products referenced on this page are products of Qualcomm Technologies, Inc. and/or its subsidiaries.

Materials that are as of a specific date, including but not limited to press releases, presentations, blog posts and webcasts, may have been superseded by subsequent events or disclosures.

Nothing in these materials is an offer to sell any of the components or devices referenced herein.