近日,著名人工智能领域专家、复旦大学计算机科学技术学院特聘教授、清华大学电子工程系兼职教授窦德景正式担任北京电子数智科技有限责任公司(简称“北电数智”)首席科学家,携手北电数智共同探索与发展人工智能时代基于大算力、大模型与大数据的AI全栈服务,助力北电数智充分激活人工智能行业应用,引领产业生态繁荣。
北电数智首席科学家窦德景
窦德景于1996年获得清华大学电子工程学士学位,随后2000年和2004年在美国耶鲁大学获得电器工程硕士和人工智能方向博士学位,并持续多年深耕人工智能、数据挖掘、数据整合、自然语言处理和健康信息学等领域。加入北电数智前,曾担任波士顿咨询公司(BCG)合伙人、副总裁、中国区首席数据科学家,百度研究院大数据实验室和商业智能实验室主任,美国俄勒冈大学计算机和信息科学系教授,发表学术论文超过250篇(Google Scholar被引用1万次以上)。
窦德景表示:“我之前在高校任职教授,做学术研究比较多。因为合作项目的机会了解到北电数智是一家专注于打造全栈式AI服务的科技企业,且北电数智正在承建的北京市数字经济算力中心,以AI工厂的理念,为AI行业打造了一个开放、多元的集聚空间,同时能够为科研课题研究和场景落地提供着力点。另一方面,北电数智的先进计算迭代验证平台,能够促进国产芯片从可用到好用,切实支撑中国人工智能产业发展,这样的理念也是吸引我加入的原因。“
北电数智要做的事情,是现在没有被解决的问题
进入人工智能时代,大模型的发展对算力需求呈爆发式增长,通常需要上千张以上算力卡的支持。当前,单纯依赖进口芯片既成本高昂又不现实。如何在保障成本效益的同时,推动国内AI行业的快速发展,成为亟待解决的问题。而且AI技术发展日新月异,如果国产芯片无法有效使用,将构成巨大的资源浪费。
市场上普遍认为,预训练环节计算要求高,基本只能用进口芯片,且芯片主要是代际差异,不同类型场景中表现差异不大。对此,窦德景教授提出了不同的创新技术构思:不同的芯片对不同类型的数据处理能力不同,根据文本、图片等不同数据类型,在不同场景的训练过程中找到更适配的国产芯片,发挥它们各自的优势,从而在复杂场景中探索出性能更好的混元解决方案。然而,这种“混元适配”比单一芯片构成的生态系统要复杂得多,需要首先对大模型进行解耦适配,再通过多机器、多芯片的协同工作,实现高效运行。
北电数智目前已经成功纳管了近十款国产芯片,并能够使上千甚至上万块国产芯片高效运行。同时,北电数智致力于带动国产芯片升级,推动国产芯片“从可用到好用“,通过公正测评和充分发挥不同芯片的优势进行混元适配,为AI多模态发展提供有力支持。在窦德景教授的带领下,北电数智在先进计算上采用这样高效整合、合理利用、综合考量的策略,能够为国内AI发展和国产芯片迭代进化开辟了一条可行之路。
谈及对国产算力的发展预测,窦教授说“目前国产芯片能够提供一定的算力,但距离世界前列仍有差距,仅能在部分场景下发挥作用。另外,国内并没有足够的生态去支撑人工智能大模型完成多模态任务。”在这样的行业洞察下,窦教授指出北电数智正在做的先进计算迭代验证平台,一来为芯片提供大规模算力适配,二来是形成混元集群,整体构造一个多芯生态系统,这是北电数智正在做的事情,也是现在没有被解决的问题。
“国产算力+可信技术”双保险,让模型安全落地
“AI是否会对人类造成伤害,其实是大模型安全问题。这是整个生成式AI能否真正成功落地必须解决的问题。”可信数据空间作为北电数智正在打造的新一代AI基础设施之一,也是窦教授在复旦大学主导的研究中比较关注的环节。在北京市数字经济算力中心即AI工厂里,北电数智在降低成本基础上,重点探索隐私计算(如同态加密、安全多方计算)、区块链(如多节点联盟链)性能、成本的均衡,同时在先进计算迭代验证平台上,以大规模芯片场景适配、多场景测评,优先探索全链条数据安全隐患及可控技术。
“大模型安全不仅是技术安全,还包括是否有人利用大模型作恶的问题。作为人工智能时代的创新型国企,北电数智的中立身份具备可信主体优势,同时在技术方面建设可信数据空间,构筑安全可靠运行环境,通过国企担当和技术创新的‘双保险’为政企提供安全可靠的数据服务。“窦教授表示。
谈及未来的愿景,窦德景教授表示,希望北电数智能够开创既能保证经济效益又确保安全性的应用。他强调,整个AI生态不应仅由几家头部公司主导,否则高昂的成本将阻碍AI技术的广泛应用和深入发展。窦教授期待与北电数智携手同行,共同研发更多能够快速落地的技术产品,通过加速芯片性能、降低智算成本,并在汇聚多样化模型的同时确保数据安全,让人工智能能够赋能更多行业和企业,在关键场景中创造出杀手级应用,从而推动AI产业的繁荣发展。