近日,国际超算大会(ISC2024)在德国汉堡举办,本届ISC主题为“重塑超算(Reinventing HPC)”。会议期间高性能计算(HPC)与人工智能(AI)融合新趋势,引发各界广泛关注。
对此,5月14日由超级计算创新联盟、国家高性能计算机工程技术研究中心联合主办的“HPC产业趋势研讨会”在德国汉堡与ISC同期举行。会上多位国内专家就“超智融合”趋势发表了观点。
“超智融合不仅促进科学研究,也对超算技术提出了新发展要求。” 超级计算创新联盟秘书长金钟表示,从应用视角看,超智融合本质是强调人工智能技术与特定领域知识的深度结合,而非仅对AI技术本身优化。
“我坚定一个看法,超算与智算要融合发展。通过在硬件设计上集成两者功能,如在单一芯片上集成支持超算与智算,才能更好地推动超智融合技术进步。” 金钟说。
在ISC2024展区,超智融合方案也随处可见,众多HPC系统均采用了如NVIDIA GH200、AMD MI300A、Intel Core Ultra等CPU+GPU/NPU的融合架构。而超智融合芯片的诞生,一方面是因为摩尔定律放缓,半导体性能突破面临物理极限;另一方面,单一计算架构已无法处理更复杂的应用场景和更多样数据,如能源、材料、生物、工业数字孪生等众多领域既需要智算也需要超算算力。
北京大学计算中心系统管理室副主任李若淼指出,要实现“超智融合”,HPC调度层面还存在诸多挑战。例如AI for Science应用在计算过程中,其前后期对资源量和数据类型需求不一致,这就要求调度系统具备灵活性和智能化,能动态调整资源分配,以优化整体计算效率和资源利用率。
“相较于传统科学计算,AI应用在资源和工具需求上更为多样,尤其是在容器化部署、数据处理、模型训练等方面。” 李若淼说,这要求HPC平台不仅要支持基本的开发调用,还要提供一套可支持AI工作流程的工具集,以适应研究人员的不同使用习惯和复杂需求。
国家高性能计算机工程技术研究中心常务副主任何铁宁表示,“超智融合”是计算技术演进的里程碑,其标志着从通用计算主导传统科学计算,过渡到异构加速的AI计算新时代。两者技术特性互补,将重新定义计算领域。而新趋势总会带来新机遇。超智融合在未来4-5年内将迎来井喷式爆发。而以此为契机,可推动计算芯片、应用、整机、系统协同创新,加快计算技术创新。