EMC易倍瀚博亮出7nm国产云端GPU：集渲染、AI、视频于一体

NEWS 易倍动态

service phone 400-123-4657

emc易倍 | 行业资讯 |

EMC易倍瀚博亮出7nm国产云端GPU：集渲染、AI、视频于一体

点击量：654 时间：2022-09-06

　　芯东西9月3日报道，今日，上海云端AI芯片公司瀚博半导体在其举办的人工智能大芯片产业落地论坛上，预览其首款7nm云端GPU芯片

　　同时，瀚博推出了瀚博统一计算架构、全新数据中心推理卡载天VA10、边缘AI推理加速卡载天VE1和瀚博软件平台VastStream扩展版。

　　瀚博半导体2018年12月成立于上海，专注于研发高性能通用加速芯片。其融资情况也很抢眼。快手、阿里巴巴两大互联网战略投资方均在其投资阵容。迄今瀚博已完成逾24亿元融资。

　　会后，瀚博半导体创始人兼CEO钱军接受芯东西等媒体的采访。钱军透露，今日新发布的两款加速卡已经进入客户层面测用。

　　钱军表示，未来瀚博将基于GPU和AI芯片带来更多产品组合，更好地满足市场、客户的需求。

　　瀚博半导体的首款7nm云端GPU芯片SG100具备业界领先的图形渲染性能，拥有超高吞吐、超高质量、低延时编码等能力，集渲染、AI、视频于一体，可为云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景提供深度优化。

　　同时，SG100还提供SR-IOV虚拟化支持，端到端整体提升用户视觉体验，能够满足市场对智能视频视觉、图形图像处理的算力需求。

　　瀚博半导体创始人兼CEO钱军是GPU巨头AMD中国前高管，曾带领AMD中国团队设计量产了业界第一颗7nm图形处理器和第一颗7nm云端GPU架构的AI芯片。据悉，瀚博核心研发团队拥有18年以上高端芯片设计和量产的经验，手上流片出去的GPU有几十款易倍动态。

　　钱军谈道，瀚博的初衷是“为像素世界提供浩瀚算力”。考虑到GPU研发技术门槛高，瀚博成立之初考虑到硬件EMC易倍、软件研发及工程能力等能力都有待加强，因此选择先面向“AI+视频”市场做基于领域专用架构（DSA）架构的AI芯片，以发挥研发团队在视频处理方面的经验。

　　“具有图形渲染能力的GPU研发一直在我们的计划当中。”钱军说，随着SG100到来，瀚博正式进入GPU市场。

　　由于瀚博云端GPU和专用AI芯片在目标市场上存在重合，当芯东西问这两大产品线如何协同时，钱军谈到瀚博的做法类似于“中台”概念，瀚博自主研发的很多核心技术与半导体IP，既可以内置于GPU，也可以AI芯片工作。

　　钱军告诉芯东西，后续瀚博也会考虑研发将GPU和AI能力整合在一起的芯片，这将根据客户需求来综合判断。

　　该架构整合了多款高性能计算引擎，拥有高效统一的存储管理、一致性接口和低链接延迟、完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块。

　　瀚博的统一计算架构，让计算密集型的AI、视频、渲染任务性能得到最大化硬件加速，同时端到端缩小延时，一体化助力云端实时图形渲染、AI增强处理、视频编解码等需求。

　　面向数据中心场景，瀚博推出数据中心推理卡载天VA10。这款加速卡搭载瀚博自研的超低延时、超高吞吐AI引擎，INT8峰值算力达400TOPS，刷新业界纪录。

　　载天VA10功耗为150瓦，整体最高推理性能达到同功耗主流GPU的2倍以上，且延时低至后者的6%。在低延时场景（低于4毫秒的YoloV3检测算法场景）下，其推理性能可以达到同功耗市场主流GPU的3倍以上。

　　据悉，载天VA10适合多种需要高实时性的云端AI应用部署，如直播视频增强、智慧交通管理、实时语义理解等场景。

　　面向边缘计算场景，瀚博发布了首款面向边缘大算力场景推理卡载天VE1系列。

　　载天VE1兼具低功耗、超低时延与超高吞吐率，吞吐率达到主流GPU的2倍，但时延仅为其的1/5。在40~65瓦功耗下，载天VE1的INT8峰值算力达100TOPS。

　　这款加速卡支持60路1080P视频实时解码，支持主流AI框架的模型，提供从模型编译到推理优化的全流程低代码开发框架VastPipe，软硬结合为客户提供端到端的AI推理解决方案。

　　载天VE1可在众多关键场景发挥作用，比如高速公路事件检测、“人、车、非机动车”视频结构化、大数据研判等超高数据量并发场景；再比如，道路实时动态信息交互、工业的缺陷检测等低延时要求场景。载天VE1非常适用于智慧交通、车路协同、工业质检等边缘大算力场景。

　　瀚博的软件平台VastStream应运而生，可加速各类AI应用部署，包括计算机视觉、视频处理、自然语言处理、搜索与推荐、算子自定义扩展等。

　　VastStream的全新软件组件，提供系统管理等三大管理工具，方便客户部署，同时其基础软件栈功能更加丰富，特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等。

　　至此，瀚博已形成一条涵盖了芯片、推理加速卡、一体机的硬件产品线和软件整合的系统解决方案。

　　在2022世界人工智能大会上，瀚博半导体展出了包括新品在内的多款芯片相关产品，展示其智能视频视觉、图形图像计算产品和算力解决方案。

　　此前，瀚博已推出首款云端AI推理芯片SV102及搭载此芯片的载天系列通用加速卡VA1，其芯片解决方案覆盖从云端到边缘的服务器及一体机市场，并在加速相关应用落地方面屡有进展。

　　2022年以来，瀚博先后与福建大数据集团、国宁瑞能，高新兴、超聚变等行业领先企业，在智慧城市、智慧政务、智慧交通、智慧园区、智慧能源等多元场景，开展深入合作，为企业智能化、数据化提供国产AI算力解决方案。

　　今年7月，瀚博半导体与高新兴签订战略合作协议，双方将围绕车联网、车路协同等智慧交通领域，就芯片解决方案和生态建设展开深度合作，助力智慧交通数字化及智能化转型升级。

　　瀚博的高性能通用智能加速芯片具备大算力、低时延等优势，可满足车路协同多传感器融合数据处理的大算力及时延要求。同时瀚博研发过程利用先进生产工艺以及创新的节能计算体系结构，可以实现更好的能耗比，从而有助于企业客户降低算力成本，降低计算能耗。

　　近期，瀚博还与国产主流服务器厂商超聚变合作共同解决企业AI应用过程中面临的典型问题EMC易倍，致力于降低AI计算门槛。

　　此外，为了促进技术生态的发展，瀚博也在联合全球顶级的技术、人才、机构和高校建立合作。

　　在今日的论坛上，瀚博与上海交通大学人工智能研究院签约，开展校企合作。瀚博希望通过产学研用联盟的方式，让更多优秀的人才、资源参与进来，推动技术进步、人才培养、科研成果转化，建立智能芯片生态。

　　作为数字经济未来发展的重要领域，元宇宙迈入虚拟和现实融合的3D互联网时代，算力需求也更加蓬勃。9月1日，瀚博创始人兼CEO钱军出席2022世界人工智能大会芯片主题论坛，在圆桌会议环节分享了对于芯片元宇宙中应用的见解。

　　钱军认为，元宇宙是国内芯片公司弯道超车的机会，“就像油车和电车比起来已经落伍了一样，当我们有一个颠覆性的方向，这个过程中会获得各种超越的机会。”

　　在他看来，元宇宙本身并不是一个颠覆性的技术，而是由多个数字技术组合起来的综合性的应用，在这中间会产生AR/VR等各种各样的交互和感知，并产生海量内容，这些内容需要实时、强大的视频处理算力，需要多样的渲染引擎，还需要综合5G网络、大数据、AI、区块链等数字技术来做支撑和管理。

　　因此，元宇宙可以被视作是一个现象级的应用，同时要综合考虑多类型、高复杂度的计算，所以对未来算力提升的需求空间巨大。

　　以元宇宙的数字孪生做渲染为例，尤其是沉浸式的渲染EMC易倍，对于GPU的性能的提升需求是巨大的。

　　“GPU一定要上云，只有上了云，才能够把多颗GPU综合连接起来，然后用一种集成的方式来做有效的渲染，才能支持元宇宙海量内容的产生。”钱军说。

　　他相信，现在场景和需求更多样化，渲染算法不断迭代，找到这些机会，GPU就有望弯道超车。不过，核心技术不是一蹴而就的，而是需要长期努力，扎扎实实地把芯片和技术做出来。

　　在9月2日举办的2022世界人工智能大会中国移动主题论坛上，钱军也探讨了对于“AI新基建”的理解。他认为，算力网属于现象级基础设施，运用到多种数字化技术，需要多样化的算力支撑。

　　芯片部署应重点关注能耗与算力密度。其中算力密度从两个维度考虑，即每平方毫米芯片提供的算力和每瓦功耗提供的算力。算力网络还应考虑算力的有效性，能否有效驱动应用。

　　从整体上看，打造算力网和做芯片的思路类似，需要系统地规划算力单元、存储单元、数据交互等资源，使每个模块的能力得到有效发挥。

　　至于生态构建，钱军希望未来出现一些领袖型企业，引导整个行业建立一个开放标准化的生态，将更加有利于行业内的有效竞争和创新，从而更好地支撑AI等行业的发展。

　　工信部数据显示，我国已成为全球第二的“算力大国”：2021年算力核心产业规模达到1.5万亿元，近5年平均增速超过30%。未来，谁的计算能力更强，谁能率先在落地进程中获得客户认可，谁就有望抢占未来制高点、赢得话语权。

　　芯片创业充满风险，过程艰苦，前路难料。但我们看到多家国内AI芯片企业仍在砥砺前行，并陆续在单卡性能、关键应用实测性能及商用落地方面取得一系列新进展。面对接踵而至的机遇与挑战，AI芯片企业仍需保持定力、练好内功，坚持自主创新与理解客户需求，方能走得长远。返回搜狐，查看更多EMC易倍

上一篇 : 易周资讯2021第37期关注行业动态掌握前沿资讯EMC易倍

下一篇 : EMC易倍中部动态 - 中国日报网

返回上一级返回首页