文 | 半导体产业纵横GPU万卡集群,小米下场了!摩尔线程智算集群扩展至万卡!中国移动将商用三个自主可控万卡集群......一系列标题的袭来,让笔者突然意识到,仿佛在不经意间,智能算力建设已然迈入万卡时代。那么到底什么是万卡集群?万卡集群到底有哪些作用?有必要部署万卡集群吗?01 什么是万卡集群?万卡集群,是指由超过一万张加速卡(如GPU、TPU或其他专用AI加速芯片)组成的高性能计算系统,用以加速人工智能模型的训练和推理过程。至于为什么需要一万张加速卡?众所周知,大模型竞赛的本质是算力竞赛。比如这里有一个超大土堆,放一个工人和放一万个工人,在效率上肯定会有质的飞跃。以OpenAI训练GPT模型为例,GPT-4需要使用2.5万张英伟达A100 GPU,并行训练100天左右的时间,在此期间要处理13万亿个token,并且涉及大约1.76万亿个参数。在不久的将来,开发大模型所需的算力将实现指数级的增长,对于即将亮相的GPT-5,预计该模型的训练需要部署20万~30万个H100 GPU,耗时130~200 天。如今OpenAI发布ChatGPT已有两年的时间,从建设进度上看,海外头部厂商在2022年、2023年已经完成万卡集群搭建。比如2023年5月,谷歌推出的AI超级计算机A3,搭载了约26000块英伟达H100 GPU;2022年,META宣布了一个由1.6万块英伟达A100 GPU组成的集群。到了2024年初,META进一步扩大规模,建成了两个各含2
智算“万卡”潮起,国产AI芯片迎高光时刻
2025-01-08 20:15:16来源: 钛媒体
关注公众号
赞
你的鼓励是对作者的最大支持
- OpenAI 12集“发布会”背后:对中国产业AI落地的五大启示2025-01-08 20:01:51
- 精神分裂症,下一个重磅药物诞生之地2025-01-08 20:01:54
- 新能源车2025:风往哪里吹?2025-01-08 20:15:22
- 被智驾行业误解,是英伟达的宿命2025-01-08 20:15:25
- 「2024盘点」特斯拉跌落神坛?2025-01-08 20:20:49
- 老乡鸡,重新开始2025-01-08 20:42:10
- 【日日龙虎榜】机器人概念走高,农机、家电流入靠前2025-01-08 21:02:56
- 凯伦股份并购:建材商跨界半导体检测,实控人同步变现“解近渴” |并购一线2025-01-08 21:50:14
- 发力数据要素产业,北京海淀已经有1300余家 AI 大模型与芯片企业|钛媒体AGI2025-01-08 22:06:00
- 全面扭亏却不见“涨声”,2025生猪养殖业面临两大挑战 |行业风向标2025-01-08 22:17:00
- 1第三代中国自主量子计算编程框架 QPanda3 发布,编译速度较美国 Qiskit 1.3.0 提升 320 倍
- 2报告:80% 游戏开发者正开发 PC 游戏,Steam Deck 成新宠
- 3《毁灭战士:黑暗纪元》游戏被曝 2025 年 5 月 15 日发行
- 4玩家投票:PS5 成索尼史上“最差一代”主机
- 5钉钉宣布全面支持 iOS / 鸿蒙 HarmonyOS NEXT 系统 CallKit 功能
- 6两院院士评选“2024 年中国 / 世界十大科技进展新闻”揭晓,嫦娥六号、星舰“筷子夹火箭”等入选
- 7努比亚红魔《三国志 8》游戏联名 65W 氮化镓充电头首销:1A + 2C 赠线,99 元
- 8全路唯一,人形客运服务 AI 机器人“小铁”上岗西安火车站候车大厅
- 9鑫谷昆仑九重 KE-1300P 电源推出黑色版本:额定功率 1300W、80PLUS 白金认证、数字化设计,1599 元
- 10十铨推出业界首款 V90 认证 2TB SDXC 存储卡:UHS-II 规范,IP67 防护