图片系AI生成大模型可能没有永远的王者,只有更适合的下一个。继DeepSeek-R1推理模型之后,算力供应端押宝阿里巴巴千问QwQ-32B,被视作产业即将大规模落地的推理模型。3月10日消息,国家超算互联网平台宣布接入阿里巴巴通义千问大模型,对外提供千问 QwQ-32B API服务,用户可免费获得100万 tokens。不少国产算力厂商也已经推出或正在计划推出更适合QwQ-32B的算力部署模式。此前,国产AI芯片厂商壁仞科技推出了基于壁砺TM106全系列一体机,全面支持QWQ-32B大模型推理;摩尔线程基于大语言模型高速推理框架 vLLM 以及 MT Transformer 推理引擎部署了 QwQ-32B。中国RISC-V芯片公司算能的SophNet云平台接入QwQ-32B模型,依托算能自研TPU,QwQ-32B的推理速度达75 Tokens/s;东南大学基于昇腾国产算力平台,接入QwQ-32B模型,成为全国首个提供该服务的高校;青云科技旗下AI算力云也上线了 QwQ-32B。业内人士表示,作为推理模型,行业更关注QwQ-32B的性价比指标,DeepSeek-R1客观普及了大模型推理场景,之后的大模型必须提供更好的效果和成本数据,才能弥补DeepSeek-R1的替换成本。据阿里巴巴官方信息,在冷启动基础上,阿里通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上,既能提供极强的推理能力,又能满足更低的资源消耗需求,适合快速响应
国产芯片加速适配QwQ-32B,业内人士:比DeepSeek更适合推理普及 | ToB产业观察
2025-03-10 19:05:00来源: 钛媒体

关注公众号
赞
你的鼓励是对作者的最大支持
- 阿里 QwQ-32B 大模型集成至国家超算互联网平台 Chatbot 可视化对话 / API 在线调用服务2025-03-17 19:32:12
- 新加坡工厂断电事故影响下,存储芯片巨头美光市值一夜之间缩水61亿元|钛媒体AGI2025-03-14 11:37:50
- 支持每秒传输 38Tb 数据,我国成功研制硅光集成高阶模式复用器芯片2025-03-13 18:33:06
- 突发,陈立武接任英特尔CEO! 老黄、苏姿丰后,华人称霸芯片三巨头2025-03-13 14:34:07
- 初探三星 Galaxy A56 5G 手机续航:Exynos 1580 芯片 + 5000mAh 电池2025-03-13 09:43:53
- 仅 1.38 平方毫米,德州仪器发布世界上最小 MCU 芯片2025-03-13 09:47:55
- 三星背水一战:MX 部门考虑接管手机芯片业务,Exynos 2600 成翻盘关键2025-03-13 10:02:55
- 联发科、台积电联手成功开发首款 N6RF+ 制程 PMU + iPA 整合测试芯片2025-03-12 16:15:55
- DeepSeek掀起算力革命,英伟达挑战加剧,ASIC芯片悄然崛起2025-03-11 13:13:34
- 小米 REDMI K80 至尊版手机现踪迹:天玑 9400+ 芯片,7000+ mAh 电池2025-03-11 10:40:54
- 1Asahi Linux 系统开发者无限期暂停苹果芯片 GPU Linux 驱动开发:存在安全隐患
- 2长和拟售港,2月USTR提议提高对华海运服务费、停靠费,本月24日举行听证会丨大事件必读
- 3家电厂商,决定把更多的钱花出去
- 4蔚来纯电小车 firefly 萤火虫将于 4 月 19 日上市,预售价 14.88 万元
- 5理想汽车为激励员工增发近 2000 万股,价值超 20 亿港元
- 6加速智驾平权,奇瑞汽车 2025 年将推出 30+ 高阶智驾产品
- 7HYTE 推出“星街彗星”主题机箱和键帽
- 8米哈游《云・绝区零》Windows / macOS 平台测试招募开启,无需下载完整包即可畅玩高画质云游戏
- 9斯莫格发布佳能 EOS R5 系列相机散热风扇:改善录制过热问题,售价 499 元
- 10腾讯 2024 年末员工数达 11.05 万人,全年总酬金成本 1128 亿元