文 | 孙永杰近日,DeepSeek在AI大模型领域引发热议,凭借其惊人的性能表现和低成本训练模式,迅速吸引了全球关注。虽然市场上几乎充满了赞叹声,但理性的业内人士已经开始提出质疑,认为这一现象可能并非一蹴而就,值得等待更多的验证。DeepSeek究竟为何引发如此广泛的关注?2024年12月,DeepSeek发布的V3模型突破了多个开源大模型的性能,超越了阿里自研的Qwen2.5-72B和Meta的Llama 3.1-405B等模型,并与OpenAI的GPT-4o、Anthropic的Claude 3.5-Sonnet等闭源大模型相抗衡。在此基础上,DeepSeek于2025年1月20日发布并开源了DeepSeek-R1模型,该模型在数学、编程和自然语言推理等领域表现出色,甚至与OpenAI的O1模型相匹敌。此举不仅让DeepSeek在市场中名声大噪,还使其在苹果App Store的美国地区免费应用程式下载榜单上登顶,超越了ChatGPT等热门应用。然而,DeepSeek的成功并非仅仅凭借其卓越的性能,更多的亮点在于其低成本与高效的训练模式。简而言之,DeepSeek通过极低的成本,成功实现了接近GPT等先进模型的性能,这一点引起了业界的广泛关注。无法证真,难以证伪的成本惹争议提及成本,DeepSeek发表的原始报告中有详细解释这笔成本的计算:“在预训练阶段,每兆个token上训练DeepSeek-V3仅需要180K H800 GPU小时,也就是说
DeepSeek火爆引争议,中国AI“软、硬”挑战犹存亟待破局
2025-02-02 08:46:29来源: 钛媒体

关注公众号
赞
你的鼓励是对作者的最大支持
- 比偶然更好的事情是必然2025-02-01 16:09:03
- 代购凶猛,县城劲吹山姆风2025-02-01 17:17:21
- 突破融资困境:掌握必杀技与关键问题,开启创业成功之门2025-02-01 17:17:44
- 造车新势力激战2025,喜忧写在1月销量榜2025-02-02 17:36:04
- 行业人士发文痛斥币安“克扣上币项目方”,存在“上币利益输送”及“内部贪腐”等问题2025-02-02 17:36:52
- 掘金2025:洞察最赚钱的十大风口,把握时代财富脉搏。2025-02-02 17:48:20
- “新造车六强”1月大洗牌:“华为系”第一,小鹏超理想2025-02-02 17:48:27
- 炒股,炒的是人性和认知2025-02-02 17:48:44
- 人和人之间,是怎么“隔了一层可悲的厚障壁”的2025-02-01 15:54:00
- ESG风雨20年,企业终于可以既要又要了?2025-02-01 16:54:00
- 1三星 Galaxy A56 5G 手机新渲染图:Exynos 1580 芯片、45W 快充、拉丝铝合金边框
- 2DeepSeek 被曝估值最高 1500 亿美元达 OpenAI 一半,巴黎地铁 70 岁老人都在聊
- 3阿维塔 07 Pro+ 将搭载华为乾崑智驾 ADS SE,后续 OTA 升级离车泊入
- 42024 年中国汽车进口 70.5 万辆:同比下降 11.7%,连续四年下滑
- 5海信电视接入 DeepSeek,支持 AI 语音对话
- 6英伟达 RTX 5090 FE 显卡供电接口熔化被指电缆功率分配不均,单根高达 269W
- 7何小鹏朋友圈晒与华为任正非合影,夸赞“无私,睿智”
- 8消息称英伟达 GeForce RTX 5070 显卡上市推迟:从 2 月延至 3 月初
- 9旗下首款 240Hz OLED 超感曲面游戏显示器,联想拯救者 Pro34 预热
- 10长安公布旗下飞行汽车部分规格:原地垂直起降 + AI 自动驾驶、最大航程 30 公里