IT之家 2 月 1 日消息,科技媒体 marktechpost 昨日(1 月 31 日)发布博文,报道称 Mistral AI 发布了 Small 3(全称为 Mistral-Small-24B-Instruct-2501)模型,共有 240 亿参数,实现了先进的推理能力、多语言支持和便捷的应用集成,并在多个基准测试中取得了令人瞩目的成绩。该模型基于 Apache 2.0 许可证发布,允许开发者自由修改、部署和集成到各种应用程序中,对标 Meta 的 Llama 3.3 70B 和阿里巴巴的 Qwen 32B 等更大模型,官方声称在相同硬件上,提供超过三倍的性能。Small 3 模型针对本地部署进行高效优化,在 RTX 4090 GPU 或配备 32GB RAM 的笔记本电脑上也能通过量化技术流畅运行。模型在多样化的指令型任务上进行了微调,实现了高级推理、多语言能力和无缝应用集成,凭借 32k 的上下文窗口,它擅长处理长篇输入,同时保持高响应速度。该模型还包含 JSON 格式输出和原生函数调用等功能,使其非常适合对话和特定任务的实现。Mistral-Small 模型在多个基准测试中表现出色,在特定任务中甚至可以媲美或超越 Llama 3.3-70B 和 GPT-4o-mini 等更大规模的模型。它在推理、多语言处理和代码基准测试中都达到了很高的准确率,例如在 HumanEval 上达到 84.8%,在数学任务上达到 70.6%,在 MMLU 基准测试中准确率
开源新秀 Mistral Small 3:低延迟、高性能、Apache 2.0 许可,赋能 AI 应用
2025-02-01 13:52:29来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 消息称美团“All in AI”,王兴、王莆中双双看重2025-02-10 17:57:42
- 摆脱英伟达依赖,OpenAI 首款自研芯片被曝上半年交由台积电流片2025-02-10 19:21:17
- 中国电信天翼云盘接入 DeepSeek 模型,提升 AI 助手的智能问答能力2025-02-10 22:02:34
- DeepSeek横空出世,医疗AI迎来“国运时刻”2025-02-10 16:00:30
- DeepSeek 流量超谷歌 Gemini 位列全球第二,马斯克携 xAI 更强模型宣战2025-02-09 15:54:05
- 斑马智行元神 AI 完成与 DeepSeek 技术融合,意图理解、融合推理和主动服务能力提升2025-02-09 16:01:27
- 七彩虹“虹光 AI”智能模型助手官宣接入满血 DeepSeek R12025-02-08 17:48:14
- Flyme AIOS 确认接入 DeepSeek-R1 大模型,魅族 21 系列下周起上线2025-02-08 19:22:12
- 消息称荣耀笔记本 AI 部分也会接入 DeepSeek2025-02-08 21:11:36
- Tesla Delivery in China Sets Record in Q4 as AI Train Challe…2025-02-08 14:32:02
- 1《哪吒之魔童闹海》首批海外上映地区定档,今日起强势登陆美澳
- 2股市龙虎榜是什么?用它来分析股票的原理是什么?
- 3上海自贸试验区数据跨境服务中心成立,提供“一站式”服务
- 4百度 Apollo 智舱大模型完成 DeepSeek 接入,将在凯迪拉克、别克新车搭载
- 5DeepSeek突袭,英伟达算力霸权是否会走入危局?
- 6索尼 2024 财年 Q3 销售额 4.41 万亿日元同比增长 18%,PS5 主机销量累计达 7510 万台
- 7《守望先锋 2》游戏迎来天赋升级系统,战利品箱、303 模式回归
- 8消息称 iPhone 17 Pro Max 将落地金属超构透镜,折叠 iPad 也会运用该方案
- 9极氪汽车宣布进军非洲市场,001 埃及售价约 38.83 万元人民币起
- 10闪迪介绍高带宽闪存 HBF:单 AI 推理 GPU 存储容量即可满足前沿模型需求