近期资本市场最大的热点是 “DeepSeek发布最新开源模型DeepSeek-R1”。
近日,国内人工智能初创公司 DeepSeek 正式发布最新开源模型DeepSeek-R1,在全球范围引发广泛关注与讨论。
目前行业普遍认为 DeepSeek带来了两个里程碑性质的意义:1.算力成本投入表现出来的性能超出行业认知,用于训练的成本可能大大降低;2.开源路线对大公司闭源路线的底层颠覆。
顶点财经柯友浪提示大家: “DeepSeek发布最新开源模型DeepSeek-R1”,对人工智能、AI应用是重大利好。
技术性能卓越。
DeepSeek-R1 采用 MIT 许可证开源,允许用户通过蒸馏技术训练其他模型。
它的创新性体现在后训练阶段大规模应用强化学习技术,在标注数据极少的情况下,仍显著提升了模型推理能力。
在数学、代码和自然语言推理等任务中,DeepSeek-R1 性能比肩 OpenAI o1 正式版 ,在一些第三方测试中表现优异,如在美国加州大学伯克利分校研究人员设立的聊天机器人竞技场(chatbotarena) 平台上,DeepSeek-R1 的性能表现位列前十。
成本优势显著,性价比极高。
在成本方面,DeepSeek-R1 有着无可比拟的优势。
此前发布的 DeepSeek-V3 仅使用 2048 颗英伟达 H800GPU,就完成了 6710 亿参数模型的训练,成本约为 560 万美元,远低于其他顶级模型的训练成本。
而DeepSeek-R1 在运行成本上同样突出,输入费用仅为 0.55 美元/百万 tokens(缓存未命中),缓存命中时更是低至 0.14 美元/百万 tokens,输出费用仅为 2.19 美元/百万 tokens。
相比之下仅为 OpenAIGPT-4o 输入费用同等情况下的,这使得DeepSeek-R1 未来可能成为预算敏感企业和团队的首选。
开源模式引领。
DeepSeek-R1 的开源发布在国际 AI 社区激起千层浪。
Meta 首席AI 科学家 Yann LeCun 表示,其成功证明了开源模型正超越闭源模型。
与OpenAI 限制对其系统的访问以维护竞争优势不同,DeepSeek 允许全球企业和开发者共同开发和改进技术。
这种开源策略为开发者提供了更多自由和灵活性,开发者能根据自身需求对模型进行调整和优化,极大地促进了技术社区的交流与创新。
突破外部限制,彰显创新力量。
近年来,美国在芯片等领域对中国实施出口限制,试图打压中国 AI 发展。
但 DeepSeek 依然构建出匹敌美国顶尖科技公司的 AI模型。
OpenAI 前高管扎克・卡斯直言,美国的限制未能阻止 DeepSeek 的进步,资源限制反而激发了中国科研人员的创造力。
DeepSeek-R1 的发布让怀疑论者重新评估中国的技术发展,也让美国决策者反思通过设置障碍确保领先地位的方法是否可行。
怎么看待“DeepSeek发布最新开源模型”的影响呢?柯老师认为,降本是科技发展的必由之路,融合不同的架构、工程优化以及硬件的迭代才能共同促进大模型降本和性能提升。
DeepSeek-R1 带来的模型优化降本虽然短期来看是对训练侧算力需求增速产生一定影响,但从 AI大模型推理和应用维度对产业链仍将带来较多机遇。
柯友浪(执业编号:A0380621090002)简介:
顶点财经首席投顾,荣登纳斯达克时代广场大屏,新浪金牌理财师,曾任较大规模的阳光私募基金经理,曾受邀参加LME亚洲年会,拥有十余年市场经验。
现任摇钱术至尊版APP常驻嘉宾,以直播、视频、专栏文章等多种形式持续和广大投资者分享专业见解。
【免责声明】本文内容及观点仅供参考,不构成任何投资建议,投资者据此操作,风险自担。
股市有风险,入市需谨慎。