近日,一款名为DeepSeek的应用掀起旋风。今天(1月27日),这款应用在苹果应用商店中美两区的免费下载榜上同时登顶,标志着中国AI应用在国际市场取得重要突破。
DeepSeek 首先在苹果应用商店中国区免费榜 站上首位。随后,在美区苹果免费榜上也一举从昨天的第六位飙升至第一位,超越了ChatGPT 以及谷歌等美国科技公司的生成式AI产品。一时间,中国颠覆者DeepSeek取代ChatGPT的消息,成为媒体报道的焦点。该应用由国产大模型公司“深度求索”开发,其推理大模型DeepSeek-R1在本月20日推出后迅速引发市场关注。
按媒体的说法,DeepSeek-R1作为开源模型,在数学、代码和自然语言推理任务中的表现 与OpenAI的o1模型正式版比肩,但其训练成本仅为557.6万美元,不到OpenAI的十分之一。
DeepSeek以较低的成本 实现了高性能的AI模型,直接改变了AI领域的游戏规则,那就是不再依赖高性能芯片。
一直担任美国总统特朗普顾问的硅谷风险投资家 马克·安德森 在社交媒体评论称,作为开源软件,这是给世界的一份意义深远的礼物。
引发硅谷震动的DeepSeek,究竟是什么呢?它又能为我们做些什么呢?
公开资料显示,DeepSeek来自杭州深度求索公司,这家公司成立于2023年7月,专注于开发先进的大语言模型和相关技术,成立几个月后,就发布了首个开源代码大模型。经过多次迭代,到了去年12月,大模型已更新到V3版本,本周一,发布了新一代推理模型 DeepSeek-R1,性能对标OpenAI 的 o1,并且开源。
与Chat GPT需要购买会员不同,DeepSeek网页版、手机app端都可免费使用。
按照DeepSeek自己的介绍,它能提供信息查询、语言翻译、学习辅导、生活建议、技术支持、娱乐互动、行程规划、心理支持等功能。
记者体验手机端软件助手后发现,界面很简洁,除了文字输入框,只有深度思考、联网搜索、发送三个按钮。以解数学题为例,如果点了深度思考的按钮,除了能够正确回答问题,还能详细展示思考步骤,部分问题还能反复验证答案,甚至使用其他方式再计算一次。
业内人士表示,DeepSeek之所以能引发行业震动,主要是由于其研发成本极大低于同类产品,并且R1拥有强大的推理能力。
专家表示,DeepSeek在训练的过程中使用的是强化学习,使其在极少数标注数据的情况下,仍能显著提升模型的推理能力。除了性能高和价格便宜,DeepSeek能够爆火,还有一个重要原因就是开源,它支持免费商用、任意修改以及衍生开发。
新模型发布后,DeepSeek,彻底火了。这两天,无论是科技界,还是投资界,几乎都在谈论DeepSeek。
受相关消息提振,A股多只概念股表现强势,浙江东方、每日互动、华金资本涨停。截至收盘,多支概念股涨幅超10%。
专家表示,未来在模型性价比持续提升下,国内AI应用依托丰富生态和成熟流量将在各领域加速落地。
业内人士表示,DeepSeek创造的行业奇迹,打破了只有烧钱才能出成果的这样一个固有的一个认知。除了堆算力,通过优化算法和模型架构,同样可以作出成功的大模型产品。
编辑: | 徐慷 |
剑网行动举报电话:12318(市文化执法总队)、021-64334547(市版权局)
Copyright © 2016 Kankanews.com Inc. All Rights Reserved. 看东方(上海)传媒有限公司 版权所有
全部评论
暂无评论,快来发表你的评论吧