• 4月17日,据英国《金融时报》报道,英伟达CEO黄仁勋今日(4月17日)访问北京并会见了生成式人工智能初创公司DeepSeek的创始人梁文峰,讨论如何为中国设计下一代芯片,以满足客户需求以及中美双方的监管要求。
    4月17日,据英国《金融时报》报道,英伟达CEO黄仁勋今日(4月17日)访问北京并会见了生成式人工智能初创公司DeepSeek的创始人梁文峰,讨论如何为中国设计下一代芯片,以满足客户需求以及中美双方的监管要求。
    Like
    1
    · 0 التعليقات ·0 المشاركات ·274 مشاهدة ·0 معاينة
  • DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、APP、小程序试用体验,API接口和使用方式保持不变。
    DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、APP、小程序试用体验,API接口和使用方式保持不变。
    Angry
    1
    · 0 التعليقات ·0 المشاركات ·367 مشاهدة ·0 معاينة
  • Manus的创始人自己承认,他们家产品是拿阿里千问大模型搞出来的。这事儿一爆出来,直接证明阿里在这波超火的AI革命里,已经狠狠拿捏住优势地位!

    过去那几年,真的有不少人觉得阿里要“凉”了。电商业务被别家分走不少蛋糕,阿里云的增长也慢了下来,大家都有点担心。谁能想到,在人工智能这股大浪潮里,阿里闷声放大招,搞出这么牛的大模型。

    不过,再看看这个Manus,虽说创始人承认用了阿里千问大模型,但它被吹得太过头了,想要真的站稳脚跟,除非能像DeepSeek那样,先得到硅谷大佬们的认可,不然大概率就是火一阵就没影了。
    Manus的创始人自己承认,他们家产品是拿阿里千问大模型搞出来的。这事儿一爆出来,直接证明阿里在这波超火的AI革命里,已经狠狠拿捏住优势地位! 过去那几年,真的有不少人觉得阿里要“凉”了。电商业务被别家分走不少蛋糕,阿里云的增长也慢了下来,大家都有点担心。谁能想到,在人工智能这股大浪潮里,阿里闷声放大招,搞出这么牛的大模型。 不过,再看看这个Manus,虽说创始人承认用了阿里千问大模型,但它被吹得太过头了,想要真的站稳脚跟,除非能像DeepSeek那样,先得到硅谷大佬们的认可,不然大概率就是火一阵就没影了。
    Love
    1
    · 0 التعليقات ·0 المشاركات ·15ميجابايت مشاهدة ·0 معاينة
  • 这段时间,美国政府不断挥动关税大棒,宣布对包括中国在内的多个国家的产品加征关税。结果中国市场没多大反应,美国股市却出现了明显调整,担忧关税拖累美国经济的声音愈加高涨。因为此前美国一系列加征关税的做法已经证明,关税最终由美国消费者埋单,美国的贸易逆差没有缩小,制造业的竞争力也没有上升。

    除了加征关税,美国遏制、打压中国还有一个非常典型的领域,那就是在高科技领域对中国进行封锁限制,尤其是芯片行业。但结果呢?不仅没卡住中国的脖子,反而极大刺激了中国芯片半导体等高科技产业的发展,自主创新的热潮在中国蔚然成风。3月5日,英国《金融时报》就刊发文章,介绍了美国的压制是如何给中国的芯片产业“助攻”的。文章写道,华盛顿最大的误判可能不是低估了中国的芯片制造能力,而是忽视了推动技术进步的力量。

    这篇题为“美国刺激了中国芯片产业”的专栏文章开头先举了华为取得成功的例子。文章写道,英伟达正在中国面临一个真正的竞争对手。美国的出口管制本来旨在切断中国获得先进芯片和芯片制造设备的渠道,确保中国不会出现任何竞争对手。但这种试图逼停中国芯片制造业的制裁反而刺激了它的发展,加速了一个意想不到的挑战者的崛起:华为。

    文章称,悖论很明显:如果美国从未实施芯片出口禁令,这家中国大陆企业或许还将继续依赖台湾半导体制造商生产芯片。那样的话,中国的芯片可能仍将依赖外部技术,缺乏创新的紧迫感。相反,通过制裁华为并切断其与美国先进芯片的联系,华盛顿已成为其试图阻止的中国企业技术自给自足的最大推动者。

    文章认为,人工智能领域的一个根本性转变可能对华为有利。人工智能可以分为两个市场:一个是训练——也就是创建人工智能模型的地方;一个是推理——部署人工智能以生成现实世界响应的地方。训练进行一次,推理就可能在现实世界的使用中进行数十亿次。这种向推理密集型工作的转变标志着芯片公司竞争的下一阶段。

    例如,创建OpenAI的GPT-4人工智能模型需要高性能训练芯片。但一旦训练完成,将其部署给用户就需要大量低功耗推理芯片。随着人工智能推理越来越普遍,对经济高效芯片的需求将会大增。在中国,高性能人工智能芯片供应不足,但仍可通过增加芯片数量弥补这一差距,并行处理使多个芯片协同工作,分配工作负载并将结果合并为最终输出。

    无独有偶,2月22日,美国《财富》杂志网站也刊文称,由于美国对中国的出口管制,美国芯片制造行业正“敲响警钟”。文章也介绍了美国的种种打压限制,正刺激中国芯片行业的自主创新和发展,不再那么依赖美国企业。目前阶段,中国先进芯片的水平可能还赶不上美国,但毕竟成熟芯片才是需求量最大的,这方面中国又是最大的市场,从而支撑了中国芯片行业的发展,美国企业则开始因美国政府的政策受到反噬。

    眼下,人工智能成为重点发展领域,华盛顿在这方面不只是试图阻止中国,而是希望通过“芯墙”将优势完全集中垄断在美国,但DeepSeek等中国开源模型的出现也再次证明,哪里有封锁哪里就有突围。美国消费者新闻与商业频道(CNBC)上月在一篇报道中,援引了美国布鲁金斯学会非常驻高级研究员、加州大学洛杉矶分校教授约翰?维拉塞诺(John Villasenor)一句很形象的话:“10年后,当我们回首往事时就会意识到,2020年代中期,美国政府试图限制150个国家的人发展快速计算的能力,是有多么异想天开。”
    这段时间,美国政府不断挥动关税大棒,宣布对包括中国在内的多个国家的产品加征关税。结果中国市场没多大反应,美国股市却出现了明显调整,担忧关税拖累美国经济的声音愈加高涨。因为此前美国一系列加征关税的做法已经证明,关税最终由美国消费者埋单,美国的贸易逆差没有缩小,制造业的竞争力也没有上升。 除了加征关税,美国遏制、打压中国还有一个非常典型的领域,那就是在高科技领域对中国进行封锁限制,尤其是芯片行业。但结果呢?不仅没卡住中国的脖子,反而极大刺激了中国芯片半导体等高科技产业的发展,自主创新的热潮在中国蔚然成风。3月5日,英国《金融时报》就刊发文章,介绍了美国的压制是如何给中国的芯片产业“助攻”的。文章写道,华盛顿最大的误判可能不是低估了中国的芯片制造能力,而是忽视了推动技术进步的力量。 这篇题为“美国刺激了中国芯片产业”的专栏文章开头先举了华为取得成功的例子。文章写道,英伟达正在中国面临一个真正的竞争对手。美国的出口管制本来旨在切断中国获得先进芯片和芯片制造设备的渠道,确保中国不会出现任何竞争对手。但这种试图逼停中国芯片制造业的制裁反而刺激了它的发展,加速了一个意想不到的挑战者的崛起:华为。 文章称,悖论很明显:如果美国从未实施芯片出口禁令,这家中国大陆企业或许还将继续依赖台湾半导体制造商生产芯片。那样的话,中国的芯片可能仍将依赖外部技术,缺乏创新的紧迫感。相反,通过制裁华为并切断其与美国先进芯片的联系,华盛顿已成为其试图阻止的中国企业技术自给自足的最大推动者。 文章认为,人工智能领域的一个根本性转变可能对华为有利。人工智能可以分为两个市场:一个是训练——也就是创建人工智能模型的地方;一个是推理——部署人工智能以生成现实世界响应的地方。训练进行一次,推理就可能在现实世界的使用中进行数十亿次。这种向推理密集型工作的转变标志着芯片公司竞争的下一阶段。 例如,创建OpenAI的GPT-4人工智能模型需要高性能训练芯片。但一旦训练完成,将其部署给用户就需要大量低功耗推理芯片。随着人工智能推理越来越普遍,对经济高效芯片的需求将会大增。在中国,高性能人工智能芯片供应不足,但仍可通过增加芯片数量弥补这一差距,并行处理使多个芯片协同工作,分配工作负载并将结果合并为最终输出。 无独有偶,2月22日,美国《财富》杂志网站也刊文称,由于美国对中国的出口管制,美国芯片制造行业正“敲响警钟”。文章也介绍了美国的种种打压限制,正刺激中国芯片行业的自主创新和发展,不再那么依赖美国企业。目前阶段,中国先进芯片的水平可能还赶不上美国,但毕竟成熟芯片才是需求量最大的,这方面中国又是最大的市场,从而支撑了中国芯片行业的发展,美国企业则开始因美国政府的政策受到反噬。 眼下,人工智能成为重点发展领域,华盛顿在这方面不只是试图阻止中国,而是希望通过“芯墙”将优势完全集中垄断在美国,但DeepSeek等中国开源模型的出现也再次证明,哪里有封锁哪里就有突围。美国消费者新闻与商业频道(CNBC)上月在一篇报道中,援引了美国布鲁金斯学会非常驻高级研究员、加州大学洛杉矶分校教授约翰?维拉塞诺(John Villasenor)一句很形象的话:“10年后,当我们回首往事时就会意识到,2020年代中期,美国政府试图限制150个国家的人发展快速计算的能力,是有多么异想天开。”
    Love
    1
    · 0 التعليقات ·0 المشاركات ·31ميجابايت مشاهدة ·0 معاينة
  • 豆包和百度的AI Agent也有各自的市场定位和技术优势,未来它们可能会通过技术升级或差异化竞争,缩小与Manus的差距,而且这两家公司的资金实力更强。

    对于Manus的火爆,很多人持观望态度。不止一位投资人对「定焦One」表示,虽然他们很看好今年AI Agent的发展,但由于之前有类似AI程序员Devin的出现,Manus并没有太惊艳到他们,核心技术问题也没有得到根本性提升。

    此刻,相比DeepSeek护城河较低的Manus,已经有不少开源复刻版项目出现,留给Manus的时间不多了。
    豆包和百度的AI Agent也有各自的市场定位和技术优势,未来它们可能会通过技术升级或差异化竞争,缩小与Manus的差距,而且这两家公司的资金实力更强。 对于Manus的火爆,很多人持观望态度。不止一位投资人对「定焦One」表示,虽然他们很看好今年AI Agent的发展,但由于之前有类似AI程序员Devin的出现,Manus并没有太惊艳到他们,核心技术问题也没有得到根本性提升。 此刻,相比DeepSeek护城河较低的Manus,已经有不少开源复刻版项目出现,留给Manus的时间不多了。
    Haha
    1
    · 0 التعليقات ·0 المشاركات ·46ميجابايت مشاهدة ·0 معاينة
  • “AI一天,人间一年”。

    3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷入争议旋涡。发布仅两天,Manus的口碑经历了数次剧烈反转。

    Manus官方将自己定义为一款连接思维与行动的通用人工智能代理,特点是擅长处理各种任务,不仅能思考(听懂复杂指令进行推理),还能交付成果(顺滑对接完成该任务的各个环节,将最终结果给到用户)。

    举个简单的例子。

    如果让Manus筛选简历,用户只需将存有多份简历的压缩包直接发给Manus,剩下的任务就全部交由它完成。Manus会自动解压缩文件,浏览找出重要信息,给出候选人评估结果,还可以将候选人姓名和重要信息做成表格,方便用户查阅。

    在此过程中,用户不仅可以关闭电脑,还能随时添加其他任务。

    有了Manus,普通HR的日常工作似乎变得“多余”。这也让许多人惊呼,取代打工人的“AI牛马”真的来了。

    不过,Manus属于“黑红”体质。

    发布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名头,风光无限。不久后质疑声接踵而至,有人认为它过度营销,技术没有太大突破实为“套壳”,噱头远大于实际能力。

    紧接着,其内测邀请码被炒到10万元天价的消息传出;它在X平台上的官方账号被冻结,显示原因为“违反平台规则”。随后,Manus联合创始人兼首席科学家季逸超公开回应称,账号被冻结可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。

    这一系列事件,更加深了外界对Manus的疑虑。这款备受瞩目的产品,究竟是真正的技术革新,还是营销噱头?未来又能火多久?
    “AI一天,人间一年”。 3月6日凌晨,Manus亮相,瞬间点燃了整个科技圈。它被称为全球首款通用型AI Agent(人工智能代理)产品,由国内一家创业团队——Monica.im打造。但这场技术狂欢,迅速陷入争议旋涡。发布仅两天,Manus的口碑经历了数次剧烈反转。 Manus官方将自己定义为一款连接思维与行动的通用人工智能代理,特点是擅长处理各种任务,不仅能思考(听懂复杂指令进行推理),还能交付成果(顺滑对接完成该任务的各个环节,将最终结果给到用户)。 举个简单的例子。 如果让Manus筛选简历,用户只需将存有多份简历的压缩包直接发给Manus,剩下的任务就全部交由它完成。Manus会自动解压缩文件,浏览找出重要信息,给出候选人评估结果,还可以将候选人姓名和重要信息做成表格,方便用户查阅。 在此过程中,用户不仅可以关闭电脑,还能随时添加其他任务。 有了Manus,普通HR的日常工作似乎变得“多余”。这也让许多人惊呼,取代打工人的“AI牛马”真的来了。 不过,Manus属于“黑红”体质。 发布之初,它被冠以“炸裂”、“拳打ChatGPT”、“比肩DeepSeek”、“震撼硅谷”等名头,风光无限。不久后质疑声接踵而至,有人认为它过度营销,技术没有太大突破实为“套壳”,噱头远大于实际能力。 紧接着,其内测邀请码被炒到10万元天价的消息传出;它在X平台上的官方账号被冻结,显示原因为“违反平台规则”。随后,Manus联合创始人兼首席科学家季逸超公开回应称,账号被冻结可能与第三方提及加密货币诈骗有关,该领域与Manus的运营完全无关。 这一系列事件,更加深了外界对Manus的疑虑。这款备受瞩目的产品,究竟是真正的技术革新,还是营销噱头?未来又能火多久?
    0 التعليقات ·0 المشاركات ·24ميجابايت مشاهدة ·0 معاينة
  • 是不是我脑子太笨了,昨晚国内发布manus顶级AGl软件怎么下载和使用,今天早上开始研究网上学习就下载不了,还要邀请码,邀请码哪里买,有没有便宜点的,10万价格太高了点,我非常想下载成功然后学习使用,,毕竟超越deepseek,属于全球顶级科技软件,请求请求各大网友指点,谢谢#ai提高效率。# #下载得a1生成#
    是不是我脑子太笨了,昨晚国内发布manus顶级AGl软件怎么下载和使用,今天早上开始研究网上学习就下载不了,还要邀请码,邀请码哪里买,有没有便宜点的,10万价格太高了点,我非常想下载成功然后学习使用,,毕竟超越deepseek,属于全球顶级科技软件,请求请求各大网友指点,谢谢#ai提高效率。# #下载得a1生成#
    Like
    1
    · 0 التعليقات ·0 المشاركات ·49ميجابايت مشاهدة ·0 معاينة
  • 国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。
    国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。
    DeepSeek“开源周”收官,连续五天到底都发布了什么?
    hot166.com
    全球开发者可基于这些开源项目进行二次开发与改进。全球开发者可基于这些开源项目进行二次开发与改进。 界面新闻记者 | 宋佳楠 2月28日,国内AI明星公司DeepSeek为期五天的 “开源周” 告一段落。其于2月24日正式启动,计划开源5个代码库,旨在以完全透明的方式与全球开发者社区分享其在通用人工智能(AGI)领域的研究进展。 回顾这五日,其最先开源的是FlashMLA,这是专为英伟达Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列设计。 在自然语言处理等任务里,数据序列长度不一,传统处理方式会造成算力浪费。而FlashMLA如同智能交通调度员,能依据序列长度动态调配计算资源。例如在同时处理长文本和短文本时,它可以精准地为不同长度的文本分配恰当的算力,避免 “大马拉小车” 或资源不足的情况。发布6小时内,GitHub上收藏量突破5000次,被认为对国产GPU性能提升意义重大。 第二日开源的是DeepEP。DeepEP是首个用于MoE(混合专家模型)训练和推理的开源EP通信库。MoE模型训练和推理中,不同专家模型需高效协作,这对通信效率要求极高。DeepEP支持优化的全对全通信模式,就像构建了一条顺畅的高速公路,让数据在各个节点间高效传输。 它还原生支持FP8低精度运算调度,降低计算资源消耗,并且在节点内和节点间都支持NVLink和RDMA,拥有用于训练和推理预填充的高吞吐量内核以及用于推理解码的低延迟内核。简单来说,它让MoE模型各部分间沟通更快、消耗更少,提升了整体运行效率 。 第三日是DeepGEMM,矩阵乘法加速库,为V3/R1的训练和推理提供支持。通用矩阵乘法是众多高性能计算任务的核心,其性能优化是大模型降本增效的关键。DeepGEMM采用了DeepSeek-V3中提出的细粒度scaling技术,仅用300行代码就实现了简洁高效的FP8通用矩阵乘法。 它支持普通GEMM以及专家混合(MoE)分组GEMM,在Hopper GPU上最高可达到1350+ FP8 TFLOPS(每秒万亿次浮点运算)的计算性能,在各种矩阵形状上的性能与专家调优的库相当,甚至在某些情况下更优,且安装时无需编译,通过轻量级JIT模块在运行时编译所有内核。 第四日开源优化并行策略(DualPipe和EPLB)。DualPipe是一种用于V3/R1训练中计算与通信重叠的双向管道并行算法。以往的管道并行存在 “气泡” 问题,即计算和通信阶段存在等待时间,造成资源浪费。DualPipe通过实现 “向前” 与 “向后” 计算通信阶段的双向重叠,将硬件资源利用率提升超30%。 EPLB则是一种针对V3/R1的专家并行负载均衡器。基于混合专家(MoE)架构,它通过冗余专家策略复制高负载专家,并结合启发式分配算法优化GPU间的负载分布,减少GPU闲置现象。 在第五日,DeepSeep开源了面向全数据访问的推进器3FS,也就是Fire-Flyer文件系统。它是一个专门为了充分利用现代SSD和RDMA网络带宽而设计的并行文件系统,能实现高速数据访问,提升AI模型训练和推理的效率。 此外,DeepSeek还开源了基于3FS的数据处理框架Smallpond,它可以进一步优化3FS的数据管理能力,让数据处理更加方便、快捷。 全球开发者可基于上述开源项目进行二次开发与改进,有望推动AI技术在更多领域的应用。
    0 التعليقات ·0 المشاركات ·50ميجابايت مشاهدة ·0 معاينة
  • 当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。
    当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。
    回顾DeepSeek“开源周”:越是开源,越能扩大生态
    hot166.com
    当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。 界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 2月最后一天,DeepSeek开源周正式收官。连续五天,这家公司刷新自己在大模型开源生态中的技术地位。 五天一共对应五个开源代码库,分别是FlashMLA,DeepEP,DeepGEMM,DualPipe和EPLB对应的优化并行策略,以及推进器3FS和轻量化数据处理工具Smallpond。在Github,这些项目累计获得星星数量接近2.8万颗。 首日的FlashMLA最为重磅。DeepSeek对其核心介绍是,这是一款面向Hopper GPU(英伟达第九代GPU架构)的高效MLA解码内核(MLA decoding kernel ),并针对可变长度序列的服务场景进行了优化。 MLA——Multi-Head Latent Attention(多头潜在注意力机制)是DeepSeek在V2时期的重要创新,也是降本的关键。FlashMLA则是针对MLA在解码阶段的注意力加速器。 用户输入的自然语言数据序列往往长短不一,如果只按照传统注意力机制会造成算力资源浪费。FlashMLA可以针对不同token长度动态调配计算资源。总体上来说,这还是DeepSeek就H800持续压榨其硬件性能利用效率——这也是DeepSeek素来最擅长的能力之一。 次日的DeepEP核心目的仍在于拉升GPU效能。这是一个专为专家混合(MoE)和专家并行(EP)量身定制的通信库。 简单而言,它通过建立一个全对全的中间系统,高效协同专家模型之间的通信,实现高吞吐量和低延迟的兼顾,并且支持FP8等低精度操作以降低计算资源消耗,最终大幅提升了大模型的训练和推理效率。 第三天的DeepGEMM来自DeepSeek-V3,是一个可用于FP8精度的通用矩阵乘法(GEMM)加速库。 通用矩阵乘法是大模型提高训练效率的重要一环,但往往还是会造成巨大的计算量。DeepGEMM的目的是在降低消耗、提升速度的同时,还能保持计算的准确度。它先是利用FP8这一低精度但快速的方式完成计算,再利用英伟达的CUDA核心对其进行精加工。 事实上,英伟达基于CUDA架构打造的CUTLASS也是用于加速这类计算,但更适用于通用且强性能的矩阵加速库。而DeepGEMM不仅在性能上可以与专家调优的库相当,而且更加轻量化,仅用300行代码就实现,且安装时无需编译,通过轻量级JIT模块就可在运行时编译所有内核。 第四天是由DualPipe和EPLB构成的优化并行策略。 DualPipe是一种双向并行算法,简单而言,它以“双向”的调度方式,在参数翻倍的情况下,大幅减少了流水线并行过程中,因为不同“工序”进程快慢而产生浪费效率的“气泡”,也就是计算和通信阶段的等待时间。 EPLB是一种“专家并行负载均衡器”,可对MoE架构中的高负载专家复制为“冗余专家”,以分担同类任务计算量,并利用“启发式分配算法”,将高负载专家分配到低负载显卡上,以优化GPU之间的负载均衡。它还会尽量将需要高度协同的专家放置在同一节点上,以提高通信效率。 最后一天是3FS(Fire-Flyer File System)以及数据处理框架Smallpond。 3FS是一个可实现高速数据访问,提高AI模型训练和推理效率的分布式文件系统。它相当于利用SSD(用于数据存储与加载、实现快速数据交换等)以及RDMA(支持分布式训练通信和高性能网络架构等)建立一个共享存储层,使模型对于资源调取和数据传输,都更为极速、自动化且高吞吐。 在此基础上,Smallpond可以进一步优化3FS的数据管理能力,能够处理PB级别(1PB 数据量大约可以存储20万部5GB大小的高清电影)的数据。 需要指出的是,DeepSeek开源周的所有内容,几乎都是“开箱即用”,团队均提供了相对完整细致的操作指南。 一名AI大模型行业人士对界面新闻记者表示,这五项开源内容的重要意义相当,都是针对训练效率的优化细节。不过他指出,DeepEP可能相对突出,因为对MoE的提升尤为明显。 另一名关注大模型行业技术进展的投资人同样表示,这些内容均可以视为DeepSeek在AI Infra层的优异表现。 他认为,针对AI Infra的优化措施其实存在于任何一家AI大模型公司,而DeepSeek之所以选择开源,除了可以诉诸其技术理想外,一个核心目的还是在于让业界能够更好部署和使用其开源模型,建立其更大的开源生态。“从战略上来说,这也是一个很明确的先后步骤。” 此外,对于DeepSeek开源周的动作,还有一种讨论声音是它看起来与英伟达的硬件生态绑定更深了。 但前述受访者认为这是一条合理路径。他指出,如果是针对国产硬件生态,DeepSeek还可以另起一套代码库来适配,两者不是非此即彼的关系。与此同时,当DeepSeek具备的是面向全球大模型的生态视野,针对英伟达GPU展示优化能力也是一种必要动作。 事实上,在DeepSeek选择开源这一周,海内外大模型发布动作频繁且热闹,其中包括腾讯新一代快思考模型混元Turbo S,阿里通义千问推理模型QwQ-Max预览版,以及Anthropic的Claude 3.7 Sonnet,和OpenAI万众瞩目的GPT-4.5。 出人意料的是,GPT-4.5并未激起巨大水花,甚至落下一众令人失望的评价。除了各方面基准测试超过4o,并在准确度和幻觉率上有了明显优化,GPT-4.5没有像从前新模型发布那样让人“震撼”的表现。 唯一的震撼或许在于定价。GPT-4.5每百万tokens输入为75美元,输出为150美元,价格分别达到了DeepSeek-V3的280倍及150倍。 OpenAI CEO Sam Altman在X平台上表示,GPT-4.5将是其最后一个非链式思维模型,未来发布的GPT-5将是一个包含o3在内的多种技术混合模型。这俨然让GPT-4.5的存在感降到更低。 回到DeepSeek的开源动作上,到目前为止,这家公司在绝大多数的算法和工程细节上都毫无保留。但它仍然将一些难以复制的核心能力牢牢掌握在自己手上,例如对于模型训练深层次的know how,以及训练数据方面的细节,这是达成DeepSeek式创新的核心秘密所在。
    Haha
    1
    · 0 التعليقات ·0 المشاركات ·41ميجابايت مشاهدة ·0 معاينة
  • 据字节跳动技术团队微信公众号3月3日消息,字节跳动宣布中国首个AI原生集成开发环境(AI IDE)Trae国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型。据介绍,Trae国内版不仅针对中国开发场景和习惯进行了一些优化,后续还即将支持模型自定义,用户可以根据自己的喜好,接入合适的大模型API。
    据字节跳动技术团队微信公众号3月3日消息,字节跳动宣布中国首个AI原生集成开发环境(AI IDE)Trae国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型。据介绍,Trae国内版不仅针对中国开发场景和习惯进行了一些优化,后续还即将支持模型自定义,用户可以根据自己的喜好,接入合适的大模型API。
    0 التعليقات ·0 المشاركات ·33ميجابايت مشاهدة ·0 معاينة
  • 今日,中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,让编程速度起飞。

    作为更贴合中国开发者开发习惯与开发场景的AI IDE,Trae 以动态协作为核心,打造了一种人机协同,人与AI互相增强的全新开发体验,助力开发者高效应对复杂技术挑战,释放创新潜能。人与AI默契协作,全新开发体验

    AI技术的快速发展,让开发方式面临着前所未有的变革,开发者亟需更高效率、更智能化的工具支持。Trae 应需而发,定位为“智能协作AIIDE”,以“人机协同、互相增强”为核心理念,对代码补全,代码理解,Bug修复,基于自然语言生成代码等开发过程全场景都有非常好的适应性,不仅是一个开发工具,更是一位全天候开发“拍档”。

    而基于人与AI协作开发的理念,无论是人还是AI,Trae 让恰当的对象,在恰当的时间接管工作,确保每一个代码片段都是人与AI共创的最优结果,为开发者带来更加高效、优质的开发体验。

    更好、更快、更准确

    Trae 为开发者打造了前所未有的开发体验,帮助开发者更快速,更准确,更高质量的完成开发需求。

    全新 Builder 模式能充分利用AI的能力,无论是初学者还是资深的开发者,都能够轻松通过自然语言描述迅速的,端到端的生成应用:只需要用简单的语言描述需求,Trae 就可以迅速搭建起项目框架,还能持续进行调优修改,产出可用代码。这种智能化的"思想到代码"直通车能力,全程助力开发者将需求端到端完美落地,极大缩短了项目筹备周期,为高效开发奠定坚实基础。

    在代码理解维度,Trae 的能力边界实现了质的突破,凭借对开发项目上下文的极致理解,深入剖析代码仓库,实时获取IDE中的各种环境上下文,精准洞察开发者的需求,从而为开发过程提供最为契合、准确的解决方法。

    针对需求沟通效率问题,Trae 的实时代码续写技术可基于开发项目整体上下文进行智能补全,提升编码效率,而在交互体验方面,开发者可以便捷地将 AI 生成的代码一键应用到多个模块,还能根据实际需求随时灵活调整指令,并实时预览 AI 生成代码的前端效果。

    在通往AI Coding 的 AGI 时代里,有众多 AI 辅助编程工具出现,但Trae 希望成为更可靠的、值得开发者信赖的“AI 工程师”(TheRealAIEngineer):通过真正的 AI 编程 Agent, 帮助开发者实现「从需求到落地」的端到端全链路开发闭环。Trae 相信,一个好的“AI 工程师”,不仅是一个好用的工具,更是一个多面手AI合作伙伴,可以更好的帮助开发者解决多种问题,让其有精力去重新构想价值创造的方式,触摸创造力的天花板。

    即刻体验畅快编程

    Trae 国内版不仅针对中国开发场景和习惯进行了一些优化,后续还即将支持模型自定义,用户可以根据自己的喜好,接入合适的大模型API,希望给开发者带来全新的AI IDE 开发体验。

    即刻访问官网trae.com.cn,下载安装包,和我们一起,解锁AI驱动的开发新未来~
    今日,中国首个AI原生集成开发环境(AI IDE)Trae 国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型,让编程速度起飞。 作为更贴合中国开发者开发习惯与开发场景的AI IDE,Trae 以动态协作为核心,打造了一种人机协同,人与AI互相增强的全新开发体验,助力开发者高效应对复杂技术挑战,释放创新潜能。人与AI默契协作,全新开发体验 AI技术的快速发展,让开发方式面临着前所未有的变革,开发者亟需更高效率、更智能化的工具支持。Trae 应需而发,定位为“智能协作AIIDE”,以“人机协同、互相增强”为核心理念,对代码补全,代码理解,Bug修复,基于自然语言生成代码等开发过程全场景都有非常好的适应性,不仅是一个开发工具,更是一位全天候开发“拍档”。 而基于人与AI协作开发的理念,无论是人还是AI,Trae 让恰当的对象,在恰当的时间接管工作,确保每一个代码片段都是人与AI共创的最优结果,为开发者带来更加高效、优质的开发体验。 更好、更快、更准确 Trae 为开发者打造了前所未有的开发体验,帮助开发者更快速,更准确,更高质量的完成开发需求。 全新 Builder 模式能充分利用AI的能力,无论是初学者还是资深的开发者,都能够轻松通过自然语言描述迅速的,端到端的生成应用:只需要用简单的语言描述需求,Trae 就可以迅速搭建起项目框架,还能持续进行调优修改,产出可用代码。这种智能化的"思想到代码"直通车能力,全程助力开发者将需求端到端完美落地,极大缩短了项目筹备周期,为高效开发奠定坚实基础。 在代码理解维度,Trae 的能力边界实现了质的突破,凭借对开发项目上下文的极致理解,深入剖析代码仓库,实时获取IDE中的各种环境上下文,精准洞察开发者的需求,从而为开发过程提供最为契合、准确的解决方法。 针对需求沟通效率问题,Trae 的实时代码续写技术可基于开发项目整体上下文进行智能补全,提升编码效率,而在交互体验方面,开发者可以便捷地将 AI 生成的代码一键应用到多个模块,还能根据实际需求随时灵活调整指令,并实时预览 AI 生成代码的前端效果。 在通往AI Coding 的 AGI 时代里,有众多 AI 辅助编程工具出现,但Trae 希望成为更可靠的、值得开发者信赖的“AI 工程师”(TheRealAIEngineer):通过真正的 AI 编程 Agent, 帮助开发者实现「从需求到落地」的端到端全链路开发闭环。Trae 相信,一个好的“AI 工程师”,不仅是一个好用的工具,更是一个多面手AI合作伙伴,可以更好的帮助开发者解决多种问题,让其有精力去重新构想价值创造的方式,触摸创造力的天花板。 即刻体验畅快编程 Trae 国内版不仅针对中国开发场景和习惯进行了一些优化,后续还即将支持模型自定义,用户可以根据自己的喜好,接入合适的大模型API,希望给开发者带来全新的AI IDE 开发体验。 即刻访问官网trae.com.cn,下载安装包,和我们一起,解锁AI驱动的开发新未来~
    Like
    1
    · 0 التعليقات ·0 المشاركات ·36ميجابايت مشاهدة ·0 معاينة
  • “AI作文全判0分”?各高校“立规矩”了!
    最近,DeepSeek火爆出圈,人工智能热度再上新高。在高校,学生们利用AI工具辅助论文写作已越发普遍,相比翻阅厚重的书籍资料或者利用互联网搜索引擎查找资料,借助AI工具让论文撰写方便了很多。但在调查中,记者发现,一些大学生对AI工具产生了依赖,不当使用正呈上升趋势。
    大学生使用AI时
    近三成用于写论文或作业
    动动手指,在聊天框里输入指令,就可以迅速获得一篇像模像样的结课论文。如今,AI工具兴起,成为不少大学生完成报告、论文的“神器”。这是某高校大一年级英语作业群里的一份通告,老师将利用AI工具直接生成的作文全部判了零分。
    “AI作文全判0分”?各高校“立规矩”了! 最近,DeepSeek火爆出圈,人工智能热度再上新高。在高校,学生们利用AI工具辅助论文写作已越发普遍,相比翻阅厚重的书籍资料或者利用互联网搜索引擎查找资料,借助AI工具让论文撰写方便了很多。但在调查中,记者发现,一些大学生对AI工具产生了依赖,不当使用正呈上升趋势。 大学生使用AI时 近三成用于写论文或作业 动动手指,在聊天框里输入指令,就可以迅速获得一篇像模像样的结课论文。如今,AI工具兴起,成为不少大学生完成报告、论文的“神器”。这是某高校大一年级英语作业群里的一份通告,老师将利用AI工具直接生成的作文全部判了零分。
    Like
    1
    · 0 التعليقات ·0 المشاركات ·39ميجابايت مشاهدة ·0 معاينة
الصفحات المعززة