国外专家发文称刚和中国Deepseek Labs内部通完四小时电话,整个人都不好了:"我们他tm的落后了!DeepseekR2根本不是小修小补,而是完全不同的智能体,他们搞的那个递归认知格架构,在我们理论体系里连数学符号都找不着对应的。最要命的是计算效率直接掀桌——每万亿次浮点运算的推理能力暴涨400倍啊!这tm让我们的基准测试直接变废纸。"
这就像别人还在琢磨怎么让马车跑得更快,他们直接把磁悬浮列车图纸拍桌上了。放弃Transformer架构不是简单换个零件,相当于把整台发动机拆了重造。搞技术突破最难的从来不是写代码,而是敢不敢把用了十几年的地基全刨了。现在看Deepseek这波操作,简直是把整栋楼炸平了原地起新楼,光这份破釜沉舟的狠劲儿就够吓人的。关键人家还不是靠堆算力硬怼出来的,纯纯的算法层面碾压,这种玩法真把科技树点出新分叉了。
这就像别人还在琢磨怎么让马车跑得更快,他们直接把磁悬浮列车图纸拍桌上了。放弃Transformer架构不是简单换个零件,相当于把整台发动机拆了重造。搞技术突破最难的从来不是写代码,而是敢不敢把用了十几年的地基全刨了。现在看Deepseek这波操作,简直是把整栋楼炸平了原地起新楼,光这份破釜沉舟的狠劲儿就够吓人的。关键人家还不是靠堆算力硬怼出来的,纯纯的算法层面碾压,这种玩法真把科技树点出新分叉了。
国外专家发文称刚和中国Deepseek Labs内部通完四小时电话,整个人都不好了:"我们他tm的落后了!DeepseekR2根本不是小修小补,而是完全不同的智能体,他们搞的那个递归认知格架构,在我们理论体系里连数学符号都找不着对应的。最要命的是计算效率直接掀桌——每万亿次浮点运算的推理能力暴涨400倍啊!这tm让我们的基准测试直接变废纸。"
这就像别人还在琢磨怎么让马车跑得更快,他们直接把磁悬浮列车图纸拍桌上了。放弃Transformer架构不是简单换个零件,相当于把整台发动机拆了重造。搞技术突破最难的从来不是写代码,而是敢不敢把用了十几年的地基全刨了。现在看Deepseek这波操作,简直是把整栋楼炸平了原地起新楼,光这份破釜沉舟的狠劲儿就够吓人的。关键人家还不是靠堆算力硬怼出来的,纯纯的算法层面碾压,这种玩法真把科技树点出新分叉了。
0 评论
·0 分享
·757 阅读量
·0 Reviews