About 51 results
Open links in new tab
  1. DeepSeek 更新两个 v3.2 新模型,这次有哪些亮点?

    Dec 1, 2025 · 看上去,DeepSeek 似乎花了一整年的时间,只从 V3 走到了 V3.2,但实际上,DeepSeek 这一年来就是在做一件事情: 如何在不增加模型规模的前提下,通过架构优化和强化学习,不断提 …

  2. OpenAI GPT-5 和 DeepSeek 等 AI 工具均向用户免费,免费 ...

    你可以把DeepSeek和OpenAI看作是平台型应用,免费但钱景无限,类似于微信、谷歌搜索,虽然现在体量和用户达不到,但趋势很明显。 这些平台型应用都是免费的,看不出有什么盈利的方向,但其实 …

  3. DeepSeek-V3.2-Exp版本更新,有哪些信息值得关注?

    DeepSeek V3.2,可以说是算法同学最想要、最符合直觉的top 2048 token的sparse attention了,然而,经历过这场适配才能知道,背后有多少infra的坑要踩。 太不容易了,三个时区的同学连轴转一个 …

  4. 如何评价 DeepSeek 的 DeepSeek-V3 模型? - 知乎

    尽管DeepSeek-V3展示了per-tile和per-group量化对于模型收敛的重要性,论文中并没有给出对应的FP8矩阵乘法的算子效率。 另外,论文中缺乏per-token加per-channel量化的讨论,不清楚这种实现 …

  5. deepseek官网地址告诉我? - 知乎

    Feb 2, 2025 · DeepSeek,特别是V3版本,因其十分有效的控制训练模型成本和开源免费的模式震惊全球,登顶应用商店的下载排行榜,甚至重创国外的科技股,而且截止到写稿日期(2025年2月9日), …

  6. 如何理解 DeepSeek 最新提出的 mHC 架构? - 知乎

    而DeepSeek的这个选择,简直是神来之笔。 具体来看看双随机矩阵的一些性质,你就能明白Deepseek这样选择的深意。 先说谱范数的事儿。 双随机矩阵有个非常好的性质——它的谱范数, …

  7. deepseek开始会员收费了吗? - 知乎

    Mar 20, 2025 · deepseek-chat 模型已经升级为 DeepSeek-V3;deepseek-reasoner 模型为新模型 DeepSeek-R1。 思维链为deepseek-reasoner模型在给出正式回答之前的思考过程,其原理详见 推理 …

  8. 使用Deepseek需要付费的吗? - 知乎

    Apr 3, 2025 · 2、阿里云百炼新人可领取百万token3: bailian.console.aliyun.com 此外,DeepSeek还为企业提供定制化的解决方案,这类服务通常需要根据具体需求协商价格。 所以,普通用户可以免费 …

  9. 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用?

    Feb 20, 2025 · 都说接入的DeepSeek是满血版,为什么感觉还是官方的好用? 接入DeepSeek的腾讯元宝,纳米,秘塔都说是满血版,但是同一个问题,我感觉解答总是不如官网细致合理,上下文联系也 …

  10. DeepSeek 更新后被吐槽变冷变傻,你感受到了吗?为什么 ...

    DeepSeek 更新后被吐槽变冷变傻,你感受到了吗? 为什么会出现这种情况? 2月11日,深度求索(DeepSeek)悄悄地对其旗舰模型进行灰度测试。 据科创板日报报道,多名用户反馈,DeepSeek …