全自动挂机赚钱 发表于 2026-3-11 16:32:10

印度阿三搞出了自己的主权AI: Sarvam 105B

官方的“底气”:国产算力 + 海量数据<br />
Sarvam AI 官方在 2026 年 3 月 9 日的最新声明中强调:<br />
<br />
训练来源: 使用了印度政府 IndiaAI Mission 提供的 4,096 颗 NVIDIA H100 算力集群,耗时数月。<br />
<br />
语料规模: 声明其 105B 模型是在 12 万亿(12T) Token 上从头练出来的,其中包含了极其大量的 22 种印度本土语言数据。<br />
<br />
架构选择: 采用 MoE(混合专家模型) 架构,总参数 105B,但每次推理仅激活约 10B 参数。<br />
<br />
===========开源社区态度=====================<br />
社区发现 Sarvam 105B 使用了 MLA(Multi-head Latent Attention) 机制。这正是 DeepSeek-V3 能够平衡长文本性能与推理成本的核心秘籍。开发者社区目前的共识是:Sarvam 在架构设计上确实“深度参考”了 DeepSeek。<br />
--------&nbsp;&nbsp;一种技术,谁都可以用。<br />
<br />
尽管它针对印度语做了优化,但部分开发者指出其对代码和通用英语的分词模式与 Qwen(通义千问) 的分词器重合度较高。这导致了“洗稿式训练”(Distillation)的嫌疑。<br />
-------&nbsp; &nbsp;这个嫌疑有问题,关键看重合比例。<br />
<br />
Sarvam 105B 在处理印度语(如印地语、泰米尔语)时表现出了远超 Qwen 和 DeepSeek 的原生能力。这证明它确实投入了真实的国产数据进行大规模预训练或深度微调。<br />
---------&nbsp; &nbsp;这个说明不是纯换皮,多少有点东西,但不能证明,纯自研。

rqp 发表于 2026-3-11 17:50:51

<img src="https://hostloc.com/static/image/smiley/yct/010.gif" smilieid="41" border="0" alt="" />

苇名梁朝伟 发表于 2026-3-11 18:16:42

非常的印度

Bedrocker 发表于 2026-3-11 18:22:32

<img src="https://hostloc.com/static/image/smiley/default/huffy.gif" smilieid="5" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/huffy.gif" smilieid="5" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/huffy.gif" smilieid="5" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/huffy.gif" smilieid="5" border="0" alt="" />

piping 发表于 2026-3-11 18:45:29

很印度,也很中国。算是会抄作业了

scheme 发表于 2026-3-11 19:13:24

很正常,你开源出来他们就能抄作业,再弄点方言蒸馏下,嘿嘿

霸王别姬 发表于 2026-3-11 22:16:12

中国 拆拿 搞出了自己的主权AI

fuckjp 发表于 2026-3-12 09:38:31

其中包含了极其大量的 22 种印度本土语言<br />
<br />
在印度作为母语使用的语言数量有1635种<img src="https://hostloc.com/static/image/smiley/default/sweat.gif" smilieid="10" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/sweat.gif" smilieid="10" border="0" alt="" /><img src="https://hostloc.com/static/image/smiley/default/sweat.gif" smilieid="10" border="0" alt="" />

williamc2 发表于 2026-3-12 10:35:33

正常

yiwuren狗几把 发表于 2026-3-12 17:35:37

<div class="quote"><blockquote><font size="2"><a href="https://hostloc.com/forum.php?mod=redirect&goto=findpost&pid=16667743&ptid=1465292" target="_blank"><font color="#999999">piping 发表于 2026-3-11 18:45</font></a></font><br />
很印度,也很中国。算是会抄作业了</blockquote></div><br />
deepseek?印度就是明着抄,看看他们搞的仿制药
页: [1] 2
查看完整版本: 印度阿三搞出了自己的主权AI: Sarvam 105B