第(2/3)页 三藩市先锋大厦。 先锋大厦说是大厦,实际只有三层楼,看上去就像刷了蓝绿色漆面的老工厂。 二层的一侧,二十多个衣冠不整蓬头垢面的年轻人或三三两两或各自为战,眼睛都盯着面前的数块电脑屏幕, “成功了?”穿着一件黑T恤的埃隆马斯克双臂抱胸,头发凌乱。 “没有,训练损失值始终是一条线,失败了。”伊利亚虽然面无表情,但眼中却闪过一丝失望。 “Fxxk!!!橘子在这种学习率下,为什么不会梯度爆炸?”布洛克曼气愤的锤了一下桌子,“他们是怎么做到的?除了注意力机制,他们一定还使用了其他机制!” 半个月了,他们自从拿到橘子大模型内测权限后第二天,就展开了对橘子大模型的逆向工程。 这种逆向太难了,毕竟橘子大模型的运行是在柚子科技服务器上的,而不是在openAI的电脑本地。 但从接口和数据上,其实是能看出一些端倪的。 而且经过柚子科技的证实,橘子大模型在架构上融入了注意力机制。 注意力机制并非AI研究的热门方向,准确的说,这个机制是前年才刚刚被蒙特利尔大学的德米特里巴赫达瑙在一篇关于机器翻译的论文中偶然间提到的。 这个机制解决了序列到序列模型在处理长序列时的信息压缩问题。 但也仅此而已,并没有掀起太大的水花。 可随着两周前柚子科技公开证实了其开发的橘子大模型中应用了注意力机制,巴赫达瑙两年前发的这篇论文一下子火了起来。 短短两周时间,引用量就多了好几百。 目前所有深度学习领域的开发者,都在研究,如何应用注意力机制开发出类似橘子的大模型。 而就在柚子科技结束橘子大模型的内测,宣布一周后将进行规模为三万人的大型公测的当天下午,一记重磅炸弹再次炸沉了科技圈。 “千寻宣布,完成全球首个AGI——“闻君一言”的开发,“闻君一言”将同样于一周后开始公测。” “据千寻内部透露,现在千寻高度怀疑橘子大模型就是柚子科技窃取了‘闻君一言’的代码做出的套壳产品,橘子大模型与‘闻君一言’高度相似,目前正在搜集相关证据” “千寻AI负责人吴恩德闪电离职,疑似与柚子科技存在利益输送!” “吴恩德发布声明,并未负责过‘闻君一言’的开发工作,拒绝对此发表任何意见。” …… 千寻的公告及公告中所附的“闻君一言”宣传影像,就像一颗数千万吨的深水炸弹,一经发布,就掀起了一场海啸。 柚子科技怎么没有回应? 难道真的是他们抄袭了千寻的产品? “我就说嘛,一个小公司,怎么可能做出这种产品,肯定是偷的,上次fb也说他们是偷的。” “让子弹再飞一会儿。” “飞个屁啊,用屁股想都能想明白。” “如果真的是柚子科技窃取了千寻的技术,为什么阿法狗的时候千寻没有发声?” “估计当时千寻还没有找到证据吧。” 第(2/3)页