手机浏览器扫描二维码访问
前世的通识是,该模式计算效率极高,但精度损失更大,适用范围非常有限。
往往是在训练完成之后,进行FP8的格式转换,以节约模型的推理使用成本。直接在训练的时候采用这种格式是从未被证实过的。
为此,黄仁勋甚至在显卡的硬件设计上对FP8提供了一定的优化可支持,但半年的时间过去了,孟繁岐并没有看到自己预期的效果。
另一方面上,孟繁岐同时在寻求“稀疏”这一概念。这一条技术路线开启得更早,(见368-369章)。毕竟他很早就知晓,随着AI技术的发展,两个超级大国之间势必会因为世界地位的争夺而脱钩。
一旦形成对抗,硬件设备无疑将会被限制封锁。
可若要孟繁岐从根本上助力中国的硬件发展......他却也没有那个本事。
能做的,唯有投资点钱罢了。
国内的芯片技术,显然不可能跳过几代的制程,直接赶上英伟达。
换句话说,孟繁岐清楚国内硬件厂商所能提供的算力必然不如英伟达,这才提议了模型“稀疏”这一概念,以求节省资源。
模型稀疏与神经网络一样,都是对大脑行为的模仿。
从生物角度上说,大脑中的神经元连接并非全连接,而是高度稀疏的。每个神经元只与少数其他神经元相连,这种稀疏性使得大脑能够在低能耗下高效处理信息。
这给了大脑极高的能量效率,大脑在极低的能耗下完成复杂任务,部分得益于其稀疏的连接方式。
人体的总功耗才70-300w,其中大脑才仅仅只有15-30w。显卡动辄就300-500w,却完全无法与人脑的能力相比拟。
孟繁岐认为这是对计算资源的极大浪费,也已经取得了一定的成果证明稀疏方向的概念,可以在不怎么影响性能的情况下成倍地减少计算消耗。
但这件事情,却又被硬件的发展大大减缓了。
传统硬件常年来仅仅只针对密集计算优化,难以高效处理稀疏数据。
孟繁岐开发并证明技术的可行性,仅仅只用了两个多月的时间,可想要硬件良好支持,批量生产,不再等个一年,却是不大可能。
正在这AI领域逐渐陷入沉寂,总是只有小修小补的时刻,DeepSeek-R1的发布像是巨石入水,掀起了巨浪。
而令孟繁岐极为懊恼的事情是,DeepSeek取得巨大成功所依赖的技术方向,竟与他本人设想相差无几。
传说,在那古老的星空深处,伫立着一道血与火侵染的红色之门。 传奇与神话,黑暗与光明,无尽传说皆在这古老的门户中流淌。 俯瞰星门,热血照耀天地,黑暗终将离去!...
世界观设定:在这个大陆上,九境的力量来自于九颗上古遗物,称为“九境原石”,每颗原石象征着一个境界的顶峰力量。然而,每颗原石都带有一种诅咒,修行者在突破至新的境界后,不仅会获得强大力量,也会失去某种人性。于是,拥有九境之力的人被称为“神”,但无人知晓在突破神境后究竟会成为怎样的存在。九境(从低到高)包括凡境、元境、灵......
文案策划耿舒宁猝死办公室。 穿成慈宁宫太后的八大掌事姑姑之一耿佳舒宁。 原主年十九,再有一年就可归家,凭着家世能嫁个体面人家,做当家姑奶奶。 却因一场无疾而终的暗恋,香消玉殒在了黎明前。...
《国色不如卿》作者:我心若明月简介前世她倾尽全力,相助郦君赫成为帝王,可,狡兔死,走狗烹,郦君赫成为皇帝的第一件事情就是灭她全族,亡她父兄,囚她于冷宫,废她武功,贬妻为妾。她默默隐忍,暗中谋划,一朝兵变,夺他江山,将所有的屈辱都还给郦君赫,用行动证明了,以血还血,以牙还牙。一朝重生,她找到那个前世为她而死的男子,悄悄依偎进他的怀中,暗中...
深渊底部的魔王向来一代强过一代。 上代魔王将远征军队团灭四次后才被击杀,至今没有哪个种族愿意去探一探这代的情报。预言中的最强剑士连个影子都不见,下次魔王远征很成问题,教皇焦虑到无发可脱。 结果魔王它自己爬出来了。 没梦想勇者攻×没出息魔王受 两个心态爆炸的普通人(?)从朴实镇民慢慢成长为传说的故事。 副CP:坑蒙拐骗小流氓×正人君子骑士长 强强/HE;...
芸芸众生,万千修士,皆为天地间一粒悬尘,风扬而起,风息而落,不问迷途,不知归处。书友群:638064822......