科技前沿:英伟达培训世界上最大的转换型语言模型
在这个正是日新月异的时代,飞黄腾达的时代,人类的科技、生活已经在近几年快速的进入快车道,在这年头有台电脑、手机已不是稀奇的事,因为几乎每家每户都会有电脑,电脑仿佛将我们彼此链接在一起,下面分析一片关于电脑与手机各种新型科技产品的文章供大家阅读。
英伟达(Nvidia)今天宣布,它已经训练出世界上最大的语言模型,这是这家GPU制造商旨在推进对话人工智能的一系列更新中的最新一个。

为了实现这一壮举,Nvidia利用了模型并行性,将一个神经网络分解成若干块,并使用一种技术来创建太大而无法容纳单个GPU内存的模型。该模型使用了83亿个参数,比BERT大24倍,比OpenAI的GPT-2大5倍。
Nvidia还宣布了双向编码器表示(BERT)的最快训练和推理时间,这是一种流行的模型,在2018年由谷歌开源时是最先进的。
Nvidia能够使用优化的PyTorch软件和超过1000个gpu的DGX-SuperPOD来训练BERT,耗时53分钟。
Nvidia应用深度学习副总裁Bryan Catarazano在与记者和分析师的对话中表示:“如果没有这种技术,可能需要数周时间来训练这些大型语言模型。”
Nvidia还声称,它已经实现了最快的BERT推理时间,在特斯拉T4 GPU和TensorRT 5.1上运行,为数据中心推理进行了优化,下降到2.2毫秒。卡塔拉萨诺说,当使用cpu时,伯特推理的时间可达40毫秒,而现在许多人工智能对话操作的时间可达10毫秒。
gpu也为微软的Bing带来了收益,后者使用Nvidia硬件将延迟时间缩短了一半。
今天介绍的每一项改进都是为了强调Nvidia的GPU在语言理解方面的性能提升。上述每一个壮举的代码今天都是开源的,以帮助人工智能从业者和研究人员探索大型语言模型的创建或使用gpu进行速度训练或推理。
除了单词错误率的大幅下降外,延迟的减少也是提高流行人工智能助手(如亚马逊的Alexa、谷歌Assistant和百度的Duer)采用率的主要因素。
几乎没有延迟的交流将导致机器与人之间的对话,这种对话更像是人与人之间的对话,通常以思维的速度进行。
就像今年为微软的Cortana、Alexa和谷歌Assistant引入的多回合对话功能一样,与助手的实时交流也让交互变得更加自然。
会话人工智能系统的发展水平在很大程度上围绕着谷歌基于转换的语言模型在2017年和BERT在2018年的发展。
从那以后,BERT就被微软的MT-DNN、谷歌的XLNet和百度的ERNIE超越了,它们都建立在BERT的基础上。Facebook在7月份推出了同样源自BERT的RoBERTa。罗伯塔目前在GLUE基准排行榜上名列前茅,在9个语言任务中有4个是最好的。每个模型在粘合任务上的表现都优于人类基线。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
【盘点老人去世后的子孙禁忌】在中国传统文化中,老人去世后,家庭成员尤其是子孙后代在行为、言语、生活习惯...浏览全文>>
-
【盘点老牛湾旅游攻略】老牛湾,位于山西省忻州市偏关县,是黄河与长城交汇的地方,被誉为“黄河第一湾”。这...浏览全文>>
-
【盘点快手上热门的方法】在短视频平台中,快手凭借其真实、接地气的内容风格吸引了大量用户。想要在快手上获...浏览全文>>
-
【盘点课堂教学模式有哪些】在当前教育不断发展的背景下,课堂教学模式也在不断创新与优化。不同的教学模式适...浏览全文>>
-
【盘点开天门的作用】在传统文化与玄学中,“开天门”是一个充满神秘色彩的概念,常被用于描述一种通灵、修道...浏览全文>>
-
【盘点金丝绒面料的优缺点】金丝绒是一种常见的纺织面料,因其柔软、奢华的触感和丰富的色彩表现力,在家居装...浏览全文>>
-
【盘点简爱好词好句】在阅读《简爱》这部经典文学作品时,许多读者都被其中深刻的情感描写和富有哲理的语言所...浏览全文>>
-
【排骨玉米板栗汤】一、排骨玉米板栗汤是一道营养丰富、味道鲜美的家常汤品,适合在秋冬季节饮用。这道汤以排...浏览全文>>
-
【排骨应该怎样炖好吃又简单】炖排骨是一道非常受欢迎的家常菜,不仅营养丰富,还能暖胃暖心。但很多人在炖排...浏览全文>>
-
【排骨要蒸多长时间能熟】在日常烹饪中,蒸排骨是一道非常受欢迎的家常菜,既保留了食材的原汁原味,又营养丰...浏览全文>>
