您的位置: 首页> 知识 > 正文

为何AI发展速度不大可能放缓?4张图表告诉你

2023-08-09 16:14:31 来源:千家网

过去十年,人工智能系统飞速发展。从2016年Alpha Go在复杂的围棋游戏中击败李世石开始,人工智能现在能够比人类更好地识别图像和语音,并通过包括商学院考试等在内的测试。


(资料图)

近期,在美国参议院司法委员会关于监管人工智能的听证会上,康涅狄格州参议员理查德·布卢门撒尔(Richard Blumenthal)描述了其人们对人工智能最新进展的反应。“这个被反复使用的词很可怕。”

负责监督会议的隐私、技术和法律小组委员会听取了三名专家证人的证词,他们强调了人工智能的进展速度。证人之一、著名人工智能公司Anthropic的首席执行官达里奥·阿莫代伊(Dario Amodei)表示:“了解人工智能最重要的一点是它的发展速度有多快。”

人工智能已经在许多任务上超越了人类,而且人类在新任务上被超越的速度正在增加。相对于人类的表现,最先进的人工智能表现都在人类基准之上。

如上图所示,人工智能在手写识别(Handwriting recognition),语音理解(Speech recognition),图像识别(Image recognition),阅读理解(Reading comprehension),语言理解(Language understanding)等方面已经超越人类,而在常识补全(Common sense completion),小学数学(Grade school math),代码生成(Code generation)方面也与人类水平非常接近。因此,按照这个发展趋势,未来几年人工智能将在更多的领域实现对人类的超越。

过去,人们通常认为科学技术进步从根本上来说是不可预测的,并且是由事后更清晰的洞察力所驱动的。但可以预见的是,人工智能系统能力的进步是由计算、数据和算法这三种输入的进步推动的。过去70年的大部分进步都是研究人员使用更强的计算处理能力(通常称为“计算”)来训练人工智能系统的结果,为系统提供更多数据,或者提出有效减少获得相同结果所需的计算或数据量的算法技巧。

因此,了解了过去这三个因素如何推动人工智能进步,是理解为什么大多数从事人工智能工作的人预计AI的进展不会很快放缓的关键。

计算

世界上第一个人工神经网络Perceptron Mark I于1957年开发出来,当时它可以学习辨别卡片是标记在左侧还是右侧。它有1000个人工神经元,训练它需要大约700000次操作。70多年后,OpenAI发布了大型语言模型GPT-4。训练 GPT-4 估计需要 21*10²⁴次运算。

计算量的增加使人工智能系统能够摄取更多的数据,这意味着系统有更多的例子可供学习。更多的计算还允许系统更详细地对数据中变量之间的关系进行建模,这意味着它可以从显示的示例中得出更准确和细致的结论。

自 1965 年以来,摩尔定律(即集成电路中晶体管的数量大约每两年增加一倍)意味着计算的价格一直在稳步下降。研究机构Epoch的主管杰米·塞维利亚(Jaime Sevilla)表示,虽然这确实意味着用于训练人工智能系统的计算量增加了,但研究人员更专注于开发构建人工智能系统的新技术,而不是关注用于训练这些系统的计算量。

杰米·塞维利亚(Jaime Sevilla)说,这种情况在2010年左右发生了变化。“人们意识到,如果要训练更大的模型,实际上不会得到收益递减的结果,”这是当时普遍持有的观点。

从那时起,开发人员花费越来越多的资金来训练更大规模的模型。训练人工智能系统需要昂贵的专用芯片。人工智能开发人员要么构建自己的计算基础设施,要么向云计算提供商付费以访问他们的计算基础设施。OpenAI首席执行官Sam Altman表示,GPT-4 的训练成本超过1亿美元。这种支出的增加,加上摩尔定律导致的计算成本的持续下降,导致人工智能模型需要接受大量计算的训练。

OpenAI和Anthropic两家领先的人工智能公司各自从投资者那里筹集了数十亿美元,用于支付他们用于训练人工智能系统的计算费用,并且每家都与财力雄厚的科技巨头建立了合作伙伴关系——OpenAI与微软、Anthropic与谷歌。

从上图可以看出,自1950年以来,用于训练人工智能系统的计算量一直在增加,增长率在2010年开始明显增加。

数据

人工智能系统的工作原理是建立训练数据中变量之间关系的模型。一般来说,更多的数据点意味着人工智能系统拥有更多的信息来建立数据中变量之间关系的准确模型,从而提高性能。

关于Perceptron Mark I 的最初研究论文称,它仅根据六个数据点进行训练。相比之下,LlaMa是由Meta 研究人员开发并于2023年发布的大型语言模型,接受了约10亿个数据点的训练,比Perceptron Mark 1增加了1.6亿多倍。就LlaMa而言,数据点是从以下多种来源位置收集的文本:其中67%来自Common Crawl数据(Common Crawl 是一个非营利组织,负责抓取互联网并免费提供收集到的数据),4.5%来自GitHub(软件开发人员使用的互联网服务),以及 4.5%来自维基百科。

上图反映了在过去的70年里,用于训练人工智能模型的数据点数量急剧增加。

算法

算法(定义要执行的操作序列的规则或指令集)决定人工智能系统如何准确地使用计算能力来对给定数据中的变量之间的关系进行建模。除了使用越来越多的计算量来简单地训练人工智能系统以获取更多数据外,人工智能开发人员还一直在寻找从更少的资源中获得更多收益的方法。Epoch 的研究发现,“每九个月,更好的算法的引入就相当于计算预算增加了一倍。”

算法的进步意味着需要更少的计算和数据来达到给定的性能水平,上图在图像识别测试中达到80.9%准确率所需的计算量和数据点数。对于在一万亿个数据点上训练的模型,2021年训练的模型所需的计算量比2012年训练的模型少16500倍。

人工智能的下一阶段进展

根据Epoch的主管杰米·塞维利亚(Jaime Sevilla)的说法,人工智能开发人员用于训练其系统的计算量可能会在一段时间内继续以目前的加速速度增加,因为企业会增加在训练每个人工智能系统上花费的资金,并且随着计算价格持续稳定下降效率也会提高。Sevilla预测这种情况将持续下去,直到某个时候不再值得继续花更多的钱,因为增加计算量只能略微提高性能。此后,所使用的计算量将继续增加,但速度会减慢,这完全是由于摩尔定律导致计算成本下降。

输入现代人工智能系统(例如 LlaMa)的数据是从互联网上抓取的。从历史上看,限制输入人工智能系统的数据量的因素一直是拥有足够的计算来处理这些数据。但是,最近用于训练人工智能系统的数据量激增,已经超过了互联网上新文本数据的产生速度, Epoch的研究人员预测,到2026年,人工智能开发人员将耗尽高质量的语言数据。研究人员预测,到 2026 年,人工智能开发人员将耗尽高质量的语言数据。

那些开发人工智能系统的人往往不太关心这个问题。OpenAI首席科学家 Ilya Sutskever表示,“数据情况仍然相当不错。还有很多事情要做。” 而人工智能公司Anthropic的首席执行官达里奥·阿莫代伊(Dario Amodei)则估计,“这种扩展可能有10%的可能性会因无法收集足够的数据而中断。”

塞维利亚还相信,数据缺乏不会阻碍人工智能的进一步改进——例如找到使用低质量语言数据的方法——因为与计算不同,数据缺乏以前并不是人工智能进步的瓶颈。他预计人工智能开发人员可能会发现许多容易实现的创新成果来解决这个问题。

杰米·塞维利亚(Jaime Sevilla)表示,算法的进步可能会继续增强用于训练人工智能系统的计算和数据量。到目前为止,大多数改进都来自于更有效地使用计算。Epoch发现过去超过四分之三的算法进步都被用来弥补计算方面的不足。如果未来,随着数据成为人工智能训练进展的瓶颈,更多的算法进展可能会集中在弥补数据的不足上。

将这三部分放在一起,包括杰米·塞维利亚(Jaime Sevilla)在内的专家预计人工智能至少在未来几年将继续以惊人的速度取得进展。随着企业花费更多的钱并且底层技术变得更便宜,计算将继续增加。互联网上剩余的有用数据将用于训练人工智能模型,研究人员将继续寻找训练和运行人工智能系统的方法,以更有效地利用计算和数据。

这些十年趋势的延续是专家认为人工智能将继续变得更加强大的原因。这让很多专家感到担忧。

达里奥·阿莫代伊(Dario Amodei)在美国参议院委员会听证会上发言时表示,如果继续以同样的速度取得进展,在未来两到三年内,很多人都能够获得即使是今天的专家也无法掌握的科学知识。他表示,这可能会增加“造成严重破坏”的人数。“我特别担心人工智能系统可能会在网络安全、核技术、化学,尤其是生物学领域被大规模滥用。”

关键词:

资讯
业界
企业
骑闻
产品
我国高技术制造业保持较快增长   服务业生产下滑
5月16日,国家统计局新闻发言人、国民经济综合统计司司长付凌晖在国新办4月份国民经济运行情况新闻发布会上表示:总体来看,4月份疫情对经
2022-05-22
唐山曹妃甸推动京津冀协同发展 产业协同转移全面提速
春暖渤海湾,书写新画卷。位于唐山曹妃甸的金隅天坛(唐山)木业科技有限公司的生产车间内一片繁忙景象——铺装、压机、翻板等工作正紧张有序
2022-03-19
石家庄海关共签发RCEP原产地证书864份 货值3.9亿元
自今年1月1日RCEP(《区域全面经济伙伴关系协定》)正式实施以来,截至3月14日,石家庄海关共签发RCEP原产地证书864份,货值3 9亿元。据介绍
2022-03-19
蚌埠海关累计签发RCEP原产地证书35份 涉及金额2583.09万元
在蚌埠海关报关大厅原产地证办理窗口,海关关员仔细核对着递交过来的材料。十分钟后,一份RCEP原产地证书打印盖章后交到了企业业务员手中。
2022-03-19
昆明西山区:“双招双引”推动人才链和产业链融合发展
为激励党员干部在营商环境建设中担当作为,昆明市西山区深入实施人才强区战略和人才领跑工程,建立健全招商引资和招才引资并轨新模式,以产
2022-03-19
绥化望奎以工业化思维为引领 推动肉类加工制造产业腾飞
望奎县以工业化思维为引领,推动全县以生猪为主的肉类加工制造产业一年全面开局、三年基本成势、五年产业腾飞,聚焦五化做强做优肉类加工制
2022-03-19
  中新网海口1月23日电(符宇群)海南省第六届人民代表大会第五次会议23日在海口举行第二次全体会议。海南省人民检察院检察长张毅在作报告
2022-01-24
  中新网太原1月23日电 (高雨晴 冉涌 张鹏宇)记者23日从国网山西省电力公司获悉,该公司冬奥保电应急发电队伍已到达河北张家口赛区,
2022-01-24
  中新网西宁1月23日电 (记者 李江宁)据青海省地震局23日消息,中国地震台网正式测定,北京时间2022年1月23日10时21分,在青海海西州德
2022-01-24
  中新网贵阳1月23日电 (周燕玲)对外开放,是内陆开放型经济试验区贵州正在召开的两会热点词汇,如何拓展海内外“朋友圈”助力贵州经济
2022-01-24
温馨生活好young 厦门推广文旅产品火爆全网
  中新网厦门1月23日电 (记者 杨伏山)“冬日暖阳厦门好young”福建省内宣传推广线下活动22日精彩收官。主办方称,本次活动火爆全网及福
2022-01-24
宁夏非遗传承人:刻刀里的守正创新更有“年味”
  (新春见闻)宁夏非遗传承人:刻刀里的守正创新更有“年味”  中新网银川1月23日电 题:宁夏非遗传承人:刻刀里的守正创新更有“年味
2022-01-24
沧州:8个重大科技专项项目确定 引领经济社会高质量发展
为充分发挥科技在经济社会高质量发展中的引领和支撑作用,沧州市确定8个项目为2021年全市重大科技专项项目。这8个重大科技专项项目分别为:
2022-03-19
  中新网海口1月23日电(王子谦 符宇群)海南省高级人民法院院长陈凤超23日说,2021年海南法院为自贸港建设提供坚强司法保障,全年有效管
2022-01-24
  新华社武汉1月23日电(记者王贤)随着春节假期临近,从广州、深圳等地返回湖北的旅客较多。为此,23日,武汉站、汉口站、襄阳东站、十堰
2022-01-24
  1月22日0—24时,广东省新增本土确诊病例3例和本土无症状感染者1例,均为珠海报告。23日,珠海市疫情防控新闻发布会上,珠海市政府副秘
2022-01-24
青海海西州德令哈市发生3.7级地震
  据中国地震台网正式测定,1月23日11时58分在青海海西州德令哈市发生3 7级地震,震源深度9千米,震中位于北纬38 40度,东经97 35度。
2022-01-24
  北京2022年冬奥会和冬残奥会颁奖花束已于近期完成交付。与传统的鲜切花不同,这些花束全部采用上海市非物质文化遗产“海派绒线编结技艺
2022-01-24
  中新网宿迁1月23日电 (刘林 张华东)核酸检测是当下及时发现潜在感染者、阻断疫情传播的有效方法。23日,记者从宿迁市宿豫区警方获悉
2022-01-24
  记者从天津市人社局获悉,从明天(24日)起,天津2022年度第一期积分落户申报工作正式开始,这是新修订的《天津市居住证管理办法》《天津
2022-01-24
  中新社北京1月23日电 (记者 刘亮)记者23日从中国海关总署获悉,2021年,中国海关组织开展“国门绿盾”专项行动,在寄递、旅客携带物
2022-01-24
  记者从天津市疫情防控指挥部获悉,天津疫情第341—360例阳性感染者基本信息公布。  目前,这20例阳性感染者已转运至市定点医院做进一
2022-01-24
“最美基层民警”武文斌:案子破了最管用
  中新网吕梁1月23日电 题:“最美基层民警”武文斌:案子破了最管用  作者 高瑞峰  同事称他为“拼命三郎”。从警14年,武文斌破
2022-01-24
  据“西安发布”消息,截至2022年1月23日,雁塔区长延堡街道近14天内无新增本地病例和聚集性疫情。根据国务院联防联控机制关于分区分级
2022-01-24
  中新网西宁1月23日电 (记者 孙睿)据青海省地震台网测定,2022年1月23日10点21分(北京时间)在青海省海西州德令哈市(北纬38 44度,东经
2022-01-24
江西南昌:市民赏年画迎新年 书法家挥毫送春联
  (新春见闻)江西南昌:市民赏年画迎新年 书法家挥毫送春联  1月23日,“赏年画过大年”新年画作品联展江西南昌站活动在江西省文化馆
2022-01-24
  中新网成都1月23日电 (祝欢)成都市第十七届人民代表大会第六次会议23日在成都举行,成都市中级人民法院院长郭彦与成都市人民检察院检
2022-01-24
列车临时停车3分钟救旅客
  (新春见闻)列车临时停车3分钟救旅客  中新网广州1月23日电 (郭军 黄伟伟)“车长,车长,4号车厢有位旅客腹涨难忍,身体不舒服”…
2022-01-24
女子背负命案潜逃24年 因涉疫人员核查落网
  中新网湖州1月23日电(施紫楠 徐盛煜 赵学良)1998年7月,犯罪嫌疑人杜某因家庭琐事,用菜刀将自己的弟媳砍伤致死。案发后,她从老家河
2022-01-24
广东“00后”雄狮少年锤炼功夫迎新春
  (新春见闻)广东“00后”雄狮少年锤炼功夫迎新春  中新社广州1月23日电 题:广东“00后”雄狮少年锤炼功夫迎新春  作者 孙秋霞 
2022-01-24
03-19 2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
2022岳阳国际旅游节开幕 特色农产品展销等系列活动目不暇接
今天,天下洞庭岳阳市君山区第九届良心堡油菜花节暨2022岳阳国际旅游节开幕,菊红、粉红、水红、桃红、紫色、白色等七色组成的4万亩花海在 [详细]
03-19 2022年郴州计划重点推进文旅项目101个 总投资354亿元
2022年郴州计划重点推进文旅项目101个 总投资354亿元
3月16日,我市举行全市文旅项目和城市大提质大融城项目集中开工仪式,市委书记吴巨培宣布项目开工。郴州嘉合欢乐世界、仙福路工地清风徐来 [详细]
03-19 宿州泗县深入推进文旅融合发展 擦亮城市品牌
宿州泗县深入推进文旅融合发展 擦亮城市品牌
近年来,泗县以争创安徽省文化旅游名县为目标,深入推进文旅融合发展,努力擦亮水韵泗州 运河名城城市品牌,全县文化旅游业实现高质量发展 [详细]
03-19 淡季不忘引流 京郊民宿市场有望迎来回暖
淡季不忘引流 京郊民宿市场有望迎来回暖
旅游淡季中的京郊民宿有望成为市场中最先复苏的板块。3月17日,北京商报记者调查发现,虽然正值旅游淡季,且受疫情变化的影响,不过各家民 [详细]
01-24 西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“社区领导怒怼咨询群众”:涉事社区主任已停职
西安浐灞回应“一社区领导在市民咨询离市政策时发生争执”事件 涉事社区主任已停职  西部网讯(记者 刘望)日前,网络上流传一条视频 [详细]
01-24 陕西:截至23日12时 西安56.5万大中专学生已离校返家
陕西:截至23日12时 西安56.5万大中专学生已离校返家
1月23日,陕西省举行第45场疫情防控工作发布会,发布会上陕西省教育厅相关负责人通报,陕西全省疫情有效控制后,大中专学校能不能放假 [详细]
01-24 河北魏县发布北京一阳性人员在魏县的主要轨迹
河北魏县发布北京一阳性人员在魏县的主要轨迹
魏县疾病预防控制中心关于紧急寻找丰台区新冠肺炎阳性检测者同时间同空间人员的公告  2022年01月22日,接到邯郸市疾控中心转北京市疾 [详细]