《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布 原创

本周,OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布。

至顶发布

至顶智库发布《全球生成式AI(AIGC)预训练大模型一张图》

本周,OpenAI的GPT-4、百度的文心一言等生成式AI预训练大模型相继发布,再次引发社会各界对于AIGC产业的高度关注。自2018年OpenAI发布GPT-1以来,全球科技巨头和相关企业相继发布多种生成式AI预训练大模型,一方面模型的参数数量明显增加,另一方面模型的应用场景得到扩展。未来人工智能将成为让所有人都能使用的最先进生产力工具,让所有人都能从中受益。

至顶智库作为持续关注人工智能等数字经济领域的研究机构,今日正式发布“全球生成式AI(AIGC)预训练大模型一张图”,全面展现全球代表性AIGC大模型,为社会各界提供参考。同时欢迎读者与至顶智库研究团队沟通交流,持续迭代研究成果。

全球生成式AI(AIGC)预训练大模型一张图(截至2023年3月)

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

 信息来源:至顶智库结合各公司官网及公开资料整理绘制

关注“至顶头条”公众号,回复“AIGC一张图”,获取高清大图。

解读视频请参见“潜流研究所”视频号:

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

行业政策

李强总理出席记者会并回答中外记者提问

2023年3月13日,十四届全国人大一次会议于13日上午在人民大会堂举行记者会,国务院总理李强应大会发言人王超的邀请出席记者会,并回答中外记者提问。

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

图片来源:中国政府网

关于新一届政府工作重点

李强指出:集中力量推动高质量发展。这次两会期间,习近平总书记在参加江苏代表团审议时特别强调,要牢牢把握高质量发展这个首要任务。我国经济社会发展已经取得了巨大成就,经济总量稳居世界第二,但发展还不平衡、不充分。任何一个总量指标,分摊到14亿多的人口基数上,人均水平都比较有限。现在,我们的发展更多地只是解决“有没有”的问题,下一步需要更加重视解决“好不好”的问题,特别是提高科技创新能力、建设现代化产业体系、推动发展方式绿色转型等。总的来说,我们要完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展。

关于中国准备采取怎样的措施实现全年经济增长目标

李强提出:去年中央经济工作会议已经作了全面部署,基本取向是坚持稳字当头、稳中求进,推动经济运行整体好转。稳,重点是稳增长、稳就业、稳物价进,关键是在高质量发展上取得新进步。具体来讲,我想要特别做好几件事,或者说要打好这么几套组合拳:一是宏观政策的组合拳,二是扩大需求的组合拳,三是改革创新的组合拳,四是防范化解风险的组合拳。这些组合拳,都是有其具体内涵的,有的还会根据实践的需要不断充实、调整和完善。

关于政府将采取哪些措施稳就业

李强表示:就业是民生之本,解决就业问题,最根本的一条,还是要靠发展经济。具体工作中,我们将全面落实就业优先战略,进一步加大就业服务、技能培训等方面的政策支持力度,多措并举稳定和扩大就业岗位,支持和规范发展新就业形态。今年高校毕业生预计1,158万,从就业看,有一定压力;但从发展看,注入的是蓬勃的活力。我们将进一步拓宽就业渠道,帮助年轻人通过劳动和奋斗,更好地实现自己的人生价值。

 

工信部提出加快5G、工业互联网等新型信息基础设施建设和应用

2023年3月14日,工业和信息化部党组书记、部长金壮龙主持召开党组会议和干部大会。金壮龙要求:

· 加快实施“十四五”规划重大工程项目,发挥重点地区作用,稳住重点行业发展,巩固工业经济回升向好势头;

· 推动制造业高端化、智能化、绿色化发展,大力发展战略性新兴产业加快传统产业和中小企业数字化转型,深化质量品牌建设,积极推行绿色制造、智能制造,扎实推进重点领域节能降碳;

· 切实落实“两个毫不动摇”,持续优化中小企业发展环境,促进大中小企业融通创新,激发涌现更多专精特新企业;

· 加快5G、工业互联网等新型信息基础设施建设和应用,壮大数字经济核心产业,推动集成电路、工业软件产业高质量发展,积极培育新业态新模式。

 

上海市经信委发布《上海市智能机器人标杆企业与应用场景推荐目录》

2023年3月13日,上海市经信委发布《上海市智能机器人标杆企业与应用场景推荐目录》,提出:

· 请各有关机器人企业持续加强新产品、新终端研发创新,加大供给高端装备、拓展应用广度深度;请各相关企事业单位积极对接推广机器人典型应用场景,支撑城市数字化转型;

· 请各区产业主管部门支持推动以机器人为代表的智能终端产业发展,培育一流营商发展环境;

· 力争到2025年,本市将打造10行业一流的机器人头部品牌、100标杆示范的机器人应用场景、1,000亿元机器人关联产业规模;

· 在第一批入围名单中,标杆企业分布于工业智能、医疗健康、建筑服务、农业服务、公共服务、家用服务、特种应急七大领域;涉及充换电一体无人驾驶矿车机器人、面向人工智能教育领域的教学机器人等多种场景。

第一批《上海市智能机器人标杆企业与应用场景推荐目录》入围名单(部分)

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

信息来源:上海市经信委 《上海市智能机器人标杆企业与应用场景推荐目录》

 

宁夏回族自治区政府印发《数字宁夏“1244+N”行动计划实施方案》

2023年3月14日,宁夏回族自治区政府印发《数字宁夏“1244+N”行动计划实施方案》,提出数字宁夏建设总体目标,并按照“1244+N”行动计划制定未来重点任务。

总体目标

围绕数字宁夏建设,推动实施“1244+N”行动计划,健全完善组织、规划、政策保障体系,加快全国一体化算力网络国家枢纽宁夏节点和国家(中卫)新型互联网交换中心建设,大力实施数字产业化、产业数字化、数字化政务、数字化社会“四化”工程,培育引进一批生产和运用数字的企业,2023年数字信息产业产值达到850亿元,数字经济占GDP比重达到36%左右(力争到2027年达到40%以上),加快推动我区经济社会高质量发展。

《数字宁夏“1244+N”行动计划实施方案》重点任务

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

材料来源:宁夏回族自治区政府 《数字宁夏“1244+N”行动计划实施方案》,至顶智库

高效运营国家(中卫)新型互联网交换中心

· 打通交换中心与深圳、北京、上海跨省传输链路,进一步降低网络时延和资费,引入20个以上知名互联网企业,打造互利共赢的互联网产业发展新生态。

实施数字产业化工程

· 全面升级信息网络基础设施,推进5G向重点园区、重点场所、行政村等区域延伸覆盖,新建5G基站2,000,累计达到1.2万座

· 加快推进数据中心集群发展,新建5超大型数据中心,增加标准机架11万架,总量达到15万架,服务器装机能力超过125万台

· 加快电子信息制造业、软件与信息服务业发展,探索人工智能计算中心、人工智能产业服务平台的建设和应用,2023年数字信息产业产值达到850亿元

实施产业数字化工程

· 实施“数字+产业”倍增行动计划,开展“上云用数赋智”服务,加快“5G+工业互联网”应用,推进智慧园区建设,建成智能工厂、数字化车间15,产业互联网平台30,新增上云企业1,000,两化融合水平达到53.5,增长速度力争走在西部前列。

加大招商引资力度

· 编制数字产业转移手册和产业链招商图册,制定自治区重点产业链“链主”企业遴选培育管理办法;

· 大力培育和引进“链主”企业,谋划布局产业链项目,引进服务器制造和数据中心配套项目,壮大软件和信息技术产业链,延长算力产业链,引导链上企业向宁夏聚集;

· 紧盯亚马逊、东方汇源等已落地重点企业,聚焦数据资源开发、信息产业培育、数字经济发展,围绕智能终端、数据服务、软件开发等数字信息产业重点领域,推动更多产业生态项目落地实施。

 

企业动态

OpenAI发布多模态预训练大模型GPT-4

2023年3月15日,OpenAI发布多模态预训练大模型GPT-4,在公布论文、System Card的同时,也将ChatGPT升级为GPT-4版本,并开放GPT-4的API。

GPT-4实现以下几个方面的飞跃式提升:

1.强大的识图能力;

2.文字输入限制提升至2.5万字

3.回答准确性显著提高;

4.能够生成歌词、创意文本,实现风格变化。

GPT-4是一个大型多模态模型,能接受图像和文本输入,再输出正确的文本回复。实验表明,其在各种专业测试和学术基准上的表现与人类水平相当,能够通过模拟律师考试,且分数在所有应试者中排名前10%左右;相比之下,GPT-3.5的得分排名在倒数10%左右。当任务的复杂性达到足够阈值时,便可发现GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

在多项选择、编写Python代码等各项任务中,GPT-4的表现大大优于现有的大型语言模型,以及大多数SOTA模型。

GPT-4与其他模型对比

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

 图片来源:OpenAI官方网站,GPT-4 Technical Report

GPT-4可以接受文本和图像形式的输入,新能力与纯文本设置并行,允许用户指定任何视觉或语言任务,例如:

1.识别出图片中搞笑或违反常理的地方;

2.对图片中的物理题目做出正确解答;

3.速读图片版论文,总结摘要等。

 

百度发布新一代大语言模型、生成式AI产品—“文心一言”

3月16日下午,百度于北京总部召开新闻发布会,正式发布新一代大语言模型、生成式AI产品—“文心一言”,在ERNIE及PLATO系列模型的基础上研发而来。其关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。文心一言能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

图片来源:百度文心一言新闻发布会

文心一言主要功能

1. 在文学创作场景中:文心一言根据对话问题将知名科幻小说《三体》的核心内容进行总结,并提出五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。

2. 在商业文案创作场景中:文心一言顺利完成给公司起名、写Slogan、写新闻稿的创作任务。

3. 在数理逻辑推算任务中:面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

4. 在中文理解方面:文心一言正确解释成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,并以“洛阳纸贵”四个字创作藏头诗。

5. 多模态生成方面:文心一言具备生成文本、图片、音频和视频的能力,甚至能够生成四川话等方言语音;因视频生成能力的成本较高,现阶段尚未对所有用户开放,未来会逐步接入。

自2月份百度官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。文心一言将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域都会因此大幅提升效率,并在每一个行业快速形成新的产业空间,助力数字中国实现。

 

商汤发布多模态多任务通用大模型“书生(INTERN) 2.5”

3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN) 2.5”,其拥有30亿参数,是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0mAP的模型。“书生 2.5”具备通用场景下的高级感知和复杂问题处理能力,如图像描述、视觉问答、视觉推理和文字识别等。

凭借在多模态多任务处理能力方面的多项突破,“书生 2.5”的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持,向通用人工智能迈出坚实的一步。同时,“书生 2.5”多模态通用大模型已在商汤参与的通用视觉开源平台OpenGVLab开源。

主要功能

《数字经济洞察周报》2023年第10期 | OpenAI GPT-4、百度 文心一言等AI预训练大模型相继发布

图片来源:商汤科技SenseTime官方公众号

1. 辅助完成自动驾驶场景中各类复杂任务,如:规划路线、寻找停车位、违章提醒等;

2. 完成居家机器人场景中各类复杂任务,如:发现需要清洗的餐具或衣服、查找菜谱、提示倒垃圾等;

3. 具备AIGC“以文生图”的能力,可根据用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像,如:繁忙的城市街道、雨天拥挤车道、马路上奔跑的狗等,生成写实的Corner Case训练数据,进而训练自动驾驶系统对Corner Case场景的感知能力上限。

4. 根据文本快速检索出视觉内容,可在相册中返回文本所指定的相关图像,或是在视频中检索出与文本描述最相关的帧,提高视频中时间定位任务的效率;

5. 支持引入物体检测框,根据文本返回最相关的物体,实现开放世界视频或图像中物体检测及视觉定位。

测试成绩

· 在视觉主流图像分类数据集ImageNet上,该模型仅基于公开数据便达到90.1%的Top-1准确率。这是除谷歌与微软之外,唯一准确率超过90.0%的模型。

· 在物体检测标杆数据集COCO上,取得65.4的mAP。“书生 2.5”也在包括图像分类、物体检测、语义分割、图像描述、图文检索等20余个不同场景、不同任务的单模态和跨模态公开数据集上均取得最佳成绩。

来源:至顶网至顶智库频道

0赞

好文章,需要你的鼓励

2023

03/17

19:06

分享

点赞