重要发布
容联云发布全新品牌“容犀智能”及生成式应用“容犀Copilot”
12月19日,容联云在北京“未来生成式——大模型应用升级新品发布会”上,发布全新产品品牌“容犀智能”和生成式应用“容犀Copilot”助力营销科技服务和企业业务智能化。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容联云的核心价值与优势在于能够为客户提供技术与业务融合的解决方案,帮助金融客户实现营销数智化升级。具体表现在四个能力上:通讯能力及数据处理能力、AI模型应用落地能力、丰富的金融服务经验、端到端解决方案落地能力。因此容联云发布容犀智能品牌,更好地帮助企业从以往的沟通连接走向真正的业务数智化。
容犀智能品牌
容犀智能着力于帮助企业从过去的沟通连接,走向真正的数字化。容犀智能拥有领先的全链路能力和大小模型底座。从底层硬件,能力于产品矩阵之上,更好服务银行、保险、证券等泛金融。全新的容犀智能品牌由四大模块组成:容犀AICC、容犀Desk、诸葛IO/CDP/CEP、容犀Copilot。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容犀Copilot
容犀Copilot融合全链路数据、大小模型和分析洞察,作为服务与营销的AI领航员为销售和客服提供最佳沟通策略。根据沟通前特征、沟通中交流内容、沟通后跟进结果,接入更全的沟通数据帮助企业形成更好的知识、话术、QA、策略,实现业务价值提升。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
“大模型话术挖掘、大模型智能知识库、大模型会话洞察”是容犀Copilot的三大核心能力。通过正反馈,立场,QA等挖掘最佳话术。以往内部知识库依赖于训练师,复杂的QA拆解和扩展。智能知识库提高时效至分钟级,降低对专业人员的依赖。企业好的业务来自于对客户的及时洞察和对产品策略的及时调整,现在可以通过大模型举一反三,通过标签快速了解客户的关注点、反馈点及诉求。在三大产品的核心能力之上,构建了通用的辅助能力,包括营销辅助、客服辅助、企微辅助、AICC以及文本机器人。为了解决业务问题,做好技术与业务的融合,还构建了专门针对具体业务场景的能力,例如银行的销卡建卡、投诉与反投诉等,将行业的经验沉淀成小助手,可以直接给出最好的行业知识和行业推荐,解决业务员的业务问题,缩短培训时间。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
大模型话术挖掘方面,容犀Copilot通过对多渠道海量历史会话数据核对筛选,生成金牌话术推荐。以往专门的团队听录音挖掘出优秀话术的模式,问题在于能保质,但无法保量。而传统AI作为非一线业务人员能保量,但无法保质。容犀Copilot基于赤兔大模型解决了质与量兼顾的问题,精准把握话术推荐的最佳时机,另外还能发现尚未被关注的高频问题,洞悉客户的新关注点和业务痛点。从产品的具体实现来看,首先是接入语音、在线和企微的全渠道会话数据;然后以海量话术语料为基础,根据会话中客户的立场、情绪、目标转化、会话市场和客户提问归纳提炼成最佳话术;最后将提炼筛选出的话术以问答对的形式呈现。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容犀Copilot赋能下的智能知识库建立管理难度和工作量大幅降低。知识库有两大痛点:时效性、很难从零开始构建,传统知识问答需要专业的人工智能训练师花费几个月,而大模型知识问答只需培训过的普通业务人员花费数分钟完成。赤兔大模型的文档对话能力,可以理解文档知识,从0开始自动化高效构建话术库,节省了时间成本和人力资本。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
知识库其他功能知识快搜:从关键词搜索升级问答式语义理解快速定位知识。智能问答:快速补充查找优秀话术。模拟用户问题,挖掘好话术。知识助手:企微侧边栏、在线客服场景快速搜索定位知识,找到答案。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
大模型会话洞察能力,会话数据配置即可分析,降低企业非结构化数据使用成本。利用大模型举一反三的理解能力,将一线业务人员的能力直接赋予到大模型中。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容犀Copilot其他功能还包括:卡片式按需生成会话分析看板,让每一通会话效果一目了然,方便业务人员及时调整业务策略。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容犀Copilot智能助手功能,是大模型打造的场景化客服助手,实现基于历史数据的个性化有效沟通,例如分期挽留助手、销卡挽回助手、消保投诉助手等,在前端不同平台更多地赋能业务。
大模型驱动数字化升维
容联云AI研究院院长 刘杰
大模型应该做成什么样?刘杰从三个核心分析了容联云面向服务营销这种ToB场景大模型的初心。智能性:客户希望模型能力丰富,解决以前不能解决的问题,也关心质量。可控性:大模型像一个孩子,聪明但有时不听话。可控性是客户选择大模型时的安全红线。投产比:因为规模的强大带来的是投入很大。在研发训练和优化时,赤兔大模型没有去无限探索,而是做了聚焦和剪枝。
对于容联云赤兔大模型来说,智能性层面归为检索增强、会话分析、逻辑推理、数据分析。检索增强指的是在海量文档中快速定位到信息,经过合理整理给客户提供答案。会话分析能让模型在对话中发现多维度信息,包括情绪,立场,各种细节的意见,并且根据不同业务快速切换业务场景。逻辑能力体现在推荐话术的原因,投诉、预警的原因这种因果分析能力。数据分析体现在对数据更细致且自动化的分析,减少技术人员和业务人员的数据层面上的操作。
道德、伦理、安全、风格、偏好上对齐,就是模型的可控性。容联云大模型能快速适应不同业务,随时变化的规定。在风格偏好上,做到语言风格精炼,能给出条理化的分析和推理。在投产比上关注大模型,明确是否所有场景都需要大模型。AI底座上,没有摒弃小模型,大小模型相配合完成对上层能力的输出。机制上合理调动分配,比如有的环节大模型靠后完成线下或离线的工作,有的环节大模型调动指挥小模型完成。
银行网点的智慧转型
容联云CV产品解决方案总监 李杰
随着多模态的发展,图像智能在更多行业和场景有了更多的落地的应用。容联云还将推出基于AIOT平台的金融银行场景解决方案。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容联云AIoT平台智能视觉产品在架构上,采取主流的端边云架构。算法层面则具备通用算法和银行营业厅这样的行业场景专用分析算法。AI设备管理支持通用的服务器设备,华为Altas系列及各种各样的物联传感器和物联设备。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
容联云的解决方案能满足银行智能化合规监督管理、优化网点现有运营模式:抓管理、避风险、提人效、树形象。抓管理:保证总行或省行对基层网点管理。避风险:通过人工智能技术对银行业务全时全量检测,提升风险检出率。提人效:让机器代替人工完成部分管理业务和视频检查业务。树形象:通过人工智能的应用提升企业公众形象。
容联云AIoT平台另外一个产品是智能物联锁控产品。
去钥匙化管理的智能物联终端:人员在获得物联终端后,通过生物识别验证获取对应权限,可以执行开关锁等操作。真正实现了无钥匙化管理。
各式各样的智能物联锁可以将银行网点的机械锁全部替换。无源保证了不需要对锁的更换进行原设备的线路、电力电源网线上的改造。在物联终端和智能物联锁上,相应的安全芯片拥有国密级的加密,保证最大程度的安全性。
图片来源:容联云“未来生成式——大模型应用升级新品发布会”
行业政策
全国工业和信息化工作会议在京召开
12月21日, 工信部在京召开全国工业和信息化工作会议,总结2023年工作,部署2024年任务。会议指出,2023年较好完成了全年工作任务。预计全年,工业增加值同比增长4.3%以上,制造业增加值占GDP比重基本稳定,总体规模连续14年保持全球第一。
制造业创新体系建设不断加强。国家级、省级制造业创新中心分别达到29个、260个,国家级高新技术产业开发区达到178家,高新技术企业达到46.5万家。产业结构进一步优化升级。1-11月,规模以上高技术制造业增加值同比增长2.3%、装备制造业增加值同比增长6.4%。新能源汽车、锂电池、光伏产品“新三样”出口快速增长,新能源汽车出口达109.1万辆。累计建设数字化车间和智能工厂近万家,创建国家级绿色工厂5100家。中小企业专精特新发展步伐加快。累计培育“小巨人”企业1.2万家、专精特新中小企业10.3万家,遴选中小企业特色产业集群100个。启动首批30个城市中小企业数字化转型试点,开展系列中小企业服务活动,累计服务中小企业950余万家。信息通信业高质量发展扎实推进。预计全年,电信业务总量同比增长16%左右,软件和信息技术服务业收入同比增长13%左右。截至11月,累计建成5G基站328.2万个。
会议强调,2024年要围绕高质量发展,突出重点、把握关键,抓好十二个方面重点任务。
一是全力促进工业经济平稳增长。抓好稳增长政策落地见效,深入实施十大行业稳增长工作方案,支持工业大省继续“挑大梁”,做好经济宣传、政策解读和舆论引导。深化原材料、消费品“三品”行动,提振新能源汽车、电子产品等大宗消费。深化产融合作,做好制造业重点外资项目服务保障。保持烟草行业平稳增长。
二是全面实施制造业重点产业链高质量发展行动。统筹推进关键核心技术攻关工程、产业基础再造工程和重大技术装备攻关工程,强化应用牵引,加快技术攻关突破和成果应用,实现“化点成珠、串珠成链”。
三是提升产业科技创新能力。大力推进科技创新和产业创新深度融合,深入实施科技创新重大项目,持续优化创新平台网络,加快培育创新型企业,打造“火炬”品牌升级版。推进园区提质增效,启动创建国家新型工业化示范区。
四是加快改造提升传统产业。实施制造业技术改造升级工程,支持企业设备更新,加快钢铁、有色、轻工等重点行业改造升级。推动制造业“智改数转网联”,深化智能制造试点示范,推进开源体系建设。继续办好产业转移发展对接活动。
五是巩固提升优势产业领先地位。加快强链补链延链,提升全产业竞争力。支持新能源汽车换电模式发展,抓好公共领域车辆全面电动化先行区试点。加强光伏行业规范引导和质量监管。促进稀土在航空航天、电子信息、新能源等领域高端应用。
六是加快培育新兴产业。启动智能网联汽车准入和上路通行试点,推进北斗规模应用和卫星互联网发展。壮大新能源、新材料、高端装备、生物医药及高端医疗装备、安全应急装备等新兴产业,打造生物制造、商业航天、低空经济等新的增长点。出台未来产业发展行动计划,瞄准人形机器人、量子信息等产业,着力突破关键技术、培育重点产品、拓展场景应用。
七是推动信息通信业高质量发展。统筹“建、用、研”各项工作,推进5G、千兆光网规模部署,加快布局智能算力设施,加强6G预研。创新信息通信市场监管,纵深推进行风建设和纠风工作,完善应急通信预案和指挥体系。推动5G规模化应用,出台工业互联网高质量发展指导意见。开展关键信息基础设施防护提升专项行动,提升行业数据安全管理水平。
八是推动工业绿色低碳发展。稳妥推进工业领域碳减排,严控钢铁、水泥、平板玻璃新增产能,开展工业数字化碳管理试点,深入实施工业能效、水效提升行动,积极探索新兴固废综合利用市场化途径,大力发展绿色低碳产业,全面推广绿色制造。
九是促进中小企业高质量发展。实施一批普惠性帮扶政策,多渠道支持专精特新企业创新发展,深入开展中小企业数字化转型城市试点和“三赋”专项行动。加快建设全国中小企业服务“一张网”。深入实施促进大中小企业融通发展等系列活动。
十是优化国防科技工业体系布局,巩固提高一体化国家战略体系和能力。
十一是支持部属高校“双一流”建设。加强党建、思政和意识形态工作,构建特色鲜明、优势突出的学科专业体系,培养造就拔尖创新人才,支持部属高校参与国家实验室建设,保障校园安全稳定。
十二是提升行业治理现代化水平。加强对产能过剩行业的规范指导。实施新产业标准化领航工程。落实制造业全面对外开放措施,放宽电信市场准入,深化双多边机制合作。抓好制造业人才培养等重点项目实施。加强通信管理局建设。支持部属单位聚焦主业、突出特色,打造核心支撑能力。加强民爆行业监管,抓好通信业及通信设施建设安全生产监管。做好重大活动和突发事件通信服务、网络安全、无线电安全等保障工作。
政策链接:
https://www.miit.gov.cn/xwdt/gxdt/ldhd/art/2023/art_bfa8bab733374d2a9a79f5c86935aead.html
国家数据局发布《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》
12月15日,为深入贯彻落实习近平总书记关于发挥数据要素作用的重要指示精神和党中央、国务院决策部署,发挥数据要素乘数效应,国家数据局研究起草了《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》。
以下为政策主要内容:
二、 总体要求
(三)总体目标
到2026年底,打造300个以上示范性强、显示度高、带动性广的典型应用场景,产品和服务质量效益实现明显提升,涌现出一批成效明显的数据要素应用示范地区,培育一批创新能力强、市场影响力大的数据商和第三方专业服务机构,数据产业年均增速超过20%,数据交易规模增长1倍,场内交易规模大幅提升,推动数据要素价值创造的新业态成为经济增长新动力,数据赋能经济提质增效作用更加凸显,成为高质量发展的重要驱动力量。
三、重点行动
(四)数据要素×智能制造
创新研发模式,支持工业制造类企业融合设计、仿真、实验验证数据,培育数据驱动型产品研发新模式,提升企业创新能力。推动协同制造,支持链主企业打通供应链上下游设计、计划、质量、物流等数据,实现敏捷柔性协同制造。强化区域联动,支持长三角、粤港澳、京津冀等区域,推动产能、采购、库存、物流数据流通,加强区域间制造资源协同,促进区域产业优势互补,提升产业链供应链监测预警能力。开发使能技术,推动制造业数据多场景复用,支持制造业企业联合软件企业,基于设计、仿真、实验、生产、运行等数据积极探索多维度的创新应用,开发创成式设计、虚实融合试验、智能无人装备等方面的新型工业软件和装备。
(五)数据要素×智慧农业
推进产业链数据融通创新,支持第三方平台企业面向农户提供智慧养殖、交易撮合、疫病防治、行情信息等服务,打通用料用药、生长、销售、加工等数据,提供一站式采购、供应链金融等服务。培育以需定产新模式,支持农业与商贸流通数据融合分析应用,鼓励电商平台、商超、物流等基于销售数据分析,向农产品生产端与消费端反馈农产品信息,提升农产品供需匹配能力。提升农业生产抗风险能力,支持在生猪、果蔬等领域,强化产能、运输、农批农贸市场价格数据融合、发布、应用,支持农业监测预警,减少周期波动造成的损害。
(六)数据要素×商贸流通
拓展新消费,鼓励各类商贸经营主体、相关服务企业依托客流数据、消费行为、交通状况、人文特征等市场环境数据,打造集数据收集、分析、决策、精准投送和动态反馈的闭环消费生态,推进直播电商、即时零售、反向定制(C2M)等发展。培育新业态,支持电商平台、传统商贸流通企业加强数据融合,整合订单需求、物流、产能、供应链等数据,优化配置产业链资源,打造快速响应市场的产业协同创新生态。
(七)数据要素×交通运输
提升多式联运效能,推动铁路、公路、水路、民航、邮政快递、海关等客票系统互联互通,推进货运寄递数据、运单数据、结算数据、保险数据、货运跟踪数据等共享互认,促进物流降本增效。挖掘数据复用价值,融合“两客一危”、网络货运等重点车辆数据,构建覆盖车辆营运行为、事故统计等高质量动态数据集,为差异化信贷、保险服务、二手车消费等提供数据支撑。支持龙头企业推进运输高质量数据集建设和复用。推进智能汽车创新发展,支持自动驾驶汽车在特定区域、特定时段进行商业化试运营试点,打通车企、第三方平台、运输企业等主体间的数据壁垒,促进道路基础设施数据、交通流量数据、驾驶行为数据等多源数据融合应用,提高智能汽车创新服务、主动安全防控等水平。
(八)数据要素×金融服务
提升重点领域金融服务水平,支持金融机构融合科技、环保、工商、税务、气象、消费、医疗等数据,加强主体识别,优化信贷业务管理和保险产品设计,探索开发基于数据资产的金融产品和服务,提升科技金融、绿色金融、普惠金融、养老金融等服务水平。提高金融抗风险能力,推进数字金融发展,在安全合规前提下,推动金融信用数据和公共信用数据、商业信用数据共享共用和高效流通,支持金融机构间共享风控类数据,基于人工智能算法对金融市场、信贷资产、风险核查等多维数据融合分析,支撑提升金融机构反欺诈、反洗钱能力,提高风险预警和防范水平。
(九)数据要素×科技创新
推动科学数据有序开放共享,加强重大科学基础设施、野外台站、科研仪器、科学计算等产生的各类科学数据开放共享,在注重知识产权保护基础上,提升科学数据复用价值。以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。
(十)数据要素×文化旅游
培育文化创意新产品,推动文物、古籍、美术、地方戏曲剧种、非物质文化遗产、民族民间文艺等数据资源依法开放共享和交易流通,支持文化创意、旅游、教育、研究、展览等领域的经营主体加强数据开发利用,培育具有中国文化特色的产品和品牌。探索公共文化大模型应用,贯通各类文化机构数据中心,关联形成中华文化数据库,探索建设公共文化知识数据集,鼓励依托市场化机制开发公共文化大模型。
(十一)数据要素×医疗健康
便捷医疗理赔结算,支持医疗机构基于信用数据开展先诊疗后付费就医。支持医保、商保机构间加强医疗病历、医保结算、商保信息等数据协同,实现一站式理赔结算,提升医保控费、商保理赔风险防控能力。有序释放个人健康数据价值,完善个人健康数据档案,融合体检、就诊、疾控等数据,创新基于数据驱动的癌症早筛、职业病监测、公共卫生事件预警等公共服务模式。加强医疗数据融合创新,支持公立医疗机构合法合规前提下向金融、养老等经营主体共享数据,支撑商业保险产品、疗养休养等服务产品精准设计,拓展智慧医疗、智能健康管理等数据应用新模式新业态。提升中医药发展水平,加强中医药诊疗、用药等多源数据融合,支撑开展中医药疗效、药物相互作用、适应症、安全性等系统分析,推进中医药高质量发展。
(十二)数据要素×应急管理
提升应急处置效率,推动灾害事故、物资装备、特种作业人员、安全生产经营许可等数据跨区域共享共用,提高监管执法和救援处置协同联动效率。提升安全生产管理能力,探索利用电力、通信、铁塔等公共数据,结合安全生产和自然灾害数据,提升对私挖盗采、明停暗开行为的精准监管。支持危险化学品生产、经营、储存、运输、使用等各环节数据融通,提高危化品全生命周期安全监管水平。
(十三)数据要素×气象服务
创新气象产品服务,支持保险、金融企业融合应用气象数据,发展天气指数保险、天气衍生品和气候投融资新产品,为保险、期货等提供支撑。
(十四)数据要素×智慧城市
优化城市管理方式,推动城市人、地、事、物、情、组织等多维度数据融通,支撑公共卫生、交通管理、公共安全、生态环境、基层治理等各领域场景应用,实现态势实时感知、风险智能研判、及时协同处置。支撑城市发展科学决策,支持利用城市时空基础、资源调查、规划管控、工程建设项目、物联网感知等数据,助力城市规划、建设、管理、服务等策略精细化、智能化、可持续。推进公共服务普惠化,深化公共数据的共享应用,深入推动就业、健康、卫生、医疗、救助、养老、助残、托育、未成年保护等服务“指尖办”“网上办”“就近办”。
(十五)数据要素×绿色低碳
提升能源利用效率,开展制造与能源数据融合创新,推动能源企业与高耗能企业打通订单、排产、用电等数据,打造能耗预测、多能互补、梯度定价等应用。提升废弃资源利用效率,汇聚固体废物收集、转移、利用、处置等各环节数据要素,促进产废、运输、资源化利用高效衔接,推动固废、危废资源化利用,促进绿色降碳发展。提升碳足迹管理水平,支持打通关键产品全生产周期的物料、辅料、能源等碳排放数据以及行业碳足迹数据,开展产品碳足迹测算与评价,引导企业节能降碳。加强生态环境公共数据融合创新,推动生态环境数据依法有序共享,支持企业开展自有数据、公共数据等融合分析,通过环境质量监测、环境信用评价等,强化环境数据在服务金融机构贷款审核、绿色供应链资质评定中的应用。
政策链接:
https://www.ndrc.gov.cn/hdjl/yjzq/202312/P020231215685140119139.pdf
行业会议
亚马逊云科技re:Invent 2023中国行城市巡展—北京站
12月12日,在2023亚马逊云科技 re:Invent 中国行城市巡展-北京站的re:Invent 2023 全球大会主题演讲分享中,亚马逊云科技大中华区产品部总经理陈晓建以重塑云计算和利用生成式AI重塑未来两个主题进行分享。
以下为会议的主要节选内容:
通用计算芯片
芯片是企业所有工作负载的基础。亚马逊云科技十多年来持续针对自研芯片进行创新,每一代自研芯片都提升性价比和能效;同时为客户提供了基于AMD、Intel以及英伟达等的最新芯片和实例组合。在re:Invent 2023,亚马逊云科技重磅推出了Amazon Graviton4和 Amazon Trainium2自研芯片,为机器学习训练和生成式AI应用等广泛的工作负载提供更高性价比和能效。
Graviton4是亚马逊云科技芯片中,最强大、最节能的芯片。与当前一代 Graviton3 处理器相比,平均性能提升高达30%,独立核心增加50%以上,内存带宽提升75%以上,为在 Amazon Elastic Compute Cloud(Amazon EC2)上运行的工作负载提供最佳性能和能效;基于 Graviton4的Amazon EC2 R8g实例目前已提供预览。值得一提的是,通过与光环新网和西云数据的紧密合作,基于Graviton3处理器的Amazon EC2 C7g、M7g、R7g实例目前均已在亚马逊云科技中国(北京)区域和中国(宁夏)区域正式可用,为中国客户广泛的云上工作负载带来更高性价比和能效。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
让每个企业都可以利用生成式AI进行创新
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
生成式AI正在以意想不到的方式改变人类的生产力,激发人类的智慧和创造力,未来生成式AI与业务的结合会充满各种可能性。愿景是美好的,现实是企业在落地生成式AI时会面临各种各样的挑战,如何兼顾规模和成本,如何选择最合适的生成式AI模型,如何保证业务的安全性和隐私,如何利用自有数据训练模型让生成式AI成为所在领域的专家等等。因此亚马逊云科技提供端到端的三层架构:1)底层提供用于训练模型的基础服务能力;2)中间层提供访问基础模型的最便捷方式;3)顶层提供开箱即用的解决方案,帮助客户更快捷地使用生成式AI的服务。
用于基础模型训练和推理的基础设施
亚马逊云科技是第一个把GPU带到云上的云供应商,推出全球首个云上GH200 AI超级计算集群,拥有16384个GH200芯片,可以达到65个ExaFLOPS的性能。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
亚马逊云科技在芯片层面上进行了创新,推出了专门用于训练和推理的芯片:Amazon Trainium、Amazon Inferentia和用于生成式AI和机器学习训练的芯片:Amazon Trainium2。Trainium2芯片专为以高性能训练具有数万亿个参数或变量的基础模型和大语言模型而构建。与第一代Trainium芯片相比,性能提升多达4倍,内存提升3倍,能源效率(每瓦性能)提升多达2倍。
为应对基础模型的训练中所充满的各种各样的挑战,包括数据收集、集群创建、集群调度分配训练任务、模型检查和优化以及硬件问题处理等。亚马逊云科技推出五项Amazon SageMaker新功能,助力规模化开发应用模型。Amazon SageMaker的五项新功能让企业更轻松快速地构建、训练和部署支持各种生成式AI使用场景的机器学习模型。新功能包括:Amazon SageMaker HyperPod可大规模加速基础模型训练,能够缩短高达40%的训练时间,并可以确保持续数周或数月的训练过程不中断,简化大型训练集群的分布式训练,可实现自动备份等功能;Amazon SageMaker Inference推理功能可平均降低50%的部署成本和20%的推理延迟;Amazon SageMaker Clarify可以帮助客户评估、比较和选择最佳模型;Amazon SageMaker Canvas的两项增强功能——用自然语言指令准备数据、利用模型进行大规模业务分析,将使客户能够更轻松、更快速地将生成式AI集成到他们的工作流程中。
使用基础模型进行建构的工具
在本次大会亚马逊云科技首次推出Amazon Bedrock平台,助力安全构建和规模化生成式AI应用。来自Anthropic、Cohere、Meta、Stability AI和亚马逊最新的高性能模型为客户提供更丰富的行业领先模型选择,以支持各种用例。Bedrock可以简化模型选择,支持根据企业自有数据进行定制模型,具有差异化定制能力,是一种通过大语言模型和其他基础模型构建和扩展生成式AI应用程序的简单方法。推出ANTHROP\C Claude2.1模型,大幅提升准确性,将模型“幻觉”出现的概率降低50%。此次发布进一步降低生成式AI应用的门槛——为客户提供了更多行业领先的模型选择和评估模型新功能,以简化客户使用相关和专有数据定制模型的方式;提供自动执行复杂任务的工具;并为客户配备了提供负责任地构建和部署应用程序的保障。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
推出可以实现把大模型和业务程序相连接的Amazon Bedrock Agents,利用Agents分布定制任务的步骤有三步。第一步:定义指令和编排,利用基础模型将任务分解为多个步骤;第二步:增强检索生成(RAG),配置基础模型并与公司数据联动;第三步:完成任务,执行API调用以满足用户请求。Amazon Bedrock可以简化模型的选择、定制和集成。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
基于25年人工智能和机器学习经验,亚马逊云科技推出自研的Amazon Titan模型,该模型是来自亚马逊的高性能基础模型,提供一系列功能强大且经济实惠的模型。Amazon Titan Text Embeddings可以实现将文本转化为向量,适用于基于语义搜索的场景,提高搜索的相关性。针对文生文的服务,Titan中包含两个模型,其中Amazon Titan Text Express适合于比较复杂的环境,可以用于生成详细的产品描述;而Amazon Titan Text Lite适用于摘要、文案微调的小场景,可以用于生成提示词、搜索词等。针对多模态应用,Amazon Titan Multimodal Embeddings可以直接创建更丰富的多模态的应用搜索和体验,接受文本、图像或文本图像的组合来生成嵌入。Amazon Titan Image Generator是文生图的工具,可以生成逼真的、工作室品质的图像,是主要适用于营销广告场景的图片文字模态模型,可以用于制作定制化宣传照片,而且所有生成的图像均带有隐形水印,支持负责任的AI。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
生成式AI的功能如此强大,所以也带来了滥用的可能性。既需要充分释放AI的潜力,也要有效地管理风险,因此推出全新服务Guardrails for Amazon Bedrock。通过负责任的AI策略,保护客户的生成式人工智能应用程序。具体来看,该项服务通过提供监管工具,告诉AI能做什么、不能做什么,限制模型能反馈和不能反馈的信息,配置有害内容过滤。例如银行可以配置Agents不提供投资建议等等。同时Amazon Bedrock助力数据安全和隐私,不会用客户的数据训练底层模型,数据传输和存储的过程中都会进行安全加密。
利用基础模型构建的应用程序
针对客户开箱即用的需求,亚马逊云科技提供了一系列的解决方案。Amazon CodeWhisperer是一个代码生成工具,可以提供更好、更具相关性的代码建议,帮助客户更快、更便捷地构建应用程序。Amazon Q是专为客户的业务量身定制的生成式AI智能工作助手,可以通过自然语言交互快速获得答案,通过现有身份和访问权限进行访问,保护用户隐私和数据安全。Amazon Q的四个主要应用场景为:1)帮助开发人员和构建者。Amazon Q基于亚马逊科技17年知识的训练,是在亚马逊云科技上构建的专家助手,用户可通过自然语言的方式获得任何关于亚马逊云科技产品的相关问题,例如故障发生原因和解决办法。Amazon Q还提供两个实用功能,一是作为虚拟程序员帮助功能的开发,二是代码转换。2)可以作为商务专家,帮助企业的业务人员更高效地完成工作。通过与多种多样的企业信息库进行连接,综合所有信息之后,安全、私密地为业务问题提供快速、准确且相关的答案,并且可以提供问题答案的来源。3)可以作为商业智能专家,完成商业智能(BI)工作,例如当向Amazon Q提问免费客户的转化率,就可以生成报表及详细的概要总结。4)Amazon Q作为客户服务代理支持,可以自动检测客户问题,并且通过搜索内部知识库,快速给出回复和建议,并且可以对电话的内容进行总结分析,从而对还未解决的问题进行后续的跟进,提高客户满意度和客服工作效率。Amazon Q可以重塑未来工作方式。作为一种新型生成式AI支持的助手,可以根据客户业务进行定制,专门用于满足办公场景需要。Amazon Q已向客户提供预览版,Amazon Connect中的Amazon Q已正式推出,Amazon Supply Chain中的Amazon Q即将推出。
图片来源:亚马逊云科技re:Invent 2023中国行城市巡展—北京站
在生成式AI的今天,企业不仅需要有一个强大的模型,还需要有坚实的数据底座。拥有一个有效的数据底座是提升企业竞争力的有效途径。一个强大的数据基石应该是全面的、集成化的和可治理的。
在演讲结束之前,陈晓建还分享了亚马逊云科技在量子计算领域最新的技术进展。目前可以实现进行1000次量子计算中发生1次错误,但这还远远不够,希望能够做到1000亿次操作中才发生1次错误,因此亚马逊云科技做出了自己的努力。亚马逊云科技内部设计和制造了量子计算芯片,以逻辑量子位元的方式,通过将比特翻转和相位反转分离实现纠偏,从而将位翻转误差比相位翻转小100倍,预计硬件开销减少6倍。
MEET2024智能未来大会召开
以通用人工智能赋能智能汽车
商汤科技联合创始人兼首席科学家、绝影智能汽车事业群总裁 王晓刚
12月14日,在北京举行的MEET2024智能未来大会上,商汤联合创始人、首席科学家王晓刚分享了通用人工智能和大模型给智能汽车带来的技术突破和发展机遇。
人工智能新范式AGI已经到来
人工智能在工业上的落地和应用,问题在于针对不同的任务,需要定制化的模型去定制解决方案。之前做过的一个统计显示,在过去的几年里,商汤科技输出的商业化模型超过3万多个,一方面可以看到这些AI应用的广泛,另一方面也能够看到它的研发成本很高且研发周期非常长。
从去年年底,大模型ChatGPT的出现改变了人工智能的新范式,基于一个或者几个非常强大的大模型,能够去解决众多的开放式的任务,为人工智能的规模化产业应用打开了一个新的道路。回顾人工智能的发展,过去几十年里人工智能的发展解决的都是小样本问题,因为当时的数据量非常的小,所以用到的计算资源和模型规模也比较小。但是2012年随着深度学习的出现,算力得到了一个大幅的增长,后续各类大模型的出现,使得算力得到了更大规模的增长。智能汽车领域的行业标杆是特斯拉,举例来说,今天特斯拉有14,000块 GPU,到明年它的算力要增加到10万块,所以这样一个增长规模背后强大的算力支撑,实际上是给未来行业的发展指引了方向。
商汤从2018年开始布局大模型,当时在上海临港投资50多个亿建了一个人工智能的数据中心。在那个时候很多人不理解,作为一个算法公司,为什么在基础设施的建设上要投入如此大的成本。今天我们会看到对于通用人工智能大模型的发展,软硬件基础设施的能力是必不可少的。特别是如今国际形势发生变化,高端GPU的供给受到阻碍,算力储备以及拥有自主算力成为一种战略资源。各类大模型,包括感知模型、生成式模型、语言模型、文生图模型、多模态模型,还有决策智能的各种模型,都建立在强大的软硬件基础设施系统能力的基础之上。这些模型之间也有很大的相关度,比如说多模态模型实际上是基于语言模型和视觉模型的基础上去发展起来的;决策智能模型,也是利用了语言模型强大的推理的能力。在自动驾驶的场景中,基于大模型可以打破以前对于手写规则的依赖,能够针对场景进行复杂推理,根据图像对各种交通状况进行分析,比如当有救护车出现应该怎么样去做出避让,能够让未来的智能汽车应对更加复杂的场景。
绝影:大模型时代,汽车智能化的核心供应商
绝影是商汤智能汽车的业务板块,在智能汽车时代,作为大模型和通用智能的供应商,主要聚焦在智能驾驶、智能座舱和AI云服务。在智能驾驶方面,提供软硬一体的智能驾驶的解决方案,未来智能驾驶的发展趋势更多的是基于视觉,通过一个大模型去端到端地实现自动驾驶,因此其中也离不开大模型的应用。在智能座舱方面,现有的智能座舱是各个AI供应商提供一些单点的AI的功能,但大模型的出现使打造智能座舱的大脑成为可能,通过一个大模型可以去调动各种AI的功能、舱内的各种APP和各种硬件部件,从而形成更好的体验。在这一过程中需要依赖强大的AI的云服务,很多主机厂也希望能够拥有AI的基础设施,包括形成数据的闭环。从大量的量产汽车里面能够去采集海量的数据,如何快速的、高效的、低成本的针对这些数据进行分析处理和标注,能够体现出大模型的优势。
图片来源:MEET2024智能未来大会
图片来源:MEET2024智能未来大会
商汤基于大模型建立了一整套的研发体系,通过各种技术支撑驾驶和座舱,包括车路协同的各种应用。对于智能座舱,打造了座舱的大脑,核心是基于语言模型的能力去控制舱里面的各种软硬件。借助车内和车外各种各样的传感器,通过多模态模型全方位感知环境和乘客,满足驾驶员的需求。基于模块对乘客和驾驶员有长短期的记忆,通过外挂知识库跟大模型的结合进行知识融合,从而能够去形成千人千面的服务。具体来看,利用大模型在智能座舱里开发的一系列应用和产品,包括绘画内容的生成、AI说明书、健康问诊、旅游规划等,能够把座舱的智能化体验提升到一个新的层次。
图片来源:MEET2024智能未来大会
智能驾驶未来的一个发展趋势是往纯视觉的方向发展,目前智能驾驶的系统在硬件上还是依赖于各种传感器,将来会更多的依赖于摄像头,大幅降低硬件成本。现有的智能驾驶系统里面感知、融合、预测、定位等模块,只有感知部分,用的是AI和神经网络。当自动驾驶覆盖的场景,从相对来说比较简单的高速领航,到更复杂的城区领航,依靠手写规则已经是不现实的,则需要依赖于数据的驱动和大模型,把所有的模块串联起来,通过数据的驱动去覆盖尽可能更多的场景,这也是未来自动驾驶的一个发展路线。
图片来源:MEET2024智能未来大会
在未来的1-2年里面,智能汽车的发展其实是处在一个关键突破的时间点。以大模型为基础的三件事情:第一个是端到端数据驱动的自动驾驶,第二个是以大模型为基础和核心的座舱大脑的出现。另外就是舱驾融合,在同一个芯片上实现,大幅降低了成本和共享算力,形成更好的产品融合以及智能驾驶和座舱的智能化体验。
终端侧AI是AI的未来
高通技术公司产品管理高级副总裁 颜辰巍
为什么端侧大模型是未来的发展趋势(手机端、PC端)
一是云经济难以支持生成式AI规模化扩展:生成式AI单次查询成本是传统方法的约10倍,且当数十亿用户都在使用复杂模型时,云计算推理综合成本会急剧增加。二是很多数据本身是在端侧,因此在端侧做计算是最经济的,同时也可以更好地保护用户隐私。三是由于高通做移动终端,因此强调移动终端运营大模型的能力,有些应用场景可能没有5G数据连接,这时候就必须有本地计算能力。
终端侧AI能够支持丰富的生成式AI模型
为实现终端侧AI发展,骁龙10月份发布两款专为生成式AI而打造的新芯片:分别是面向PC端的低功耗大算力AI PC智能平台X-Elite, 以及面向智能手机的第三代骁龙8 Hexagon NPU,相较于上一代性能提升98%,能效提升40%。
图片来源:MEET2024智能未来大会
只有当终端就能运行基于AI大模型的用例,端侧与云侧能够很好结合时,生成式AI才能大规模普及,发挥出所有的潜力,加之大语言模型的性能愈发强大,随着基础模型的创新,很多用例可以完全在终端上运行,从而实实在在得改变人们的互动方式。
高通在终端侧AI的应用方面,已开发出一系列应用。例如可以实现1秒内快速文生图的全球最快终端侧Stable Diffusion、生成式AI模型终端侧、全栈AI优化模型、支持开发者优化AI模型以及支持更直观的用户体验的多模态生成式AI。
图片来源:MEET2024智能未来大会
源2.0在大模型算法、数据与算力上的探索与实践
浪潮信息人工智能高性能计算产品线副总经理 吴韶华
2021年浪潮信息发布了源1.0模型,该模型基于经典Transformer结构,支持开发者调用API直接利用。两年后,浪潮信息发布了源2.0大模型,相比于源1.0大模型,源2.0大模型支持中英双语,且代码逻辑更出色。具体来看,两个版本的迭代的改进主要体现在以下三个方面:
一是算法改进。浪潮信息提出了卷积过滤结构,LFA(Localized Filtering-based Attention)针对自然语言的局部依赖进行建模,例如假设句子中相邻词间具有更强的依赖。相比传统Attention注意力结构,模型精度提高3.53%。
图片来源:MEET2024智能未来大会
二是数据改进。源2.0在训练数据来源、数据增强和合成方法方面进行创新,更加注重提升数据的质量。模型的训练数据来源除了互联网,还采用了基于大模型的数据生产及过滤方法,用大型语言模型作为数据训练生成器,在保证数据多样性的同时提升数据质量,获取了一批高质量的数学与代码预训练数据。
图片来源:MEET2024智能未来大会
三是计算改进。针对多元异构芯片间P2P带宽的极大差异,浪潮信息在3D并行策略的基础上提出了一种非均匀流水并行的分布式训练方法,大幅减少大模型对节点芯片间通信带宽的需求,使得模型的性能不随带宽变化,具有更广的适应性。
图片来源:MEET2024智能未来大会
源2.0大模型可以应用于数学问题求解等场景。源2.0发布后,浪潮信息发布了“源2.0大模型共训计划”。做到模型全开源、免费可商用。且开发者可以提场景需求,浪潮信息研发团队基于数据清洗平台,训练模型之后直接开源到社区。
好文章,需要你的鼓励