2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx
《2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx》由会员分享,可在线阅读,更多相关《2024北京市人工智能大模型行业应用分析报告-北京市科学技术委员会.docx(40页珍藏版)》请在课桌文档上搜索。
1、大模型行业应用分析报告北京市人工智能北京市科学技术委员会、中关村科技园区管理委员会二。二四年四月目录编写说明-00-综述-05-一.大赛开放多维度场景及高质量数据,大模型企业奇招频出0(一跟务领域0*.赛题情况0*.企业解决方案亮点0(二途融领域-*1.,-兄”.0。,企业解决方案亮点*0(三产业升级领域赛题情况.企业解决方案亮点9(j,*e0*。一赛题情况一。.企业解决方案亮点/(五淡化教育领域*5。.赛题情况*5。.企业解决方案亮点一(六)8禁城市领域.赛题情况.企业解决方案亮点.二、北京市人工智能大模型行业应用情况分析-O0-(一应用特征-OO-。由浅入深,大模型穿越边缘场景,向核心场景
2、挺进0-.守正獭,央国企翔蹒技术,加快大模型在产业升级、金融等领域的落地步伐.百花齐放.大模型应用搭建难度下降.旬态行业大成为落地。5g.QQ-g9305g“。g新关键OO体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明5.保驾护航,大模型安全逐渐受到策视,为可持续发展提供保障(二应用挑战e算力需求持续增长,挈时大模型落地应用一知识产权、数据除私与大模型应用之间的最佳平衡点仍在探索中.大模型幻觉问题有所改菁,但距离规模落地尚有差距.部分大触!应用处于何用阶段.需求方和技术企业协同发力让回ff1.53S1.辆5.部分领域受监管影响,对大模型落地提出特殊要求(三应用研判.政务领域.金融领域。产
3、业升级领域。.医疗领域5.文化教育领域智赫城市领域结语致甜声明附录写说明编写说明大棋型是指通过在海量数据上依托强大算力资源进行训练后的完成大量不同下游任务的模型。大模型以其在模型精度和泛化能力等多个指标上超越传统A1.模型的表现,以及JR能千行百业的巨大潜力,成为当今世界各国人工智能技术发展的核心方向。大模型经过一年多的高速发展,已在政府、医院、学校、企业等各类需求群体中建立初步认知。其中一部分需求群体设立专项预算、开放业务场景.对大模型进行试点应用。通过试点应用,需求群体加深了对大模型能力和价值的认同感,进而普遍希望在未来继续增加相关预算,将大模型与实际业务进行更深入、更广泛的融合。在此背景
4、下,北京市科学技术委员会、中关村科技园区管理委员会会同有关部门和相关区举办了北京市人工智能行业大模型创新应用大赛,并依托大赛成果及前期工作积累编写本报告,致力于分析北京市大模型行业应用发展趋势,促进大模型价值传播和供需对接。限于煽写时间仓促、编写人员知识积累有限、整体场景应用尚不成熟等方面的影响,内容或有疏漏,敬请指正。综述d源市税粮布人工智IB,加速推动产业夏展I人工智能大模型经过过去一年的发展,行业应用开始出现井喷式增长,作力发展新质生产力的垣要引擎,人工智能正成为经济高质发展的最大增。北京市委市政府高度电视人工智能发展.0。年5月,北京市政府印发北京市加快建设具有全球影响力的人工智能创新
5、策源地实施方案(0-0。5年R,强调构建高效协同的大模型技术产业生态,建设大模型算法及工具开源开放平台,构建完整大模型技术创新体系。北京市政府办公厅印发羽晾市促迸通用人工智能创新发展的若干措施b,强调开展大模型创新算法及关健技术研究、加强大模型训练数据采集及治理工具研发,推动大模型在政务、医疗、科学研究、金融等领域的示范应用。近年来,北京市积极布局人工智能产业发展要素,通过部署智能算力平台、建设数据基础制度先行区,发布中文互联网语料庠、设立产业投资基金、建设大模型产业集聚区等一系列举措,加速推动人工智能产业发展。截至目前,全市人工智能相关企业均900家,约占全国四成的年人工智能产业核心产值突破
6、500亿元。北京人工智签领域越新和产业链条完整,在基咄设施层面集聚了寒武纪、摩尔线程、昆仑芯等国内头部企业;核心技术及算法屋面拥有百度、智诣、百川智能、月之暗面、零一万物等代表性基础大模型,目前已备案上坡大度型5。款,全国第一;应用层面拥有猿力科技、中科闻歌、瑞莱智慧等行业大模型技术企业,相关产品已在教育、金融、政务等领域率先应用。北京市以行“大新亶用大赛为振手全力推动大模超技术应用落地为进一步加强重点领域大模型裳设,根据市委市政府整体部鲁,在市人工智能专班的统筹调度下,北京市科委、中关村管委会会同相关单位,国绕重点行业领域,研究建立全市行业大模型应用推进工作机制,并于eo年月举办北京市人工智
7、能行业大模型创新应用大赛,全力推珠模组技术应用落地。以期通过大赛,挖掘一批典型的行业应用案例,启发一批潜在试点单位拥抱大模型技术.梳理一批核心业务场景,开放一批行业核心业务数据,发现一批有潜力有实力的大模型技术企业,推动一批大模型供需之间的交流与合作。大赛设覆政务、金融、产业升级、医疗、文化教育、智点城市个赛道,分初赛和复赛两个阶段。初赛阶段类似“自由创作,针对参赛团队所申报的应用案例,BS绕商业价值和社会效益进行烁合评估:复赛阶段类似,命题作文”,结合试点单位真实业务需求,由试点单位出题,对通过初赛的大模型技术企业进行能力考核。历经数月,大赛从。个赛道00余家参赛单位中,征集应用案例。0余项
8、凝练应用场景5个.开放高质量行业数据上万条。本报告以大赛为切入点,展示了北京市大模班技术在各领域各行业的应用方向,根据不同领域对大模型应用趋势进行分析研判,并提出工作建议,力求向市场各类参与主体呈现北京市人工留能行业大模型创新应用发展态势.为未来决策提供参考。大模型企业奇招:出TO政务领域.赛题情况方向一为基于多形态知识的政务认知智能体系研究,由北京市政务服务和数据管理局提出,以构建高质政务数据知识体系为核心目标,需要参赛企业对全市海政务数据的实时动态挖掘、清洗.标记、转换,并打造大模型测试训练的蜕一平台接口。复赛所用训练及测试数据集由公积金、交管局等政务知识数据脱勖成.可供参赛企业带回,迸行
9、部署调试。该方向将有助于进一步提升政务服务数字化、智能化水平,在政务愁体场景布局中发挥大模型数据中台作用,从而支撑政务领域各项业务的大模型应用。方向二为基于依申请政务服务里项知识图谱的智能咨询,由北京市政务服务和数据管理局提出,以提升办事企业、群众在统政务咨询及申请办事的体脸为核心目标,需要参赛企业针对用户提出的依申请办事相关咨询问题进行精准回答,并锁定服务事项。复赛所用训练及潴试数据集由政务服务事项办事指南、事项说明等数据形成,可供参赛企业带回,进行部詈调试。该场景从形式上属于大模型智斓问答,是市政务服务和数据管理局面向大众群体的重要场景,需要大模型精准把控生成内容的同时保殴用户的良好体验。
10、方向三为面向政策分析场景的政策专业化标注,由北京市政务服务和数据管理局提出,以为政府办事人员提供政策分析问答、指导政策制定为核心目标,需要参赛企业对政策性文件进行条款拆解、理解并训探大箱型,获得准确的问答效果。复赛所用训练及测试数据集由专M新的政策原文数身形成,可供参赛企业带回,进行部詈调试。该场最需要大模型深度理解政策原文对其拆解及标注,并在政策制定的过程中给出参考意见,将有助于提升政策制定的效率及全面性。.企业解决方案亮点在提升回复准他率方面,参赛企业提出两个较为有效的解决方案。部分参赛企业通过外挂知识庠的检索增强(RAG历法来索引政策知识,从而提升大模型生成错果的准确性,弁且可行性较强,
11、但这种方案依赖知识库的知识储备和及时更新,在长期运维过程中不仅带来额外的人力成本也可能生成大量重复、过期的知其部分参赛企业利用大模型来对知识进行分析和存储,相比于外挂检索增强.这种通过大模型对知识迸行管理的方案虽然在短期内可能会因为大模型幻觉等问题在答案精准性上有所欠缺,但长期看,陨着基座大模型霞力不断提升,这类方案地够真正的理解数据,从而更好的更新和利用知识,在开展垂追领域微调后表现出更好的效果。参赛企业在提升用户体览方面也做出了多维度的尝试,从部署上,参赛企业在微调大模型后采用一体机的形式将大模型应用进行私有化部詈,为数据敏感的政务场景提供解决方案。在提升准确度的考虑上,接赛企业利用知识图
12、谙辅助大模型精准定位知识,并通过主动多轮质询用户的方式提升答案质量。s金融领域.赛题情况方向一为豆于A1.GC技术的智能审计合规研究,由北京银行提出,以提高审计工作效率和准确性为核心目标,需要参赛企业什对检查内容.利用大模型技术寻找并给出相关现象涉及的制度名称及相关原文,生成包含检查要点、检查方法等内容的审计合规方案。复赛所用训练及测试数据集由北京银行制度、监管政策以及历史问题库等内部审计合部相关知识形成,仅允许本地私有化部署。金融审计场景作为北京银行的核心业务之一,对审计结果的正确性要求很高,对大模型的检索能力及溯源能力提出较高要求。方向二为基于金融行业的营销引导式智能员工,由北京首创融资担
13、保有限公司提出,以错助业务人员迅速生成风险报告,评估企业风陵情况为核心目标,需要参赛企业对金融场景的数据进行理解并训炼大模型,最终生成包含产品特征、贷款担保资质、项目方案(预估放款金S1.担保费率同问我的解决方案。复赛所用训炼及测试数据集由企业画像、业务评审报告等文件数据形成,仅允许本地私有化部署。金殿担保同时具备金融性和中介性双重属性,为完成融资担保流程,担保公司不仅需要熟悉了解金融专业及法律规定,还需要具备一定的蓄销能力,因此本题目方向覆羞了金融领域的端到端需求,对大模型在金融领域的综合能力提出了较高的要求。.企业解决方案亮点外挂知识昨的检索,技术(RAG同于提开金!大B的回鲁M)MOMM
14、.RAG在使用语言大模型回答问题之前,从外部知识库中检索相关信息,为大模型回答提供外部知识支撑。金融领域业务具有较强的专业性,RAG技术的运用可以让大模型更好的应对知识图集型任务,不同企业在RAG的基础上可以对检索方式进行扩充,从而更准确的命中外部知识,提升回答的精准度。化对齐技术在金IMM发筹要作用.未经强化对齐的模型可能会输出不符合金融行业风格甚至计算错误的结果。金附领域对结果的合规性、专业性要求很高,利用强彳匕对齐技术的参赛企业在本次比赛中表现更好。1产业升锻领域.赛题情况方向一为基于多形态、多维度、多场景数据的企业成本智能化分析及预测,由中都物流有限公司提出,该题目方向以提升物流服务领
15、域企业成本分析和预测的智能化水平为核心目标,需要参赛企业基于企业成本相关的数据集、社会面的数据集开展大模型训练,形成企业成本颈测和分析的大模型智能工具。复赛所用训炼及窝试数据集由中都物流提供的线路成本、台账运营成本等数据脱敏形成、可供参赛企业羽数据带回,进行部署调试。该赛题以企业成本分析为核心目标,本身属于企业数字化转型的任要部分之一,大模型的分析及生成摘要能力.在此场景下有较好的应用空间.将有助于企业智能化决策.帮助企业把控成本。方向二为区于联通业务数据的运营商行业大模型研究,由联通(北京产业互联网有限公司提出,该题目方向以实现运营商业务数字化、办公智能化升级,提升运营商企业服务能力和效率为
16、核心目标.需要参赛企业竹对用户提出的运营商领域相关咨询问题进行精准回答。复赛所用训练及利试数据集由与联通公司相关的媒体报道、产品和方案介绍等内客组成.涉及大数娓、云计算、物联网、区块链、安全、人工智能、产品介绍、解决方案、公司业务等方面,可供参赛企业将数据带回,进行部署调试。北京联通作为北京市的主导通信运营商之一,用户量庞大,每天有海的用户咨询和业务服务,以大模型技术驱动的智能助手将有望在众多运营场景中藕助客户服务和业务合作,实现降本增效的效果。.企业解决方案亮点”企通过大MS1.号*方4搭配解决气条业务耳量网产业升级领域的场景覆盖范围相比于其他领域更加广泛,更看重大模型产品的综合能力,比如在
17、成本预测方面,模型需要更为强大的计算能力来得到准确的结果,而在数字化转型方面则更看重模型的理解及生成能力,因此多家技术参赛企业根据不同细分业务的具体需求选择合浦的模型进行处理,通过大模型与专有模型的合理搭配,形成大模型全产业链解决方案。!EH医疗领域.赛题情况方向一为基于大模型的策症医学领域多源知识体系搭建及临床辅助决策,由北京协和医院提出,该题目以提升重症医学领域科研效率和临床辅助决策能力为目标,需要参赛企业整合重症医学领域专有的指南、文献等数据,构建重症医疗领域高质知识际,从文献知识问答、专业知识考试、重症患者辅助诊断三个维度考察行业大模型能力。复赛所用调练数据集由重症医学领域知识文献、操
18、作指南、专业试题座和入院病历样例四部分银成,不涉及患者临床信息,通过脱敏处理后,可供参赛企业带回,进行部署调试。该赛JS领向于将大模型作为辅助工具,利用大模型的理解和索引能力为医生的科研工作提供帮助,利用大模型的推理能力提供辅助诊断建议.因此该题目方向需要大模型全面无遗漏她生成内容,从而帮助医生迸行判断。方向二为大模型驱动的疑难肝病可解释精准诊断平台构建及应用,由苜都医科大学附腹北京友谊医院提出,该剧目以建设面向复杂肝病会诊场景的可解释智能诊疗系统为目标,研发能筋实现医生和智能体多方.多轮辩论的会诊方法和平台。需要参赛企业构建肝病诊疗智能体,实现对肝SE疾病的初步诊Bi;增强智签体的学习和辩论
19、能力,实现人机联合诊疗最优决策,提升复杂肝病会诊决策准确率。复赛所用训练数据集由友谊医院提供的电子病历、实验室检变指标、腹链影像数据报告的半结构化脱敏数据组成,因数据保密的相关要求,仅允许参赛企业在医院内部进行私有化部署调试。该赛就期待大模型差幅作为一个专业的肝病医生,在复杂的医疗数据中自动化形成确诊,因此对于大模型的专业性及精准住要求更高。.企业解决方案亮点数是决定星疗大Itm性的关!秦.模型训练及测试过程中,面粉不同程度的金标准数据匮乏,少错误数据对医疗大模型的不良影响潍以评估。参赛企业充分利用经专家治理的互联网问诊、全流程诊疗、医学科研、医学知识图语等高版量数据,构建超百亿Token的医
20、学数据集,提升医学领域大模型姜力。长期深耕医疗行业、积58丰富息础医学知识和深入了解医疗场景应用需求的企业研发的医疗领域大模型统合能力更强。助音疗要求*疗大sm备可解哥利可雳源动不同疾病专科的诊疗思路和治疗方式差异大,但共同点是明确诊疗依据.加强诊断准确性。如重症医学诊疗需要大模型辅助提示尽可能多的诊断.用助排壹病因;肝病等专科疾病诊疗需要大模型提升诊断准确率,并具备可解释性和诊断溯源功能。部分参赛企业基于枳果的通用医学知识预训缘大模型,采用多Agent+ReAct思维链跟曲的结构,提升大模型诊断准确性,并补充发现和解器患者可能存在的疾病,得到医疗专家的认可。:文化教育领域.赛题情况方向一为大
21、模组支持下的课堂师生行为精准分析,由北京市第二十中学琨出,该题目方向需要参赛企业对海量课堂数据进行实时动态挖掘、清洗、标记、转换,并打造大模型测试训练的统一平台接口。精准分析课堂教学过程中的师生行为,获得定量的课堂观察数据,解读课型教学过程,为指引老师改善教学方法提供数据依据。复赛所用调练数据集由第二十中学课堂录像数据脱敏形成,数霜包括学生、教师、交互大屏等相关视痰文件,以及课堂音频文件,可供参赛企业将数据带回,进行部詈调试。本题目看重企业对视频关键要素的识别与蜕计,不仅考察了大模型的多模态理解能力,也为后续大模型应用打下教育视频分析的区础,在当前教育行业大模型应用尚未成熟的阶段,该题目可发挥
22、从智能化教育到大模型教育的关健过渡作用。方向二为基于大模型的数智图书馆员服务,由首都图书馆提出,该Ifi目方向以提升首都图书馆对外交互式自助服务水平及读者借阅体编为核心目标,需要参赛企业针对读者提出的知识杳询、智能问答、图书推荐等相关咨询问题迸行精准回答。复赛所用训练及测试数据集由首都图书馆图书借阅信息等数据脱敏形成,包括读者卡号、借还书时间、题名、责任者、出版社、出版年等信息和读者咨询相关问答知识弹,可供参赛企业科数据带回,进行部署调试。该场景应用模式可以复刻于其他图书馆、博物馆寻,开展针对多模态资源的应答式咨询服务等延伸场景。数智图书馆员应用交互利用大模型快速准确的语义识别优势解决了图书馆
23、读者咨询时程中问题泛化的问施,同时结合应用内容快速提供给读者正确方向的内容和知识,让读者互动更接近于人与人之间的交流,让回答更加贴近用户群体。方向三为面向运动员训炼指导场景的大模型技术研究及应用,由北京市体育科学研究所提出,以形成个人专属运动训练基叱模型为目标,迸一步提升运动员训练的数字化、智能化水平,需要参赛企业针对运动员的个人血液生化测试数据与体成分测试数据,应用大模型提供贴合运动员自身的饮食、营养、训练方案;根据个体特征和历史数据迸行智能分析,提供个性化的健康建议,帮助运动员在训练和比赛场上保持最佳状态,预防潜在的健康风险。复赛所用训练数据集由运动员近三年的血液测试、体成分测试、血液报告
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 北京市 人工智能 模型 行业 应用 分析 报告 科学技术委员会

链接地址:https://www.desk33.com/p-1647304.html