2024图书馆领域大模型创新应用需求调研报告(V0-WN8正式版.docx
图书馆领域大模型创新应用需求调研报告(征求意见稿V")上海图书馆(上海科学技术情报研究所)2024年5月第一章前言第二章大模型行业应用调研32.1 大模型行业应用价值32.2 大模型行业应用服分42.3 大模型行业应用技术方案62.3.1 提示词工程62.3.2 检索生成增强2.3.3 智能体102.3.4 型微调132.4 大模型行业应用案例142.4.1 医药健康16.4.2金融保险172.4.3 文化教育18第三章大模型对图书馆的影响203.1 图书馆大模型影响分析203.2 图书馆大模型应用策略233.3 图书馆大模型应用路径253.4 图书馆大模型应用范式273.5 图书馆大模型技术架构29第四理智慈图书馆中的大模型应用314.1 智/服务中的大的大应用324.2 智裁业务中的大模型应用364.3 智型管理中的大模型用384.4 智意空间中的大模型应用41第五章图书馆典里型应用需求及场景举例445.1 钟想咨询455.1.1 需求45512场景举例455.1.3 己有案例462智假资源发现475.2.1 得求分析475.2.2 场景举例47523己有案例4953智意阅读推广495.3.1 需求分析495.3.2 场景举例505.3.3 己有案例515.4智能知识服务525.4.1 需求分析S2542场景举例53第一章前人工智能(AI)技术以其迅猛的发展势头,正在成为推动社会进步的重耍力a.在A1.时代浪潮的推动下,以大模型技术为代表的生成式人工智能已经成为推动科技进步和产业变革的重:量,为各行各业带来了革新的可能。2023年7月.国家互联网信息办公室等七个中央部门联合发布/生成式人工智能服务管理哲行办法3,文件鼓励生成式人工智能技术在各行业、各领域的创新应用,探索优化应用场景,构建应用生态体系.2024年,政府工作报告中明确提出深化人工智能研发应用,开展“人工智能+"行动。国家鼓励人工智能技术与经济社各领域深度融合,以推动各行业应用创新,赋能百业智能化转型升伴随着新代A1.技术的兴起,图书馆界也迎来了重要的契机,步入了一个既充满机遇又面临挑战的新时代。在这一新的技术背景卜.,图书馆作为信息资源中心和知识服务核心场所,必须适应新时代的发展趋势.把握机遇,积极应对将A1.融入运营与服务中的史杂挑战。为了有效应对变革,上海图书馆(上海科学技术情报研究所联合上海人工智能研究院、智慧图书馆技术应用联盟于2023年9月发布f$图节馆大规模模型创新与应用白皮书°白皮书从宏观必面,解读了智敷图书馆在AI2.0时代的发展环境和机遇,勾勒了大模型技术赋能智慈图书馆全景应用视图、实现路径应用架构,为行业推进场景创新、落地实践、生态建设提出了方向性、建设性的参考与建议。本报告R在作为图书馆大规模模型创新与应用白皮书的补充,深入探讨大模型技术在图域的应用价值与潜在影响.在白皮书提出的图书佗领域大模型应用的总体架与应用视图的基础上,本报告进一步分析了大模型技术在智.道图书馆中可实践应用的具体领域、场珏和需求。本报告旨在揭示大模型在智慈图拈馆中的应用潜力与可能性,提供图拈馆在探索大模型技术新应用的参考,以助图书馆更好地把握人工智能发展所带来的机遇。报告第二章首先对大模型的价值、技术、行业应用进行调研,旨在洞察行业趋势,评估大模型技术在图书馆领域的应用前第三章在详细分析了大模型对图书馆的影响后,提出了图书馆应用大模型的、路径和架构。报告第四章根据当前技术发展和落地现状,梳理J'图书馆在智越服务、智慈业务、智越管理、智慈空间四个领域中,当前可实、实施或展望的A1.应用,并进行总结。第五章重:点聚焦于图书馆中的八个典型领域,通过需求分析、场景举例以及相关实践案例,深入探讨了大模里技术在这些领域的应用潜力。这八个领域是:参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文和管理决策,通过对这些关键领域的详细讨论告意在激发更多的创新思维,促进图书馆领域在大模型技术的开发应用和产品设计方面的思考与实践。人工智能技术正处于快速演变之中.因此,本白皮书所阐述的观点和建议反映了当前阶段性的探索与思考。这些内容旨在为图书馆领域的未来发展提供启发,并促进对新兴技术趋势的理解和应用。随着技术进步和实践经验的积累,未来应用模式和需求可能会有所变化,需持续对这些变革保持关注,并适时进行调整和优化以适应新的发展趋势。我们深知报告中存在诸多不足之,因此,我们也诚挚邀各界人士进行批评指正,我们将借助各方经验对报进行修改和完善,从而为智慧图书馆大模型创新应用提供有益参考。第二章大模型行业应用调研2.1 大模型行业应用价值2022年11月上线的生成式人工智(A1.GC.A1.GeneratedComent)应用ChatGPT,在"大模型+大数据+力"的加持下,其在语义理解、文本创作、代码编写、逻辑推理、知识问答等领域表现卓越,在具备/多场景、多用途、踏学科的任务处理能力,是人工智能技术极为关键的发屣节点YChatGPT的横空出世,标志着大语言模型(1.arge1.anguageMode1.1.1.M,简称“大模型D突破自然语言处理(Natura1.1.anguageProcessing,N1.P)领域以小模型为主导的传统发范式。通常认,大语言模型是基于海量自然语言数据进行预训练得到的超大型深度学习模型,参数通常从数十亿到超千亿“底U基于Trmer深度神经网络.由具仃自注意力功能的编码罂和解码器组成,编码器和解码器从一系列文本中提取含义,能够理解更大能囤上下文的单词和短语之间的语义关系。这种巨量数据训练架构使得大语言模型具有了被称为“涌现”的泛化推理能力2,使其具有了通用人工智能(AGI)的特性。用同样方法对海量图片、音频、视频等多媒体信息结合语言数据进行预训练和指令微调的超大型深度学习模型也是大语言模型的一种发展,通常称为多模态大模型。也可以符上述两者并称为“大模型"。大模型的“涌现能力”不仅可以实文本、图像、音频、视频的生成,构建多模态,还可以在更为广泛的领域生成新的设计,新的知识,甚至实现广义的艺术和科学的再创造3。大模型的“大规模”和“预训练”属性,决定了其具有能力泛化、技术融合、应用大核心作用4.(1)能力泛方面,大模型预先在海量通用数据上训练使其具备了通用任务的泛化能力,更可进一步结合垂直行业和业务场景需求进行模型微调和应用适配,摆脱传统A1.能力碎片化、作坊式开发的束缚。大模型得益于其“大规模预训练+调”的范式,可以很好地适应不同下游任务,展现出它强大的通用性。(2)技术腱合方面,文本大模型融合语言、视觉、听觉等多模态信息,通】中W人工程傥学会.中W人I:皆使系列白皮书一一大模型3ffi)zhttpsw.cMi.tnindex.php?shonwart1.c1.edetad3172.htm1.,2023.2赵/李军觌MJ½,图灭一,文联荣.大iff。模型,https:M1.mbook-zh.Mhub.iM2024.3龙之黄妥.大梗型时代:ChirtGPT开启通用人工助解泡沏M.中译出版社,2023.4海通国际.MaaSMode1.asaService模即版务,https7pdf.dfcfw.pdfH3.AP202302081S8288S37S_1.pdf,2023.过对齐预训练和指令微调,实现多模态感知与统一表示:也可集成知识图谱、搜索引擎、代码执行、工具调用等技术,或者与小型融合,从而实现优势互补,性能上实现+的效果,显著提升模型的功能丰富性和性能优越性I2。(3)应用支掾方面,大模型能力的至要体现是复杂任务推理2.复杂推理能够使大模型应用通过与工具、用户和外部环境的互动来完成电杂的指令。这为构建大员应用程序提供了机会,从而使大模型有机会成为下代计算平台/操作系统,有效支撑智能终端、系统、平台等产品应用落地,解决传统A1.应用过程中存在的壁垒多、部署难问题。从人工智能到各行业的商业应用,可以看作是上下游的关系。大模型因其自身在能力泛化与技术融合方面的优势,使其在应用支撑方面具先进性:同时大模型做了相对标准化,下游可以降低对算法的使用成本,商业应用的适配成本。因此,大模型在“AI+”行业中将承担“基础设施”式的功能,作为底座将A1.技术赋能干行百业。也就是说,在战于数据的互联网时代、基于算力的云计算时代之后,将进入基于大模型的AI时代。在未来,基丁大模型,人工智能将如供水供电一般流向终端,流向用户和企业。2.2大模型行业应用服务大模里应用落地场景按照架构层级,一般可分为:模里层、中间层和应用层5。(1)第一层上游基础模型层,也就是由预训练模型为基础搭建的A1.GC技术基础设施层预训练模型的高成本和技术投入,具有较高的进入门槛,不在本文讨论范围。(2)第二层,为中间层,即垂直化、场景化、个性化的模型和应用工具。预训的大模型是基础设施,在此基础上可以快速抽取生成场比、定制化、个性化的小模型,实现在不同行业、垂直领域、功能场景的工业流水线式部署,同时兼具按需使用、高效经济的优势。随若兼具模型和多模态的AIGC模型加速成为新的技术平台,模型即服务(MOde1.ce.MaaS)开始成为现实。OPenAI创始人山姆奥特及(SamAItman)“认为中间那一层会创造很多价值。S腌iR研完胱.AIGC发心势报的2023,https:/eearch.tencereport7id=AJJ,2023.它们不必创建她本模型,可以只为自己或与人共享来创造应用。这是创业公司能够做的关于数据乜轮的事。”(3)第三层,为应用层,即面向端用户的文字、图片、音视频等内容生成服务。在应用以,(W重满足户的需求,将A1.GC模型和用户的需求无缝衔接起来实现产业落地。根据内容生产模态,AIGC能缈被分为四大基础模态,包括文本、音频,图像、视频,每一种模态技术都有着独特的应用场景和特点。此外,这四类模态的融合还带来第五类模态一胯模态内容生成模式,支持创造出更为丰富多彩的AIGC生成内容以2023中关村论坛人工智能大模型发展论坛,阿里云科能集团CTO周靖人表示,“以模型为中心的开发范式(MaaS)已成为行业标准,未应用开发的整个链路都基于这理念来做”。所谓MaaS,模型即服务,指用户可以直接通过AP1.调用基础大模型,为不同的业务场景,来构建、训练和部署专属模型.云平台提供从数据、模型到应用服务的全周期管理和工具。A1.产业的场景落地一直面临碎片化、长尾场景数据较少导致模型训练精度不够等行业痛点。传统“小模型”范式的A1.应用开发流程-一般针对单一场景,独立地完成一系列开发环节,包括模型选择、数据处理、模型优化和模型迭代。因此,A1.应用在定制化需求、长尾求下的开发效率较低,且模型精度、性能、可扩展性等指标质量也会受到影响。随若大模型的出现,A1.应用开发流程转变为,调用通用潦程、结合行业经5佥、解决实际问题.Maas服务商大模型作为重要的生产元素,依托于既有IaaS设施与PaaS平台架构,为卜.提供以大模型为核心的数据处理、模型托管、模型训练、模型调优、推理部署、智能应用开发等多样化需求,保障客户的大模型够顺利交付。客户则通过低成本、高效率的MaaS平台版务获得A1.能力,完成A1.应用的开、优化及部署,符A1.能力应用渗透到各行各业的场景业务中7。6横号弓冽深慢介作K数於敛字金融研究院,亚洲数据帔假行业招能时代的生产力变革:A½c产业应川实友h1.tpswww.bjxi11¼vpcontentupM06%E4%BA%BAI57%A5E6%99BA%ES83%B0%E8%A1.%8C%E4%B8%9Af6%99BA%E8%83%BDE6%97%6%E4%88%A3%E79A%84%E7%94%9F%E4%BA%A7%nSA%98%E5%8F%98E9%9D%A9%EF%8C%9AAIGC%E4%BAA7E4%B8%9A瓶S%BA%94%E7%X%A8%ES%AE%E8%B7%8SOAFRIOG.pdf,20237艾瑞咨询.2023年中国A1.GC产业勺景报告,httpsreporUrep<xt2023084227.ihtm1.,2023.5,个词元。因此,基于自然语言的提示词工程(PrOmPtengineering)成为大模型实际应用的主要方法。所谓提示是经过精心构造由不同要素组成的任务指令来引导模型的输出,使大模型能够在不同的务和领域中表现出色。而提示的质盘也在很大程度上影响了大模型在下务中的表现,因此需要通过人工设计或自动优化的方法来生成合适的任务提示。人工设计大语言提示需要考虑四个关键要素,即任务描述、输入数据、上下文信息和提示策略。基于这四个关键要素,提示设计的战本原则分别是:清晰地表达任务目标:分解为简单且详细的子任务:提供少样本示例:采用模型友好提示格式(1)清晰地表达任务目标.在使用大模型时需要给出清明确的指令。具体来说一个清晰详尽的任务描述中应当包含任务的各种要素息,如任务目标、输入/输出数据和回史限制。(2)分解为简单且详细的子任务。将一个更杂任务分解为若干个相对独立但又相互关联的子任务,每个子任务都时应原始任务的某个方面或步骤。这种策略有助于减少更杂任务的解决难度:通过招复杂任务分解为若干个子任务并按照一定的顺序处理这些子任务,模型能够逐步获得最终的答案.(3提供少样本示例。在提中加入少量目标任务的输入输出作为任务示例(即少样本示例),有助于大模型在无需调整参数的前提下学习输入与输出之间的语义映射关系,提升大模型解决更杂任务的能力。(4)采用模好的提示格式。大模型采用专门构建的数据能进行预训练,因此可以从数据习到大量的语言表达模式,发现并利用这些语言表达模式可以帮助我们更有效地使用大模型完成特定任务。如MarkdoWn语法、XM1.标签等。循上述原则设计的简单提示对大多数的问题都是有效的,但涉及匆杂推理任务时,则需要更高级的提示策略。其中被广泛应的就是思维链(ChainofThought,CoT)为增强大模型在各类发杂推理任务上的Wei等人12设计了思维链的提11 Q您,李军较,周昆博天一,文域荣.大噜吉模斗!,https:/1.1.mbook-zhgithub.io/.202412 WeiJ,WangXzSchuurmansDzeta1.In-Of-ThoughtPromptingEk1.tsReasoningIn1.arge1.anguageModeIsIJ1.arjv,2022.2.3.2检索生成增强当大模型处理本地的或特定领域信息时,幻觉、知识过时以及推理过程不透明、不可追踪等问题进步凸显,不能足业务实际格求。这就需要在提示中提供更多的专业知识作为上下文背确保大模型输出的准确、可靠。检索增强生成技术(Retrieva1.-AugmentedGeneration,RAG)1.ewisBPrczE,PiktusA,e<a1.Retrieva1.augmcntodgct»onforknow1.edgeintensivenipUsksJ,AdvancesinNeura1.InformationProcessingSystems.2020,33:GaoXXiongXGaoX,eta,Retrieva1.-AugmentedGeneratiorge1.anguageMode1.s:ASurveyJarXrv,2023.通过整合外部数据库的知识,成为一种高效的解决方案。RAG通过传统的检索方法,用外部来源的最新信息补充大模型的训练数,使其不仅能够访问专属知识库,还能动态地引入最新数据,从而引导其生成更瑜的回第。个典型的RAG系统流程分为索引、检索和生成:(1)索引:索引首先从不同格式的文件中提取原始数据将其转换为统一的纯文格式。然后,文本被分割成更小的块。最后,使用模型编码为矢量表示,并存储到矢量数据阵中.(2)检索:检索时,系统将用户查询转换为向量表示。然后进行语义相似性检索与问题最相关的前k个块。(3)生成:将原始问题和检索到的信息块被合并为提示,一并输入大模型生成最终答案。具体来讲,RAG系统涉及多不同的组件,每个组件都需要精心设计和优化,以确保整体性能达到令人满意的水平。索引阶段包括了文档智能解析、文本分块、索引构建与优化、向量嵌入等:检索阶段有检索的理解与优化、检索路由与策略等:生成有重排序、上下文过浓与压缩等。根据上述组件与优化方案的选择,RAG可为原生、增强、模块3种类型21为进一步提海系统的性能,也会引入后理处理环节,如风控检测、结果缓存、指标监控等.而在生产环境中,则可以根据业务需求在原生RAG基咄上合理选择扩展组件和优化策略。R类工具有JinaReaderhttpsitjina-a1.feader,SCraPegraPh-aihttp5:/githubxom/VinciGit00/$crap<*grapi、CraWI4AR4等专门为大模型优429从技术角度A1.AgeA是一种编排软件,它将大模型、规划能力、记忆、工具结合起来,执行各种任务,例如理解和成自然再言、从内存中存储和检索信息、利用特定功能的工具,甚至评身的表现,核心组件一般包括记忆模块(Memory),规划模块(P1.anning)和执行模块(Execution)https:/www.deep1.earning.ai/the-batch/issue-241/WangUMaCrFengXzeta1.AsurveyoargeIanguaEemode1.basedautonomousagentsJ,FrontiersofComputerScience,2024,18(6):126.,(1)记忆模块主要用于存储智能体与环境的历史交互记录,包括短期记忆和长期记忆。短期记忆相当于Transformer架构约束下的上下文窗口内的输入信总。长期记忆类似于可以根据需要迅速查询和检索的外部向量存储。(2)规划模块赋予智能体类似于人类的解决复杂任务的能力,即将复杂任务分解为一系列简单的子任务,进而逐一进行解决.根据是否收反馈影响未来行为,分为无反保规划和有反饿规划。在无反馈规划中,我们可以采用单路径推理,这种策略将最终任务分解为系列中间步骤,这些步骤以级联方式连接,每个步骤仅指向一个后续步骤.另一种方法是多路径推理,其中生成的推理步骤被组织成树状结构,每个中间步骤可能有多个后续步骤。此外,还有针对特定领域的长期规划问题的外部规划器,这类规划器基于高效的搜索算法,提供更可兼的规划能力。有反馈规划则包括从环境、人和模型中接收反馈,以引导反思和提高规划能力。环境反馈通常采用ReAct的推理-行动-反馈模式,明确的推理和行动按顺序进行,如果某个行动的反馈未达到预期结果,则重新进行推理直至得出正确答案。人类反饿,在环中"模式,通过与人类的互动获取反馈,帮助智能体与人类的价值和偏一致,并更好地适应实际环境,同时也有助于缓解幻觉问题.模型反馈则涉及使用大型模型作为质量审核专家,对生成的计划进评估和改进,引入自我完善机制,通过迭代反馈和改进来提商模型的输出效果。)执行模块的目标是将智能体的决策转化为具体结果。它直接与环境互动,决定了智能体完成任务的效率.具体来说,智能体在行动决策过程中执行规划组件制定的明确行动规划,同时会参考记忆组件中的长短期记忆来得助执行准确的行动。在技术实现上,执行组件可以空自身来完成预定规划,或服务交互,而NV1.DIA的Bi。NeM。则可以加速新药的研发。华为盘古气象大模型也已应用于欧洲中期天气预报中心。随着生成人工智能的不断推广和应用,其产生的深远影响和潜在价值正在加推动从实验到消费者领域再到企业领域的应用。大模里能否落地一方面取决于大模型的性能,另一方面与所落地行业的特点是分不开的。数据是大模型的基础燃料,这就意味着数据量大、数据质量高、数据多样性强的行业能够为大模型提供充足的训练和微调的数据,而技术需求、创新能力强、竞争激烈的行业自身就有着拥抱新技术的热情,这些因素决定下大模型在各国、各行业的成熟度并不一致,在各个应用落地的表现也有所不同.目前,国内外大模型已在办公、教育、医疗、金融、文娱交通等领域落地应用,行业渗透率来看,金融业的渗透率最高,已达78%在微软、金山办公等龙头企业的带动推广下,在办公领域的渗透率也比较可观,而能源和建筑行业的渗透率较低保.图2.3大模型垂直应用行业用成熟度67在全球,已经有金融行业如SmPe、B1.oomg;零传行业如可口可乐:生命6b钛峡体.2023中JQA1.人极型应用比核研报i,httpSb.ia.accne¼vsnewsdeui1.68671,2023.67枕媒体.2023中美A1.大模型应用比较研究报告,http"kbJa.accnews/CeWSdetW68671,2023.IS科学领域如ProfIUent、absci:能源行业如C3i开始将生成式A1.应用到内容创建、知识发现、智能客服等场景,引领了行业企采用新一代A1.的风潮由。大模型在垂直领域应用的案例不断涌现,卜作荷要介绍,国内外更多的大模型行业应用可见相关文献6htt(>s:/69腌讯研究院,向AJ而行共筑新Mi生产力一一行大使型调研报告,httpr1.ib.ia.cnnew11(nvsdetai1.68815,2024.70IDC½izHi.2024生成A1.白皮耳https7www.sc11bdxo11Vdocuwnt73168159kJ<-%e48A%9A9A9%AC%E9%808A4%eA%91%E7%A791%E68A8-2024%E7%94%9F%E6%88%90S8C%8Fai%E7%劣¾8D%E7%9A%B9%A6,202471人民Iq财经研究mA1.大模型产业发联报泻,hNpzdownk>ad.cMian1.ngninetee1117114578641pdfz202472深圳巾人工智能行业协会2024人工钟健发履白皮书.httspreview.h1.code.crPd三h1.dfitve=f&time=1.716431M4M7Aid=7026569finame=%E3%808A2024%E48A8A%E5%B7%A5%E6%99%8A%E8%83%BD5%8F%9E581%95%E7%998D%E7%9A%AE%E4%B9%A6%E3%808B.pdf,2024.73北京学技术委员会察北京市人工智能行业大怏型创新应用白皮M2O23班)htt$/Awwbeijinggov.c11ywdzdt2O2311t2O231129.332172O.htm1.f2O23740I广位皆昨.2024»|«WAIGC应川全景报?;.s5R1.Y3M5OsFuWuv.bFH821Q,2O24.7Shttpswww.b1.og.apoft.techpthe-frst-tfu1.-g1.oba1.-gene762024TheA1.FounderReportBusinessImpact1.UseCases,U>sb1.azpree1.j52024-hamptona-busincMrcportuscstoo1.sandbuincMimpact/,202477姑存,季军轨周昆,博大二文辨荣.大诙占极力.h11os1.1.mbook-2hg1.thub.k>.2024.781.iX1.iZvZhangKzeta1.Chatdoctor:medica1.chatmode1.fine-tunedonaUrge1.anguagemode1.meuaiWama)USiMmedica1.domainknow1.ede(J.Cureus,2023,15(6.1670717277576Tre2.4.1医药健康医学方面,ChatDoCtor是一个在1.1.aMA上微调的医学领域大模型78。在相关研究中,研究团队从在线医疗咨询网站-Hea1.thCareMagiC"收集了约10万条真实的医患对话,并对这些数据进行了人工和自动过渡等预处理作为训练数据。从在线医疗咨询网站iC1.iniq2收集/大约1万条医患对话用F评估模型的性能。对于医疗场景中的问答,研究团队收集并编译/一个数据库,中包括大约700种疾病其相关症状、进一步的医学测试或措施以及推荐的治疗.该数据库可以随时更新,无需重新训练模型。基于此,ChatDOCtornJ以检索相应的知识和可靠的来源,以更准确地回答患者的询问。构建完外部知识大脑后,通过构造适当的PromPt让ChatDoCtor自主检索其所需要的知识0华南理工大学有一款名为“灵心”的心理陪伴机器人,研究团队构建了超过15万规模的单轮长文本心理咨类和性能类的需求,也可以满足体验类和专业类的不同需求,提升了图书馆服务的效果与能力。衣3.1大模任务功能对图书伯的作用影响大校型典中ff务功能文本生成语义理解信息抽取任务推理机器翻译识别分类总结摘要模态转换数据分析知识图谱构建作用与影响影晌飨域举例自动生成各类文档、报告、新闻稿等.辅助图书馆内容创作和信息发布.可用学术研究、阅读推广等于创作、学习与开发.理解用户萱询的深层含义.提供更精准的杵询网亚、搜索结果等信息服务.可用于问答式交互。可探索对话式发现,改变图书馆资源检索、资源推荐模式。理解并执行发杂的用户指令,自动化完成特定的图书馆服务任务。将不同语言的文献资料进行互洋,扩大服务苞用和读者群体,可用干语苜文献眼务、跨语言阅读。对图书馆资源进行自分类、自动标注、元数据创建,优化源组织和检索效率.自动生成文献或报告的摘要,帮助用户快媒核心内容.息转换为图像或视频.增强信息可访问性和衣达力.可用于多媒体档案保存、内容制作、信息可视化、阅读障同支持.可进行数据处理、格式折换、扳衣分析,指标分析、数据挖明.可在图书馆数据系统、数据中台基础E构建A1.数据分析能力,提升运营效率.可构建和维护知识图谱.增强图书知识哲理和服务能力.信息检索、交互问答检索推荐、资源发现等图书珀服务平台、后联系统A1.升级、机战流程自动化等读者服务、文献服务、学术研究等朱编、数字宽源加工与开发、数字人文研究等贲源发现、学术研究等回谀推广、数字人文等业务分析、用户行为分析、决策支持等数字人文、知识管理、学术研究、学科服务等模式转变,进一步提商图拈馆资源加工的效率和质量。(4)激发本地特色资源价值。利用生成式A1.技术,对图书馆的古籍资源、地方特色资源等历史文化特色馆版资源进行开发、挖掘、利用,充分发挥语料价值,增强资源的表现力和吸引力,有化典籍知识,弘扬中华经典文化、区域特色文化,激发这些资源的文化影响力。(5)提升图拈馆管理决策能力。大模型应用可以更好地对图书馆的各项业务数据进行指标监控与分析挖掘,提供科学合理的决策支持,为图书馆业务优化、资源配巴提供分析建议,从而提升图书馆的智趣化管理水平和效果,辅助图书馆理决策更加科学、合理和有效。图3.1大模型技术对图书馆的影响3.2书馆大模型应用策略在入思考图书馆大模型应用之前,有必耍探讨生成式A1.的应用策略及应用方式。国际图联(IF1.A)在其学图书馆对人工智能战略响应中,提出了三项策略建议,旨在指导图书馆如何有效利用I技术,提升服务效能,同时确保其应用的伦理性和可解糅性。三项策略分用图书馆的A1.能力构建负贵任且可解择的描述性A1.应用:利用图书馆员的数据能力增强组织的A1.能力:推广人工智能素养以提升组织和社会的AI能力is。此外,美国国会图书馆(1.ibraryOfCongress,简称1.C)提出了A1.规划框架,强调了在A1.系统中数据、模型和人M三个要亲的重要性,并提出广理解、实验和实施分阶段的方法论,以实现负货任的A1.实践1。2。图书馆可在上述权威性A1.应用策略的指导下进行实践,本报告归纳如下的策略要点供图书馆进行参考:(1)考虑馆藏与数据价值对图书馆数据与资源进行分析,以识别和评估潜在的数据源,特别是对于籍和特我,明确可以优先应用A1.技术的数据。高度重视数据治理,包括数据清洗、集成和质应保证,确保数据的准确性和可苑性.推广数据享、开放性和互操作性(2)进行概念验证与服务转化实施小规模的概念险证项目,以测试生成式A1.技术在图书馆服务中的可行性。对手技术挑战(例如图像分类等)开发或整合高效的A1.克法,提升处理的精确度。成功的概念验证项目应转化为可持续的服务,以实现技术的长期价值。(3)持续监控与质量保证建立监控机制,根据反馈持续改进A1.服务,确保服务质量。考虑使用数据为中心的评估方法,通过科学地评估和测试,确保A1.系统的秘定性和可转性。以迭代、循环的方式,长期优化、监控应用。建立质量标准基线,搜集用户反馈。(4)积极培训与参与提升图书馆用户的A1.素养,并通过社区反馈优化服务。支持并参与图博档机构合作、行业机构联盟,以开放、共享、创新、合作为核心要,整合来自不同机构的独特资源和专业知识。(5)好经济性与工具评估对AI技术应用进行成本效益分析,确保所选工具解决方案在预算内提供最大的价值。评估不同A1.工具的性能,选择那能够最大化投资回报率的工具。(6)关注法律与伦理框架确保A1.应用遵守所有相关的法律法规,特别是在数据保护、版权和知识产101https:/www.if1a.0rg/g/ai/dcVc1.oping1.irStratcgicrcsponsctoartificia1.intc1.cnce/102httpst>1.ogs.1.oc.govtbe5iga1.20231.1.ntrouc1.ng-the-k-1.abs-artifk1.a»-inte1.i»gence-p1.ann1.ng-framewofk/24言助力华人探根号脉,通过发挥各自的资源、技术和服务优势,共同推动文化资源和知识服务智能化Q.在实施人工智能(A1.)应用的过程,图书馆应在宏观指导策略框架下进行,综合考量包括资源适配性、用户、风险管理以及长期规划在内的多个关键因素首先,图书馆需确保所选应用路径与其可用资源和技术能力相匹配,以实现资源的最优配置和利用效率的最大化。对于技术基础较弱或希望快速实现A1.服务的图书馆,可以考虑从集成第:方A1.服务开始,逐步积素经脍和技术能力。对手具有较强技术实力和研究背景的图书馆,可以考虑自主研发或联合开发A服务产品,以实现更高水平的创新和服务侦星提升。其次,深入的需求分析是确保A1.应用能够切实解决问题、提升服务体验的前提。此外,险评估与管理是保障A1.应用稳健性的重要环节,图书馆需制定相应的风险管策略,以应对潜在的技术风险和道德挑战。为了适应技术的快速发展,图书馆还需制定长期的A1.技术发展规划,以保持其服务的前瞻性和竞争力.3.4图书馆大模型应用范式图书馆通过上述六种实施路径,在AI应用策略方针的指导下,成功地运用并实施生成式A1.技术,以此深入意图书馆的转型。这转型主要体现在两种主要的应用方向。一方面,图书馆通过优化现有工作流程,将传统的应用通过集成A1.技术进行重塑,提高了服务质量和流程效率:另一方面,图书馆开创开发A1.原生应用,推书馆服务智能化跨越式发展。这正对应了智念图书馆大模型创新与应用中智然图书馆+大模型大模型+智怒图书馆"两种不同的应用范式106.统应用的A1.重型:这类别中,传统的图书馆应用通过集成A1.技术得到增强化、重塑,从而提高服务质量和流程效率。例如员工知取库的智君升级、A1.辅助的采编潦程、数字资源的加工与开发等,通过化现有工作流程,提升了馆员的工作效率。此应用方向体现J'以图书馆业务场景为核心,通过接入大模型的智能化能力实现服务和效率的双重提升大模型”的应用范式。IM105I画图M馆(上斑科学技术情报研究所)等科U图H馆大模型创新与应用门皮U,HBRAmwQdown1.oad-categorwhitepaperz2O23.开发A1.原生应用:关于原生应用这概念并没仃准确的定义,仍存在不同的理解。本报告中认为大模型原生.应用即那些将大模里技术作为核心功能和价值支控的应用。这一类应用直接根植于生成式A1.技术最核心的能力,如提供个性化服务和内容创新创造。典型的应用例如利能聊天机器人、A1.写作助手、多模态创作工具等,为图书馆的内容服务带来创新动力:比较具有行业典型性的AI原生应用如:A1.研究助手、个性化学术教练等,为用户提供定制化的信息和学术支持.路径5中“自主/联合开发的A1.原生应用”,可兼具行业的典型性及图书馆个体的特色性随省A1.技术的不断发展,越来越多的原生应用将被开应用,智趣图书馆中的大模型应用则逐渐由“+大模型”向“大模型+”范式转变。当然,原生应用中还包括了智未触及的A1.应用领域。尽当前尚未广泛实现,但前景广阔,这类应用代表着未来的颇覆性创新。例如包括基于智能体的流程自动化、具身智能应用以及高智能A1.员工等概念。这些潜在应用有望进一步扩展图书的的服务范围,实现服务的自动化和个性化,为图书馆带来前所未有的发展机遇。图3.4图书馆+大模r-应用蕊式目标:整合大模型技术,使虚拟人和数字人成为图书馆服务的IR要力量,以提升用户体验感。模型能力:问答对话、搜索/信息抽取语音识别与合成等建议:利用虚拟人和数字馆员实4/7在线咨if1.)服务,提供及时且准幽的信息查询、阅读辅助:结合将减资源,提供A1.解析与内容服务:结合阅读推广服务,运用它们举办多样化的阅读推广活动,蝌加自由资源的可见度,增加读者的参与度.引入A1.Agem业务流编排,使得虚拟人具有设定专业能力从而向A1.数字馆员升级。技术方案:提示词工程、RAG、智能体应用路径:直接集成应用的A1.产品工具、需整合开发的A1.产与服务领域8:智慈创新阅读与体脸目标:利用大模型为广大读者提供新颖、智慈的新型阅读体眩服务“模型能力:问答对话、搜索/信息抽取、文本牛.成、图像与语音识别、多模态创