生成式AI企业应用落地技术白皮书2023.docx
《生成式AI企业应用落地技术白皮书2023.docx》由会员分享,可在线阅读,更多相关《生成式AI企业应用落地技术白皮书2023.docx(76页珍藏版)》请在课桌文档上搜索。
1、致广大而尽精微生成式Al企业应用落地技术白皮书CONTENT目录1生成式Al是一场技术范式变革32生成式Al的六层技术生态8ZlAI算力基础设施-8Z2基础大模型与相关技术142.3 大模型与训练、评测数据222.4 生成式AI应用开发技术262.5 生成式Al安全与监控352.6 生成式Al应用设计383生成式AI企业应用落地实践探索和总结413.1 生成式Al与企业数字化转型413.2 企业应用落地的关键问题与应对方法.423.3 企业应用落地的四类驱动模式554AI产业政策与发展趋势654.1 我国Al产业政策654.2 AI产业发展趋势694.3 促进我国AI产业发展的对策建议.735
2、写在最后746引用761生成式AI是一场技术范式变革2022年末ChaIGPT的横空出世及其之后的持续迭代,以一种人人可亲身感知的方式,把人工智能在自然语言领域里的重大进展在一夜之间展示在世人面前。而在企业应用场景方面,之前的Al技术都集中在相对专业的应用场景内,如机器视觉、语音识别、或推荐系统、风控管理等。但是语言,作为人类重要的思维工具以及知识组织和传播的最主要手段,其“能力泛化”的可能性远远超出了其他领域。因此,当ChaIGPT能够与人类进行深入、富有深度的对话时,人们开始想象一个真正能够理解业务或专业、思考解答专业问题、甚至进行业务的组织、管理和创新的机器的可能性。对企业的数字化转型进
3、程而言,生成式Al技术带来的潜在影响很容易让人将之类比于交通史上铁路系统的发明、亦或动力系统中对交流电的引入。在生成式Al技术出现之前的十多年间,数字化转型一直是企业采取的一项重要战略,来促进企业在新的商业环境中保持竞争优势、创造新的商业机会。根据2011年,数字化转型最早的提出者之Garlner的定义,数字化转型包括从IT现代化升缴比如全面云化升级),到通过数字技术进行业务优化(比如精准营销)或业务模式创新(比如创新的引流和盈利模式)的一系列战略举措。近几年来,数字化转型的重点聚焦领域,已经越来越转向企业数据资产的建立,神州数码集团的创始人和CEe)郭为在数字化的力量一书中,对此提出了全面和
4、系统的论述。而生成式Al出现之前,数据一般只有经过结构化处理之后,才能够在企业应用环境中发挥作用:而在企业的经营活动中,产生的大量的数据无法被结构化处理,比如内部海量的会议纪要、周报、季报,其中包含大量关于企业具体业务事项的分析和讨论;企业的大量的合同文本、项目验收材料,其中包含有大量的交易细节;而在销售和客服人员与顾客的线上互动文本,其中也有一手的客户对产品和服务的反馈;再有,就是企业产品的大量的用户手册、故障分析文档、产品服务和支持技术资料等等,其中有丰富的技术支持所需的知识。所有这些包含的非常有价值的信息和知识,以往只能限于少数专家或管理者的随机及离散地利用。传统的数据处理和分析方法对这
5、种非结构化的文本数据无所适从。高价值的信息无法被有效提取,意味着企业可能错失了重要的决策依据、市场洞察和创新机会。以大语言模型为代表的先进的自然语言处理技术的出现,预示着这种情况开始发生变化。企业有可能利用这些创新技术来自动分析归类和抽取这些非结构化数据中的关键知识,进而为决策者提供有力的支持。例如,通过自动分析销售和客服的交互文本,企业可以更准确地了解客户的需求和不满,进一步优化产品和服务。更进一步,企业还可以利用这些技术结合知识图谱技术,将分散在不同文档和系统中的信息连接起来,形成一个跨组织结构、跨业务领域、跨时间维度的企业大脑;为企业提供一个一体化的知识查询甚至咨询平台。这样的平台将会成
6、为企业的超级销售助理超级客服助理或者是超级管理助理生成式Al技术的出现为企业数字化转型,注入了强大且更为直接的新动能。不过,以上对生成式Al技术对数字化转型的推动的“推演”,可能还存在很大局限。如同早期的英国铁路,斯托克顿-达灵顿专线其实是在铁轨上跑马车。早期的蒸汽机的一个主要应用场景是在枯水期将水引向高处蓄水池以帮助驱动水车。目前我们设想的生成式Al的应用场景,也处于早期状态。生成式Al技术为企业数字化转型带来的会是更为根本的变革,即技术范式的改变(ParadigmShift)。我们借用技术的本质一书中对“技术域”的定义来解读“技术范式的改变”:作者在这本书的第8章指出,(它)不是单独一个技
7、术体的出现,而是新技术体引发的“重新域定”。新技术域对经济的影响也比单个技术对经济的影响要更深刻。作者认为,经济并不是采用(Adopt)了一个新的技术体,而是遭遇EThcouThters)了一介新的技术体。经济对新的技术体的出现会作出反应,它会改变活动方式、产业构成以及制度安排,也就是说,经济会因新的技术体而改变自身的结构。如果改变的结果足够重要,我们就会宣称发生了一场颠覆性改变。生成式Al技术正在形成新的技术域定,它首先对应用软件开发产生了显著影响。得益于计算机程序设计语言的严格语法、清晰逻辑性和罕见的二义性,生成式Al技术在代码生成和辅助编程方面的效果日益突出。展望未来,软件开发的重心将更
8、多地倾向于需求分析和软件架构设计,而编码和代码质量审核的流程,将在先进的辅助编程工具的助力下,实现效率的飞跃性提升。在2017年,曾经是OPenAl创始成员和研究科学家,担任特斯拉技术总监的AndrejKarPalhy就预见到了引入AI之后的新软件开发范式,他在一篇技术博客中提出了软件2.0的概念。在软件Lo的模式下由程序员设计软件解决问题的方法和细节逻辑,并通过编写显示指令来实现这些逻辑。而软件2.0是利用神经网络自动完成软件的设计。未来大部分程序员无需编写复杂的程序,维护复杂的软件库、或者分析它们的性能。他们只负贡收集、清理、操作、打标签、分析和可视化为神经网络提供信息的数据即可。随着生成
9、式Al技术的快速迭代,业界内正在宣称“软件工程3.0”时代的开启:Al重新定义了开发人员构建维护和改进应用软件的方式,研发团队的主要任务而是以含有私域专业知识的语料(或图像、视频)来训练或精调模型、围绕业务主题设计提示模板(PromptTemplate)、探索最有效的智能体(Agem)机制等。解决问JS的方法由机器产生(场景泛化)解决问题的方法 由人脑产生N (场景具体):于于于:f止生I IAptI IPrlPtIJLLMMAafiI AIII I上下p, I II _, I提示工程Software 3.0.一一 一一一 一一 一一一 一一一 一一一 一一一 一一 一一一 J;亭 亭亭:;里
10、里 :I I丽/空融f,lE- 11 I: :架构工程深信椁蛭网修言- - 包向第X外域899羽好里- - - -L-二-二N - - ,: 甲rT1中:Software 2.0,力亲我,! AAA ;二管里1I:写ra孚:Nfi!区|也!0州&Q凡伸*机*千可aaaI:e昌:辱1苧1亭特征工程Software 1.0软件工程美&N工、RSl络8、1.Ia件产*工存.I ;Sl I小小小I l区串口化l Issgd*oCf JI _AAAII II 图 1 SoftwareLO 到 3.0综上所述,不论是“1.0”“2.0”还是“3.0”模式的软件,生成式AI技术都将为其注入革命性的创新力量。
11、应用会在价值和体验、安全和运营、架构和交付等方面发生深刻变革,从而催生出企业应用的大升级和大迭代。而更快和更广泛的业务数字化转型,则会产生更多的数据资产和应用场景,数字化转型的飞轮效也将应运而生。为什么会有这篇白皮书每一次技术的范式变革都深刻地重塑了经济格局和社会结构,同时也催生出企业数字化的新浪潮。例如,以2010年为分水岭,移动互联网和智能手机的快速渗透为众多崭新的应用提供创新的土壤。在此背景下,移动定位、身份绑定和移动支付等技术场景快速落地,为企业开辟了全新的移动获客架道。不少企业敏锐地捕捉到这一趋势,纷纷推出小程序或打造移动应用平台,助力自身在激烈的市场竞争中快速而精准地获取用户、拓展
12、市场地位。这不仅为企业和市场带来了前所未有的变革和机会,甚至形成了新的社会消费习惯。由于对上一次的技术变革带来的影响仍记忆犹新,使得这一轮人工智能的飞跃式进展所产生的震撼和影响更为强烈。不仅技术层面的CIO、CDO和CTo表现出浓厚的兴趣,企业的各个业务单元、包括CEO在内的高级决策层,几乎都在第一时间启动了密切地关注与讨论。而另一方面,在这场由生成式Al引领的技术范式变革中,相关的推动力量从实验室快速走到了公众舆论中心。这些力量,不再仅仅局限于学术会议的探讨。行业头部公司、初创企业及各个研究团队,也在数字化的今天利用自媒体平台和社区平台积极互动,并保持与主流媒体的沟通。开源社区的贡献和风险投
13、资的活跃参与,更是助燃了这场技术革命,大量创新的想法都会快速落地实现、并成为资本追逐的目标。大量的自媒体在这场热潮中成为了连接“圈内”和公众的纽带,他们迅速收集信息,并按更易传播的方法拆解(或碎片化)信息,使其在短时间内成几何级数放大,触达更广泛的受众。然而这种聚光灯下的创新展现也给企业带来了难题。在信息海量涌入的时代过多的信息反而形成了负担。企业在努力把握技术趋势、评估技术进展对自身业务的潜在影响时,往往陷入信息过载的困境,这不仅无法快速做出决策,更可能导致企业面临选择困惑,产生不必要的焦虑。而大量的粗粒度信息,也会对技术产生误解并不恰当的期望,这反而会阻碍早期的创新型尝试。在与众多企业客户
14、深入交流的过程中,我们深刻地认识到,对于当前的技术进展和各种应用实践进行系统的梳理与小结是至关重要的。这不仅能为企业提供一个清晰的技术发展蓝图,同时也助于他们更好地了解趋势,捕捉潜在机会,进而制定更加科学、前瞻性的战略计划。此外,这样的梳理还能推动行业间的交流与合作,为企业之间打造共赢的合作模式,加速整个数字化转型领域向更新的阶段发展。我们希望通过编撰这篇白皮书”能够起到“抛砖引玉”的效果,引发业界的讨论。我们热切地期望生成式Al相关的技术提供者、应用解决方案的开发者、行业内的重要客户,以及各大研究机构等,能够以这篇白皮书为“靶子”进行深入的梳理和探讨。我们更希望它能成为企业客户和生成式AI技
15、术落地实践者之间共识的起点,帮助大家澄清概念分析当前的技术趋势,预测未来可能的发展方向。我们深知,单凭一家之力难以捉摸整个行业的脉搏,但是,通过集思广益,我们相信能够对这一领域产生更深入、更全面的了解。在这篇白皮书中,我们旨在全面探索生成式Al技术的进展与应用。后续内容将分别从生成式Al的相关技术梳理、技术落地企业应用的路径、以及生态和监管这三个维度展开:对相关技术梳理,将从生成式Al的六层技术生态的角度,思考和总结生成式Al技术在不同维度带来的技术创新和挑战:然后,我们将深入探索生成式Al在落地企业中的实际应用,以及与现有业务的整合和可能遇到的挑战;最后,我们将讨论生成式Al在整个行业生态中
16、的地位,伴随的伦理考量,以及对应的监管建议和未来发展趋势。通过这三个章节,希望可以为读者提供清晰的技术发展蓝图,帮助企业和研究者更好地理解应用并推动技术的健康发展从而应对信息过载技术误解和创新尝试中的挑战,正如我们在白皮书开篇所述的背景和目的。并发式创新的复杂局面和企业应对的策略生成式Al的企业应用落地,事实上已经形成了基础研发、监管和安全、应用开发、企业(或行业)私域数据就绪、企业能力就绪等多个领域并行探索的局面。上述每一个领域既相互促进,又相互制约,而在企业应用的实际环境中,又需要探索业务流程、使用习惯和技术落地之间的变通和粘合。例如企业(或行业)私域数据就绪意味着企业需要建立一套完整的数
17、据管理和维护体系,来确保数据的质量、完整性和安全性,当大语言模型需要进行微调或适应特定场景时,可以迅速地获得高质量的训练数据。而最为重要的是,生成式AI的基础技术研发还在快速进展之中,制约其在真实业务场景使用范围的问题:例如在私域知识框架内的对齐,包括幻觉消除,知识收敛,以及上下文长度等,还在不断探索和解决之中。其中应用场景更为广阔的多模态大模型技术,更是令人充满期待。从来没有哪一个时刻,使得企业在制定技术战略时,需要理解如此复杂的技术趋势,平衡考虑如此多的矛盾因素。从近期和客户的广泛交流中,我们发现,一些非常值得借鉴的策略已经形成:1、两个立即着手:立即着手采用点状业务创新的方式:紧密跟踪最
18、新技术进展探索安全和监管的边界构建;立即着手采用共创的方式:选择外部供应商和合作伙伴,为有可能到来的生成式Al的场景爆发准备好强大的外援力量。2、两个规划制定:私域知识治理规划:生成式Al技术助力企业数字化转型,无论如何都需要企业私域知识的加持,部分企业曾经开展过数据治理工作,这为企业私域知识治理打下了很好的基础;生成式AI应用开发和管理平台规划:不论软件1.0、2.0还是3.0的应用,都是企业数字化转型落地的手段,在点状创新之后,需要认真规划新应用的体系化开发、部署、运维和管理的平台,以及大模型及其算力管理平台和现有技术栈的触合。神州数码,作为中国IT生态的核心参与者,始终致力于促进先进技术
19、在企业的系统化应用。作为生态链的建设者和守护者我们深知生成式Al技术的崛起标志着一场技术革命的开始。因此暇们决意联合整个生态体系,共同帮助企业全面拥抱这一技术范式转变的到来。面对巨大而复杂的机遇与挑战,儒家经典礼记中庸篇为我们提供了宝贵的指导思想:“故君子尊德性而道问学,致广大而层精微J这启示我们在追求技术创新的道路上,既要有宏观的视角,又必须全神专注于每一个关键的落地技术细节。持此信念,神州数码将继续汇聚各方力量,助力生成式Al技术为企业数字化转型注入更强劲的动力。2生成式AI的六层技术生态GpT的成功,促成整个AI行业的技术生态正发生着巨大变革,并形成了激烈的竞争:从众多AI芯片厂商奋力追
20、赶英伟达当前的技术优势,到模型厂商间的“百模大战”迅速升级为“千模混战”,生态中的厂商都在力图找准自己的定位,形成自己的技术优势。激烈竞争的同时也带来了技术的快速发展,相关的论文和报告以惊人的速度发布着,新的应用以及产品更是层出不穷。随着不断地创新、试错以及优化,生态架构中许多关键的概念逐步清晰,一些关键的技术沉淀下来,积极影响着企业场景的落地。我们可以明显观察到生成式AI相关技术的发展已经形成了六层技术生态体系,包含AI算力基础设施、基础大模型与相关技术、大模型与训练及评测数据、生成式Al应用开发技术、生成式Al安全与监控以及生成式Al应用设计。本章概述了架构中每层的核心技术,并结合自身在实
21、际应用场景中的经验与思考,为大家带来生成式Al技术生态的总结。模型的安全和监控偏倚桧溜 和缓解改进训炼 数据多样性增加用户反 馈/对抗性 浦试应用公平性 技术Al防火墙等生成式Al应用创新层图2生成式AI六层架构技术生态体系1.1.1 AI算力基础设施大模型的基础算力设施是Al生态中不可或缺的核心组成部分,为大模型在企业场景中的实际应用提供了关键的驱动力。其中Al芯片是算力的核心来源,其选型会直接影响到后续大模型的开发效率和性能。与此同时,AI服务器,作为Al芯片的主要承载平台,其架构设计和性能优化也显得尤为父键。基于AI服务器,各大厂商会根据所持有的算力资源,发展出不同的经营模式。一些厂商选
22、择采用“基础设施即服务(IaaS)”馍式.,主要提供硬件设施的使用权限;而一些厂商则采用“平台即服务(PaaS)”模式,不仅提供算力,还为用户提供了一系列与模型开发相关的服务。为了更高效地管理这些AI服务器和算力资源,许多企业和政府机构会选择构建智算中心,这是一种集中管理和优化算力资源的方式,同时也反映了其对AI技术的重视和支持。我们将深入探讨大模型基础设施的各个方面,包括Al芯片、Al服务器、AIIaaS、AIPaaS以及Al智算中心,阐述大模型对基础设施的特定需求,旨在为读者提供一个更全面的视角。2.1.1 AI芯片2.1.1.1 AI芯片概述与分类AI芯片也称为Al加速器,专门用于处理人
23、工智能应用中需要的大量计算任务的模块,为AI任务提供基础算力。AI芯片前身是GPU(GraphicsProcessingUnit图形处理单元),专门为游戏或者图像软件提供高效图形渲染的处理器,之后在人工智能技术逐步发展的过程中发现GPU的独特高效并行计算架构同样适用于人工智能计算加速过程。在人工智能理论知识逐渐丰富的过程中,芯片厂家也对AI芯片处理器的计算单元和架构组成有了更多的探索。根据芯片的处理单元和可编程灵活性分类,AI芯片可以分为GPGPU、FPGA和ASIC以及类脑芯片。其中GPGPU(GeneralPurposeGraphicsProcessingUnit*通用图形处理器)是GPU
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 AI 企业 应用 落地 技术 白皮书 2023

链接地址:https://www.desk33.com/p-1040772.html