AI应用企业落地方法论:践行财务共享AI审单项目(第一篇)

2024-08-28 09:43 栏目: 技术学堂 查看()

本文通过AI审单项目的实际案例,深入探讨了企业引入AI大模型的顾虑、应用步骤与机会洞察,旨在为读者提供一份AI落地的实用指南。

一、引言

人人都在谈AI。可AI的信任赤字、AI的投入成本,都让决策者和拥趸畏首畏尾。如何在企业内洞察机会、如何说服决策者投入资源、如何衡量价值达成。这些都是绕不过去的问题。

笔者以个人践行的AI审单项目为例,历时一年多的痛苦与挣扎、现分享给各位,与各位共同探讨AI的落地方法。

二、企业引入AI大模型的五个顾虑

ChatGPT问世以来,AI行业再度被引爆。相比于技术本身,普罗大众更关注和纠结的是“AI+什么场景”。

结合这段时间的实践经验,我认为大部分企业引入AI大模型都存在5个顾虑:

1. AI如何在企业内找到落地场景,且能形成规模效应?

2. AI是一个好东西、要投入多少钱、能产生多大的收益和价值?

3. AI技术可理解性差,如何衡量落地场景的应用稳定性?

4. AI会不会引发数据泄露,数据安全如何保障?

5. AI要在企业内如何复制成功,推进方法论是什么?

三、AI应用的5步法概述

image.png 

四、第一步:AI技术特征与企业应用的匹配

开源节流是所有企业引入新技术能力和新商业模式的主旨,换言之、多、快、好、省的维系百年企业。这四字真言拆解之下即是:多(量大的作业、高利润的领域)、快(快捷交付、实时响应)、好(精准的、高质交付)、低(成本最优);

就如笔者所在的财务共享服务领域,发票OCR能力应用在发票审单。国内的发票结构标准、字符规范(抬头、发票号等)、识别自然精准(特别是随着电票的发展,发票内容更为清晰)。所以发票OCR能力非常满足这四个特征:

1. “多”字决:在规模上财务共享领域集中了各产业的发票校验工作;

2. “快”字决:在快捷性上因为OCR厂商可快速返回结果信息,故而实时性有保障;

3. “好”字决:在准确性层面国内发票OCR几乎可以达到99%以上的准确度;

4. “省”字决:在成本层面整个国家所有企业均离不开发票,市场空间巨大,各厂商也只有工具提供方,没有太多变动成本。

反观AI能力,境遇截然不同。OCR是“视觉“类新技术能力,模拟的是人眼、技术能力可理解性较强;而AI是“理解”类新技术能力,模拟的大脑、技术的认知和认可度偏弱性。

既然AI有这样的技术特征,那对应到四字真言之下,将需要如何对应企业场景呢:

1. 量大的作业、AI越具备规模效应:AI按字数收费,且从企业实际应用来看,大量字符理解成本是浪费的。若规模上不够,AI更无用武之地了,故而一定要选择具备规模效应的场景。

2. 准确性要求越高,AI越难自证清白:一千个读者有一千个哈姆雷特。理解本身就是多元的,而理解标化的前提是知识的标化,AI是一门认知技术,必然对知识有准确性要求。这就比如AI客服,你让AI回答一下产品型号还有可能、你让AI做促销转化和商品引荐,若无足够标准的知识去喂,指不定会惹出什么幺娥子来。

3. 实时性要求越高、AI越难有良好表现:实时性和准确性是相伴相随的两个指标。若场景准确性要求不高,但实时性要求高,比如AI+人脸识别,这时达到一定百分比即可通过门禁;若实时性要求和准确性都要求高,比如AI自动驾驶,那就需要大投入大手笔了。实时性要求不高,也才会给“半自动+人工介入”提供了可能。比如笔者所选的审单,若要求自动AI审单,就是高实时性要求,则对AI的要求必然高;若是审单助手,则提供了人工介入的可能,那AI就无过高准确性的要求。

五、第二步:机会洞察分析

5.1 项目图谱

image.png 

5.2 机会洞察的6个阶段

image.png 

5.3 机会洞察第一阶段:FTE机会分析法、找出规模效应最高点

AI有很多场景,比如图片生成、代码检测、设备维修、多语言翻译等。而且笔者所在部门在这些领域都有做AI的实践,比如图片生成,就通过AI大模型、将企业内的宣传物料进行自动化生成(如下图),最终减少了0.2个UI人员的投入,可这些场景“人微言轻”,

所以我们紧紧瞄准了FTE最高的机会点,经过长达1个月的FTE分析,最终认定“审单”才是最具规模效应的点,哪怕其中有反对声音说现实的附件有多么不标准、我们的当下时效已有多么高效。我们依然咬定青山不放松,认定只要提升1分钟/单,在巨大的流量面前(若10万单),则就可提效1666小时,折合9.57人。那也能hold住成本。

这给了我们一个深彻的领悟,AI路途中有很多野花,牢牢盯住远方的大树,方可直达目标。

image.png 

5.4 机会洞察第二阶段:工序计算分析法、下钻机会下的耗时工序

FTE机会分析法找到了“最耗人”的地方,下一步则针对审单这个垂直场景再下钻一层,分析“审单中最耗时的工序”(如下图所示)。从下图两类报销业务耗时分析可知,费用报销类的检查一致性虽然比较耗时(编号4)、但是查找附件(编号1)、定位附件具体内容(编号2)、计算统计(编号3)、查阅规则覆盖度(编号5)也比较耗时。
而总账业务中、审阅附件(编号1、编号3)恰恰不是最耗时的地方,最耗时的是“转换总账报账单明细”(编号2),所以引入AI审单并不能达成总账审单提效目标,最终我们采用了另外一个新技术能力解决了这类场景。

这给我们一个认知,不要将鸡蛋放在一个篮子里面,场景洞研后要因地制宜做最适合的方案、万不可墨守成规。

1)费用报销业务:用户提报报销单,会计审阅附件和单据;

image.png 

2)总账业务:总账人员要依据产业业财提报的账务表、手填转换成总账报销单据

image.png 

3)经验总结

1. 不同工序的操作方法大相径庭,AI识别附件方案并非万金油,还需依赖其他技术能力实现突破;

2. 工序可指导后面的“审单作业端到端分析”和“ROI分析”,是所有后面工作的信息输入,绝不可忽略;

3. 只有深入一线了解工序操作、才不会偏听偏信,才不会主观臆想,才真能代表一线业务发声;

4. 工序也为后面的“产品原型设计”奠定了基础,产品是为业务服务的,没有场景的AI技术都是耍流氓;

5.5 机会洞察第三阶段:单据驳回日志分析法、找出审单规则明细

本步骤的目的是梳理审单规则、通过规则与附件的匹配来校验AI能力的可行性。
绝大多数的企业的审单规则是这样写的“需提交A附件、附件要符合业务实质”。笔者在正式进入AI训练之前,花费1个月的时间深度梳理了规则,通过规则与附件的匹配来校验AI能力的可行性。

而且没有强依赖审单部门提供的规则,而是通过分析单据驳回日志,一条一条的检视出审单SOP。个人觉得这种操作方法的好处是:一方面个体知识存在局限性,一个人难以知晓所有审单规则,我们要降低个体的依赖;另外一方面是深入一线挖掘审单规则、找出附件类型和样本,从而深度分析AI能力的可行性,为下一阶段的“规则配对附件评估AI能力法”提供了信息输入。

所以,导出1年的驳回数据、匹配制度手册的SOP、建立附件样本表、搭建审单规则与附件样本的对照表。就是本阶段的关键动作。下图是“审单规则与附件样本对照表”:

image.png 

规则梳理经验:

1. 规则要细化到具体的附件字段和单据字段级(即系统可理解)、且附件字段要要对应到AI理解的结构化数据;

2. 规则要考虑多个重复附件提交情况、单据上有多行情况。从而思考要限定附件提交数、还是先分组后再比较;这为AI的理解要求和单据的字段要求提供了参考;

3. 规则的比较方法要区分:存在于、等于,存在于为“AB 在ABC内存在,则通过”,等于为“AB 和ABC等于、则失败”。这对多个附件、单据的多行的校验提供了明确要求,同时若附件不规范、附件提供多份,都会造成规则失败,所以就可进一步审视附件提报页面的设计合理性;

4. 规则中的等于情况要精准到:完全匹配等于、忽略大小写等于、去除前后空格、忽略大小写等;

5. 一条规则中存在并且情况,则尽可能就拆分成两条规则,审单人可清晰了解是具体那一段规则校验失败;

5.6 机会洞察第四阶段:规则匹配附件评估AI能力法

成语“有求必应”才是正常的协同机制、AI大模型不是万金油,要让AI去理解附件,首先就一定是要让AI知道你需要它理解附件的哪些内容。就比如下表的合同。我们通过分析步骤三梳理了规则、也建立了规则与附件对照表。在本步骤,我们会建立“附件识别能力表”进一步去评估AI的能力。

5.6.1 附件识别能力

1. 附件可视得出:肉眼在附件上就可看到这个字段内容,比如资产数量、总金额;

2. 附件计算得出:肉眼在附件上不可见字段内容,但是可通过多个字符计算得出,比如预付款金额=合同总金额*预付款比例;预付款金额在合同不可见,合同总金额和预付款比例可见;

3. 附件理解得出:肉眼不可见、也无法通过其他结构化数据计算得出,只可以通篇理解文章,或通过关键词库做匹配才可以理解;比如合同的是否为框架合同,整篇文章都没有框架合同这个字符,得需要通过合同类型得出。

image.png 

经验:

1. 反对者总是会举一个特殊例子(一张非常特殊的附件)来证明这件事情的不可行,你只需要用2/8原则去回怼他(这个业务模块是整个企业80%的量么、这个附件是这个业务的80%的附件量么?这个附件的识别规则是所有规则的80%的量么)

2. 市场上的AI平台均有提示词工程,产品人员可以不掌握AI底层算法,但是一定要知道调试提示词,也要知道AI的评估模型;

5.6.2 大模型评估指标

AI大模型需要引入,还需要建立一个企业整体的模型评估指标,这个指标是结合全局来做的思考,也可作为技术评估指标。如下表:

image.png 

5.7 机会洞察第五阶段:审单作业端到端流程分析、建立产品矩阵架构图

企业内现在也存在一个怪圈,人人都在谈数字化转型、人人都在谈端到端流程打通。好像不这么说上两句,视野就不够高、说服力就不够强似的。可真正深入了解并实践的也屈指可数。

笔者也是能力有限水平一般,不能免俗端到端流程分析一把,不然就会在产品评审阶段被质疑。
个人总结端到端流程的概念为:“以客户价值为依规、围绕流程整体经营和财务运营指标实施的打破组织壁垒的流程重构”。这里面的关键信息可以转换为几个自省问题:

1. 流程是否有存在的必要?

2. 流程的KPI是否是服务客户和经营价值最大化还是单个部门节点效率最大化(流程是局部最优还是全局最优)?

3. 流程的客户满意度如何?

1)流程分析详解:

就以普通的员工国内差旅报销为例(举一个例子,并非笔者所在公司)现在的流程是:国内出差是员工出差完毕后回来拿票填报报销单、国外出差是员工提报申请单后,出差完毕后关联申请单拿票报销。

image.png 

注明:因本文章重点讨论的是AI大模型应用,故而就不展开端到端流程分析,下来再专门输出一篇端到端实践文章以飨读者、里面包含更全面的实践经验)

从上表信息可知、当我们打破现有流程的惯式、从客户满意度来审视流程的合理性的时候,现在的流程如此不堪、现在的指标如此狭隘。

原来的指标是“单个部门的审单时效和人效”,那么就会无脑驳回、就不会关注流程的体验和质量。而现在改成“单据一次通过率”和“自动化审单占比”等指标的时候,客户满意度得到了提升。

同时、流程方案也有了AI和新技术加持的可能,用户的填单服务体验也变成:不填单、少填单、不咨询、少耗时。

2)端到端流程分析的价值和意义:

1. 站在全局角度洞察机会与设计方案、与决策者和客户同频共振,

2. 方案具备多视角、多策略,不仅保证了立项时方案的客观和完整,也保证了结案时的价值经得住挑战;

3. 从成本最节约角度设计方案,不强依赖单一技术,不压码单一方案。保证了成本、也提升了项目的成功率,毕竟不能将鸡蛋全部放在一个篮子里。

5.8 机会洞察第六阶段:ROI分析方法

ROI分析是大部分人最头疼的地方、人都希望快意恩仇、都希望信任有加、都希望资源滚滚。而世间最大的特点就是“资源永远是有限的”,而且大部分决策者的心理都是“花小钱办大事、最好是不花钱”。所以ROI就成为不可避免的一环。那我们就需要详细来审视下这个命题:

5.8.1 附件识别能力ROI为何如此痛苦

1. 这领导好麻烦:首先我们在心态上就认为ROI分析没有必要。要客观的认识ROI分析是项目立项的关键一环,并非个别领导的喜恶,更不是某几个领导的特意针对。

2. 这测算太定性:其次我们的ROI测算容易做成语文题,而难以量化成数学题。无图无真相、无数不证明。ROI测算一定需抽丝剥茧、泾渭分明。更需数据辅证、真凭实据。

5.8.2 收益测算

1)收益测算:定量分析维度

image.png 

通过对影像件(含电子件)资料与单据填写内容做一致性校验,进行审单(即:AI审单)的详细分析:

image.png 

2)收益测算:定性分析维度

1. 用户满意度提升

2. 人控改成技控、减少了审单风险,提升了账务质量;

3. 减少了审计风险

4. 减少了对账问题,可实现后期自动对账;

5. 发票结构化了,为后期的税务抵扣提供可能;

5.8.3 投入测算

image.png 

六、本章总结

1. 通过FTE机会分析法,分类企业所有任务,整理形成AI审单外的排行前8的机会点,从整体视角看流程、从整体视角看AI在整个流程中的位置;

2. 依托工序计算分析法,围绕8个机会,深度研究耗时点、将机会进一步下钻打开,找出最耗时的工序,可指导后续的端到端流程分析、ROI分析、产品原型设计。所以工序研究是必修课;

3. 不要开始就大投入、大手笔的签订一个大厂商,上船容易、下船难啊。可先用SAAS服务运作一段时间,等项目架构、技术能力、团队能力稳健运营了、运营指标达成后再换用成熟厂商。

4. 80%时间要花在机会洞察阶段,FTE分析、工序计算、规则梳理、AI能力匹配。每一步扎扎实实的走下去,想不成功都难。

5. ROI测算花费再多时间都不为过,算不清账、就做不了事。

扫二维码与商务沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流

郑重申明:小伙伴科技以外的任何非授权单位或个人,不得使用我公司案例作为工作成功展示!