本文转自:
前面已经分析过多次RPA的本质,可以参考
哪些AI相关应用技术跟RPA是绝配呢 ?
【OCR+】
光学文字识别(Optical Character Recognition,OCR),传统的OCR其实也算不上AI技术,但融合了机器学习的OCR+技术,基本也可以凑凑AI的热闹。
RPA经常需要识别图片,或是需要破解登陆验证码,或是需要识别屏幕图片中的信息。下面介绍几个RPA+OCR的应用场景。
▲本地OCR
本地OCR包最大的优势,本地执行,速度快。首推的是
Tesseract
http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe (下载地址)
Tesseract是免费开源的OCR工具,部署在本地以后可以搞定比较基础的图像文字识别。Tesseract 对英文,数字,的识别率和准确率是蛮高的 ,但是对咱们的中文汉字的识别效果就要差许多 ,通过适配不同的FONT字体库,可以提升汉字的识别率。 Tesseract 也支持机器识别,可通过训练提升准确度。
对于图片上有很多干扰的验证码,Tesseract 的识别率会大打折扣 。
FineReader
Abby公司有比较成熟的OCR产品,名叫FineReader ,18年听说Uipath与Abby战略合作了,让Abby公司在RPA圈子的知名度应该上升了不少。
但早在2017年,我的团队就做了RPA+FineReader的项目。记得当时用户给FineReader起了个非常可爱的名字,叫“鱼眼”,因为FineReader 的Icon很像鱼眼吧
,说实话好像也没那么像 。(这款软件国内有破解版的)
FineReader对英文和数字的识别率特别高 ,甚至可以直接把PDF的表格自动在Excel中生成,这个功能真的很好用。但是FineReader的致命弱点一样是汉字 ,细想也很容易理解,毕竟是老外做的软件,对咱们的中文肯定没那么用心。
▲打码平台(灰色产业)
打码平台是另一个大量“人工”而形成的智能平台。
打码平台的架构如下图所示:
从这样的平台架构就能知道,只要网上兼职做打码佣工的人足够多,验证码的库积累的足够大,那么就可以无比强大。
当然有的打码平台也结合了机器识别的方法,再加上人工识别作为后盾的,这会让打码的效率和准确率进一步提升。
缺点: 要收费,打码有延迟 ,需要连外网(纯内网的应用可能就没办法)
目前活跃的打码平台蛮多的,百度搜索“打码平台“应该可以搜出来一堆:
斐斐打码(价格较高-3.6分/码)
若快 价格便宜
超级鹰(价格居中-1分/码)
其实很多网赚平台的原理基本都是这个道理,这样的平台互联网上其实也有不少。
▲ 百度 AI开放平台
百度AI开放平台是目前国内比较强的AI OCR平台,也可以为大客户本地部署,价格贵。类似的平台也有好几个,我就不一一列举了。
【ChatBot】
ChatBot就是指聊天机器人,目前国内已经有蛮多的公司在做相关的技术和产品的研发。 互联网上也已经存在多个开源的ChatBot框架供自学爱好者研究。
聊天机器人目前的主要应用领域是在客服领域。类似的用户使用体验大家肯定不陌生 , 本来我们是想去找个真人客服的,结果被一堆所谓的“智能”客服忽悠着那边兜圈子。机器人当然可以陪你聊一晚,但是能解决问题吗?答案是否定的。这类客服聊天机器人会将解决问题的方法大概告诉你一下,或者直接发一篇帖子链接过来 。问题还是要靠我们用户自己来解决。
“那多没劲啊,没帮我们解决问题,也没有妹子可以情感上安慰一下”
如果 ChatBot + RPA 又会是什么场景呢 ?
举两个实例吧:
1-平安好车主APP
我在平安好车主智能客户的留言和答复如下:
可以看到这个智能客服不太智能的,他们其实有我的全部信息,完全可以更加智能。 比如,第二个请求, 如果智能客服的身后,还有一个RPA机器人,那么这个RPA机器人完全可以将一份PDF的电子保单以我想要的方式发送给我。
2-携程APP
携程APP的智能客服很强大,有点超出我的预期。
首先对每一条机器人的答复可以请求客户帮忙认证结果,赞 或者 踩。用来提升机器人的准确度。其次,碰到连续几个刁钻问题,客服MM突然就自动介入了。 携程的价格说实在的是真的是一年年越卖越贵 ,但是这个智能客服服务给我的体验我还是点
RPA结合ChatBot是一个非常好的融合点,ChatBot负责理解用户需求,RPA负责干活,Perfect !!!
【语音识别】
语音识别挺酷的,对着房间吼一句,“热死了”,空调自动打开并设定了合适的温度。 目前国内一大堆所谓的智能家居产品,多数都是买了成熟的语音API接口(听过几个内部交流的会,买科大讯飞接口的居多),然后基于这个接口结合一些硬件,实现一些看起来的比较智能的功能。
语音识别+RPA的结合场景其实也非常容易想象了。 财务老师对着麦克风说,“开始跑深圳的报税工作” ;过了一会机器人说,“深圳报税流程跑完了,结果已经发送到您邮箱” ; 财务老师接着说,“下面跑重庆的报税吧” ,机器人说,“好滴,马上去跑 ”
这样的场景,个外行看起来,是不是无比高大上,无比智能啊。
【智能决策支持】
4年多RPA项目经验,其实也挺明白RPA的缺点的,那就是无法处理突发或者临时事件。平时访问某个网站都挺正常的,在某个特定情况下,居然会弹一个MessageBox,不让机器人点掉,后面的操作全部废了。解决方案其实也特别简单,就是在那个环节多+一步 MessageBox的监测,出现就点掉,没出现就不用管。然而用户对RPA的期待是,能不能更加智能一些,这些情况能否都自己搞定,甚至智能帮忙做一些偏业务层面的决策。
智能决策,哈哈,就看到什么程度了,真要是科幻片场景中的智能决策,我想应该也不是多数人的期待吧,因为细思极恐 。 我就想问问看,谁可以驾驭你们老板吗?
比较初级的智能决策支持,还是多数人乐于接受的。
目前市场上的智能决策系统,基本上是基于大数据分析,加上机器学习来实现的。 能落地的场景主要集中在,金融行业的反欺诈,保险行业的投核保智能定价,远远达不到能自主理解业务流程逻辑,业务老师讲一遍,或者视频录一遍,机器人就可以学会这个维度。
基于人工智能算法框架的一些理念,提升RPA机器人的自容错能力,增强RPA机器人的可靠性在现阶段还是可取的。
【其他】
本文简单聊了几点跟RPA 可以深度融合的技术,期待与各位大大交流。
欢迎关注公众号并回复,RPA或虚拟员工转型之路, 加入行业交流群。
小礼物走一走,来简书关注我