博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[转]AI+RPA 融合更智能
阅读量:5341 次
发布时间:2019-06-15

本文共 2899 字,大约阅读时间需要 9 分钟。

本文转自:

前面已经分析过多次RPA的本质,可以参考

 
 

哪些AI相关应用技术跟RPA是绝配呢 ?

【OCR+】

 
 

光学文字识别(Optical Character Recognition,OCR),传统的OCR其实也算不上AI技术,但融合了机器学习的OCR+技术,基本也可以凑凑AI的热闹。

RPA经常需要识别图片,或是需要破解登陆验证码,或是需要识别屏幕图片中的信息。下面介绍几个RPA+OCR的应用场景。

▲本地OCR

本地OCR包最大的优势,本地执行,速度快。首推的是 

Tesseract

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe  (下载地址)

Tesseract是免费开源的OCR工具,部署在本地以后可以搞定比较基础的图像文字识别。Tesseract 对英文,数字,的识别率和准确率是蛮高的 ,但是对咱们的中文汉字的识别效果就要差许多 ,通过适配不同的FONT字体库,可以提升汉字的识别率。 Tesseract 也支持机器识别,可通过训练提升准确度。

对于图片上有很多干扰的验证码,Tesseract 的识别率会大打折扣 。

 
 

FineReader

Abby公司有比较成熟的OCR产品,名叫FineReader ,18年听说Uipath与Abby战略合作了,让Abby公司在RPA圈子的知名度应该上升了不少。

但早在2017年,我的团队就做了RPA+FineReader的项目。记得当时用户给FineReader起了个非常可爱的名字,叫“鱼眼”,因为FineReader 的Icon很像鱼眼吧

,说实话好像也没那么像 。(这款软件国内有破解版的)

 
 

FineReader对英文和数字的识别率特别高 ,甚至可以直接把PDF的表格自动在Excel中生成,这个功能真的很好用。但是FineReader的致命弱点一样是汉字 ,细想也很容易理解,毕竟是老外做的软件,对咱们的中文肯定没那么用心。

▲打码平台(灰色产业

打码平台是另一个大量“人工”而形成的智能平台。

打码平台的架构如下图所示:

 
 

从这样的平台架构就能知道,只要网上兼职做打码佣工的人足够多,验证码的库积累的足够大,那么就可以无比强大。

当然有的打码平台也结合了机器识别的方法,再加上人工识别作为后盾的,这会让打码的效率和准确率进一步提升。

缺点: 要收费,打码有延迟 ,需要连外网(纯内网的应用可能就没办法)

目前活跃的打码平台蛮多的,百度搜索“打码平台“应该可以搜出来一堆:

斐斐打码(价格较高-3.6分/码)

若快 价格便宜

超级鹰(价格居中-1分/码)

其实很多网赚平台的原理基本都是这个道理,这样的平台互联网上其实也有不少。

▲ 百度 AI开放平台

百度AI开放平台是目前国内比较强的AI OCR平台,也可以为大客户本地部署,价格贵。类似的平台也有好几个,我就不一一列举了。 

【ChatBot】

 
 

ChatBot就是指聊天机器人,目前国内已经有蛮多的公司在做相关的技术和产品的研发。 互联网上也已经存在多个开源的ChatBot框架供自学爱好者研究。

聊天机器人目前的主要应用领域是在客服领域。类似的用户使用体验大家肯定不陌生 , 本来我们是想去找个真人客服的,结果被一堆所谓的“智能”客服忽悠着那边兜圈子。机器人当然可以陪你聊一晚,但是能解决问题吗?答案是否定的。这类客服聊天机器人会将解决问题的方法大概告诉你一下,或者直接发一篇帖子链接过来 。问题还是要靠我们用户自己来解决。

“那多没劲啊,没帮我们解决问题,也没有妹子可以情感上安慰一下”

如果 ChatBot + RPA 又会是什么场景呢 ?

举两个实例吧:

1-平安好车主APP

我在平安好车主智能客户的留言和答复如下:

 
 

可以看到这个智能客服不太智能的,他们其实有我的全部信息,完全可以更加智能。 比如,第二个请求, 如果智能客服的身后,还有一个RPA机器人,那么这个RPA机器人完全可以将一份PDF的电子保单以我想要的方式发送给我。

2-携程APP

携程APP的智能客服很强大,有点超出我的预期。

 
 
 
 

首先对每一条机器人的答复可以请求客户帮忙认证结果,赞 或者 踩。用来提升机器人的准确度。其次,碰到连续几个刁钻问题,客服MM突然就自动介入了。 携程的价格说实在的是真的是一年年越卖越贵 ,但是这个智能客服服务给我的体验我还是点

RPA结合ChatBot是一个非常好的融合点,ChatBot负责理解用户需求,RPA负责干活,Perfect !!!

【语音识别】

语音识别挺酷的,对着房间吼一句,“热死了”,空调自动打开并设定了合适的温度。 目前国内一大堆所谓的智能家居产品,多数都是买了成熟的语音API接口(听过几个内部交流的会,买科大讯飞接口的居多),然后基于这个接口结合一些硬件,实现一些看起来的比较智能的功能。 

语音识别+RPA的结合场景其实也非常容易想象了。 财务老师对着麦克风说,“开始跑深圳的报税工作” ;过了一会机器人说,“深圳报税流程跑完了,结果已经发送到您邮箱” ; 财务老师接着说,“下面跑重庆的报税吧” ,机器人说,“好滴,马上去跑 ”

这样的场景,个外行看起来,是不是无比高大上,无比智能啊。

 
 

【智能决策支持】

4年多RPA项目经验,其实也挺明白RPA的缺点的,那就是无法处理突发或者临时事件。平时访问某个网站都挺正常的,在某个特定情况下,居然会弹一个MessageBox,不让机器人点掉,后面的操作全部废了。解决方案其实也特别简单,就是在那个环节多+一步 MessageBox的监测,出现就点掉,没出现就不用管。然而用户对RPA的期待是,能不能更加智能一些,这些情况能否都自己搞定,甚至智能帮忙做一些偏业务层面的决策。 

智能决策,哈哈,就看到什么程度了,真要是科幻片场景中的智能决策,我想应该也不是多数人的期待吧,因为细思极恐 。 我就想问问看,谁可以驾驭你们老板吗?

 

 
 

比较初级的智能决策支持,还是多数人乐于接受的。

目前市场上的智能决策系统,基本上是基于大数据分析,加上机器学习来实现的。 能落地的场景主要集中在,金融行业的反欺诈,保险行业的投核保智能定价,远远达不到能自主理解业务流程逻辑,业务老师讲一遍,或者视频录一遍,机器人就可以学会这个维度。

基于人工智能算法框架的一些理念,提升RPA机器人的自容错能力,增强RPA机器人的可靠性在现阶段还是可取的。

【其他】

本文简单聊了几点跟RPA 可以深度融合的技术,期待与各位大大交流。

欢迎关注公众号并回复,RPA或虚拟员工转型之路, 加入行业交流群。

小礼物走一走,来简书关注我

作者:RPA虚拟员工转型之路
链接:https://www.jianshu.com/p/cf25b3dfc0f0
来源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

转载于:https://www.cnblogs.com/freeliver54/p/10660796.html

你可能感兴趣的文章
c++中的string常用函数用法总结!
查看>>
[DLX精确覆盖+打表] hdu 2518 Dominoes
查看>>
SuperMap iServerJava 6R扩展领域开发及压力测试---判断点在那个面内(1)
查看>>
Week03-面向对象入门
查看>>
一个控制台程序,模拟机器人对话
查看>>
web.xml 中加载顺序
查看>>
pycharm激活地址
查看>>
hdu 1207 四柱汉诺塔
查看>>
Vue 2.x + Webpack 3.x + Nodejs 多页面项目框架(上篇——纯前端多页面)
查看>>
display:none与visible:hidden的区别
查看>>
我的PHP学习之路
查看>>
【题解】luogu p2340 奶牛会展
查看>>
对PostgreSQL的 SPI_prepare 的理解。
查看>>
解决响应式布局下兼容性的问题
查看>>
京东静态网页练习记录
查看>>
使用DBCP连接池对连接进行管理
查看>>
【洛谷】【堆+模拟】P2278 操作系统
查看>>
hdu3307 欧拉函数
查看>>
Spring Bean InitializingBean和DisposableBean实例
查看>>
Solr4.8.0源码分析(5)之查询流程分析总述
查看>>