找回密码
 立即注册
查看: 363|回复: 5

人工智能有哪些落地了?

[复制链接]

1

主题

4

回帖

17

积分

新手上路

积分
17
发表于 2024-9-13 10:02:06 | 显示全部楼层 |阅读模式
人工智能有哪些落地了?
回复

使用道具 举报

0

主题

2

回帖

0

积分

新手上路

积分
0
发表于 2024-9-13 10:02:36 | 显示全部楼层
目前人工智能正在出现分化:符号人工智能,这是一种关于自然语言和逻辑表达式进行推理的人工智能;机器学习,它利用统计推理在海量数据中挖掘范式;还有仿生学AI,它创建模仿简单动物行为的反应性机器人。以上三种是人工智能在发展中出现的三种分支。




在人工智能场景落地中,除了上述的场景中,人工智能在呼叫中心行业的商业落地情况良好。它充分将人工智能的自然语言处理技术、机器学习技术等运用到实际的呼叫中心商业场景中。早在几年前,国外某银行贷款催收部门果断裁撤人工座席,采用智能机器人座席,开始走机器辅助人工座席的新型服务模式。
随着中国人口红利的消失,很多企业也都开始模仿国外采用人工座席和智能机器人座席相结合的运营服务模式。让技术赋能产业走向商业化。国内呼叫中心提供商开启将人工智能技术运用到传统的呼叫中心技术之中,此后市场上出现的智能在线客服系统、智能电销系统、预测外呼、预览外呼、智能IVR、语音通知系统等等半智能的呼叫中心系统。
目前国内呼叫中心提供商开发的呼叫中心产品还属于半智能的产品,这些半智能的呼叫中心系统可以做到智能的筛选意向客户、智能拨打并简单解决问题、定期企业友好问候维护客户等简单的操作。
呼叫中心提供商将人工智能技术融合到呼叫中心技术中,致力于将智能座席代替人工座席,解放人力。人类对人工智能的探索。最重要的原因是企业对人工智能的迫切需要。任何一个新型产品唯有商业化才是它生存发展之道,离开商业化它将很快被遗忘丢弃。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

4

回帖

15

积分

新手上路

积分
15
发表于 2024-9-13 10:02:59 | 显示全部楼层




AI能上天测算天气,能下地自动驾驶,那能帮你妈妈织毛衣吗?
你别说,还真能!
近日,麻省理工大学发布了一项AI工具,能够看图织毛衣。这款工具可以将针织图案的照片翻译成指令,然后与机器协同制出针织服饰。什么高难度针法、精致图案统统能胜任,指令完成概率高达94%。
编织工艺可以追溯到中世纪的埃及,人类一千多年积累下来的精巧工艺今朝竟被机器“一眼破获”。学院派的成果虽然令人拍案叫绝,但距离落地应用还有很长的路要走。
事实上,“AI+传统行业”、“技术赋能产业”已经不再是空泛的口号和概念,人工智能技术已经悄然潜入寻常百姓的衣、食、住、行各个方面。何止AI织毛衣,炒菜、当水军、搬砖、缝衣服,AI几乎无所不能。
而且根据可靠数据,用AI砌砖,效率是普通工人的十倍,顺便还能解决搬砖、刷墙等一揽子的活儿。
那么,到底AI都能干什么?实验室刷榜与工地搬砖之间的距离究竟多远?AI又是如何改变我们生活方式的?
为了寻求这些答案,本文对全球的AI产业在衣食住方面的落地情况进行深入调查。




AI设计服装成爆款,22秒做出T恤

即使是一位针织高手,都很难仅凭几眼就能复制一件“蚂蚁上树针法”、“镶嵌卡通人”的针织品,机器却可以在几秒之间悟出其中几万步没有太大规律的纺织步骤。当然,这一实验室内的技术离地落应用可能还很远,但是在棉布类服饰产业,算法系统和纺织机器人早已走出温室,潜入服装设计部和纺织工厂之中。
除了麻省理工大学的算法已经能根据织品图片倒推针法并个性化定制图案——韩国公司用AI设计的卫衣,成为电商平台最畅销服装之一;美国公司的缝纫机器人在22秒之内可以做出一件T恤,将阿迪达斯T恤的成本降至2元/件……
1、看图织毛衣,图案可定制
上周,麻省理工学院发布的一款AI工具InverseKnit,能够看图织毛衣。
当给这个系统一张手套的照片,它就会按模组生成的指令输出一双一样的针织手套。测试时,在94%的时间里,InverseKnit都能生成准确的指令。
InverseKnit系统依赖一个编织指令的数据集,以及这些模式匹配的图像。研究人员用这些数据训练系统的深度神经网络,来解释图像中的二维编织指令。
除了看图织毛衣,研究人员还设计了计算机辅助设计工具,用以私人定制针织物品。它使用了二维图像、CAD软件和照片编辑等技术。
虽然这款辅助设计工具无法独立设计服饰,但是可以让人使用模板来调整图案和形状,无需专业经验。比如在帽子上加上三角形图案,在袜子上加上竖条纹等等。




▲通过该系统,用户可以使用模板来调整图案和形状以私人定制图案
2、AI设计T恤成爆款,无法胜任高端设计工作
其实,当我们走出实验室,会发现AI已经潜入到服装设计师左右做起了设计工作。2018年11月,韩国公司就在其国内首次推出一款AI设计的卫衣。




▲这款卫衣背部印有SJYP的logo、卡通图片、不规则排列的方块模块。
该卫衣背后的设计师,名为“Style AI 系统”。Style AI系统的核心是图像处理技术结合卷积神经网络。
简单来说,通过对该品牌服饰的logo、卡通形象、衣服材质等图片的学习,“Style AI 系统”能掌握该品牌的颜色、形状、图案等风格。按照学习到的风格,AI还会提出新的样式和设计。
实际上,全球的电商时装企业都有积极使用AI参与服装设计的趋势。从2017年开始,美国服饰购物网站就已经在出售由AI设计的服装。
2018年8月,在印度电商网站Myntra上,最畅销的产品之一是一款由计算机算法生成的拼色T恤。其CEO表示,这些AI设计服装的销售量正在以倍速增长。
早在2017年,亚马逊就利用GAN(Generative Adversarial Network)模型,推出算法系统,通过分析大量图像并模仿其风格来设计服装。该技术可能已经被大规模用于电商快时尚服饰设计。




▲基于 Google 的开源学习系统 TensorFlow 展开的服装设计
GAN的基本原理其实非常简单。G和D是两种相互博弈的算法,一种生成图像,另一种比较判定图像与源图像的差别。博弈的理想结果是G成为了能够“以假乱真”的图像生成模型。
尽管如此,如果你问”连服装设计师都要失业了?”,答案可能是否定的。因为创意设计工作需要深厚的先验经验和共情能力,也受到社会风潮的影响,这对机器来说还很有难度。
目前,情感识别及先验经验运用方面明显是算法的短板,因此虽然一些跟风、模仿类的服装设计师已经可以被AI设计师取代,但对于更需要创造性的服装设计师来说,AI设计往往是作为辅助的存在。
正如电影《穿普拉达的女王》中所说,时尚体现在各种精致细节,一种“天蓝色”可能要游经国际展会、设计师发布会、高级卖场、街头、廉价卖场等多种场景,才在大众中流行开来。
3、22秒做出T恤,一个操作员顶11个缝纫工
AI在服装设计上小试牛刀,在服装制作上大显身手。
美国SoftWear公司的缝纫机器人造一件T恤只需22秒。这款设备从取布料到成品整个过程无需人工干预,可使其客户阿迪达斯的T恤成本降至2元/件。




▲SoftWear缝纫机器人在快速整理布料、完成缝纫
对服装制造业来说,引入AI的关键技术难点是机器人难以处理柔软的面料。因为布料往往易折叠、形状不规则,而织物又必须严丝合缝。
因此,长期以来,在缝纫的“拿起物料”、“对齐”、“缝制”和“整理”四个步骤中,只有“缝纫”这一步骤已经实现自动化,其他部分仍由人工完成。
SoftWear缝纫机器人的创新之处,是把针头移到布料上,而不是把布料移到针头上。这种方法解决了柔软面料的张力平衡问题,使服装制造的全流程自动化成为可能。




▲SoftWear缝纫机器人工作的全流程
Softwear系统配备每秒捕获超过1,000帧的专用相机,并配合图像处理算法实时检测针头位置。因此,SoftWear可以比人眼更精准地观察织物,并精准追踪到不到半毫米误差的缝纫针位置。
另外,SoftWear还开发了机器人操纵器、滚轮工作台、四轴机械臂和真空吸盘等装备来传输处理布料。
同样是解决布料柔软的痛点,西雅图的一家创企则采取了另外的一种思路。他们用一种无毒的聚合物使织物暂时变硬,因此现成的工业机器人就能用“硬布”来制造服装。但据说目前该方法还鲜有商用。
2019年3月,中国天源公司“雇用”了SoftWear公司大约330台自动缝纫机器人,预计可降低50%至70%的人工成本,同时提高70%以上的生产率。
目前,自动缝纫机器人主要在T恤和短裤等制品上投入应用。但Softwear认为,在未来五年内,它的机器将能够生产出吊带衫、连衣裙、牛仔裤等更复杂的服饰。
服装制造全流程的自动化将重塑制造业的全球化分工格局。服装制造业一直是劳动密集型行业,我国许多成衣厂都出现了大规模的“用工荒”。纺织全流程的自动化能有效地解决“用工荒”问题。
随着我国经济发展结构的变革,许多服装制造厂转入越南、印尼等地区。据世界银行预测,未来20年,南亚地区每月会新增120万名劳工,20年后将新增2.4亿人。自动化进程将使得这些劳工面临巨大的挑战。
除了服装制造业,在服装批发与零售等方面,人工智能也在渐渐地承担起一些“库存清点”等高重复、偏体力的劳动,同时也为消费者带来一些“AR试衣”等有趣的购衣体验。




懂菜谱、能实战,大锅菜厨师马上下岗

很多人可能还记得,十年前,智能手机和移动互联网是如何悄然而迅速地“随风潜入夜”。似乎一夜之间,所有人都开始用美团、饿了么点餐,所有人都在用支付宝、微信付款,所有人都开始用美食杰、百度经验学习做菜。
现在,历史正在重演,“舌尖上的AI”正在潜入人们的生活,轻巧、迅速,且“润物细无声”。信不信,你刚刚点的外卖可能就是机器人做的,你刚刚看的美食推荐就是AI写的,而你看到的菜谱是AI看图猜出来的。
1、AI看图识别菜谱,“皮卡丘”当成“煎蛋”
今年6月,Facebook开源了一个AI识菜谱系统。该系统可以通过分析食物图片,判断图片中是什么食物,进而判断出食材和加工过程。




▲Facebook的AI识菜谱系统页面
传统的AI识菜方法往往将识别过程简化为——从静态数据库中匹配的检索任务。这些系统在判断出图片中的食物之后,会去已有的数据库中匹配相应的或相似的菜品。这种方法极其依赖数据集的大小和多样性,很容易识别失败。
Facebook换了一种新思路,将图像到配方问题公式化为条件生成问题。即:使用预先训练图像编码器和成分解码器,以图像及其相应的成分列表为条件生成指令序列,以此生产可能的菜谱。
换句话说,就是在识别图片中的食材之后,该系统会预测成分列表。然后依据成分列表,推导菜品的加工方式。




▲Facebook的AI识菜谱系统的工作模式
这类食品识别系统的技术难点在于高级推理和先验知识,由于食品在加工后往往会形成严重的形变。比如,要判断羊角包里可能有黄油,这并不是从图片可以简单得知的。
有趣的是,Facebook的这款AI认菜谱系统可以接受任何图片。比如,当研究者导入卡通人物皮卡丘的图片,系统将它识别为了“煎蛋”。
Facebook的菜单识别系统是迈向更广泛的食品理解系统的第一步。
2、一键炒菜,“大锅饭”、快餐厨师马上失业
“舌尖上的AI”不仅会识别菜谱,还能撸起袖子上灶台。
在家常烹饪方面,美的、九阳等多家品牌推出了炒菜机器人。用户只需要准备好食材,完成几步操作,香喷喷的饭菜立马出锅。
这类炒菜机器人的操作很简单。用户可以在显示屏幕上选择菜单,转动旋钮就可以开始炒菜。




▲某品牌的家用“炒菜机器人”
家用炒菜机器人一般内置螺旋式搅拌器、传感器和温控设备。通常来说,这类机器人都配合手机APP进行菜谱选择和精细调控。
在职业烹饪方面,今年4月,一款名为“味霸”的智能炒菜机器人面世。它内置有先进的油烟处理技术,可将炒菜时产生的油烟进行“油、水、气”分离,做到无油烟烹饪。
这款炒菜机器人具有一键式操作功能。点击屏幕自动完成整个炒菜过程,食材按序入锅,自动翻炒、自动添加调料,通常炒制一道青菜只需要3分钟左右,半荤全荤在4到6分钟内炒熟,菜炒好后会自动感应出锅。




▲工作人员在使用“味霸”炒菜机器人
目前,许多这类大型炒菜机器人已投入商用。在百度上搜索炒菜机器人,可以看到许多商用炒菜机器人已经迭代了多款产品。




▲某品牌已经发布多款炒菜机/炒菜机器人
2018年11月,据新华社报道,北京市东城区前拐棒胡同老年配餐中心配备了炒菜机器人。工作人员只需要点击屏幕选择菜品,把备好的食材投放到炒菜机器人里,不到两分钟,一份味道鲜美的豆角小炒肉就做好了。
为了方便老人使用,这种智能售卖机还将开放交通一卡通和刷脸付费。“机器人能做饭,真是太棒了!这个饭菜很合我的口味,不是很咸,也不油腻,很适合我们老年人。”李淑茹大妈告诉新华社记者。
有些企业在集中发力AI炒菜机器人,还有企业在布局完整的智慧厨房系统。2018年9月,四川长虹发布的智慧厨房系统通过数据,致力于打通农场种养、净菜加工、冷链配送、智能烹饪,到手机点餐、食材溯源等全流程“端云一体”。




▲长虹机器人餐厅
其中净菜车间用以实现食材标准化和包装的标准化;厨房机器人则负责最终菜品的烹制,自动投料、自动翻炒、自动洗锅,5台设备只需一人操作。
由此来看,以AI识菜谱和AI炒菜机器人为切入点,随着AI菜谱识别、自动化食材获取、机器食材烹饪流程被连接,农场、货运、仓库、后厨、餐厅等多个场景被打通,AI将促进整个餐饮行业生态发生重大变革。
曾有广告戏言“遇见新东方厨师,就嫁了吧”,这句话现在可能要打上问号了。机器人势必会取代一大部分厨师的工作,包括“大锅饭”、食堂厨师、走量的快餐厨师等等,这是一个“经济成本”问题。
但是,这也在倒逼厨师们从重复的体力劳累和噪音油烟中解放出来,进而把时间用在和顾客交流、研究菜谱、实地考察等更有价值的事情上。
3、AI推荐、AI水军、AI认菜结算,餐饮服务人员迎挑战
也许前面讲到的AI识菜谱、AI炒菜还离大众视线较远,但AI推荐、AI水军和AI结算机器人就是台前和人们“大宝天天见”的戏码了。
在选择餐厅之前,很多人都会参考大众点评、抖音等平台上的口碑推荐,以避免“踩坑”。这些平台可以利用海量用户数据,根据用户的兴趣用算法为用户推荐好吃的东西,这使得各种口味的人都能找到对味的美食。
与此同时,AI水军已悄然进入口碑平台,其撰写的广告软文常常能混淆视听。据公关领域业内人士爆料,机器撰写“水军评论”、“口碑软文”已经形成了一条灰色产业链。你能看出来以下评论都为AI自动生成的吗?




魔高一尺,道高一丈。随之而来的是用AI消灭AI水军的抗争。近日,哈佛大学的一款检测工具,可以帮助人们识别机器撰写的文段,辨识比例从54%提高到72%,让机器评论秒现身。(用AI消灭水军新突破!哈佛和IBM联手研究,让机器评论秒现身)
人们除了可以参考AI的美食推荐,也开始接触AI食物识别和结算付款。例如,今年7月北京大学开始试行识菜结算机器人。
据体验,这款机器人认识200多道菜品,并且能够刷脸支付。用户将菜品放在识别出,该机器可以根据食物纹理在2s之内识别出菜品,整个支付过程可以小于10s。




▲北大食堂卖饭机器人
当然,也有这种结算机器人难以识别的菜品。比如馒头和包子、土豆烧鸡和红烧肉、大小碗米饭,仍需要员工调试。5-6台这种结算机器人只需要配1个调试员。(探访北大最AI的食堂!刷脸打饭,机器认识200多道菜)
由此可见,除了厨师,餐饮服务人员也面临着被机器取代的挑战。




建筑机器人搬砖砌墙,AI辅助家居设计

从AI在服饰、饮食业等传统产业的落地进展来看,AI赋能传统行业已经成为热潮。作为传统行业代表的房地产行业,其实嗅觉更敏锐。随着我国人口红利的消失,劳动力短缺问题日益突出。
实际上,铺砖机器人、粉刷机器人、焊接机器人等几十种建筑机器人已经在工地“上工”;AI家居设计也已有成熟的产品投入商用,为用户提供比传统方案便宜十倍的可视化方案;而AI房产个性化推荐、房屋匹配等的应用已经比售楼人员能提供更客观的推荐。
1、AI砌砖机器人,两天能砌完一栋房子
拿房地产商碧桂园来说,该公司去年宣布在5年内投资800亿元到机器人领域,今年一月又更新业务架构,重点布局建筑机器人。
其墙板安装机器人、铺砖机器人、粉刷机器人等等都已投入应用。如,全自动砌砖机器人“哈德良”每小时可以砌1000块砖,两天内就能砌完一栋房子,速度是普通砌砖工的10倍左右。
我国是建筑大国,但是随着人口红利的消失,劳动力短缺、劳动效率不高、施工质量良莠不齐、工作环境差成为建筑行业的痛点。近年来,国家鼓励企业积极发展大数据及人工智能技术,推动传统产业改造提升。
碧桂园集团董事会主席杨国强设想,假如在一栋30层楼的建设中,70%的工人工作由建筑机器人来完成,留30%的建筑熟练工,培养20%的操作建筑机器人的新型建筑工人,不仅可以从根本上解决安全和质量问题,还能大大提高劳动生产率并节约大量成本。
在北京海淀丰台的一个房地产项目中,用于预制墙板搬运的遥控搬运小车引人注目。预置墙板每块重一百多公斤,但一名女工通过遥控操作,就能使得搬运小车分别将4-6块墙板提升、捆扎、倒放,再通过工地复杂的路况、进出电梯,最终整齐堆放到楼层指定地点。
从全球来看,建筑机器人已经广泛用于各种建筑领域。涉及种类包括测绘机器人、砌墙机器人、预制板机器人、施工机器人、钢梁焊接机器人、混凝土喷射机器人、施工防护机器人、地面铺设机器人、装修机器人、清洗机器人、隧道挖掘机器人、拆除机器人、巡检机器人等在内的众多家族成员。




▲某建筑机器人实验室




▲3D打印建筑机器人




▲清拆/清运作业机器人




▲墙/地面施工机器人
其实建筑工地环境复杂,意味着建筑机器人并不简单。目前大多数建筑机器人仍属于可编程机器,只能执行一系列重复性的体力劳动。面对工地上更加复杂的环境和任务,仍需要一线工人通过思考来解决。




▲日本HRP-5P搬运机器人
同时,从目前的情况来看,企业需要加速传统建筑机器的改造,同时促进既有机器人技术的应用,改变施工人员的工作习惯。另外还需要推动建筑业专用机器人系统及配套建材的研究和开发。
2、AI家装使人身临其境,少花十倍的钱
虽然人工智能在房屋设计上应用很少,但在家居设计上应用已经不少。市面上已有商家能利用VR为消费者提供实惠酷炫的服务。
传统的VR效果方案成本很高。一套房子的效果图大概需要2000-3000元,整个小区做一套方案就需要几万,一个小区为了吸引业主会设计2-3套设计风格,就得花费十几万。
因此一些高效、低成本的VR方案应运而生。有的企业利用人工智能设计结合绘图设计师的简单操作,能将定制一套房子的VR效果方案降至100多元,成本下降近十倍。
通过云渲染技术云设计、BIM、VR、AR、AI等技术的研发, 这类应用可以10秒生成效果图,5分钟生成装修方案。
例如,一些平台研发了全屋定制交互体验产品,使业主可以在虚拟场景中提前体验到未来的家。用户可以体验在家里开关门、开关灯、切水果等等,还可以切换装修风格、切换家居、加入购物车等等。




▲国内某VR辅助的AI家居设计解决方案
对于特定的场景,这类产品可以利用深度学习和自动识别技术,综合考虑建筑障碍、生活轨迹等因素,自动推荐符合用户要求且构造合理的方案。
人工智能设计当下能做到的只是智能绘图、大数据链接、快速云渲染等基础工作,它无法代替专业设计师的思想、创意、生活经验以及对业主的情感把控等等。因此,对于设计师来说,AI将会是一种重要的辅助工具,能将设计师解放出来做更多的沟通交流和灵感酝酿工作。
3、个性化匹配房子,计算成交概率
如果说AI盖楼和AI装修解决了房地产商“用工荒”的痛点,那么AI辅助买房租房,则可以使广大消费者免于在房产营销人员铺天盖地的宣传中迷失方向。目前,在国内外,AI应用主要集中在个性化推荐、算法审核资质、合租者协调互动等方面。
总部位于美国蒙特利尔的Nobbas能够根据用户“划屏幕”判别其喜好,进而向用户个性化推荐房屋。其目标是利用人工智能帮买家或租客找到房子,并且使得共同的购买或租住者能更好的配合。




▲Nobbas APP页面
使用该公司的产品,用户只需要通过向左或向右划动屏幕,就可以让AI了解自己的喜好。该平台上具有140多万房源,经过一定的训练,AI会从这些房源中为用户推荐符合用户兴趣的房产。
该公司还创建了一个交互式协作工具。“所有受邀合作的人都会看到你喜欢的房屋,你也能看到他们的,”Muir说。Nobbas于6月初在Apple的App Store和Google Play商店推出该平台。
美国PropertyNest公司能够利用算法对用户的信用评分进行考察,进而帮用户找到最合适的房源。匹配标准涉及到用户财产的审核、收入水平、信用评分、储蓄情况等等。
用户需要提前将收入、储蓄等信息输入到系统,当找到自己喜欢的公寓,算法会告诉用户获得批准的可能性。




结语:实打实落地,劳动密集产业为主

随着近年来AI落地热潮首先席卷易于落地的汽车、安防等大产业,许多更加垂直、细分和深入的产业也正在出现AI的身影。涉及到人们的衣食住,场景往往复杂细碎,消费形态也是短平快,并不容易推进AI落地。经过深入调查我们发现,在这些产业中,AI虽然主要是在劳动密集型工作上“小荷才露尖尖角”,却“早有蜻蜓立上头”,展现出进一步赋能全流程自动化的潜力。
在衣着方面,虽然人工智能技术还不能进行连衣裙、牛仔裤等复杂款式衣着的设计,但是它能进行简单的设计。并且技术发展解决了机器难以处理柔软布料的痛点,这将大大提高服装厂商的效率,同时也使得从事重复服装制作工作的人面临挑战。
在饮食方面,炒菜机器人不仅开始取代“大锅菜”、“快餐”厨师掌勺炒菜,还能够“看菜识菜谱”,越来越具有“大厨修养”。这既使厨师职业者面临威胁,又能将他们从重复肢体劳动和厨房油烟热浪中解放出来,进而研究更好吃、健康的美食。
在住宅方面,多类企业入局的建筑机器人有利于应对建筑行业劳动力短缺、施工质量良莠不齐、工作环境差等痛点。同时,擅长复杂决策的机器人系统和产业全流程自动化成为燃眉之需。
在出行方面,自动驾驶家用车、自动驾驶货车等出行工具已经在各地试行并获得不错的测试成绩。
人工智能在给人们带来便利的同时也在对人类劳动价值发出挑战。美国莱斯大学计算机工程教授Moshe Vardi预测,在未来30年,人工智能将逐步取代目前世界上50%的工作。只有在巨浪来临前学会游泳,个人和企业方能趋利避害、逐浪归来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

6

回帖

6

积分

新手上路

积分
6
发表于 2024-9-13 10:03:54 | 显示全部楼层
人工智能细分领域很多,比如计算机视觉,机器学习,语音识别,自然语言处理,智能机器人,自动驾驶等等。
术业有专攻,作为一家专注做OCR识别的人工智能公司,今天来跟大家聊一下OCR技术的落地应用有哪些场景。

首先简要介绍一下OCR技术。
OCR识别技术属于计算机视觉领域,是Optical Character Recognition的简称,直译是光学字符识别,直观理解就是把纸张、卡证、车牌之类的载体上的文字通过光学手段和技术手段翻译成计算机可以使用的电子化数据的过程。
要把电脑中的文字变成不可编辑的图像很简单,截图,拍照,转pdf都可以做到。
但要将图像中的文字形状转化为可编辑的数据,这个过程比我们大多数人的想象可能会更复杂一些。

在银行、保险、证券为代表的金融领域以及政府、医疗、司法、档案管理等等诸多领域中,存在着大量的需要把卡证、牌照、票据、表单、合同以及其他纸质文档录入的需求。
而早先我们解决这种需求的办法是——人工录入
有一种叫【打字员】的职业,曾经就是干这种把文字录入电脑的工作。
不过现在这个职业已经成功“转型”为专业诈骗了。
嗯,也许说现在招聘打字员工作百分百都是诈骗也有点绝对,那我们严谨一点,用@江宁公安在线 的话来说:




第一个原因是——现在的年轻人里,想找几个不会敲键盘打字的都难(感谢我们国家基础教育的普及和个人电脑智能手机的推广)。
第二个原因则是——将图像转文字的OCR技术已经很成熟。收费的OCR识别按页收费,千字成本顶多一两毛,录入准确率不比人手打要低,而人工成本千字少的说要给三五块,有的说能给十几块甚至更多,小说网站上的原创作者都不一定能拿这么多。大量文字录入的工作不考虑用OCR,还非要人手打,不是蠢就是骗子。

现在在市面上你可以找到不少免费的识别软件,哪怕识别率稍微低一点,也是可以将就用的。而企业所需要的专业OCR识别产品更是已经非常成熟,录入准确率甚至已经超过人工录入。大批量使用OCR的场景购买专业识别产品,准确率高,速度快,价格也不贵。干嘛还要人工来录呢?
不过说实在的,哪怕这项技术已经非常成熟,距离真正大规模应用,在各行各业都发挥出应有的功能,还是需要很长时间的。
大家可以想想,在自己的工作和日常生活中,是不是仍然存在很多情况需要手动去敲一串很长的卡证号码,或者手动录入一大段纸质文档中的文字。
哪怕已经到了2019年,北京的连锁便利店里还能看到有收银员是要靠手动把产品条码输进系统的,就连条码识别的技术都没有百分百普及,更何况文字识别?

我们回过头来接着讲OCR的落地应用,以我们公司为例,重点着眼的领域是金融——
易道博识的创始团队是几位来自于中科院、清华大学、北京大学的人工智能专家,为了把他们在视觉识别领域的技术成果转化为商业应用,易道博识在经过一段时间的探索后把方向瞄准了金融领域。
不是说其他领域的OCR识别需求不多,事实上像在档案管理、医疗、司法卷宗还有一些政府工作中,需要录入的东西只多不少。
但是金融领域对新技术的包容性是最强的。金融对低成本和高效率的极致追求使得它们“敢为天下先”,除了天生根植在新兴技术里的互联网行业,金融行业往往是最先能够接纳前沿技术的领域。
而OCR识别技术,又恰好戳中了金融行业迫切需要解决的一个痛点。

OCR识别能做什么?

1.远程开户
易道博识在金融领域最早的尝试,是推广卡证识别开户方案。
没错,当你在银行证券等APP上开户绑卡的时候,拿手机摄像头扫描一下你的身份证和银行卡就能录入系统,不需要再手动输入姓名号码,这就是人工智能OCR技术落地应用的实例。
易道博识的视频流识别技术甚至不需要点击拍照识别或者上传,只要把身份证在摄像头前放一下,银行卡号对准扫描线晃一下,就能自动识别录入。




由于识别速度太快,为了这个画面截了N次图



识别结果还是非常OK的,没有受到花里胡哨的背景影响

有华为手机的小伙伴也可以打开手机自带的华为钱包,到卡包里去试一下绑定银行卡的功能,用的就是一样的技术。(权限限制不能截图录屏,只能大家自己去试了)




后来为了配合实名制的身份验证需求,又加入了人脸识别的功能。
卡证+人脸识别完成远程开户,现在绝大多数的银行、证券之类的金融APP应该都有了这项功能,过于普及以至于可能很多人都没把它当做人工智能技术。

2.表单票据录入
在银行最怕的是什么?
排队。
明明自己几分钟就能办好的业务,交个号排一两个小时都是有可能的。
但是柜员小哥哥小姐姐明明在一刻也不停的工作呀,一个接待完了马上接下一个号。那么这么长的时间里,他们在干什么呢?

办理业务的人把一大堆材料递进去,里面的人把需要的信息一个字一个字敲进电脑。
早些年汉字输入法还在智能ABC阶段的时候,银行柜员甚至还要求要学五笔打字,一快二准。现在拼音输入的速度有了很大提升,生僻字录入也方便了很多,对五笔的要求才逐渐放宽,不是必修科目了。
当银行柜员虽然不需要职业电竞选手的手速,但是打字速度起码也要在一分钟三五十字左右,快的甚至能到100字,特别是数字小键盘要用的特别6。
可能很多人觉得这也不是什么高要求,但是银行证券等等金融行业的入门门槛越来越高,985硕士进了银行先去做柜员,每天在小键盘上敲一串串无意义的数字,这样的工作能带来多少价值呢?

而现在,使用OCR技术可以省去绝大多数文字录入的繁琐工作。目前在银行证券保险等行业中,除了身份证、护照、户口本、军官证、港澳通行证这些身份证件和银行卡以外,使用比较多的有营业执照、开户许可证、行驶证、驾驶证、支票、汇票、机动车销售发票,不动产登记证等等的识别。
引入这些OCR识别产品可以省去业务录入的时间,原来需要三五分钟才能完成的工作可以缩减到几秒钟,大大提升业务效率。
3.发票识别

财务会计也是一个录入工作非常多的岗位,每天要和大量的数字打交道,一家大型企业的财务部门每天都要处理成千上万张票据。
众所周知,在感性思维上人工智能还远远比不上人类,但是在纯粹的运算处理和数据工作上,机器的效率可是要远远超过人类的。
而财务这样一个需要大量处理数字的岗位,也是OCR技术的一个大舞台。
简单的说,人工智能在这里扮演的角色就是一个帮你把票据自动录入系统并且进行验真和自动审核的功能。
这个录入功能到底有多强大?



这样一张A4大小(其实更大)的幅面的票据图像进行识别,3秒内可以完成自动分类、切割、定位、识别和结构化输出,直接对接到系统,而且可以做到票面全字段识别,自定义所需要的字段,不会舍弃任何有潜在使用价值的数据。
你要是觉得把票据这样摆得整整齐齐浪费时间,也可以选择简单粗暴模式



(摆个票都是爱你的形状)



发票类型不一样,方向不一致,票据有交叠,这些都没关系。只要不遮盖关键信息,怎样摆都可以。




哪怕你摆出个花,一样可以精准定位。



截图来自易道博识票据识别APP“慧报销”实际识别页面

这套识别平台目前已经在某些大型集团的集中运营中心落地使用了,财务更大程度地向自动化智能化转型,运营成本压缩的同时,效率也有明显提升。越是票据处理工作量大的企业,这套平台的价值也越明显。

综上,是OCR技术在泛金融领域几个比较典型的落地应用场景,有些是大家熟悉的,有些是刚刚开始试点推广的,但从实际效果来看,都有切实的应用价值,真正提升了用户的使用体验,提高了企业的工作效率,还节约了不少人力成本。
我们也期望这一项技术之后能在各行各业普及,让大家日常的工作更轻松,哪怕一点点,都是科技发展的价值所在。
最后贴个链接:易道博识AI开放平台-优质的人工智能服务平台
当前已经上线的识别产品有这些,可以在线试用效果。



还有一些例如财务报表之类的识别产品还没有上架,如果有类似识别需要可以私戳或者官网上获取联系方式咨询。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

1

回帖

0

积分

新手上路

积分
0
发表于 2024-9-13 10:04:27 | 显示全部楼层

  • 语音识别

    • 微信语音转文字;
    • 王者荣耀、百度搜索、百度地图、高德地图:语音输入
    • 小度音响、小爱音响:语音控制开关、换歌
    • 怕怕:说出指定口号,APP自动报警
    • 微信、支付宝:语音解锁
    • 未来:语音实时转字幕、智能家居、实时翻译等等

  • 人脸识别

    • 华为、小米、vivo、苹果、三星各大手机厂商:人脸解锁
    • 支付宝、许多自动售卖机:刷脸支付
    • 美图秀秀、B612、激萌、轻颜等美图软件:贴纸、加妆容、动画互动
    • 机场、车站、酒店:人证对比
    • Faceapp:一键变老、一键年轻、一键假笑、一键换发型
    • 很多小区:刷脸进小区
    • 商场:客流分析,捕捉会员
    • 安防:人流密集区,通过人脸识别快速锁定嫌疑人

  • 文字识别(OCR)

    • ETCP、停简单:停车闸机设计(车牌识别)
    • 有道翻译、微信:拍照翻译
    • 作业帮、小猿搜题:拍照搜题
    • 公路上的电子警察:车牌识别
    • 哈尔滨银行旗下“随享贷”APP:为方便客户在移动端进行身份认证,使用身份证识别、银行卡识别、名片识别等技术。

  • 以上只是列举了一小部分生活中的AI落地应用,题主如果想了解更多的话,建议去AI Hero(www.aihero100.com),这是我找到比较全的AI落地案例的网站了,希望我的回答对题主有帮助吧~
回复

使用道具 举报

0

主题

3

回帖

4

积分

新手上路

积分
4
发表于 2024-9-13 10:05:10 | 显示全部楼层
在中国,人工智能落地一个很魔幻的场景是人脸识别,大规模的人脸识别,从金融,到政务,到安保,几乎原来需要人力核验身份的场景,需要证明“你妈是你妈”的场景,现在都可以用更便捷更安全的人脸识别代替。
只有中国能在演唱会上通过人脸识别捉那么多逃犯;只有中国能在地铁上实施刷脸进站;只有中国能发现10亿人中必有一个像你这种洞察;只有中国能通过一个小程序刷脸核验返回你散落在十几个部门的政务数据。。。
这种准确、大规模铺开的刷脸落地场景,连英国、美国都做不到。它们的大规模人脸识别才刚刚开始、错漏百出、实施阻力巨大。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-12-22 01:49 , Processed in 0.070630 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表