阿里云
发表主题 回复主题
  • 7803阅读
  • 17回复

[云安全体系/架构/合规专区]阿里绿网图文识别服务(OCR)已正式商业化啦

级别: 新人
发帖
16
云币
23
                                   阿里绿网图文识别服务(OCR)已正式商业化啦! @y0bU*v7  
                                                                                                   4ZJT[zi  
                                                     拥有亿级样本,采用深度学习技术,精准识别图片文字信息,提供业界领先识别服务 8jjk?PUD8  
                                                                                                                                                                                   
如果您是一名资深的信息安全管理员,一定会遇到这样的烦恼:
传统的文本监控已无法遏止”垃圾广告”等违规信息的产生,越来越多的非法用户将文字内容PS到图像上来传递违规信息,以躲避文本监控系统,达到“逃逸”的目的,而垃圾信息不清除,无论是对用户体验还是平台健康度的影响都后患无穷。
vN,}aV2nq  
现在,集成阿里巴巴多年算法运营经验沉淀的产品:阿里绿网图文识别服务(OCR)于2016年7月21日正式上线并商业化啦,是您扫除“垃圾广告”等违规图片的又一利器!
一、服务简介:
基于深度学习技术及阿里巴巴多年的海量样本沉淀,能精准识别图片中的文字信息,提供业界领先识别服务。
二、使用过程
用户通过阿里绿网图文识别服务API接口将图片传递给阿里绿网,然后阿里绿网会识别图片中的文字内容,用户可通过输出的文字信息进行业务上的应用。
三、OCR技术介绍:
OCR全称是光学字符识别(Optical Character Recognition),也就是图像中的文字识别,简称图文识别。
一般的OCR技术是基于传统的检测与识别方法,对于“垃圾广告”图片识别效果较差,而阿里绿网主研发了基于深度学习的OCR技术,整体框架如下:
`+hy#1]  
1%hM8:)i_  
如图所示,阿里绿网在各个模块中均有自主研发的部分。例如,在切分和识别模块中字符预分割阶段,除了传统图像方法外,更引入了基于学习的分割点判别模型,可以有效的弥补传统方法的不足,对于复杂背景文字图像有较强的适应能力。字符识别+动态调整过程也可以称为“解码”过程,在这个过程中使用了CNN字符识别模型和语言模型。在路径选择过程中,同时考虑了字符模型、语言模型、字符结构等因素,进行了综合评价,从而实现最优结果选择。 foz5D9sQ  
四、产品优势: X}j'L&{F@  
1、大数据:依托于阿里巴巴全生态体系,拥有海量的特征样本及丰富的数据模型分析经验 5&HT$"H :  
2、强大的识别能力:拥有业内顶尖的算法专家,基于深度学习理论,自主研发技术,荣获多项专利
h76NR  
3、丰富的业务实践:已应用于阿里巴巴生态众多业务及外部用户,业务理解和安全能力为多年实践沉淀 tC?A so  
4、海量数据快速检测:基于云计算平台,能对海量数据进行快速检测
c. TB8Ol  
让“清理”工作变得更轻松,从今天开始吧~! 欢迎立即开通阿里绿网图文识别服务
效果测试:点此查看>>     
服务开通:点此查看>>
异步接口调用文档:点此查看>>
价格及收费说明:点此查看>>
762o~vY6$  
如有意见或建议,也欢迎大家通过工单等方式与我们交流,我们会不断优化产品功能及用户体验,谢谢!
n4vXm  
s0)qlm*  
+f\pk \Ith  
c3zT(FgO>N  
HTDyuqs  
V5yxQb  
\za5:?[xB  
//X e*0  
P34LV+e  
K=m9H=IX~T  
uP%axys  
a(}VA|l  
N &I8nZ9  
Q(=Vk~v  
Y8J ;+h9  
[ 此帖被chenlei20080417在2016-07-21 15:06重新编辑 ]
级别: 论坛版主
发帖
9140
云币
13059
只看该作者 沙发  发表于: 2016-07-21
中英文的成功率分别是多少
级别: 新人
发帖
16
云币
23
只看该作者 板凳  发表于: 2016-07-21
回 1楼ivmmff的帖子
您好,目标文字是包含中英文的,您说的中英文我们没有单独统计,另外测试集合不同,可能会产生识别率是不一样的,但是,我们基于千万级样本做过统计, OCR图文识别服务在真实的综合性业务场景下,字符识别率>=80%。即若扫描样本集中共有10,000个汉字,可准确抓取识别的汉字大于等于8,000个,其中 “真实的综合性业务场景”指用户日常业务交互产生的图片内容,即非经人工挑选的样本集; OCR图文识别服务不对单张或非大量样本的字符识别率承诺,建议您进行实测,谢谢。
级别: 论坛版主
发帖
9140
云币
13059
只看该作者 地板  发表于: 2016-07-21
回 2楼(chenlei20080417) 的帖子
好的,了解了
级别: 小白
发帖
41
云币
58
只看该作者 4楼 发表于: 2016-07-22
Re阿里绿网图文识别服务(OCR)已正式商业化啦
前排围观 V#1_jxP)Q  
[ 此帖被qiukong在2016-07-22 14:55重新编辑 ]
级别: 新人
发帖
2
云币
8
只看该作者 5楼 发表于: 2016-07-23
Re阿里绿网图文识别服务(OCR)已正式商业化啦
好啊!
级别: 论坛版主
发帖
3346
云币
8691

只看该作者 6楼 发表于: 2016-07-24
弱弱的问下这个功能 除了鉴黄,还有其他功能不?比如用户自己调用API做一些其他的识别功能?
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
2
云币
3
只看该作者 7楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
能否通过这个来识别用户禁止让他上传二维码啥的?
级别: 新人
发帖
16
云币
23
只看该作者 8楼 发表于: 2016-07-29
回 7楼cnwebmasters的帖子
您好,目前我们还有一个接口在内测,能识别二维码的链接,如有需要可提交工单进行申请,谢谢。
级别: 新人
发帖
16
云币
23
只看该作者 9楼 发表于: 2016-07-29
回 6楼小柒2012的帖子
您好,除了鉴黄、目前的OCR就是做图片中的文字信息识别的,例如如果有垃圾小广告等内容可通过此接口进行识别,谢谢。
级别: 新人
发帖
1
云币
1
只看该作者 10楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
级别: 菜鸟
发帖
82
云币
98
只看该作者 11楼 发表于: 2016-07-29
文字识别返回结果不全,识别能力还不行
级别: 新人
发帖
1
云币
1
只看该作者 12楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
图文识别功能可以试用下吗?
级别: 论坛版主
发帖
3346
云币
8691

只看该作者 13楼 发表于: 2016-07-30
回 9楼(chenlei20080417) 的帖子
那 再咨询一下 后期 会不会实现 OpenCV 的一些其他识别功能,提供一些收费的API接口?因为我们现在图像识别就用的OpenCV   但是这东西吃内存太厉害了。
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
4
云币
4
只看该作者 14楼 发表于: 2016-08-05
回 5楼云量师的帖子
好啊!
发表主题 回复主题
« 返回列表
«12»
共2页
上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个