发表主题 回复主题
  • 6895阅读
  • 17回复

[云安全体系/架构/合规专区]阿里绿网图文识别服务(OCR)已正式商业化啦

级别: 新人
发帖
16
云币
23
                                   阿里绿网图文识别服务(OCR)已正式商业化啦! y2hFUq  
                                                                                                   Y`_X@Q  
                                                     拥有亿级样本,采用深度学习技术,精准识别图片文字信息,提供业界领先识别服务 {O,M}0Eg  
                                                                                                                                                                                   
如果您是一名资深的信息安全管理员,一定会遇到这样的烦恼:
传统的文本监控已无法遏止”垃圾广告”等违规信息的产生,越来越多的非法用户将文字内容PS到图像上来传递违规信息,以躲避文本监控系统,达到“逃逸”的目的,而垃圾信息不清除,无论是对用户体验还是平台健康度的影响都后患无穷。
[ BC%$Sj  
现在,集成阿里巴巴多年算法运营经验沉淀的产品:阿里绿网图文识别服务(OCR)于2016年7月21日正式上线并商业化啦,是您扫除“垃圾广告”等违规图片的又一利器!
一、服务简介:
基于深度学习技术及阿里巴巴多年的海量样本沉淀,能精准识别图片中的文字信息,提供业界领先识别服务。
二、使用过程
用户通过阿里绿网图文识别服务API接口将图片传递给阿里绿网,然后阿里绿网会识别图片中的文字内容,用户可通过输出的文字信息进行业务上的应用。
三、OCR技术介绍:
OCR全称是光学字符识别(Optical Character Recognition),也就是图像中的文字识别,简称图文识别。
一般的OCR技术是基于传统的检测与识别方法,对于“垃圾广告”图片识别效果较差,而阿里绿网主研发了基于深度学习的OCR技术,整体框架如下:
YM/3VD  
bqwW9D(  
如图所示,阿里绿网在各个模块中均有自主研发的部分。例如,在切分和识别模块中字符预分割阶段,除了传统图像方法外,更引入了基于学习的分割点判别模型,可以有效的弥补传统方法的不足,对于复杂背景文字图像有较强的适应能力。字符识别+动态调整过程也可以称为“解码”过程,在这个过程中使用了CNN字符识别模型和语言模型。在路径选择过程中,同时考虑了字符模型、语言模型、字符结构等因素,进行了综合评价,从而实现最优结果选择。 W%<]_u[-}  
四、产品优势: 3 BhA.o  
1、大数据:依托于阿里巴巴全生态体系,拥有海量的特征样本及丰富的数据模型分析经验 [^BUhm3a  
2、强大的识别能力:拥有业内顶尖的算法专家,基于深度学习理论,自主研发技术,荣获多项专利
Y\9*e5?`I3  
3、丰富的业务实践:已应用于阿里巴巴生态众多业务及外部用户,业务理解和安全能力为多年实践沉淀 b0x0CMf  
4、海量数据快速检测:基于云计算平台,能对海量数据进行快速检测
vrO$8* sy  
让“清理”工作变得更轻松,从今天开始吧~! 欢迎立即开通阿里绿网图文识别服务
效果测试:点此查看>>     
服务开通:点此查看>>
异步接口调用文档:点此查看>>
价格及收费说明:点此查看>>
m~IWazj;A  
如有意见或建议,也欢迎大家通过工单等方式与我们交流,我们会不断优化产品功能及用户体验,谢谢!
qy(/   
zc~xWy+  
r Q@o  
nKJ7K8)  
\kGtYkctZ  
34M.xB   
E/-Kd!|"  
b2kbuk]  
UNLNY,P/!)  
4 J2F>m40  
&>B>+}'  
${,eQ\  
Bo(l!G  
d?X6x  
/ H/Ne )r  
[ 此帖被chenlei20080417在2016-07-21 15:06重新编辑 ]
级别: 论坛版主
发帖
9049
云币
12506
只看该作者 沙发  发表于: 2016-07-21
中英文的成功率分别是多少
QQ:1251205255,仅提供付费服务。
级别: 新人
发帖
16
云币
23
只看该作者 板凳  发表于: 2016-07-21
回 1楼ivmmff的帖子
您好,目标文字是包含中英文的,您说的中英文我们没有单独统计,另外测试集合不同,可能会产生识别率是不一样的,但是,我们基于千万级样本做过统计, OCR图文识别服务在真实的综合性业务场景下,字符识别率>=80%。即若扫描样本集中共有10,000个汉字,可准确抓取识别的汉字大于等于8,000个,其中 “真实的综合性业务场景”指用户日常业务交互产生的图片内容,即非经人工挑选的样本集; OCR图文识别服务不对单张或非大量样本的字符识别率承诺,建议您进行实测,谢谢。
级别: 论坛版主
发帖
9049
云币
12506
只看该作者 地板  发表于: 2016-07-21
回 2楼(chenlei20080417) 的帖子
好的,了解了
QQ:1251205255,仅提供付费服务。
级别: 小白
发帖
41
云币
58
只看该作者 4楼 发表于: 2016-07-22
Re阿里绿网图文识别服务(OCR)已正式商业化啦
前排围观 Fh)YNW@  
[ 此帖被qiukong在2016-07-22 14:55重新编辑 ]
级别: 新人
发帖
2
云币
8
只看该作者 5楼 发表于: 2016-07-23
Re阿里绿网图文识别服务(OCR)已正式商业化啦
好啊!
级别: 论坛版主
发帖
3260
云币
8246

只看该作者 6楼 发表于: 2016-07-24
弱弱的问下这个功能 除了鉴黄,还有其他功能不?比如用户自己调用API做一些其他的识别功能?
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
2
云币
3
只看该作者 7楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
能否通过这个来识别用户禁止让他上传二维码啥的?
级别: 新人
发帖
16
云币
23
只看该作者 8楼 发表于: 2016-07-29
回 7楼cnwebmasters的帖子
您好,目前我们还有一个接口在内测,能识别二维码的链接,如有需要可提交工单进行申请,谢谢。
级别: 新人
发帖
16
云币
23
只看该作者 9楼 发表于: 2016-07-29
回 6楼小柒2012的帖子
您好,除了鉴黄、目前的OCR就是做图片中的文字信息识别的,例如如果有垃圾小广告等内容可通过此接口进行识别,谢谢。
级别: 新人
发帖
1
云币
1
只看该作者 10楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
级别: 菜鸟
发帖
82
云币
98
只看该作者 11楼 发表于: 2016-07-29
文字识别返回结果不全,识别能力还不行
级别: 新人
发帖
1
云币
1
只看该作者 12楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
图文识别功能可以试用下吗?
级别: 论坛版主
发帖
3260
云币
8246

只看该作者 13楼 发表于: 2016-07-30
回 9楼(chenlei20080417) 的帖子
那 再咨询一下 后期 会不会实现 OpenCV 的一些其他识别功能,提供一些收费的API接口?因为我们现在图像识别就用的OpenCV   但是这东西吃内存太厉害了。
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
4
云币
4
只看该作者 14楼 发表于: 2016-08-05
回 5楼云量师的帖子
好啊!
发表主题 回复主题
« 返回列表
«12»
共2页
上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: ECS是阿里云提供的什么服务? 正确答案:云服务器
上一个 下一个