阿里云
发表主题 回复主题
  • 7324阅读
  • 17回复

[云安全体系/架构/合规专区]阿里绿网图文识别服务(OCR)已正式商业化啦

级别: 新人
发帖
16
云币
23
                                   阿里绿网图文识别服务(OCR)已正式商业化啦! NS6#od ZeV  
                                                                                                   Sir7TQ4B  
                                                     拥有亿级样本,采用深度学习技术,精准识别图片文字信息,提供业界领先识别服务 UO5^4  
                                                                                                                                                                                   
如果您是一名资深的信息安全管理员,一定会遇到这样的烦恼:
传统的文本监控已无法遏止”垃圾广告”等违规信息的产生,越来越多的非法用户将文字内容PS到图像上来传递违规信息,以躲避文本监控系统,达到“逃逸”的目的,而垃圾信息不清除,无论是对用户体验还是平台健康度的影响都后患无穷。
2P`hdg  
现在,集成阿里巴巴多年算法运营经验沉淀的产品:阿里绿网图文识别服务(OCR)于2016年7月21日正式上线并商业化啦,是您扫除“垃圾广告”等违规图片的又一利器!
一、服务简介:
基于深度学习技术及阿里巴巴多年的海量样本沉淀,能精准识别图片中的文字信息,提供业界领先识别服务。
二、使用过程
用户通过阿里绿网图文识别服务API接口将图片传递给阿里绿网,然后阿里绿网会识别图片中的文字内容,用户可通过输出的文字信息进行业务上的应用。
三、OCR技术介绍:
OCR全称是光学字符识别(Optical Character Recognition),也就是图像中的文字识别,简称图文识别。
一般的OCR技术是基于传统的检测与识别方法,对于“垃圾广告”图片识别效果较差,而阿里绿网主研发了基于深度学习的OCR技术,整体框架如下:
0t*JP  
B=%cXW,  
如图所示,阿里绿网在各个模块中均有自主研发的部分。例如,在切分和识别模块中字符预分割阶段,除了传统图像方法外,更引入了基于学习的分割点判别模型,可以有效的弥补传统方法的不足,对于复杂背景文字图像有较强的适应能力。字符识别+动态调整过程也可以称为“解码”过程,在这个过程中使用了CNN字符识别模型和语言模型。在路径选择过程中,同时考虑了字符模型、语言模型、字符结构等因素,进行了综合评价,从而实现最优结果选择。 ^:5 ;H=.  
四、产品优势: H[U$4 %t  
1、大数据:依托于阿里巴巴全生态体系,拥有海量的特征样本及丰富的数据模型分析经验 iK#5HW{  
2、强大的识别能力:拥有业内顶尖的算法专家,基于深度学习理论,自主研发技术,荣获多项专利
SSY E&  
3、丰富的业务实践:已应用于阿里巴巴生态众多业务及外部用户,业务理解和安全能力为多年实践沉淀 mg[=~&J^  
4、海量数据快速检测:基于云计算平台,能对海量数据进行快速检测
C|5eV=f)P  
让“清理”工作变得更轻松,从今天开始吧~! 欢迎立即开通阿里绿网图文识别服务
效果测试:点此查看>>     
服务开通:点此查看>>
异步接口调用文档:点此查看>>
价格及收费说明:点此查看>>
UBs'3M  
如有意见或建议,也欢迎大家通过工单等方式与我们交流,我们会不断优化产品功能及用户体验,谢谢!
,Bk mf|  
w(U-6uA  
PCF!Y(l  
2>l4$G 0  
v3x_8n$C9  
f;!1=/5u-  
A1Ia9@=Mf  
GKu@8Ol-wu  
FU kO$jnO  
5"%r,GMU  
RJYuyB  
e7T"?s  
k(+ EY%  
*kY\,r&!P  
/5 B{szf  
[ 此帖被chenlei20080417在2016-07-21 15:06重新编辑 ]
级别: 论坛版主
发帖
9086
云币
12721
只看该作者 沙发  发表于: 2016-07-21
中英文的成功率分别是多少
QQ:1251205255,仅提供付费服务。
级别: 新人
发帖
16
云币
23
只看该作者 板凳  发表于: 2016-07-21
回 1楼ivmmff的帖子
您好,目标文字是包含中英文的,您说的中英文我们没有单独统计,另外测试集合不同,可能会产生识别率是不一样的,但是,我们基于千万级样本做过统计, OCR图文识别服务在真实的综合性业务场景下,字符识别率>=80%。即若扫描样本集中共有10,000个汉字,可准确抓取识别的汉字大于等于8,000个,其中 “真实的综合性业务场景”指用户日常业务交互产生的图片内容,即非经人工挑选的样本集; OCR图文识别服务不对单张或非大量样本的字符识别率承诺,建议您进行实测,谢谢。
级别: 论坛版主
发帖
9086
云币
12721
只看该作者 地板  发表于: 2016-07-21
回 2楼(chenlei20080417) 的帖子
好的,了解了
QQ:1251205255,仅提供付费服务。
级别: 小白
发帖
41
云币
58
只看该作者 4楼 发表于: 2016-07-22
Re阿里绿网图文识别服务(OCR)已正式商业化啦
前排围观 M+WN\.2pX  
[ 此帖被qiukong在2016-07-22 14:55重新编辑 ]
级别: 新人
发帖
2
云币
8
只看该作者 5楼 发表于: 2016-07-23
Re阿里绿网图文识别服务(OCR)已正式商业化啦
好啊!
级别: 论坛版主
发帖
3319
云币
8627

只看该作者 6楼 发表于: 2016-07-24
弱弱的问下这个功能 除了鉴黄,还有其他功能不?比如用户自己调用API做一些其他的识别功能?
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
2
云币
3
只看该作者 7楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
能否通过这个来识别用户禁止让他上传二维码啥的?
级别: 新人
发帖
16
云币
23
只看该作者 8楼 发表于: 2016-07-29
回 7楼cnwebmasters的帖子
您好,目前我们还有一个接口在内测,能识别二维码的链接,如有需要可提交工单进行申请,谢谢。
级别: 新人
发帖
16
云币
23
只看该作者 9楼 发表于: 2016-07-29
回 6楼小柒2012的帖子
您好,除了鉴黄、目前的OCR就是做图片中的文字信息识别的,例如如果有垃圾小广告等内容可通过此接口进行识别,谢谢。
级别: 新人
发帖
1
云币
1
只看该作者 10楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
级别: 菜鸟
发帖
82
云币
98
只看该作者 11楼 发表于: 2016-07-29
文字识别返回结果不全,识别能力还不行
级别: 新人
发帖
1
云币
1
只看该作者 12楼 发表于: 2016-07-29
Re阿里绿网图文识别服务(OCR)已正式商业化啦
图文识别功能可以试用下吗?
级别: 论坛版主
发帖
3319
云币
8627

只看该作者 13楼 发表于: 2016-07-30
回 9楼(chenlei20080417) 的帖子
那 再咨询一下 后期 会不会实现 OpenCV 的一些其他识别功能,提供一些收费的API接口?因为我们现在图像识别就用的OpenCV   但是这东西吃内存太厉害了。
你只看到我的技术,却没看到我的通宵。 你有你的需求,我有我的选择。 你嘲笑我技术宅孤独一生,我可怜你只能呆呆站在墙里。 你可以轻视昼夜不分的Coding,但我会证明它至少可以买到xx票。 技术宅的路上少不了苦逼和孤独,又怎样,哪怕成不了大神,也要码的漂亮。我是IT男,我为自己代言!
级别: 新人
发帖
4
云币
4
只看该作者 14楼 发表于: 2016-08-05
回 5楼云量师的帖子
好啊!
发表主题 回复主题
« 返回列表
«12»
共2页
上一主题下一主题

限100 字节
如果您提交过一次失败了,可以用”恢复数据”来恢复帖子内容
 
验证问题: 阿里云官网域名是什么? 正确答案:www.aliyun.com
上一个 下一个