举报  报料热线:2820847656    

持续发力AI领域 搜狗刷新ICDAR2019榜单三项新记录

发布时间:2019-11-10 20:51:14

来源:大理热线

中新网11月8日电最近,在ocr识别权威竞争的icdar2019挑战中,sogou刷新了任意形状文本识别(ART)中检测、识别和端到端任务的新记录,充分反映了Sogou在字符识别领域的领先优势。

Icdar国际文件分析和识别比赛是图像文本检测和识别领域的一项权威活动,引起了业界的关注。Icdar2019-艺术是在2019年提出的一项新任务。由于极具挑战性,icdar2019-ART吸引了传统强队如斜视、华为、阿里等的参与。不同于往年的任务,2019年的数据集旨在促进任意形状文本检测和识别技术的发展和创新,因此数据层侧重于任意形状,特别是不规则场景文本的检测和识别,这就要求算法框架具有较高的鲁棒性。而且,数据集是一幅自然场景图像,场景类型覆盖范围大,背景复杂,不规则文本数量众多,是目前行业中最大的任意形状场景文本集,这就更加复杂和困难。

在本课题中,索沟采用了基于案例分割的文本检测方法,并在训练和测试过程中引入了掩码融合、评分机制优化、多尺度等技术。在字符识别方面,Sogou以主流编解码技术为框架,Se-RESNET作为编码器的骨干网络,引入了薄板样条插值算法(TPS)和信道注意机制(信道注意),创新性地将残差思想引入到多层双LSTM中,并通过残差连接融合了不同层的LSTM特征,增强了模型的鲁棒性。在解码模块中,采用注意译码机制来实现特征的解码和识别。

文本检测与识别技术在现实生活中有着广泛的应用,如扫描输入、照片搜索、照片翻译、道路标志识别等。索沟OCR技术已经应用于许多垂直领域,以满足大多数用户多样化和个性化的需求,帮助用户提高输入效率,Sogou翻译和输入方法等产品得到了用户的广泛使用和好评,同时也使活体和其他合作伙伴得以参与。

索沟在刷新2019年艺术排行榜方面取得的成就,是他在OCR领域不断努力的结果,也是他在人工智能领域的能力的结果。未来,索沟将继续扩大技术成就的登陆场景,给用户带来更多的实用方便和惊喜体验。

上一篇:搜狗Q3营收恐不及预期?用户数量是关键

下一篇:最后一页
24小时排行
24 houe rankings