极具价值的教育培训与互动学习平台

百度大脑,“上新了”!

2019-03-26 16:14:00 投稿人 : haixia002 围观 : 50488 次 0 评论

  本文作者:赵晨希

  前不久,百度大脑推出了包括语音技术、视觉技术、自然语言处理、知识图谱等在内的通用AI能力,以及开源深度学习框架方面的优化升级。与此同时,人工智能已经连续三年进入政府报告、“智能+”成为2019年行业的新命题。

  雷锋网了解到,百度大脑自2016年启动开放以来,目前已经是服务规模最大的AI开放平台。共计开放了158项AI能力,24小时快速集成,开发者数量超过100万。面向广泛的企业和开发者提供最先进、最全面的AI能力,不断降低AI应用落地的门槛。

  语音方面

  在今年1月的百度输入法探索版发布会上,首次发布了领先国际的语音技术:在线语音领域全球首创的流式多级截断注意力模型SMLT「Streaming trancated multi-layer attention」。值得注意的是,这是首次在大规模语音识别工业界采用注意力(attention)模型。

  提升识别率的同时大幅优化了解码速度。“语音识别极速版”,拥有更快的响应速度,相对识别准确度提升15%。此项语音能力在API调用方式下,实时率小于0.1,意味着5s的音频不到500ms即可完成识别过程,减少了识别音频所需的耗时,提升语音交互的响应体验。

百度大脑,“上新了”!

  在近距离安静环境下,识别准确率可达到98%,同时支持略带口音、童声、耳语的识别,使语音识别应用更加广泛。多平台的SDK也即将推出,使APP、服务器端更可实时识别,应用这一领先技术。目前,每个开发者账户将赠送5W次免费调用量,针对新能力的使用者,也即将推出一系列赠送及优惠活动。

  同时,近场语音识别升级了预置语义解析。预置场景由35个升级为51个,包括天气、航班、电话、电影播放、页面屏幕控制、电视剧、美食、手机设置、通用录、提醒、短信、故事等,语义解析效果全面优化,80%优于原有解析结果。

百度大脑,“上新了”!

  百度大脑称以下新品也将推出,例如:语音识别自训练平台,支持自动评估选出最好的基线模型,仅上传业务场景文本语料即可训练语言模型,零代码自助训练专属的语音识别模型,极大地方便语音开发者提升所在业务场景的识别准确率,满足业务上的语音识别需求。

  另外,远场语音开发套件,可快速进行远场识别开发评估,此套件应用于机器人、儿童故事机、家电、车载设备等硬件。同时还将开放离线合成,以及推出更多音库。

  视觉方面

  首先,在OCR方面:

  新增了卡证OCR 4个新能力:户口本OCR、出生医学证明OCR、港澳通行证OCR、台湾通行证OCR,总数达到9种;

  新增票据OCR 4个新能力:行程单OCR、保单识别OCR、通用机打发票OCR,定额发票OCR,总数达到9种;

  汽车场景3个新能力:车辆VIN OCR、机动车销售发票OCR、车辆合格证OCR,总数达到6种。这些OCR新能力在关键字段的准确率均在90%以上,并有多项是业界首次平台化开放。至此,OCR产品全系列共34款,实现卡证、票据、文档、汽车全场景覆盖。

  对已有的OCR能力也进行了功能升级:表格识别:支持合并单元格、无表格线等复杂样式;iOCR 自定义模版文字识别:支持列宽不固定、有合并单元格的表格样式的定制识别;驾驶证识别:支持驾驶证副页的识别。

百度大脑,“上新了”!

百度大脑,“上新了”!

百度大脑,“上新了”!

百度大脑,“上新了”!

  其次,在车辆分析方面,推出包括车辆检测、车流统计、车辆属性分析和外观损伤识别。

  车辆检测,通过识别图像中的所有机动车辆(包含小汽车、卡车、巴士、摩托车、三轮车),返回每辆车的类型和坐标位置,并对每类车辆分别计数,可应用于违章停车监测和智能停车场。

  车流统计,则根据视频抓拍图片序列,进行车辆检测和追踪,识别各类车辆(包括小汽车、卡车、巴士、摩托车、三轮车)在指定区域内的驶入/驶出情况,实现动态车流统计,可应用于实时监控交通道路、卡口的车流量,自动统计不同时段各类车辆的进出数量,分析路口、路段的交通状况,为交通调度、路况优化提供精准参考依据。

  车辆属性分析和外观损伤识别两项服务,也即将开放。

百度大脑,“上新了”!

  最后,在人脸人体识别方面,新发布了情绪识别,可以准确识别7类情绪:生气、害怕、厌恶、高兴、悲伤、惊讶、无情绪。

  此项技术可应用于幼儿园安全监控等场景,通过监控孩子的心理状态,判断教师和幼儿是否有异常状况,从而保障幼儿安全、及时预警并参与辅导等。

  同时,人脸融合以及手部关键点将在3月推出。此外还有2项功能全新升级,包括:人脸检测快速检测人脸并返回人脸框位置、定位五官与轮廓关键点数量,从72个增加至150个;新增2种手势,共24种常见手势,整体识别率在90%以上,使得手势识别更丰富、更准确;而即将上线的更高进精度的人像分割,可应用于人像美图、影视后期等场景。

百度大脑,“上新了”!

  图像识别方面,新增红酒识别和地标识别这2个新能力。通过红酒识别,用户只需要对着红酒标签拍照,系统就能自动识别红酒的品牌和名称,目前可识别数十万种国内外红酒,识别准确率98%以上,从法国波尔多到中国张裕,商品信息都能得到准确关联。

  地标识别则能够精准识别约5万中外著名地标、景点,准确率高达94%以上。用户只需要拍摄包含国内外著名景点、地标的照片,系统就能自动生成足迹、图文博客等有意思的交互内容。

  百度大脑还宣布即将上线邀测钱币识别功能。该功能可以精准识别中外钱币,支持数百类币种、数千种面额,识别准确率98%以上,不仅能够提升金融机构货币兑换的效率,也能让“外币骗局”无处藏身。目前,百度大脑的图像识别种类已经多达11种。

百度大脑,“上新了”!

  语言及知识方面

  雷锋网了解到,百度大脑语言及知识方向能力集,共包括语言处理应用平台、语言处理应用技术、语言处理基础技术、知识理解以及知识图谱。

  语言处理应用技术方面,推出新能力:

  文本纠错,识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容;

  新闻摘要,对新闻内容进行全面的语义理解与分析,自动抽取新闻文本中的关键信息并按指定长度生成摘要,可应用于热点新闻聚合、新闻推荐、语音播报、APP消息Push等场景;

  智能写诗,用户只需要输入任意主题词(如公司名、节气名),机器便可自动生成融合了该主题词的诗词;

  智能春联,用户输入任意主题词(如自己的名字),机器可自动生成融合了该主题词的春联,可以应用在企业互动营销、APP春节互动活动;

  对话情绪识别,可以针对一段对话文本,自动识别出当前会话者所表现出的情绪类别。

  在知识理解方面,推出新能力:

  作文检索,有数万篇作文范文,可支持按文体、字数、年级、常见主题等进行查询检索,可应用在少儿教育产品(如学习机)、图书馆等场景;

  知识问答,可提供娱乐、人物、教育、影视、综艺、动漫、小说、文学作品等垂类的问答能力,以及日期历法、年龄差、算数、时间时区差等推理计算能力,可应用于智能音箱、儿童故事机、泛娱乐产品等场景。

  不久后,智能写作平台也将上线,将从素材上为创作者提供工具、帮助找到灵感,提升创作者的写作效率和产出质量,降低写作成本。

百度大脑,“上新了”!

  深度学习

  雷锋网(公众号:雷锋网)了解到,2016年,百度开源了深度学习框架PaddlePaddle。近期,百度大脑对PaddlePaddle进行了更新:

  视频分类模型库:核心框架Paddle Fluid v1.3新增视频模型库,提供5个视频分类经典模型以及适合视频分类任务的通用骨架代码,用户可一键式高效配置模型完成训练和评测。视频理解权威竞赛ActivityNet - Kinetics视频动作识别任务冠军方法stNet的resnet50版本开源实现。

  基于PaddlePaddle的BERT多机多卡和混合精度训练,新增支持NLP语义表示BERT模型,支持多机多卡训练,支持混合精度训练,训练速度对比主流实现提升50%+,提供完整部署示例。

  提升分布式训练性能:大规模稀疏参数服务器Benchmark发布, CPU多机异步训练发布显著提升点击率预估任务IO吞吐的built-in reader,多机多卡训练性能多方面提升。

  推出深度强化学习框架PARL1.0,支持可定制的并行扩展,覆盖DQN、DDPG、PPO、A3C等主流强化学习算法。通过8块GPU拉动近20000个CPU节点运算,将近5个小时迭代一轮的PPO算法加速到不到1分钟。

百度大脑,“上新了”!

  雷锋网原创文章,未经授权禁止转载。详情见转载须知。

https://www.leiphone.com/news/201903/ySdfE2dHUh1O5jlO.html

来源:育学天下,转载请注明作者或出处,尊重原创!

相关文章

  • “靓音教育”成为福建电视台2020“品牌福建”新春贺岁互动合作伙伴
    “靓音教育”成为福建电视台2020“品牌福建”新春贺岁互动合作伙伴

    海峡头条携手福建省电视台邀请全省优质企业录制新春贺岁片。“靓音教育”从同行业中脱颖而出,入围贺岁企业名单。同时,贺岁视频在福建电视台经济频道强档栏目《品牌福建》黄金时段播出。厦门靓音教育(咨询)有限公司旗下店铺靓音琴行艺术中心,是一家拥有钢...

    2020-01-14 14:07:15
  • “敏试教育”成为福建电视台2020“品牌福建”新春贺岁互动合作伙伴
    “敏试教育”成为福建电视台2020“品牌福建”新春贺岁互动合作伙伴

    海峡头条携手福建省电视台邀请全省优质企业录制新春贺岁片。“敏试教育”从同行业中脱颖而出,入围贺岁企业名单。同时,贺岁视频将在福建电视台经济频道强档栏目《品牌福建》黄金时段播出。厦门敏试教育咨询有限公司是一家专注于教师资格证辅导培训和教师招聘...

    2020-01-07 13:50:11
  • 传下代iPhone将定制ToF相机,可模拟人眼,增强AR体验
    传下代iPhone将定制ToF相机,可模拟人眼,增强AR体验

      明年的下代iPhone将会增加ToF相机,从而提升AR和拍照体验已不是什么新闻,但苹果对于ToF相机的用法却可能与当前其他厂商存在较大的差异。根据来自产业链人士披露的消息称,苹果将会借助定制CMOS的方式模拟人眼功能。虽然暂时不清楚将来...

    2019-12-03 10:03:28
  • 潜行类VR动作游戏《Phantom》发布最新预告片
    潜行类VR动作游戏《Phantom》发布最新预告片

      11月29日青亭网报道,今天Oculus发布官方博客,公布了此前于5月份宣布的潜行身类VR动作游戏《Phantom:Covert Ops》的最新预告片。  据了解,该作由nDreamsk开发,将同时支持Rift与Quest,此前预计...

    2019-12-02 14:21:52
  • 线下VR游戏《星际迷航》:一款适合团建的刺激太空枪战体验
    线下VR游戏《星际迷航》:一款适合团建的刺激太空枪战体验

      上个月,线下VR品牌Sandbox VR与CBS合作,推出了新款VR游戏《星际迷航:发现号Away Mission》。据悉,该作的故事背景设置在联邦星舰发现号中,玩家将作为星舰军官,在同名电视剧中人物Sylvia Tilly军官(原版演...

    2019-12-02 14:17:54
  • 下一代苹果手机或全部采用OLED屏,渗透率有望加速提升
    下一代苹果手机或全部采用OLED屏,渗透率有望加速提升

      外媒称,苹果将推出3款iPhone分别为5.4寸、6.1寸、6.7寸。该报告称,苹果计划向三星采购5.4寸和6.7寸的屏幕,与iPhone11Pro和iPhone 11 Pro Max同样采用OLED技术,另外6.1寸的OLED...

    2019-11-29 16:28:52
  • 传亚马逊已研发出第二代AI芯片,比第一代至少快20%
    传亚马逊已研发出第二代AI芯片,比第一代至少快20%

      2019 年 11 月 28 日,据路透社报道,亚马逊公司旗下云计算部门 AWS 设计出性能更强的第二代数据中心处理器芯片。如果消息属实,该芯片将帮助亚马逊降低对 Intel 、AMD 服务器芯片的依赖。  有消息人士称,AWS 的...

    2019-11-29 16:26:16
  • 《半条命VR》效果明显,Valve Index美国和加拿大售罄
    《半条命VR》效果明显,Valve Index美国和加拿大售罄

      在V社上周公布《半条命》VR独占游戏《半条命:Alyx》之后,外媒报道称V社自家VR——Index已经在美国和加拿大卖断货。  Steam上推出的Index套装售价999美元,包括以下内容:VR头盔,Index手柄,两个基站(定位器)和...

    2019-11-29 10:25:57
  • 三星Galaxy S11带壳渲染图曝光:矩阵相机/1亿像素 还有骁龙865
    三星Galaxy S11带壳渲染图曝光:矩阵相机/1亿像素 还有骁龙865

      11月27日消息,知名爆料人士Slashleaks放出了Galaxy S11的带壳渲染图——和此前曝光的渲染图一致,Galaxy S11采用了矩阵式摄像头造型。而规格方面,Galaxy S11 5G和Galaxy S11+会搭载一亿...

    2019-11-28 17:05:10
  • Insomniac推第二款Magic Leap游戏《Strangelets》
    Insomniac推第二款Magic Leap游戏《Strangelets》

      11月27日消息,前不久曾被索尼收购的游戏公司Insomniac Games开发的新AR游戏《Strangelets》登陆Magic Leap World。据悉,Insomniac此前曾开发PS 4游戏《漫威蜘蛛侠》,以及多款AR/VR...

    2019-11-27 15:00:55
发表评论