概要:
自然语言:1、语言处理基础技术;2、语言处理应用技术;3、智能对话定制与服务平台UNIT;4、文本审核;
图像技术:1、图像识别;2、图像效果增强;3、图像搜索;4、图像审核;
知识图谱:1、知识图谱Schema;2、知识理解;
视频技术:1、视频内容分析;2、视频封面选取;3、媒体内容审核VCR;
文字识别:1、通用文字识别;2、卡证文字识别;3、票据文字识别;4、汽车场景文字识别;5、其它文字识别;6、iOCR通用版;
语音技术
1、语音识别
介绍:采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景。
2、语音合成
介绍:基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性。
3、语音唤醒
介绍:支持特定语音指令唤醒,唤醒的同时执行指令操作,轻量级,低功耗,可自定义设置多个唤醒词,为您的应用打造自然流畅的对话。
自然语言
1、语言处理基础技术
介绍:提供国际领先的自然语言处理技术,帮助你的产品更好的理解这个世界。
2、语言处理应用技术
介绍:以多场景技术应用为导向,提供可直接应用于产品策略的NLP技术能力,让您的产品更好地理解语言、理解用户。
3、智能对话定制与服务平台UNIT
介绍:百度UNIT搭载业界领先的对话理解和对话管理技术、引入语音和知识建设能力,为企业和个人开发者轻松定制专业、可控、稳定的对话系统提供全方位技术与服务。
4、文本审核
介绍:一站式检测文本中夹杂的色情、推广、辱骂、违禁、涉政、灌水等垃圾内容,净化网络环境,为您的应用提供更可靠的内容安全保障。
图像技术
1、图像识别
介绍:精准识别超过十万种物体和场景,包含多项高精度的识图能力并提供相应的API服务,充分满足各类个人开发者和企业用户的业务需求。
2、图像效果增强
介绍:基于领先的深度学习技术,对质量较低的图片进行去雾、对比度增强、无损放大、拉伸恢复等多种优化处理,重建高清图像。
3、图像搜索
介绍:以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品、相似商品推荐等场景。
4、图像审核
介绍:基于深度学习的智能内容审核方案,准确识别图片和视频中的涉黄、涉暴涉恐、政治敏感、微商广告、恶心等内容,也能从美观和清晰等维度对图像进行筛选,快速精准,解放审核人力。
AI开发平台
1、百度机器学习BML
介绍:面向企业和AI开发者的端到端机器学习平台,可一站式完成数据预处理、模型训练与评估、服务部署等工作。
2、AI训练一体机
介绍:AI训练一体机提供软硬一体的一站式解决方案,可以助力研发人员和数据科学家使用海量数据进行深度神经网络模型的构建、训练和部署,平台支持异构GPU计算集群,并包含训练任务提交管理和监控等功能。
知识图谱
1、知识图谱Schema
介绍:定义知识图谱数据模型及用以描述物理世界的词汇体系,规范结构化数据的表达。
2、知识理解
介绍:基于知识图谱丰富的数据体系,提供对文本语义中实体、概念等深度理解解析能力。
人脸与人体识别
1、人脸识别
介绍:包含人脸检测与属性分析、人脸对比、人脸搜索、活体检测等能力。灵活应用于金融、泛安防、零售等行业场景,满足身份核验、人脸考勤、闸机通行等业务需求。
2、人体分析
介绍:准确识别图像中的人体相关信息,提供人体检测与追踪、关键点定位、人流量统计、属性分析、行为识别、人像分割、手势识别等能力。支持服务器私有化部署,保障业务数据的私密性和安全性。
视频技术
1、视频内容分析
介绍:通过多维AI技术,对视频进行智能分析,输出视频内容的泛标签,从而提高搜索准确度和用户推荐视频的曝光量。
2、视频封面选取
介绍:通过对视频内容的理解,基于深度学习自动截取视频中的精彩片段或单张画面作为视频封面,提升视频的点击率和用户体验。
3、媒体内容审核VCR
介绍:VCR(Video Content Regulation)可对视频、语音、图片、文本等多媒体内容进行审核,可覆盖色情、暴恐、政治敏感、广告、违禁事物等多维度识别,为您大幅降低人工审核的风险和成本。
文字识别
1、通用文字识别
介绍:基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。
2、卡证文字识别
介绍:基于业界领先的深度学习技术,提供对身份证、银行卡、营业执照等常用卡片及证照的文字内容进行结构化识别的服务。
3、票据文字识别
介绍:基于业界领先的深度学习技术,提供对财税报销、金融保险等场景所涉及的各类票据进行结构化识别的服务。
4、汽车场景文字识别
介绍:基于业界领先的深度学习技术,提供对汽车购买及使用过程中所涉及的各类卡证、票据进行结构化识别的服务。
5、其它文字识别
介绍:基于业界领先的深度学习技术,提供对表格、手写文字、网络图片、数字、二维码等内容进行识别的服务。
6、iOCR通用版
介绍:基于业界领先的图像处理和文字识别技术,针对固定版式的卡证票据可由用户自助创建识别模板和分类器,实现图片自动分类并结构化输出识别结果。
AI硬件与平台
介绍:为客户提供搭载了ABC Robot机器人平台的整机产品,为合作伙伴提供集语音、语义、视觉等AI核心技术为一体的多模态人机交互解决方案。
归纳到位,帮我们新手指清了方向。赞一个~~~
资料很全面
全面深刻
资料很全面。