依托百度大脑十余年AI技术与能力的积累,面向金融、能源、互联网、教育、运营商、制造、政府等行业提供智能中台解决方案,助力企业构建统一的AI基础设施,实现AI资产的共建共享、敏捷的智能应用开发,加速企业智能化升级。
如今“元宇宙”概念爆火,作为前沿数字科技发展的集成体之一,元宇宙正成为诸多产业寻求破局的全新风口。元宇宙是利用科技手段进行链接与创造,与现实世界映射和交互的虚拟世界,具备新型社会体系的数字生活空间;其本质上是对现实世界的虚拟化、数字化过程,而内容的生产则是这一过程中必不可少的环节。在元宇宙内容最主要的三个要素“人,货,场”的内容生产中,目前还是大量依赖于人工制作。新技术引发新变革,支撑元宇宙发展的底层技术正在逐步的走向完善和成熟,通过人工智能技术去创作内容(AIGC)也逐渐变成了行业趋势。因此,本篇文章将重点阐述元宇宙中“货”的自动生产,即物品的三维重建。 三维重建技术概述 在元宇宙空间中,数字化身对应的是一个个三维模型,数字化的过程即是三维重建过程。“人”和“场”由于不同个体之间的差异性较小,因此很多建模工作都依赖于人工通过专业软件去建立标准模型,再通过设置和调整参数去获取不同的个体。而对于“货”而言,由于物品形状复杂、纹理多变,且极具个性化的属性,往往导致通过建模软件制作出的模型需耗费大量的时间。例如下图通过人工制作的手办模型就比较费时费力,这极大拉高了人们参与元宇宙内容建设的门槛,但同时也给自动三维重建技术蕴藏了更多的应用潜力。 🔼基于人工制作的三维模型效果展示 物品的自动三维重建技术通常可以分为两大类,一类称之为“主动式”,另一类则为“被动式”,“主动式”和“被动式”指传感器接受信息的不同方式。一般而言,“主动式”三维重建需要先通过硬件投射出预设的信号,经由物体以后再被传感器捕捉;而“被动式” 三维重建指利用周围环境如自然光的反射,使用相机获取图像,然后通过特定算法计算得到物体的立体空间信息。常见的“主动式”三维重建方法有结构光、飞行时间(Time of Flight, ToF)、主动立体视觉技术等;而“被动式”三维重建方法包括被动视觉(双目视觉,多视角立体视觉)等。 🔼常见的物品自动三维重建技术 结构光:该技术对硬件要求较高,需要精密且复杂的投影设备(projector)和成像设备(imager) 进行操作。首先,用户使用投影设备将预设的编码图像投射到物体表面,然后编码图像因受物体形状影响发生变化,进而通过这些变化估算出物体的深度信息,实现模型重建。其中预设的编码图像包括随机散斑(激光或红外光)、条纹编码和二维结构编码等,如下图条形编码结构光系统示例。结构光技术基于的原理是三角测量法,用户只需找到变形图像中的编码特征与投射编码的对应位置关系,即可以计算出物体的深度信息。 🔼条形编码结构光系统示例 飞行时间:该技术的测距方式是主动式测距,利用如激光等光源发射至目标物体,然后再通过接收返回的光波来获取物体的深度信息。即在光速及声速一定的前提下,通过测量发射信号与接收信号的飞行时间间隔来获得距离的方法。 被动立体视觉:该技术不需要额外的装置,只需要利用相机直接对物体成像即可。根据参与重建的相机视角个数,可以分为双目(两个相机视角)和多目(>2个相机视角)两种情形。该技术同样基于三角测量法原理,通过连接不同相机光心与同一个物理点的对应像素位置来获取三维重建信息;而对应像素点的寻找则通过图像特征的匹配来实现的。 🔼三角法示例:连接相机光心与对应的像素位置生成一条直线,不同相机的直线在空间中的交点即对应了物理点的三维位置 主动立体视觉:该技术是在被动立体视觉的基础上,添加了与结构光方法类似的投射装置,但它投射出来的图像不需要有编码;更多的只是去改变物体表面的纹理性状,以增强被拍摄物体的图像特征,方便不同相机图像之间的特征匹配。 通常来说,主动式的重建方式精度会更高,但受制于投影设备,分辨率一般相对较低;而被动式的重建方式往往精度相对低一些,但分辨率较高(与图像分辨率相关)。这里的“精度”指物体重建的三维模型与物体真实三维结构间的误差,而“分辨率”则指三维重建方法建立物品模型的最小物理尺寸。从使用方式的难易程度及成本考虑,结构光、ToF等主动式三维重建方法使用的装置因普及度不高,往往需要额外购买,同时,在操作过程中还需要做定期的标定,提高了操作难度;而被动式三维重建方法则直接使用相机就能获取图像,通过手机自带的高分辨率相机就能实现物品的三维重建。因此市面上普及程度较高的智能手机就能轻松满足拍摄需求,能让更多用户参与到元宇宙的内容建设中。 百度VR物品三维重建 百度VR自研的三维重建算法能够实现物品全方位、多角度环绕拍摄,支持通过照片生成物品的3D模型。为有效降低用户拍摄物品的难度和成本,提高物品建模的效率;百度VR推出了能够全面覆盖和适配iOS和Android端的软硬件采集系统—“TL-50mini+百度VR·AI拍“。智能拍摄硬件“TL-50mini”打造了多窗口的精巧桌面摄影台,用户可以根据实际需要,实时调控灯箱
5月13日,百度智能云与石嘴山市民政局、中国电信股份有限公司石嘴山分公司、中国银行股份有限公司石嘴山市分行、石嘴山市青鸟颐居养老服务有限公司在宁签订《石嘴山市智慧康养战略合作协议》,将发挥各自优势,合力推进智慧康养产业高质量发展
石油炼化是一个能源密集型的过程,对能源的消耗非常大。为了提高能源利用效率,减少能源消耗,我们可以借助机器学习的方法来优化石油炼化过程中的能源消耗。
一、对快消品而言数字化石油有哪些事物 我们再看一张图片,数字化采集有哪些核心信息? 店招包含信息: 网点的类型、网点的位置、网点的通路属性、网点的面积、网点内部经营产品结构等等。
2)漏洞利用 黑客团伙此次使用了ElasticSearch远程命令执行漏洞发起的攻击,该漏洞是黑客利用ElasticSearch 1.2版本使用的脚本引擎MVEL存在的安全问题:不进行任何脚本安全性校验
,打造了百度点石联邦学习、百度点石机密计算、百度点石数据安全沙箱等多款产品。
目前,百度点石已在政务、金融、电商、教育、媒体等多个领域成功落地,其中在生物医疗的隐私计算实践于前日获得信通院“星河”标杆案例。
🔥🔥 AllData大数据产品是可定义数据中台,以数据平台为底座,以数据中台为桥梁,以机器学习平台为中层框架,以大模型应用为上游产品,提供全链路数字化解决方案。 AllData数据中台的核心功能 AllData数据中台囊括丰富的功能模块,覆盖了系统管理、数据集成、数据质量管理、数据标准管理、元数据管理、数据模型管理、数据比对管理、数据安全管理、数据服务管理、BI报表、数据集成平台、数据同步平台、数据质量平台、实时开发中心、实时开发IDE、离线开发平台、元数据管理平台、指标体系平台等功能,提供一站式可定义数据中台解决方案。 数据中台28种组件源码掌握 AllData数据中台的核心价值 在于它通过整合、治理和应用数据,将分散的数据资源转化为可复用、可共享的能力,从而驱动企业效率提升、业务创新和数字化转型。 1、打破数据孤岛,实现数据融合与共享 价值核心:数据中台通过统一的数据标准和治理体系,将企业内部分散在不同系统、部门的数据(如CRM、ERP、供应链、日志等)整合到同一平台,消除数据孤岛。 业务价值:支持跨部门协作,避免重复开发,例如营销部门可直接调用客户行为数据,而无需从零开始采集。 2、沉淀可复用的数据资产 核心能力:将原始数据加工成标准化、标签化、主题化的数据资产(如用户画像、商品画像、业务指标库等),形成企业级数据资产目录。 业务价值:业务部门可快速调用标准化数据服务(如API、模型、报表),缩短产品开发周期,例如电商平台的实时推荐系统可基于预置的用户标签快速上线。 3、支撑敏捷业务创新 技术杠杆:通过数据开发工具、低代码平台和预置算法模型,企业能快速响应市场需求。例如,新零售场景中,基于中台可在一周内搭建出“门店热力图分析”功能。 场景案例:某银行通过数据中台的实时风控模型,将信贷审批流程从3天缩短至10分钟。 4、数据驱动智能决策 核心价值:提供实时数据分析能力(如流计算、AI预测),将数据从“事后统计”升级为“事前预测”。 典型应用:供应链中台可通过历史销售数据和外部市场信息,预测未来3个月的库存需求,降低缺货率20%以上。 5、降低长期成本 隐性收益:通过统一技术架构(如Hadoop+Spark+Flink的混合计算引擎),减少重复建设的数据仓库和ETL开发成本。 效率提升:某制造业企业通过中台将数据开发人力成本降低40%,同时数据需求交付速度提升3倍。 6、推动组织数字化转型 战略意义:数据中台不仅是技术平台,更是组织变革的抓手。它倒逼企业建立数据文化,重构业务流程(如从“经验决策”到“数据决策”)。 行业影响:零售企业可通过中台实现“人-货-场”全链路数字化,优化SKU管理效率达30%。 7、关键差异点:续价值释放能力,与传统数据平台相比,数据中台的核心优势在于其“平台+服务”模式:技术侧:支持多租户、弹性扩展,适应云原生环境; 业务侧:通过数据资产运营机制(如数据血缘分析、价值度量体系),确保数据能被持续挖掘和复用。 8、数据中台的终极价值,企业需根据自身阶段选择建设重点:初期聚焦数据打通与治理,成熟期侧重AI驱动创新。短期:解决数据“能用”问题(快速获取可信数据); 长期:实现数据“赋能”价值(驱动新业务增长点,如某车企通过用户出行数据衍生出保险服务,年增收超5亿元)。 AllData数据中台架构图概览AllData数据中台架构图通常分为五层:数据采集层、数据存储与计算层、数据治理层、数据服务层和数据应用层。每一层都有其独特的功能和技术工具,共同构成了一个完整的数据中台生态系统。 01、业务部门数据-数据入湖仓 功能说明:业务数据入湖仓是数据中台的起点,负责从各种数据源(如数据库、日志、传感器、第三方API等)中采集数据。这一层的主要任务是将分散的数据集中化,确保数据的全面性和实时性。 应用场景: 企业内部的业务系统数据采集(如ERP、CRM等) 互联网数据采集(如社交媒体、电商平台等) 物联网设备数据采集(如传感器、智能设备等) 02、数据汇聚平台-数据同步到湖仓 DataX:多源数据高效同步,助力数据流通 Chunjun:一站式实时数据集成,敏捷又高效 FlinkCDC:基于 Flink 实时捕获,数据无缝同步 TIS:智能数据集成平台,高效稳定同步 SeaTunnel:多场景适配,实现数据高速同步 03、大数据组件平台功能说明:大数据组件平台是数据中台的核心,负责存储海量数据并提供高效的计算能力。这一层通常包括分布式存储系统和分布式计算框架,能够处理结构化和非结构化数据。 应用场景: 大数据存储与计算(如用户行为分析、推荐系统等) 实时数据处理(如实时监控、实时风控等) 数据仓库建设(如企业级数据仓库、数据集市等) 04、大数据组件运维-集群运维管
本文整理自百度云智峰会 2024 —— AI 基础设施论坛的同名演讲。 插播一条百度百舸产研岗招聘信息:加入百度智能云 AI 计算部,共同建设行业领先的 AI 基础设施。站在浪潮之巅,探索大模型时代基础设施的边界。(参考:大模型走进产业,生产力跃迁正当时) 百度百舸·AI 异构计算平台支持了百度文心系列大模型的落地和迭代升级,帮助客户训练了很多行业和多模态大模型, 包括国内首个专为数学打造的大模型 —— 九章大模型、国内首个对标 Sora 的视频大模型 —— Vidu、生成效果全球领先的 3D 大模型 —— Tripo 2.0 …… 新一代的百度百舸将支撑和加速更强大的大模型问世,这样的机会怎么可以轻易错过。先投递简历开始,加入顶尖技术团队,在大模型的发展潮流中画上自己的一笔。 目前,百度百舸开放以下职位:异构计算工程师 —— 加速方向、AI 计算通信加速研发工程师、云原生 AI 计算工程师、AI 算力平台资深产品经理。 请访问 talent.baidu.com 了解以上职位更详细信息。或者可以将简历直接发送至 wenxin09@baidu.com。 1 百度百舸 4.0 核心架构 过去一年大模型的浪潮,让我们深切感受到当前基础设施建设赶不上模型发展的需求。那 AI 基础设施要如何变革,如何提供更优质的算力,支持模型的探索和创新呢?今天我来分享一下百度智能云的技术探索和创新。 对比 CPU,以 GPU 代表的 AI 芯片最大的难题是充分发挥芯片性能。如果 CPU 是聪明的大脑,AI 芯片就是强壮的手和腿,需要一个很复杂的软件栈和配套设施,才能充分发挥出性能。我们常说,不经意间 50% 的 AI 算力就被浪费掉了。 百度百舸是专为 AI 计算设计的高性能算力平台,为用户解决掉软件栈的复杂度,充分把 AI 算力发挥出来。百度百舸 4.0 的技术架构可以分成 4 层: 硬件资源层,以高性能网络架构为核心,包括高密 AI 服务器,以及全液冷的数据中心; 集群组件层,包括百度集合通信库 BCCL,除了基础的通信能力,更重要的能支持集群的性能调优以及故障定位;以及 AI 编排和调度的组件,能实现任务混布,资源的充分利用,以及多维度的可观测能力; 训推加速层,针对大模型提供的算子库、并行策略、推理架构等,对长文本、MoE、多模态等实现全面加速; 最上面是平台工具层,实现训练任务的管理、自动容错;推理任务的不同 SLA、不同芯片的部署;以及各类应用的快速部署;为用户提供易用的使用界面。 接下来,我为大家逐一分享相关的技术。 2 AI 基础设施 我们说 AI 计算需要极致规模、极致高密和极致互联,这是指的硬件设计层面的要求。 XMAN 5.0 是我们最新推出的新一代 AI 计算机,通过异构多芯、兼容液冷、高可用性设计,应对当前 AI 计算中的多重技术挑战。 首先,是算力多元化,AI 芯片的选择必然更加多样。XMAN 5.0 通过模块化设计,支持多种芯片组合,既兼容 NVLink,也支持 OAM 模组,兼容 Intel、AMD 及国产芯片。 第二个挑战是芯片功耗的持续攀升。随着 AI 算力密度增加,AI 芯片的功耗也从几年前的 400W,迅速上升到 700W,下一代要到 1200W。XMAN 5.0 实现了液冷,相较于风冷方案,单机功耗下降 800W,同时运行温度降低 5-10℃,故障率降低 20%~30%。 此外,密度高,带来了故障域高,硬件故障对集群可用性的影响变大;XMAN 5.0通过模块化设计,实现灵活的组件替换,提升系统高可用性,降低了故障风险。 只有经过优秀设计的 AI 计算机还不够,XMAN 5.0 还配备了百度自研的「灵溪」液冷 IDC,专为高密度计算集群打造,使单机柜功率密度从传统的 30kW 提升到 100kW 以上,PUE 值从 1.3 降至 1.15,系统能效提升超过 10%。 HPN 网络是 AI 集群的核心,他既不同于为 HPC 设计的 IB 网络,他是以延迟为核心;也不同于传统 IaaS 的 RDMA 需求,他是以多租户共享为核心。我们在 RDMA 的基础上,设计吞吐优先的 AI 网络。针对 AI 典型的场景,通信流少、通信路径可预期的情况下,最大化系统吞吐。 我们新一代的 HPN 网络,具有以下几个特性: 规模上支持到了 10 万卡。 基于 51.2T 交换芯片,采用多平面架构,单集群最大可支持 10 万卡。同时,这一代 HPN 对物理空间也实现大幅拓展,可支持 30km 内的跨地域组网; 通信上实现了完全无阻塞。 网络拥塞和多路径负载不均是 RDMA 的痛点问题,通过自适应路由技术,实现了通信带宽有效率超过 95%,通信性能提升 20%; 运维上实现了毫秒级的监控。通过 10ms 级别的高精度
此次合作,双方基于黑龙江的地域产业优势及百度的技术优势,共同建设黑龙江“数字经济产业基地”,立足推动发展黑龙江省的数字产业化与产业数字化,形成有竞争力的产业集群并引领东北区域发展。