中科慧拓自主研发的生成式平行智能数据体系GenDS由“生成式预训练大模型辅助的数据生成引擎”和“多模态大模型辅助4D自动标注引擎”组成。多模态大模型辅助4D自动标注引擎基于前沿人工智能技术与多模态大模型,专为复杂自动化标注任务量身定制。该系统通过融合4D数据的多模态信息,依托跨模态表示学习与深层次地融合神经网络技术,实现对多源数据的精准标注。系统大范围的应用于矿山无人驾驶、矿业主煤流运输、以及矿山人员安全管控等多个高风险领域。该系统为建立“数据工厂”提供了坚实的基础,加速了从数据智能到知识智能的迭代进程,为工业领域的智能化转型提供了强有力的支持。
系统实现了全面的数据全生命周期管理,涵盖从数据生成、采集、存储、治理、到利用和归档的各个阶段。通过集成的数据治理框架和合规管理,确保数据在整个生命周期内的可追溯性、安全性、完整性和一致性
系统提供了一条高度自动化、模块化的数据处理流水线,从数据采集到数据清洗、预处理、转换、集成,直至标注和质检,涵盖全流程的操作。该流水线使用先进的并行计算和批处理技术,确保大规模数据流的实时处理和高效运作
系统采用智能化的大数据智能挖掘技术,结合自适应数据挖掘算法和强化学习模型,能够在数据海量增长的情况下自动筛选更有价值数据样本。通过自学习机制一直在优化挖掘策略,实现对多源异构数据的持续挖掘,解决Conner Case样本稀缺和数据长尾分布问题。
系统采用多模态大规模预训练模型进行4D辅助自动标注,结合跨模态表示学习和深层次地融合神经网络,能够在异构数据源之间实现信息互补与语义统一。该模型通过多源感知数据的协同处理,充分的利用自监督学习与迁移学习技术,精准完成复杂场景中的自动化标注任务,明显提升标注的效率与精度
系统采用人机协同增强标注技术,融合了人类专家知识与深度学习模型,通过交互式机器学习与主动学习机制,实现智能标注系统与人工标注者之间的高效协作。该系统能够动态调整标注建议,利用基于不确定性的采样自动识别复杂数据,优先推送给人工处理,并通过持续反馈循环对模型进行实时优化
系统采用高级标注质量控制机制,结合自动化质检算法和多层次交叉验证策略,确保标注数据的准确性和一致性。通过不一致检测和异常标注识别,系统能够实时捕捉潜在错误
成功签约|中科慧拓携手国际先进的技术应用推进中心共商国际先进技术应用合作发展大计
2024中国自动化学会智慧矿山专委会年会暨国际智慧矿山机器人+人工智能高峰论坛圆满举办