谛视多模态视觉大模型应用平台
谛视视觉多模态大模型应用平台是上海谛视广州分公司打造的创新AI大模型,旨在通过多模态大模型优化企业的人员管理、安全管理,提升企业的运行效率,提高企业的经济效益。 该平台利用人工智能技术,通过对海量视频的汇聚、处理和分析,统一实现对人、车、行为、事件的实时感知、分析和预警,识别重点区域潜在风险,系统具备灵活算法自定义能力,具备灵活的算力调配配置能力,全面助力客户精细化管理。
立即咨询
方案展示
方案优势
应用场景
方案展示

技术特点

1、大模型技术使用Transformer架构可以有效地处理图像和文本数据,实现高效的特征提取和信息融合。

2、多模态学习实现图像和文本的联合学习,通过对比学习的方式,使得模型能够学习到图像和文本之间的相关性,实现零样本分类。

3、模型仓架构兼容GPT、BERT、LLAMA等主流模型架构,它在保持Transformer性能的同时提供了更好的训练稳定性和扩展性。

4、混合模型架构结合CNN和Transformer的优点,兼容hybrid模型,利用CNN的局部感知能力和Transformer的全局建模能力。

技术亮点

1、语言描述即算法:可通过文字自定义描述方式新增、修改、删除场景算法。支持多解析器、多提示词设置,通过多条件叠加完成复查场景的算法新建、修改操作。面对用户的突发合理需求,平台具备分钟级算法定义、小时级实施上线部署、零素材预训练的能力,真正做到随需而变。

2、支持实时布控预警:通过兼容各类智能终端设备实时数据接入、根据不同应用场景灵活配置预警功能以及实现重点事件实时、准确的布控预警响应。

3、视频全量结构化:用户可以通过自定义文字描述来指导模型完成特定的任务,而无需从零开始训练模型。实现针对海量音视频数据关键场景、对象、行为和事件的全结构化解析检索。

4、智能语音指令搜寻:为用户提供高效、便捷的视频搜索和管理服务,实现包含“一句话找视频”、“一句话视频找人”等功能。

5、全国产化生态支持:完全适配自主可控的国产化IT底层架构和生态体系,全面支持华为鲲鹏+昇腾、海光+DCU等、飞腾国产化硬件技术路线。支持主流音视频标准化协议,如GB/T28181、GA/T1400、RTSP、ONVIF、FTP等。同时兼容海康威视、大华、宇视等。

6、环境设备要求低:实施部署灵活度高,除了可最大程度利旧已有摄像头,在面对算力有限的请款修改,平台可以通过算力的动态调配,利用有限算力发挥更大的效能。



方案优势
语言描述即算法
语言描述即算法
分钟级定义算法、小时级部署上线、零样本素材训练
支持实时布控预警
支持实时布控预警
可兼容各类摄像头终端
实现视频全量结构化
实现视频全量结构化
包含对象、行为和事件等
智能语音指令搜寻
智能语音指令搜寻
一句话视频找人
全国产化生态支持
全国产化生态支持
华为鲲鹏+昇腾、海光+DCU等
应用场景

  在市场拓展与行业应用方面,谛视万象成果斐然。2024年10月18日,公司与赢海科技达成战略合作,双方整合优势资源,围绕航运多模态大模型平台,为港航物流企业打造数智化产品全新范式。通过深度融合多模态大模型与航运数字技术,构建起覆盖船务运营、港口管理、海事监管等全流程的数智化解决方案,为行业智能化升级注入澎湃动力。 

  同月,谛视万象与宇树科技建立战略合作伙伴关系,并于 2025 年 3 月联合发布公共 安全巡逻机器狗解决方案技术白皮书。公司主导研发的核心图像 AI 智能识别技术,在白皮书中大放异彩,充分展现了其在 AI 技术领域的创新能力与硬核实力。

  我司的谛视多模态视觉大模型产品目前已在公安、交警、应急管理、交通、水利、政数局、城市治理、钢铁冶炼、建筑工程及企业等多元领域大规模开展 POC(概念验证)及产品试用工作。通过深度贴合各行业场景需求,持续优化产品性能,推动人工智能技术在实际场景中的落地应用,助力行业客户实现数字化转型,驱动产业生态向智能化、高效化方向加速迈进。

  截至目前,已在应急、海关、钢铁冶炼领域破冰、签单,并持续为客户提供技术服务与业务支持。

图片.png