工业互联网|供需发布-广州市一体化算力网监测调度平台

谛视多模态视觉大模型应用平台

谛视视觉多模态大模型应用平台是上海谛视广州分公司打造的创新AI大模型，旨在通过多模态大模型优化企业的人员管理、安全管理，提升企业的运行效率，提高企业的经济效益。该平台利用人工智能技术，通过对海量视频的汇聚、处理和分析，统一实现对人、车、行为、事件的实时感知、分析和预警，识别重点区域潜在风险，系统具备灵活算法自定义能力，具备灵活的算力调配配置能力，全面助力客户精细化管理。

立即咨询

方案展示

技术特点

1、大模型技术：使用Transformer架构可以有效地处理图像和文本数据，实现高效的特征提取和信息融合。

2、多模态学习：实现图像和文本的联合学习，通过对比学习的方式，使得模型能够学习到图像和文本之间的相关性，实现零样本分类。

3、模型仓架构：兼容GPT、BERT、LLAMA等主流模型架构，它在保持Transformer性能的同时提供了更好的训练稳定性和扩展性。

4、混合模型架构：结合CNN和Transformer的优点，兼容hybrid模型，利用CNN的局部感知能力和Transformer的全局建模能力。

技术亮点

1、语言描述即算法：可通过文字自定义描述方式新增、修改、删除场景算法。支持多解析器、多提示词设置，通过多条件叠加完成复查场景的算法新建、修改操作。面对用户的突发合理需求，平台具备分钟级算法定义、小时级实施上线部署、零素材预训练的能力，真正做到随需而变。

2、支持实时布控预警：通过兼容各类智能终端设备实时数据接入、根据不同应用场景灵活配置预警功能以及实现重点事件实时、准确的布控预警响应。

3、视频全量结构化：用户可以通过自定义文字描述来指导模型完成特定的任务，而无需从零开始训练模型。实现针对海量音视频数据关键场景、对象、行为和事件的全结构化解析检索。

4、智能语音指令搜寻：为用户提供高效、便捷的视频搜索和管理服务，实现包含“一句话找视频”、“一句话视频找人”等功能。

5、全国产化生态支持：完全适配自主可控的国产化IT底层架构和生态体系，全面支持华为鲲鹏+昇腾、海光+DCU等、飞腾国产化硬件技术路线。支持主流音视频标准化协议，如GB/T28181、GA/T1400、RTSP、ONVIF、FTP等。同时兼容海康威视、大华、宇视等。

6、环境设备要求低：实施部署灵活度高，除了可最大程度利旧已有摄像头，在面对算力有限的请款修改，平台可以通过算力的动态调配，利用有限算力发挥更大的效能。

应用场景

在市场拓展与行业应用方面，谛视万象成果斐然。2024年10月18日，公司与赢海科技达成战略合作，双方整合优势资源，围绕航运多模态大模型平台，为港航物流企业打造数智化产品全新范式。通过深度融合多模态大模型与航运数字技术，构建起覆盖船务运营、港口管理、海事监管等全流程的数智化解决方案，为行业智能化升级注入澎湃动力。

同月，谛视万象与宇树科技建立战略合作伙伴关系，并于 2025 年 3 月联合发布公共安全巡逻机器狗解决方案技术白皮书。公司主导研发的核心图像 AI 智能识别技术，在白皮书中大放异彩，充分展现了其在 AI 技术领域的创新能力与硬核实力。

我司的谛视多模态视觉大模型产品目前已在公安、交警、应急管理、交通、水利、政数局、城市治理、钢铁冶炼、建筑工程及企业等多元领域大规模开展 POC（概念验证）及产品试用工作。通过深度贴合各行业场景需求，持续优化产品性能，推动人工智能技术在实际场景中的落地应用，助力行业客户实现数字化转型，驱动产业生态向智能化、高效化方向加速迈进。

截至目前，已在应急、海关、钢铁冶炼领域破冰、签单，并持续为客户提供技术服务与业务支持。

图片.png